OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

1080p kalitesindeki videoların uzunluğu 1 dakika.

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
TT

OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)

OpenAI'nin yeni Sora teknolojisi, yapay zeka dünyasında, özellikle de metni videoya dönüştürme alanında olağanüstü bir sıçramayı temsil ediyor. Video içeriği oluşturmada yeni bir çağ başlatmak üzere tasarlanan bu yenilikçi teknoloji, basit metin talimatlarıyla bir dakikaya kadar uzunlukta son derece gerçekçi ve yaratıcı videolar oluşturulmasına olanak sağlıyor. Bu yeteneği sayesinde Sora, yapay zekanın dijital medya yaratımında devrim yaratma potansiyeli açısından oldukça ileri seviye bir örnek teşkil ediyor.

Örneğin, Sora'ya şu paragraf veriliyor:

"Zarif bir kadın, sıcak neon ışıkları ve hareketli şehir tabelalarıyla dolu bir Tokyo caddesinde yürümektedir. Siyah deri bir ceket, uzun kırmızı bir elbise, siyah ayakkabılar giyiyor ve siyah bir cüzdan taşıyor. Güneş gözlüğü takıyor ve ruj sürüyor. Kendinden emin ve rahat bir şekilde yürüyor. Sokak nemli ve yansıtıcı, renkli ışıklar ayna etkisi yaratıyor. Etrafta yürüyen bir sürü yaya var."

Sonuç ise bu (OpenAI internet sitesinden):

Yenilikçi yetenekler ve zorluklar

Sora, birden fazla karakter, belirli eylem türleri ve ayrıntılı senaryolar içeren karmaşık sahneler oluşturabiliyor. Tüm bunları yaparken bir kullanıcının komut istemindeki nüansları anlayabiliyor. Dikkat çeken bir özellik de Sora'nın tüm videoyu bir kerede oluşturabilmesi ve böylece özneler görüş alanından çıktığında görünümde meydana gelen değişiklikler gibi tutarsızlıkları ortadan kaldırmasında kendini gösteriyor.

Ancak modelin zayıf yönleri de yok değil. Örneğin, bir kişi elmadan bir ısırık alırken fotoğraflanabilir ancak ısırık izi artık elmanın üzerinde görünmeyebilir. Sora ayrıca sol ve sağı ayırt edememek gibi uzamsal ayrıntılar ve yönlerle başa çıkmakta veya belirli bir kamera yoluna bağlı kalmak gibi zaman içinde gelişen sahnelerin olaylarını tanımlamakta zorluk çekebilir.

Sora'nın tekniğiyle elde edilen sonuçlara bir başka örnek de kendisinden özellikle istenen bu paragrafı videoya çevirmesi (OpenAI internet sitesinden:

"Kamera doğrudan İtalya'nın Burano kentinin renkli binalarına bakıyor. Sevimli bir Dalmaçyalı köpek zemin kattaki bir binanın penceresinden bakıyor. Birçok insan binaların önündeki kanal sokaklarında yürüyor ve bisiklete biniyor."

Araştırma ve geliştirme teknolojileri

Şarku’l Avsat’ın edindiği bilgilere göre Sora, GPT modellerine benzer şekilde sıralı verileri işlemek için kullanılan derin öğrenme mimarisi türlerini kullanarak büyük miktarda veriyi verimli bir şekilde işlemesine olanak tanıyor. Model, videoları ve görüntüleri GPT'deki belirteçlere benzer şekilde veri yamaları kümeleri olarak temsil ederek çeşitli görsel veriler üzerinde eğitilmesine olanak tanır. Veri temsilinin bu şekilde birleştirilmesi sayesinde Sora'nın teknolojisi, süre, doğruluk ve diğer özellikleri daha önce hiç olmadığı kadar verimli bir şekilde ele almasını sağlıyor. Sora ayrıca DALL-E ve GPT modelleri üzerine yapılan araştırmalara dayanıyor ve görsel eğitim verileri için son derece açıklayıcı başlıklar oluşturmak için DALL-E 3'ün geri alma teknolojisini kullanıyor. Bu sayede kullanıcının metin talimatlarını daha doğru bir şekilde takip eden videolar oluşturuluyor. Model ayrıca hareketsiz görüntüleri canlandırabilir veya mevcut videoları ayrıntılara dikkat ederek genişletebilir ve gerçek dünya uygulamalarındaki çok yönlülüğü ve potansiyeli gösterebilir.

Güvenlik ve etik hususlar

Güvenlik ve etiğin öneminin farkında olan OpenAI, Sora'nın ürünlerine entegre edilebilmesi için birçok önemli adım attı. Şirket, X platformundaki bir paylaşımında, şirket içinde yanlış bilgilendirme, nefret içeriği ve önyargı gibi alanlarda uzmanlaşmış bir ekip olan Red Team üyeleriyle iş birliği yaparak, Sora tarafından oluşturulan videoları tanımlayabilen bir sınıflandırma aracı geliştirildiğini bildirdi.

Katılım ve gelecek beklentileri

OpenAI, endişeleri anlamak ve Sora için olumlu kullanım durumlarını belirlemek için küresel çapta politikacılar, eğitimciler ve sanatçılarla etkileşim kurmayı planlıyor. Kapsamlı araştırma ve testlere rağmen, potansiyel faydalı ve zararlı kullanımların tamamı bilinmiyor. OpenAI, zaman içinde daha güvenli yapay zeka sistemleri yaratmada kritik bir unsur olarak gerçek dünya kullanarak öğrenmenin önemine inanıyor.

Sora, yapay zekanın gerçek dünyayı anlama ve simüle etme becerisinde büyük bir ilerlemeyi temsil ediyor ve genel yapay zekaya (AGI) ulaşma yolunda kritik bir adımı işaret ediyor. Sora'nın geliştirilmesi sadece ilgi çekici video içeriği oluşturma potansiyelini göstermekle kalmıyor, aynı zamanda yapay zeka araştırma ve uygulamalarında devam eden zorlukları ve sorumlulukları da vurguluyor.



NASA, Artemis görevi için şair arayışında

(Reuters)
(Reuters)
TT

NASA, Artemis görevi için şair arayışında

(Reuters)
(Reuters)

Andrew Griffin 

NASA, Ay'a yönelik Artemis görevi ve diğer çalışmalarına destek olacak şairler ve başka yaratıcı hikaye anlatıcıları arıyor.

Uzay ajansı, yürüttükleri görevleri paylaşacak "sinemacılar, belgeselciler, şarkı yazarları, hikaye anlatıcıları, şairler ve diğerleriyle" çalışmak istiyor.

Bunlar arasında insanları Ay'a geri götürecek Artemis programının yanı sıra başka görevler de var. 2028'de Mars'a nükleer reaktör gönderme planları, Ay yüzeyinde üs inşa etme çalışmaları ve test uçuşları da bunlar arasında.

Ajans kamuoyuna yaptığı çağrıda bu çalışmaların, "NASA'nın görevlerine dair hikayeleri mümkün olduğunca geniş bir kitleyle paylaşmasını ve yeni nesil kaşiflere ilham vermesini" hedeflediğini belirtti.

Açıklamada başarılı içerik üreticilerinin, NASA'nın program tesislerine davet edileceği, "program ve görevler hakkında bilgi edineceği, personelle röportaj yapacağı ve programın içeriği ve onun bir parçası olmanın nasıl bir şey olduğunu birkaç gün boyunca deneyimleyeceği" söylendi.

Çalışma öncelikle ABD'deki içerik üreticilerine odaklansa da Amerikan ekiplerindeki uluslararası işbirlikçilerin de değerlendirmeye alınacağı ifade edildi. İlk turda en fazla 10 kişi veya ekibin yer alması bekleniyor ancak uzay ajansı daha fazla fırsatın ortaya çıkmasının muhtemel olduğunu belirtti.

İçerik üreticilerine çalışmaları karşılığında ödeme yapılmayacak. Bunun yerine NASA, çalışmanın "karşılıklı fayda" sağlayacağını umduğunu ve uzay ajansıyla üreticilerin kendi masraflarını kendilerinin karşılayacağını ifade etti.

NASA, ilgilenen herkesten haziran sonuna kadar tekliflerini sunmalarını istedi. Ajans, ilgilenenlerin tam olarak ne göndermesi gerektiğine dair bilgiler gibi ayrıntıları içeren bir teklif çağrısını internet sitesinde yayımladı.

Independent Türkçe,independent.co.uk/space


Çin bütün insansı robotlara kimlik numarası getiriyor

 Hangzhou'da halk, polis memuru olan insansı robotun yanından geçiyor (AFP)
Hangzhou'da halk, polis memuru olan insansı robotun yanından geçiyor (AFP)
TT

Çin bütün insansı robotlara kimlik numarası getiriyor

 Hangzhou'da halk, polis memuru olan insansı robotun yanından geçiyor (AFP)
Hangzhou'da halk, polis memuru olan insansı robotun yanından geçiyor (AFP)

Vishwam Sankaran Bilim ve Teknoloji Muhabiri 

Çin devlet televizyonu CCTV'ye göre Asya ülkesi, insansı robotlarını yaşam döngüleri boyunca daha iyi takip edebilmek amacıyla bu araçların hepsine eşsiz dijital kimlik numaraları getirmeyi planlıyor.

Çin sektörde hızlı bir büyüme hedeflerken bu program, yetkililerin insansı robot ürünlerini üretim aşamasından nihai geri dönüşümlerine kadar güvenlik riskleri açısından izlemesini sağlamak üzere tasarlandı.

Çinli yetkililer ayrıca insansı robotların nasıl yönetilmesi gerektiği ve bu eşsiz kimlik numaralarının nasıl takip edilebileceğine dair yeni yönergeler yayımladı.

Bu benzersiz insansı robot kimlikleri 4 bölümden oluşuyor. Bunlar arasında sınır ötesi sevkıyatları takip etmeye yarayan iki basamaklı bir kod ve robotu üreten Çinli firmayı tanımlayan 4 basamaklı bir kod da yer alıyor.

Yeni yönergeye göre 6 basamaklı bir ürün kodu insansı robotun türünü belirlerken, 17 basamaklı seri numarası ise her bir robotu birbirinden ayıracak.

Bu girişim halihazırda 100'den fazla Çinli üreticiyi kapsarken, 200 farklı modelden 28 binden fazla insansı robota dijital kimlik atandı.

Bütün bu programı, Çin Sanayi ve Bilgi Teknolojileri Bakanlığı bünyesindeki Çin İnsansı Robotik ve Bedenlenmiş Zeka Standardizasyonu (HEIS) yürütüyor.

Uzmanlara göre Çin'de insansı robotlar halihazırda çoğunlukla üniversiteler, araştırma laboratuvarları ve imalat sektöründe kullanılsa da ülke, yaşlı bakımı ve ev temizliği gibi ticari uygulamalar için geniş çaplı kullanıma sunmaya da hazırlanıyor.

Ülke ayrıca donanım tedarik zincirini hızla yerelleştirerek ABD menşeli Nvidia çiplerine bağımlılığını azaltıyor.

Yerel haberlere göre ülkede halihazırda kullanılan insansı robotlar tamamen otonom olmaktan uzak ve genellikle çeşitli görevleri yerine getirmek için gereken hassasiyet ve el becerisinden yoksun.

Bu robotlar çoğunlukla farklı sektörlerde sahaya özgü denemeler yapmak için kullanılıyor ancak uzmanlar, bu görevlerde bile robotların sınırlı el becerisi nedeniyle insanlara kıyasla sadece kısmen verimli olduklarını belirtiyor.

GigaAI, Unitree ve Agibot gibi şirketler, önemli donanım yenilikleriyle pazara öncülük ediyor.

Örneğin GigaAI, Çin'in ev işlerini yerine getirmek üzere geliştirilen ilk genel amaçlı insansı robotunu kısa süre önce tanıtmıştı.

GigaAI'ın SeeLight S1 robotu, Hubei İnsansı Robot İnovasyon Merkezi ve Hubei İnsansı Robotik Endüstri Birliği'yle işbirliği içinde üretildi. SCMP'nin haberine göre robotun 2027'nin ilk yarısında test edilmek üzere Vuhan'daki ailelere ücretsiz verilmesi planlanıyor.

Robotik şirketi, iki kollu ve tekerlekli insansı robotun sebze doğrama, yumurta kızartma ve çamaşır makinesini doldurma gibi çeşitli ev işlerini yaptığını gösteren bir videoyu WeChat'te yayımladı.

Independent Türkçe, independent.co.uk/tech


Apple, Siri'yi baştan aşağı değiştiriyor: Yenilikler neler?

Fotoğraf: AP
Fotoğraf: AP
TT

Apple, Siri'yi baştan aşağı değiştiriyor: Yenilikler neler?

Fotoğraf: AP
Fotoğraf: AP

Apple'ın odağına gizliliği alarak Siri'yi baştan aşağı yenilemeyi planladığı yeni bir haberde bildirildi. 

Apple, iki yıldır sanal asistanına yepyeni yetenekler kazandıracağına söz verirken, bunun için sistemin yenilenmesi gerekiyor.  Bu yeni özellikler arasında kullanıcının kişisel koşullarını anlama yeteneği de yer alacak. Böylece kullanıcılar, örneğin birinin uçağının ne zaman ineceğini sorabilecek ve sistem o kişinin kim olduğunu bilip seyahatiyle ilgili daha fazla bilgi edinebilecek.

Ancak bu yenileme ve Apple'ın yapay zeka alanındaki çabaları genel olarak bir dizi sorunla karşılaşırken özelliklerin çoğu ya geç geldi ya da hiç gelmedi. Buna Siri'deki değişiklikler de dahil.

Apple'ın bu yeni Siri sürümünü, gelecek ay düzenlenecek yıllık yazılım etkinliği Dünya Geliştiriciler Konferansı'nda (WWDC) piyasaya süreceği söylentileri dolaşıyor.

Bloomberg'ün yeni haberine göre Siri'nin yeni sürümü bir dizi özellikle birlikte geliyor ancak Apple, gizliliğe odaklanmasının, halihazırda yapay zekayı daha yoğun kullanan diğer rakiplerinden ayrışmanın anahtarı olacağını umuyor. Kullanıcıların sohbet geçmişlerini 30 gün veya bir yıl sonra otomatik olarak silmesine imkan vermenin de bu özellikler arasında yer alacağı raporda iddia ediliyor.

Diğer sohbet botları da sohbet geçmişlerini silme ve geçici sohbetler yapma olanağı sunsa da gizlilik politikaları daha belirsiz. Dahası, sohbet geçmişlerinin yıllarca saklanabilmesi ve hatta modelleri daha fazla eğitmek için kullanılabilmesi, kişisel verilerin sohbet botu içinde depolanma ihtimali olduğu anlamına geliyor.

Öte yandan bu geçmişler, cevapları kişiselleştirmeye ve daha ayrıntılı bir bağlam sağlamaya yarayabileceğinden kullanıcılara fayda sağlayabilir. Apple, gizliliğe yönelik katı inancının bazı yapay zeka özelliklerini zedelemesiyle ilgili geçmişte eleştirilerle karşılaşmıştı çünkü bu, ürünlerinin kullanıcılar hakkında daha az veriye sahip olduğu anlamına geliyordu. Ancak şirket, her ikisini de yapmanın mümkün olduğuna inandığını defalarca vurguladı.

Siri'deki değişikliklerle ilgili diğer söylentiler arasında, kullanıcıların sohbetlerini görebilecekleri bağımsız bir uygulama ve sanal asistanla etkileşim kurma yöntemlerinin yeniden tasarlanması yer alıyor.

Independent Türkçe