OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

1080p kalitesindeki videoların uzunluğu 1 dakika.

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
TT

OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)

OpenAI'nin yeni Sora teknolojisi, yapay zeka dünyasında, özellikle de metni videoya dönüştürme alanında olağanüstü bir sıçramayı temsil ediyor. Video içeriği oluşturmada yeni bir çağ başlatmak üzere tasarlanan bu yenilikçi teknoloji, basit metin talimatlarıyla bir dakikaya kadar uzunlukta son derece gerçekçi ve yaratıcı videolar oluşturulmasına olanak sağlıyor. Bu yeteneği sayesinde Sora, yapay zekanın dijital medya yaratımında devrim yaratma potansiyeli açısından oldukça ileri seviye bir örnek teşkil ediyor.

Örneğin, Sora'ya şu paragraf veriliyor:

"Zarif bir kadın, sıcak neon ışıkları ve hareketli şehir tabelalarıyla dolu bir Tokyo caddesinde yürümektedir. Siyah deri bir ceket, uzun kırmızı bir elbise, siyah ayakkabılar giyiyor ve siyah bir cüzdan taşıyor. Güneş gözlüğü takıyor ve ruj sürüyor. Kendinden emin ve rahat bir şekilde yürüyor. Sokak nemli ve yansıtıcı, renkli ışıklar ayna etkisi yaratıyor. Etrafta yürüyen bir sürü yaya var."

Sonuç ise bu (OpenAI internet sitesinden):

Yenilikçi yetenekler ve zorluklar

Sora, birden fazla karakter, belirli eylem türleri ve ayrıntılı senaryolar içeren karmaşık sahneler oluşturabiliyor. Tüm bunları yaparken bir kullanıcının komut istemindeki nüansları anlayabiliyor. Dikkat çeken bir özellik de Sora'nın tüm videoyu bir kerede oluşturabilmesi ve böylece özneler görüş alanından çıktığında görünümde meydana gelen değişiklikler gibi tutarsızlıkları ortadan kaldırmasında kendini gösteriyor.

Ancak modelin zayıf yönleri de yok değil. Örneğin, bir kişi elmadan bir ısırık alırken fotoğraflanabilir ancak ısırık izi artık elmanın üzerinde görünmeyebilir. Sora ayrıca sol ve sağı ayırt edememek gibi uzamsal ayrıntılar ve yönlerle başa çıkmakta veya belirli bir kamera yoluna bağlı kalmak gibi zaman içinde gelişen sahnelerin olaylarını tanımlamakta zorluk çekebilir.

Sora'nın tekniğiyle elde edilen sonuçlara bir başka örnek de kendisinden özellikle istenen bu paragrafı videoya çevirmesi (OpenAI internet sitesinden:

"Kamera doğrudan İtalya'nın Burano kentinin renkli binalarına bakıyor. Sevimli bir Dalmaçyalı köpek zemin kattaki bir binanın penceresinden bakıyor. Birçok insan binaların önündeki kanal sokaklarında yürüyor ve bisiklete biniyor."

Araştırma ve geliştirme teknolojileri

Şarku’l Avsat’ın edindiği bilgilere göre Sora, GPT modellerine benzer şekilde sıralı verileri işlemek için kullanılan derin öğrenme mimarisi türlerini kullanarak büyük miktarda veriyi verimli bir şekilde işlemesine olanak tanıyor. Model, videoları ve görüntüleri GPT'deki belirteçlere benzer şekilde veri yamaları kümeleri olarak temsil ederek çeşitli görsel veriler üzerinde eğitilmesine olanak tanır. Veri temsilinin bu şekilde birleştirilmesi sayesinde Sora'nın teknolojisi, süre, doğruluk ve diğer özellikleri daha önce hiç olmadığı kadar verimli bir şekilde ele almasını sağlıyor. Sora ayrıca DALL-E ve GPT modelleri üzerine yapılan araştırmalara dayanıyor ve görsel eğitim verileri için son derece açıklayıcı başlıklar oluşturmak için DALL-E 3'ün geri alma teknolojisini kullanıyor. Bu sayede kullanıcının metin talimatlarını daha doğru bir şekilde takip eden videolar oluşturuluyor. Model ayrıca hareketsiz görüntüleri canlandırabilir veya mevcut videoları ayrıntılara dikkat ederek genişletebilir ve gerçek dünya uygulamalarındaki çok yönlülüğü ve potansiyeli gösterebilir.

Güvenlik ve etik hususlar

Güvenlik ve etiğin öneminin farkında olan OpenAI, Sora'nın ürünlerine entegre edilebilmesi için birçok önemli adım attı. Şirket, X platformundaki bir paylaşımında, şirket içinde yanlış bilgilendirme, nefret içeriği ve önyargı gibi alanlarda uzmanlaşmış bir ekip olan Red Team üyeleriyle iş birliği yaparak, Sora tarafından oluşturulan videoları tanımlayabilen bir sınıflandırma aracı geliştirildiğini bildirdi.

Katılım ve gelecek beklentileri

OpenAI, endişeleri anlamak ve Sora için olumlu kullanım durumlarını belirlemek için küresel çapta politikacılar, eğitimciler ve sanatçılarla etkileşim kurmayı planlıyor. Kapsamlı araştırma ve testlere rağmen, potansiyel faydalı ve zararlı kullanımların tamamı bilinmiyor. OpenAI, zaman içinde daha güvenli yapay zeka sistemleri yaratmada kritik bir unsur olarak gerçek dünya kullanarak öğrenmenin önemine inanıyor.

Sora, yapay zekanın gerçek dünyayı anlama ve simüle etme becerisinde büyük bir ilerlemeyi temsil ediyor ve genel yapay zekaya (AGI) ulaşma yolunda kritik bir adımı işaret ediyor. Sora'nın geliştirilmesi sadece ilgi çekici video içeriği oluşturma potansiyelini göstermekle kalmıyor, aynı zamanda yapay zeka araştırma ve uygulamalarında devam eden zorlukları ve sorumlulukları da vurguluyor.



Meta, yapay zekâ ihtiyaçları için nükleer enerjiye yöneliyor

Meta'nın Kaliforniya'daki şirket merkezinin yakınındaki logosu (DPA)
Meta'nın Kaliforniya'daki şirket merkezinin yakınındaki logosu (DPA)
TT

Meta, yapay zekâ ihtiyaçları için nükleer enerjiye yöneliyor

Meta'nın Kaliforniya'daki şirket merkezinin yakınındaki logosu (DPA)
Meta'nın Kaliforniya'daki şirket merkezinin yakınındaki logosu (DPA)

Meta, Constellation Energy'den nükleer enerji satın almak için 20 yıllık bir anlaşma imzalayarak, teknoloji devlerinin veri merkezlerinin artan enerji ihtiyaçlarını karşılamak için sektörle iş birliği yapma eğilimini sürdürdü.

Meta, Haziran 2027'den itibaren Constellation'ın Illinois'deki Clinton Temiz Enerji Merkezi'nden yaklaşık 1,1 gigavat güç satın alacak. Bu, tesisin tek nükleer reaktörünün toplam çıktısını temsil ediyor.

İki şirket, uzun vadeli anlaşmanın santralin devam eden işletimini ve yeniden lisanslanmasını destekleyeceğini doğruladı.

Şarku’l Avsat’ın CNBC'den aktardığına göre Meta'nın taahhüdü olmadan santral, 2017'den bu yana kullandığı emisyonsuz kredinin süresi dolduğunda kapanma riskiyle karşı karşıyaydı.

Constellation Başkanı ve CEO'su Joe Dominguez, “Meta ile ortaklık yapmaktan gurur duyuyoruz... Meta, mevcut santrallerin yeniden lisanslanmasını ve genişletilmesini desteklemenin yeni enerji kaynakları bulmak kadar etkili olduğunu fark etti” ifadelerini kullandı.

Clinton Centre'ın üretimini de 30 megawatt artıracak olan anlaşmanın şartları açıklanmadı. Santral doğrudan Meta'nın veri merkezlerini beslemeyecek; teknoloji devinin yüzde 100 temiz enerji üretme hedefine katkıda bulunurken bölgesel şebekeye güç sağlamaya devam edecek.

Bu duyuru, büyük teknoloji şirketleri ile nükleer endüstri arasında yapılan bir dizi anlaşmanın sonuncusu. Eylül ayında Constellation, Three Mile Island'ı yeniden çalıştıracağını ve 20 yıllık bir anlaşma kapsamında Microsoft'a enerji satacağını duyurmuştu.

Google geçtiğimiz yıl küçük modüler nükleer reaktörler (SMRs) geliştiren Kairos Power ile yaptığı iş birliğinin ardından üç yeni nükleer tesisin geliştirilmesini finanse etme sözü verdi. Amazon ise ekim ayında bu reaktörlerin geliştirilmesi için 500 milyon dolardan fazla yatırım yaptı ve Mart 2024'te Susquehanna Nükleer Santrali’nde faaliyet gösterecek bir veri merkezi kompleksi satın aldı. Amazon, Google ve Meta gibi teknoloji devleri mart ayında Dünya Nükleer Birliği öncülüğünde 2050 yılına kadar nükleer enerjinin küresel olarak üç katına çıkarılması çağrısında bulunan bir taahhüdü imzaladılar.

Ancak Constellation ile yapılan anlaşma, Meta'nın nükleer enerji sektörüne ilk resmi girişi anlamına geliyor. Şirket aralık ayında, ABD'de bir ila dört gigawatt arasında yeni nükleer kapasite ekleme arzusunu belirterek, ortak olacak nükleer enerji geliştiricileri bulmak için bir teklif talebinde bulundu. Gelişmiş nükleer enerjiye odaklanan bu teklif halen değerlendirme aşamasında ve şirketin Clinton tesisine verdiği destekten farklı.

Meta Küresel Enerji Başkanı Urvi Parekh şunları söyledi: “Yapay zekâ hedeflerimizi ilerletmeye devam etmek için temiz ve güvenilir enerjiyi güvence altına almak şart. Clinton tesisinin önümüzdeki yıllarda da faaliyet göstermesine katkıda bulunmaktan ve bu tesisin ABD'nin enerji liderliğini ilerletmenin önemli bir parçası olduğunu göstermekten gurur duyuyoruz.”

Başkan Donald Trump kısa bir süre önce, 2050 yılına kadar ABD'nin nükleer kapasitesini dört katına çıkarma hedefiyle nükleer enerjinin yaygınlaştırılmasını hızlandırmayı amaçlayan dört kararname imzaladı. Bu kararnameler, diğer hususların yanı sıra, Nükleer Düzenleme Komisyonu'nun elden geçirilmesini ve yerli bir nükleer yakıt tedarik zinciri kurulmasını öngörüyor.

Beyaz Saray ayrıca, küçük modüler reaktörler de dahil olmak üzere reaktörlerin düzenleyici onayının hızlandırılması çağrısında bulundu. Geçmişte nükleer projeler yüksek ön maliyetlerden ve uzun inşaat programlarından mustaripti. Sektör, küçük nükleer reaktörlerin nükleer enerjiyi genişletmek için daha uygun maliyetli bir yol olacağını umuyor. Şu anda ABD'de faaliyette olan küçük nükleer reaktör bulunmuyor.

Diğer yandan Constellation dün yaptığı açıklamada, Clinton sahasında küçük bir nükleer reaktör inşa etme olasılığı için Nükleer Düzenleme Komisyonu'ndan yeni bir lisans almayı değerlendirdiğini duyurdu.