OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

1080p kalitesindeki videoların uzunluğu 1 dakika.

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
TT

OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)

OpenAI'nin yeni Sora teknolojisi, yapay zeka dünyasında, özellikle de metni videoya dönüştürme alanında olağanüstü bir sıçramayı temsil ediyor. Video içeriği oluşturmada yeni bir çağ başlatmak üzere tasarlanan bu yenilikçi teknoloji, basit metin talimatlarıyla bir dakikaya kadar uzunlukta son derece gerçekçi ve yaratıcı videolar oluşturulmasına olanak sağlıyor. Bu yeteneği sayesinde Sora, yapay zekanın dijital medya yaratımında devrim yaratma potansiyeli açısından oldukça ileri seviye bir örnek teşkil ediyor.

Örneğin, Sora'ya şu paragraf veriliyor:

"Zarif bir kadın, sıcak neon ışıkları ve hareketli şehir tabelalarıyla dolu bir Tokyo caddesinde yürümektedir. Siyah deri bir ceket, uzun kırmızı bir elbise, siyah ayakkabılar giyiyor ve siyah bir cüzdan taşıyor. Güneş gözlüğü takıyor ve ruj sürüyor. Kendinden emin ve rahat bir şekilde yürüyor. Sokak nemli ve yansıtıcı, renkli ışıklar ayna etkisi yaratıyor. Etrafta yürüyen bir sürü yaya var."

Sonuç ise bu (OpenAI internet sitesinden):

Yenilikçi yetenekler ve zorluklar

Sora, birden fazla karakter, belirli eylem türleri ve ayrıntılı senaryolar içeren karmaşık sahneler oluşturabiliyor. Tüm bunları yaparken bir kullanıcının komut istemindeki nüansları anlayabiliyor. Dikkat çeken bir özellik de Sora'nın tüm videoyu bir kerede oluşturabilmesi ve böylece özneler görüş alanından çıktığında görünümde meydana gelen değişiklikler gibi tutarsızlıkları ortadan kaldırmasında kendini gösteriyor.

Ancak modelin zayıf yönleri de yok değil. Örneğin, bir kişi elmadan bir ısırık alırken fotoğraflanabilir ancak ısırık izi artık elmanın üzerinde görünmeyebilir. Sora ayrıca sol ve sağı ayırt edememek gibi uzamsal ayrıntılar ve yönlerle başa çıkmakta veya belirli bir kamera yoluna bağlı kalmak gibi zaman içinde gelişen sahnelerin olaylarını tanımlamakta zorluk çekebilir.

Sora'nın tekniğiyle elde edilen sonuçlara bir başka örnek de kendisinden özellikle istenen bu paragrafı videoya çevirmesi (OpenAI internet sitesinden:

"Kamera doğrudan İtalya'nın Burano kentinin renkli binalarına bakıyor. Sevimli bir Dalmaçyalı köpek zemin kattaki bir binanın penceresinden bakıyor. Birçok insan binaların önündeki kanal sokaklarında yürüyor ve bisiklete biniyor."

Araştırma ve geliştirme teknolojileri

Şarku’l Avsat’ın edindiği bilgilere göre Sora, GPT modellerine benzer şekilde sıralı verileri işlemek için kullanılan derin öğrenme mimarisi türlerini kullanarak büyük miktarda veriyi verimli bir şekilde işlemesine olanak tanıyor. Model, videoları ve görüntüleri GPT'deki belirteçlere benzer şekilde veri yamaları kümeleri olarak temsil ederek çeşitli görsel veriler üzerinde eğitilmesine olanak tanır. Veri temsilinin bu şekilde birleştirilmesi sayesinde Sora'nın teknolojisi, süre, doğruluk ve diğer özellikleri daha önce hiç olmadığı kadar verimli bir şekilde ele almasını sağlıyor. Sora ayrıca DALL-E ve GPT modelleri üzerine yapılan araştırmalara dayanıyor ve görsel eğitim verileri için son derece açıklayıcı başlıklar oluşturmak için DALL-E 3'ün geri alma teknolojisini kullanıyor. Bu sayede kullanıcının metin talimatlarını daha doğru bir şekilde takip eden videolar oluşturuluyor. Model ayrıca hareketsiz görüntüleri canlandırabilir veya mevcut videoları ayrıntılara dikkat ederek genişletebilir ve gerçek dünya uygulamalarındaki çok yönlülüğü ve potansiyeli gösterebilir.

Güvenlik ve etik hususlar

Güvenlik ve etiğin öneminin farkında olan OpenAI, Sora'nın ürünlerine entegre edilebilmesi için birçok önemli adım attı. Şirket, X platformundaki bir paylaşımında, şirket içinde yanlış bilgilendirme, nefret içeriği ve önyargı gibi alanlarda uzmanlaşmış bir ekip olan Red Team üyeleriyle iş birliği yaparak, Sora tarafından oluşturulan videoları tanımlayabilen bir sınıflandırma aracı geliştirildiğini bildirdi.

Katılım ve gelecek beklentileri

OpenAI, endişeleri anlamak ve Sora için olumlu kullanım durumlarını belirlemek için küresel çapta politikacılar, eğitimciler ve sanatçılarla etkileşim kurmayı planlıyor. Kapsamlı araştırma ve testlere rağmen, potansiyel faydalı ve zararlı kullanımların tamamı bilinmiyor. OpenAI, zaman içinde daha güvenli yapay zeka sistemleri yaratmada kritik bir unsur olarak gerçek dünya kullanarak öğrenmenin önemine inanıyor.

Sora, yapay zekanın gerçek dünyayı anlama ve simüle etme becerisinde büyük bir ilerlemeyi temsil ediyor ve genel yapay zekaya (AGI) ulaşma yolunda kritik bir adımı işaret ediyor. Sora'nın geliştirilmesi sadece ilgi çekici video içeriği oluşturma potansiyelini göstermekle kalmıyor, aynı zamanda yapay zeka araştırma ve uygulamalarında devam eden zorlukları ve sorumlulukları da vurguluyor.



Betelgeuse'in uzun "kalp atışlarının" gizemi çözülüyor mu?

Betelgeuse, süpernova patlaması yaşadığında muhtemelen gündüz vakti bile görülebilecek ancak bunun binlerce yıl daha yaşanması beklenmiyor (ALMA/ESO)
Betelgeuse, süpernova patlaması yaşadığında muhtemelen gündüz vakti bile görülebilecek ancak bunun binlerce yıl daha yaşanması beklenmiyor (ALMA/ESO)
TT

Betelgeuse'in uzun "kalp atışlarının" gizemi çözülüyor mu?

Betelgeuse, süpernova patlaması yaşadığında muhtemelen gündüz vakti bile görülebilecek ancak bunun binlerce yıl daha yaşanması beklenmiyor (ALMA/ESO)
Betelgeuse, süpernova patlaması yaşadığında muhtemelen gündüz vakti bile görülebilecek ancak bunun binlerce yıl daha yaşanması beklenmiyor (ALMA/ESO)

Bilim insanları, gökyüzündeki en parlak yıldızlardan biri olan Betelgeuse'in yalnız olmayabileceğini öne sürdü. 

Orion Takımyıldızı'nda Dünya'dan 427 ışık yılı uzaktaki Betelgeuse, yeryüzüne en yakın kırmızı üstdev. 

Evrendeki en büyük hacme sahip bu yıldızların kütlesi, boyutuna oranla daha az oluyor. Betelgeuse de Güneş'in 700 katı büyüklüğe ve 15 katı kütleye sahip.

Dünya'dan görülebilen en parlak yıldızlar arasındaki Betelgeuse, gökbilimciler tarafından da epey detaylı bir şekilde inceleniyor. Ancak yeni bir araştırmaya göre çok önemli bir şey gözden kaçmış olabilir. 

Betelgeuse gibi yıldızlar, belirli periyotlar halinde şişip iniyor. Yıldızın çekirdeğindeki gazın ısınıp yüzeye çıkması ve ardından soğuyarak geri inmesi sonucu bu döngü yaşanıyor. 

Yapılan gözlemlerde Betelgeuse'in bu türden 400 günlük döngülere girdiği ve bu nedenle parlaklığının artıp azaldığı kaydediliyor. 

Ancak gökbilimciler Betelgeuse'in 2 bin 170 gün süren daha yavaş bir döngüde de parlaklığının artıp azaldığını gözlemliyor. 

Bilim insanları, uzun ikincil periyot (long secondary period / LSP) dedikleri bu ikinci döngünün sebebini saptayamıyor. 

Henüz hakem denetiminden geçmeyen ve ön baskı sunucusu arXiv'de yayımlanan araştırmaya göre, Güneş'in yaklaşık 1,7 katı kütleye sahip bir yıldız bu uzun periyoda yol açıyor olabilir. 

2019 sonu ila 2020 başında Betelgeuse'in parlaklığında ciddi bir düşüş yaşanmıştı. Bu olayı yıldızın ömrünün sonuna geldiği ve süpernova patlaması geçireceği şeklinde yorumlayanlar olmuştu. 

Fakat daha sonra araştırmacılar, çok yüksek ihtimalle Dünya'yla Betelgeuse arasına büyük bir toz bulutu girmesinin parlaklıktaki muazzam düşüşe yol açtığı sonucuna varmıştı.

Yeni çalışmayı yürüten ekip LSP'yi açıklayabilecek farklı senaryolar üzerinden çeşitli hesaplamalar yaptı. 

Hesaplamalar, başka bir yıldızın Betelgeuse'i çevreleyen toz bulutunun içinden geçmesinin 2 bin 170 günlük döngüyü açıklayabileceğine işaret ediyor.

Ekip, yoldaş yıldızın bu döngü içinde toz bulutunu kısa süreliğine dağıtarak Betelgeuse'in parlaklığını artırdığını öne sürüyor. 

Betelgeuse'in bir yoldaşı olabileceği ihtimali daha önce de ortaya atılmıştı. Ancak yeni araştırmayı yürüten ekip 2020'deki parlaklık düşüşünden sonraki gözlemlerin bu teoriyi güçlendirdiğini savunuyor. 

Bilim insanları ayrıca yıldızın çok uzun bir süre boyunca daha süpernova patlaması geçirmeyeceğini düşünüyor.

Araştırmacılar yoldaş yıldızın Güneş'in 1,7 katı kütleye sahip olduğunu tahmin ediyor ancak bir nötron yıldızı da olabilir. 

Bazı yıldızların süpernova patlamasından sonra kendi içine çökmesiyle oluşan nötron yıldızları çok daha yoğun oluyor. 

Yeni çalışmada öne sürülen teori Betelgeuse'le ilgili önemli bir soru işaretini giderme potansiyeli taşısa da doğrulanması için gözlem verilerine ihtiyaç var. 

Independent Türkçe, Live Science, EarthSky, Evrim Ağacı, arXiv