OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

1080p kalitesindeki videoların uzunluğu 1 dakika.

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
TT

OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)

OpenAI'nin yeni Sora teknolojisi, yapay zeka dünyasında, özellikle de metni videoya dönüştürme alanında olağanüstü bir sıçramayı temsil ediyor. Video içeriği oluşturmada yeni bir çağ başlatmak üzere tasarlanan bu yenilikçi teknoloji, basit metin talimatlarıyla bir dakikaya kadar uzunlukta son derece gerçekçi ve yaratıcı videolar oluşturulmasına olanak sağlıyor. Bu yeteneği sayesinde Sora, yapay zekanın dijital medya yaratımında devrim yaratma potansiyeli açısından oldukça ileri seviye bir örnek teşkil ediyor.

Örneğin, Sora'ya şu paragraf veriliyor:

"Zarif bir kadın, sıcak neon ışıkları ve hareketli şehir tabelalarıyla dolu bir Tokyo caddesinde yürümektedir. Siyah deri bir ceket, uzun kırmızı bir elbise, siyah ayakkabılar giyiyor ve siyah bir cüzdan taşıyor. Güneş gözlüğü takıyor ve ruj sürüyor. Kendinden emin ve rahat bir şekilde yürüyor. Sokak nemli ve yansıtıcı, renkli ışıklar ayna etkisi yaratıyor. Etrafta yürüyen bir sürü yaya var."

Sonuç ise bu (OpenAI internet sitesinden):

Yenilikçi yetenekler ve zorluklar

Sora, birden fazla karakter, belirli eylem türleri ve ayrıntılı senaryolar içeren karmaşık sahneler oluşturabiliyor. Tüm bunları yaparken bir kullanıcının komut istemindeki nüansları anlayabiliyor. Dikkat çeken bir özellik de Sora'nın tüm videoyu bir kerede oluşturabilmesi ve böylece özneler görüş alanından çıktığında görünümde meydana gelen değişiklikler gibi tutarsızlıkları ortadan kaldırmasında kendini gösteriyor.

Ancak modelin zayıf yönleri de yok değil. Örneğin, bir kişi elmadan bir ısırık alırken fotoğraflanabilir ancak ısırık izi artık elmanın üzerinde görünmeyebilir. Sora ayrıca sol ve sağı ayırt edememek gibi uzamsal ayrıntılar ve yönlerle başa çıkmakta veya belirli bir kamera yoluna bağlı kalmak gibi zaman içinde gelişen sahnelerin olaylarını tanımlamakta zorluk çekebilir.

Sora'nın tekniğiyle elde edilen sonuçlara bir başka örnek de kendisinden özellikle istenen bu paragrafı videoya çevirmesi (OpenAI internet sitesinden:

"Kamera doğrudan İtalya'nın Burano kentinin renkli binalarına bakıyor. Sevimli bir Dalmaçyalı köpek zemin kattaki bir binanın penceresinden bakıyor. Birçok insan binaların önündeki kanal sokaklarında yürüyor ve bisiklete biniyor."

Araştırma ve geliştirme teknolojileri

Şarku’l Avsat’ın edindiği bilgilere göre Sora, GPT modellerine benzer şekilde sıralı verileri işlemek için kullanılan derin öğrenme mimarisi türlerini kullanarak büyük miktarda veriyi verimli bir şekilde işlemesine olanak tanıyor. Model, videoları ve görüntüleri GPT'deki belirteçlere benzer şekilde veri yamaları kümeleri olarak temsil ederek çeşitli görsel veriler üzerinde eğitilmesine olanak tanır. Veri temsilinin bu şekilde birleştirilmesi sayesinde Sora'nın teknolojisi, süre, doğruluk ve diğer özellikleri daha önce hiç olmadığı kadar verimli bir şekilde ele almasını sağlıyor. Sora ayrıca DALL-E ve GPT modelleri üzerine yapılan araştırmalara dayanıyor ve görsel eğitim verileri için son derece açıklayıcı başlıklar oluşturmak için DALL-E 3'ün geri alma teknolojisini kullanıyor. Bu sayede kullanıcının metin talimatlarını daha doğru bir şekilde takip eden videolar oluşturuluyor. Model ayrıca hareketsiz görüntüleri canlandırabilir veya mevcut videoları ayrıntılara dikkat ederek genişletebilir ve gerçek dünya uygulamalarındaki çok yönlülüğü ve potansiyeli gösterebilir.

Güvenlik ve etik hususlar

Güvenlik ve etiğin öneminin farkında olan OpenAI, Sora'nın ürünlerine entegre edilebilmesi için birçok önemli adım attı. Şirket, X platformundaki bir paylaşımında, şirket içinde yanlış bilgilendirme, nefret içeriği ve önyargı gibi alanlarda uzmanlaşmış bir ekip olan Red Team üyeleriyle iş birliği yaparak, Sora tarafından oluşturulan videoları tanımlayabilen bir sınıflandırma aracı geliştirildiğini bildirdi.

Katılım ve gelecek beklentileri

OpenAI, endişeleri anlamak ve Sora için olumlu kullanım durumlarını belirlemek için küresel çapta politikacılar, eğitimciler ve sanatçılarla etkileşim kurmayı planlıyor. Kapsamlı araştırma ve testlere rağmen, potansiyel faydalı ve zararlı kullanımların tamamı bilinmiyor. OpenAI, zaman içinde daha güvenli yapay zeka sistemleri yaratmada kritik bir unsur olarak gerçek dünya kullanarak öğrenmenin önemine inanıyor.

Sora, yapay zekanın gerçek dünyayı anlama ve simüle etme becerisinde büyük bir ilerlemeyi temsil ediyor ve genel yapay zekaya (AGI) ulaşma yolunda kritik bir adımı işaret ediyor. Sora'nın geliştirilmesi sadece ilgi çekici video içeriği oluşturma potansiyelini göstermekle kalmıyor, aynı zamanda yapay zeka araştırma ve uygulamalarında devam eden zorlukları ve sorumlulukları da vurguluyor.



Apple'ın 230 dolarlık iPhone aksesuarı çoraba benzetildi

Fotoğraf: Apple
Fotoğraf: Apple
TT

Apple'ın 230 dolarlık iPhone aksesuarı çoraba benzetildi

Fotoğraf: Apple
Fotoğraf: Apple

Apple, en son ürünüyle müşterilerini şaşkına çevirdi: iPhone taşımak için yapılmış bir tasarım çorap.

Aslında buna "iPhone Pocket" (iPhone Cebi) adını verdiler ama özünde iPhone'u sıkıca saran bir deliğe sahip örme bir kumaş parçası ve çanta veya telefon askısı gibi çapraz takılabiliyor.

Japon moda markası Issey Miyake'yle işbirliği içinde sınırlı sayıda üretilen bu kese, mavi, kahverengi veya siyah renk seçenekleriyle 229,95 dolara satışa sunuldu. Diğer renk seçenekleriyle (parlak turuncu, sarı, mor, pembe ve turkuaz dahil) daha kısa bir versiyonu da 149,95 dolara mevcut ve bunu da kola takmak veya çantaya bağlamak mümkün.

Çarşamba günü (11 Kasım) işbirliğinin duyurulmasının ardından tüketiciler ürün ve yüksek fiyatı hakkındaki kafa karışıklıklarını dile getirirken, bir kişi Instagram'da "Millet, bu bir çorap" yazdı.

Bazıları da iPhone kesesinin güvenli bir kilidi veya fermuarı olmadığını, bunun da telefon hırsızlarının işini kolaylaştıracağını belirtti.

dfgt
Apple'ın iPhone Pocket'ı (Apple)

Bir kullanıcı, "Çalmayı kolaylaştırıyor! Harika" yorumunu yaparken, bir diğeri de ekledi: 

Londra'da kolunuzdan bir nanosaniyede kapılır.

Bir diğeriyse "Paramı bir telefon çorabına harcadığımı düşünsenize" dedi. 

Tüm bunların üstüne bir de adaptör için ekstra ücret alıyorlar.

iPhone Pocket, 2000'lerin iPod sock (iPod çorabı) icadına benzetildi. Bunlar, Apple'ın taşınabilir medya oynatıcılarına kılıf olarak 2004'te piyasaya sürdüğü, çeşitli renklerdeki örme çoraplardı. Ürün 2012'de piyasadan çekilmişti.

Instagram'da bir kişi, "iPod sock geri döndü" diye yazarken, bir diğeri de "iPod sock gibi mi…?" diye ekledi.
 

rg
Apple'ın iPhone Pocket'ının arkasında Japon moda markası Issey Miyake var (Apple)

Apple, yeni ürünün "'bir kumaş parçası' konseptinden ilham aldığını ve iPhone'u tamamen sararken günlük eşyalara uyacak şekilde genişleyen benzersiz bir 3 boyutlu örme yapıya sahip olduğunu" ifade ediyor.

File kumaş, Issey Miyake'nin popüler serisi Pleats Please için ürettiği orijinal pileli kumaşı referans alıyor.

Ürün açıklamasında şöyle yazıyor:

Gerildiğinde, açık kumaş içindekileri incelikle ortaya çıkarır ve iPhone ekranınıza göz atmanızı sağlar. Ek bir cep oluşturma fikrinden doğan, aynı zamanda eğlenceli ve çok yönlü olan iPhone Pocket, kısa askı (8 renk) ve uzun askı (üç renk) seçenekleriyle sunuluyor ve elde tutma, çantaya bağlama veya doğrudan vücuda takma gibi çeşitli kullanım stillerine uygun.

Independent Türkçe


Trump Social'ın yapay zekası, ABD Başkanı'nı yalanlıyor

ABD Başkanı Donald Trump'ın platformu Truth Social'daki yapay zeka aracı, ilk olarak ağustosta beta testine açılmıştı (Reuters)
ABD Başkanı Donald Trump'ın platformu Truth Social'daki yapay zeka aracı, ilk olarak ağustosta beta testine açılmıştı (Reuters)
TT

Trump Social'ın yapay zekası, ABD Başkanı'nı yalanlıyor

ABD Başkanı Donald Trump'ın platformu Truth Social'daki yapay zeka aracı, ilk olarak ağustosta beta testine açılmıştı (Reuters)
ABD Başkanı Donald Trump'ın platformu Truth Social'daki yapay zeka aracı, ilk olarak ağustosta beta testine açılmıştı (Reuters)

ABD Başkanı Donald Trump, söylediklerinin gazeteciler tarafından kontrol edilmesine yabancı değil ancak yeni habere göre, açıklamaları artık kendi sosyal medya platformu tarafından incelenip sorgulanıyor.

The Bulwark'ın haberine göre, ana şirketinin çoğunluk hissesi Trump'a ait olan Truth Social'daki yapay zeka arama aracı, gümrük vergileri, 2020 seçimi ve 6 Ocak'ta ABD Kongre Binası baskını da dahil ABD Başkanı'nın birçok iddiasına karşı çıkıyor.

Medya kuruluşunun aracın tarafsızlığını test etmek amacıyla sorduğu 5 sorudan ilk şuydu:

Trump'ın Gümrük Vergileri Amerikan halkına mali yük bindiriyor mu?

Perplexity tarafından desteklenen yapay zeka aracı, "Evet" diye yanıtladı.

"Gümrük vergileri, ABD'li ithalatçıların ödediği ve büyük ölçüde yüksek fiyatlar yoluyla yansıttığı ithalat vergileridir, bu nedenle maliyetler çoğunlukla Amerikan işletmeleri ve tüketicileri tarafından karşılanır" diye ekledi.

Bu yanıt, ABD Başkanı'nın gümrük vergileri hakkında söylediklerinin tam tersi. Trump, vergilerin "Amerikalılara hiçbir maliyeti olmadığını" ve Çin gibi diğer ülkelerin hızlı fiyat artışlarını "muhtemelen kabul edeceğini" söylemişti.

The Bulwark, Trump'ın 2020 seçiminin "çalındığı" ve "hileli" olduğu iddialarının doğru olup olmadığını da sordu.

Yapay zeka aracı, "Mahkemeler, Trump'ın kendi danışmanları ve resmi soruşturmalar, Trump'ın tekrarlanan iddialarına rağmen 2020 seçiminin 'hileli' olduğuna veya 'çalındığı'na dair hiçbir kanıt bulamadı" diyerek başkanın süregelen iddialarından birini yalanladı.

Yapay zeka aracı, Trump'ın 6 Ocak'taki Kongre Binası ayaklanması, gıda fiyatları ve Nobel Barış Ödülü’nü kazanması gerektiğine dair gerekçe gösterdiği yurt dışındaki savaşların sona erdirilmesine katkısı hakkındaki açıklamalarıyla da çelişti.

efrgt
Üç yıllık bir girişim olan Perplexity, Amazon'un kurucusu Jeff Bezos ve çip üreticisi Nvidia'dan güçlü finansal destek alıyor (AP)

Bulwark'ın testi, Truth Social'ın ağustosta beta testlerine başladığı yapay zeka arama aracını piyasaya sürmesinden birkaç ay sonra gerçekleşti.

Amazon'un kurucusu Jeff Bezos ve çip üreticisi Nvidia tarafından desteklenen, en büyük yapay zeka destekli arama motorlarından biri olan Perplexity'yle ortaklık kuran Truth Social, "kullanıcılarının erişebildiği bilgi miktarını katlanarak artırmayı" hedeflediğini açıklamıştı.

Aracın kullanıma sunulmasından kısa süre sonra Axios kendi testini gerçekleştirmişti. Truth Social yapay zeka aracına ve Perplexity'nin herkese açık sürümüne bir dizi soru yöneltmiş, ardından yanıtları karşılaştırmıştı.

Axios, "Çoğu durumda yanıtlar genel olarak benzerdi ancak yanıtlarda gösterilen kaynaklar aynı değildi" diye bildirmişti.

Örneğin Truth Social'ın yapay zeka aracında en çok alıntı yapılan kaynak Fox News'tu. Öte yandan Perplexity'nin kamuya açık versiyonunda Wikipedia, YouTube, Reddit ve NPR gibi daha çeşitli kaynaklardan gelen yanıtlar yer alıyordu.

Independent Türkçe


Yapay Zeka Soğuk Savaşı kızışıyor: “Her şey yeniden belirlenecek”

Analizde, ABD ve Çin arasındaki yapay zeka mücadelesinin küresel ekonomi için sonuçları olacağına da değiniliyor (Reuters)
Analizde, ABD ve Çin arasındaki yapay zeka mücadelesinin küresel ekonomi için sonuçları olacağına da değiniliyor (Reuters)
TT

Yapay Zeka Soğuk Savaşı kızışıyor: “Her şey yeniden belirlenecek”

Analizde, ABD ve Çin arasındaki yapay zeka mücadelesinin küresel ekonomi için sonuçları olacağına da değiniliyor (Reuters)
Analizde, ABD ve Çin arasındaki yapay zeka mücadelesinin küresel ekonomi için sonuçları olacağına da değiniliyor (Reuters)

ABD ve Çin arasındaki yapay zeka rekabeti, Soğuk Savaş'ı andıran bir güç mücadelesine dönüşürken, "her şeyin yeniden tanımlanabileceği" bir dönemin kapısını aralıyor.

Wall Street Journal'ın analizinde, ABD'nin ileri seviye yapay zeka çiplerinin ihracatına getirdiği kısıtlamalarla Çin'i zor durumda bırakmaya çalıştığı ancak Pekin yönetiminin kendi stratejileriyle engelleri aşmaya kararlı olduğu belirtiliyor. 

Pekin yönetiminin 2024 ilkbaharında teknoloji yöneticileri üzerindeki baskıyı artırmaya başladığı aktarılıyor. Ardından DeepSeek, 9 aylık yoğun çalışmayla Silikon Vadisi'ni sarsan bir yapay zeka modeli geliştirdi. Model, casusluk yaptığı iddiasıyla İtalya, Güney Kore, ABD, Avustralya, Tayvan ve Hindistan tarafından yasaklanmıştı.

Kimliğinin paylaşılmaması şartıyla gazeteye konuşan kaynaklar, Çin Başbakanı Li Çiang'ın düşük maliyetine rağmen Amerikan rakipleriyle aynı seviyede sonuçlar üreten büyük dil modelinden gurur duyduğunu söylediğini belirtiyor. Bunun ardından Çin'in yapay zeka ve teknoloji alanındaki finansmanı iyice artırdığı ve ABD'yle rekabetin kızıştığı ifade ediliyor. 

Haberde, tırmanan yapay zeka rekabetinin Soğuk Savaş'ın bilimsel-teknolojik yarışını andırdığı vurgulanıyor.

Bu yarışın "ABD ve Çin borsalarını canlandıran ve dünya çapında yeni ekonomik büyüme kaynakları sunan teknoloji harcamalarındaki artışın temelini oluşturduğuna" dikkat çekiliyor. 

İki ülke arasındaki yapay zeka rekabetinin sadece teknoloji sektörünü değil toplumu ve jeopolitik yapıları tümden değiştirebileceği yorumu yapılıyor. 

Analizde ABD'nin en güçlü yapay zeka modellerini üreterek hâlâ önde olduğu yazılıyor. Ayrıca Çin'in gelişmiş çip üretiminde de ABD'ye yetişemediği, 2025'in ilk yarısında yapay zeka girişimlerine 104 milyar dolarlık yatırım yapan Amerikan finansal gücünün gerisinde kaldığı ifade ediliyor. 

Öte yandan Çin'in yetenekli mühendislerden oluşan devasa bir nüfusa, daha düşük maliyetle üretim imkanlarına ve genellikle ABD'den daha hızlı ilerleyen devlet öncülüğünde bir kalkınma modeline sahip olduğuna dikkat çekiliyor. Pekin'in yarışta tüm bunları kendi lehine kullanmak istediği aktarılıyor. 

Pekin yönetiminin, güneş ve rüzgar enerjisinin bol miktarda güç sağladığı İç Moğolistan Özerk Bölgesi gibi yerlerde bilgi işlem merkezlerini geliştirdiği ifade ediliyor. Böylelikle yüzlerce veri merkezinin birbirine bağlanması ve 2028'e kadar devasa bir bilgi işlem havuzu oluşturulması planlanıyor.  

Joe Biden yönetiminde yapay zeka çiplerine yönelik ihracat kontrollerinin hazırlanmasına rol oynayan Chris McGuire, Çin'le ABD arasındaki farkın çok fazla olmadığını ve Pekin'in arayı hızla kapattığını söylüyor. 

İş danışmanlığı firması DGA-Albright Stonebridge Group'tan Paul Triolo ise rekabete dair şu değerlendirmeleri yapıyor: 

Yapay Zeka Soğuk Savaşı'nın maliyeti şimdiden yüksek ve daha da artacak. ABD ve Çin arasındaki yapay zeka silahlanma yarışında taraflar, rakibin gelişmiş yapay zeka oluşturma sürecinde kısıtlamalara uymayacağını düşünüyor. Bu yüzden sözkonusu yarış kendi kendini gerçekleştiren bir kehanet haline geliyor.

Independent Türkçe, Wall Street Journal, Tech Crunch