OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

1080p kalitesindeki videoların uzunluğu 1 dakika.

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
TT

OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)

OpenAI'nin yeni Sora teknolojisi, yapay zeka dünyasında, özellikle de metni videoya dönüştürme alanında olağanüstü bir sıçramayı temsil ediyor. Video içeriği oluşturmada yeni bir çağ başlatmak üzere tasarlanan bu yenilikçi teknoloji, basit metin talimatlarıyla bir dakikaya kadar uzunlukta son derece gerçekçi ve yaratıcı videolar oluşturulmasına olanak sağlıyor. Bu yeteneği sayesinde Sora, yapay zekanın dijital medya yaratımında devrim yaratma potansiyeli açısından oldukça ileri seviye bir örnek teşkil ediyor.

Örneğin, Sora'ya şu paragraf veriliyor:

"Zarif bir kadın, sıcak neon ışıkları ve hareketli şehir tabelalarıyla dolu bir Tokyo caddesinde yürümektedir. Siyah deri bir ceket, uzun kırmızı bir elbise, siyah ayakkabılar giyiyor ve siyah bir cüzdan taşıyor. Güneş gözlüğü takıyor ve ruj sürüyor. Kendinden emin ve rahat bir şekilde yürüyor. Sokak nemli ve yansıtıcı, renkli ışıklar ayna etkisi yaratıyor. Etrafta yürüyen bir sürü yaya var."

Sonuç ise bu (OpenAI internet sitesinden):

Yenilikçi yetenekler ve zorluklar

Sora, birden fazla karakter, belirli eylem türleri ve ayrıntılı senaryolar içeren karmaşık sahneler oluşturabiliyor. Tüm bunları yaparken bir kullanıcının komut istemindeki nüansları anlayabiliyor. Dikkat çeken bir özellik de Sora'nın tüm videoyu bir kerede oluşturabilmesi ve böylece özneler görüş alanından çıktığında görünümde meydana gelen değişiklikler gibi tutarsızlıkları ortadan kaldırmasında kendini gösteriyor.

Ancak modelin zayıf yönleri de yok değil. Örneğin, bir kişi elmadan bir ısırık alırken fotoğraflanabilir ancak ısırık izi artık elmanın üzerinde görünmeyebilir. Sora ayrıca sol ve sağı ayırt edememek gibi uzamsal ayrıntılar ve yönlerle başa çıkmakta veya belirli bir kamera yoluna bağlı kalmak gibi zaman içinde gelişen sahnelerin olaylarını tanımlamakta zorluk çekebilir.

Sora'nın tekniğiyle elde edilen sonuçlara bir başka örnek de kendisinden özellikle istenen bu paragrafı videoya çevirmesi (OpenAI internet sitesinden:

"Kamera doğrudan İtalya'nın Burano kentinin renkli binalarına bakıyor. Sevimli bir Dalmaçyalı köpek zemin kattaki bir binanın penceresinden bakıyor. Birçok insan binaların önündeki kanal sokaklarında yürüyor ve bisiklete biniyor."

Araştırma ve geliştirme teknolojileri

Şarku’l Avsat’ın edindiği bilgilere göre Sora, GPT modellerine benzer şekilde sıralı verileri işlemek için kullanılan derin öğrenme mimarisi türlerini kullanarak büyük miktarda veriyi verimli bir şekilde işlemesine olanak tanıyor. Model, videoları ve görüntüleri GPT'deki belirteçlere benzer şekilde veri yamaları kümeleri olarak temsil ederek çeşitli görsel veriler üzerinde eğitilmesine olanak tanır. Veri temsilinin bu şekilde birleştirilmesi sayesinde Sora'nın teknolojisi, süre, doğruluk ve diğer özellikleri daha önce hiç olmadığı kadar verimli bir şekilde ele almasını sağlıyor. Sora ayrıca DALL-E ve GPT modelleri üzerine yapılan araştırmalara dayanıyor ve görsel eğitim verileri için son derece açıklayıcı başlıklar oluşturmak için DALL-E 3'ün geri alma teknolojisini kullanıyor. Bu sayede kullanıcının metin talimatlarını daha doğru bir şekilde takip eden videolar oluşturuluyor. Model ayrıca hareketsiz görüntüleri canlandırabilir veya mevcut videoları ayrıntılara dikkat ederek genişletebilir ve gerçek dünya uygulamalarındaki çok yönlülüğü ve potansiyeli gösterebilir.

Güvenlik ve etik hususlar

Güvenlik ve etiğin öneminin farkında olan OpenAI, Sora'nın ürünlerine entegre edilebilmesi için birçok önemli adım attı. Şirket, X platformundaki bir paylaşımında, şirket içinde yanlış bilgilendirme, nefret içeriği ve önyargı gibi alanlarda uzmanlaşmış bir ekip olan Red Team üyeleriyle iş birliği yaparak, Sora tarafından oluşturulan videoları tanımlayabilen bir sınıflandırma aracı geliştirildiğini bildirdi.

Katılım ve gelecek beklentileri

OpenAI, endişeleri anlamak ve Sora için olumlu kullanım durumlarını belirlemek için küresel çapta politikacılar, eğitimciler ve sanatçılarla etkileşim kurmayı planlıyor. Kapsamlı araştırma ve testlere rağmen, potansiyel faydalı ve zararlı kullanımların tamamı bilinmiyor. OpenAI, zaman içinde daha güvenli yapay zeka sistemleri yaratmada kritik bir unsur olarak gerçek dünya kullanarak öğrenmenin önemine inanıyor.

Sora, yapay zekanın gerçek dünyayı anlama ve simüle etme becerisinde büyük bir ilerlemeyi temsil ediyor ve genel yapay zekaya (AGI) ulaşma yolunda kritik bir adımı işaret ediyor. Sora'nın geliştirilmesi sadece ilgi çekici video içeriği oluşturma potansiyelini göstermekle kalmıyor, aynı zamanda yapay zeka araştırma ve uygulamalarında devam eden zorlukları ve sorumlulukları da vurguluyor.



Gemini'dan Kişisel Zeka: Maillerinizi okuyacak, YouTube'unuza erişecek

Gemini'ın yeni özelliği, sorulara daha iyi yanıt vermek için telefondaki aktivitelerden bilgi toplayan Apple Intelligence'a benziyor (Reuters)
Gemini'ın yeni özelliği, sorulara daha iyi yanıt vermek için telefondaki aktivitelerden bilgi toplayan Apple Intelligence'a benziyor (Reuters)
TT

Gemini'dan Kişisel Zeka: Maillerinizi okuyacak, YouTube'unuza erişecek

Gemini'ın yeni özelliği, sorulara daha iyi yanıt vermek için telefondaki aktivitelerden bilgi toplayan Apple Intelligence'a benziyor (Reuters)
Gemini'ın yeni özelliği, sorulara daha iyi yanıt vermek için telefondaki aktivitelerden bilgi toplayan Apple Intelligence'a benziyor (Reuters)

Google, yapay zeka aracı Gemini'ın Kişisel Zeka (Personal Intelligence) özelliğini tanıttı. Araç bu yenilikle birlikte Gmail ve YouTube gibi hesapların verisine erişebilecek.

Teknoloji devi yapay zekanın kişiselleştirilmiş cevaplar vermesi yolunda önemli bir adım attı. Gemini, kullanıcıların isteklerini daha iyi karşılayabilmek için Gmail, YouTube, Fotoğraflar ve Arama gibi diğer Google hesaplarının verisini kullanacak.

Halihazırda beta versiyonu ABD'deki AI Pro ve AI Ultra üyelerine sunulan Kişisel Zeka özelliğinin, zamanla daha fazla kullanıcının erişimine açılması bekleniyor.

Yeni özelliğin aktivasyonu ve hangi uygulamalara erişeceği tamamen kullanıcının seçimine bırakılıyor.

Gemini uygulamalardan gelen bilgilere zaten başvuruyordu ancak Kişisel Zeka bunu daha ileriye taşıyor. 

Örneğin bir tatil programı oluşturmasını istediğinizde e-posta ve fotoğraflarınızı tarayarak zevklerinize daha uygun bir yanıt verecek. 

Gemini, bilgileri nereden aldığını da belirtecek ve verileri her yanıtı kişiselleştirmek için kullanmayacak, yalnızca gerek duyduğunda bunu yapacak. 

Google yayımladığı blog gönderisinde, modelin sağlığınız gibi hassas veriler hakkında proaktif varsayımlarda bulunmaktan kaçınacak şekilde tasarlandığını da ekliyor.

Ayrıca sonuçtan memnun kalmadığınızda yanıtlarını kişiselleştirmemesini veya tekrar denemesini de isteyebilirsiniz. 

Şirket sözkonusu hesaplardaki kişisel verilerin zaten Google'da güvenle saklandığını ve hassas bilgileri başka bir yere göndermek gerekmediğini ifade ediyor.

Bu bilgilerin Gemini'ı eğitmek için kullanılmadığının da altını çiziyor. Gmail'deki yazışmalar veya fotoğraflar yanıtları verirken sadece referans olarak kullanılıyor.

Google, sistemin hassas bilgileri öğrenmek için değil, bu verilere erişmeniz gerektiğinde "bunu anlayıp onları bulmak üzere" eğitildiğini belirtiyor.

Beta versiyonu test edilip sınırlı bir şekilde kullanıma sunulsa da Google hâlâ geliştirilmeye ihtiyaç olabileceğini söylüyor. 

Örneğin model alakasız konular arasında bağlantılar kurarak "aşırı kişiselleştirme" yapabilir veya yanlış yanıtlar verebilir. Şirket kullanıcılardan bu yanıtlara olumsuz karşılık vererek geri bildirimde bulunmasını rica ediyor.

Google özelliği ileride ücretsiz kullanıcılara da sunmayı planladıklarını belirtiyor.

Independent Türkçe, ZDNET, Google


X, Grok’un kişileri çıplak gösteren görseller üretmesini engellediğini doğruladı

X, Grok aracıyla görsel oluşturma özelliğinin hâlâ yalnızca ücretli abonelere açık olduğunu açıkladı (Reuters)
X, Grok aracıyla görsel oluşturma özelliğinin hâlâ yalnızca ücretli abonelere açık olduğunu açıkladı (Reuters)
TT

X, Grok’un kişileri çıplak gösteren görseller üretmesini engellediğini doğruladı

X, Grok aracıyla görsel oluşturma özelliğinin hâlâ yalnızca ücretli abonelere açık olduğunu açıkladı (Reuters)
X, Grok aracıyla görsel oluşturma özelliğinin hâlâ yalnızca ücretli abonelere açık olduğunu açıkladı (Reuters)

Elon Musk’a ait sosyal medya platformu X, yapay zekâ aracı Grok’un “gerçek kişileri çıplak gösteren” görseller üretmesini engellemeye yönelik önlemler aldığını açıkladı. Ancak platformun, hakkında soruşturma yürüten birçok ülkedeki yetkilileri ikna etmesi gerektiği belirtiliyor.

X’ten çarşamba günü yapılan açıklamada, “Grok’un gerçek kişilere ait görüntüleri değiştirerek müstehcen içerik oluşturmasını engellemek amacıyla teknik önlemler aldık” denildi.

Açıklamada, bu kısıtlamaların “ücretli aboneler dâhil tüm kullanıcılar” için geçerli olduğu vurgulandı. Ancak metinde belirsizlik de yer aldı; söz konusu görsellerin “oluşturulmasına” yönelik yasağın yalnızca bunun yasa dışı kabul edildiği bölgelerde “coğrafi kısıtlama” yoluyla uygulandığı ifade edildi.

Avrupa Birliği ve Birleşik Krallık, açıklanan ek önlemleri temkinli bir şekilde memnuniyetle karşıladıklarını duyurdu. Ancak bu önlemlerin ayrıntıları henüz kamuoyuyla paylaşılmadı.

Avrupa Komisyonu’nun dijital işler birimi sözcüsü Thomas Regnier, “Eğer bu değişiklikler etkili olmazsa, Komisyon sahip olduğu tüm yasal yetkileri kullanmaktan çekinmeyecektir” dedi. Bu yetkiler arasında para cezaları uygulanması ve hatta sosyal ağın AB içindeki faaliyetlerinin askıya alınması da bulunuyor.

Birleşik Krallık Başbakanı Keir Starmer ise parlamentoda yaptığı konuşmada, “Bu sabah X’in, Britanya yasalarına tam uyum sağlamak için adımlar attığı bilgisi verildi. Eğer durum buysa bu olumlu, ancak geri adım atmayacağız; harekete geçmeleri gerekiyor” ifadelerini kullandı.

X, xAI şirketi tarafından geliştirilen Grok aracılığıyla görsel oluşturma özelliğinin hâlen yalnızca ücretli abonelere açık olduğunu da doğruladı.

Platform, ocak ayı başında “yasadışı içeriklere karşı; silme, hesapları kalıcı olarak askıya alma ve yerel makamlarla iş birliği dâhil olmak üzere önlemler aldığını” açıklamıştı. Ancak bu açıklamanın ardından, artan tepkilere ve resmi yaptırım tehditlerine rağmen sessiz kalması dikkat çekmişti.


Elon Musk, 7 bin 500 yeni Starlink uydusu için izin aldı

Starlink uydularının güzergahları (NASA Bilimsel Görselleştirme Stüdyosu)
Starlink uydularının güzergahları (NASA Bilimsel Görselleştirme Stüdyosu)
TT

Elon Musk, 7 bin 500 yeni Starlink uydusu için izin aldı

Starlink uydularının güzergahları (NASA Bilimsel Görselleştirme Stüdyosu)
Starlink uydularının güzergahları (NASA Bilimsel Görselleştirme Stüdyosu)

Elon Musk'ın SpaceX şirketi, uzay tabanlı internet ağını genişletmek için 7 bin 500 adet daha Starlink uydusu fırlatma izni aldı.

ABD Federal İletişim Komisyonu (FCC) ayrıca, şirketin geniş bant ve mobil hizmetlerini dünyanın daha fazla bölgesine yaymasına imkan sağlayacak Gen2 uydularına yönelik yükseltmeleri de onayladı.

ABD düzenleyici kurumu yaptığı açıklamada, "Bu izin kapsamında SpaceX, toplam uydu sayısını dünya çapında 15 bine çıkaracak şekilde 7 bin 500 adet daha Gen2 Starlink uydusu inşa etme, konuşlandırma ve işletme yetkisine sahip oldu" dedi.

Bu genişleme, SpaceX'in gelişmiş mobil ve uzaydan ek kapsama alanı da dahil yüksek hızlı, düşük gecikmeli internet hizmetini küresel olarak sunmasını sağlayacak.

Dünyanın en zengin insanı, halihazırda alçak Dünya yörüngesinde 9 binden fazla Starlink uydusundan oluşan bir ağ ile tüm aktif uyduların üçte ikisinden fazlasını kontrol ediyor.

Bu son onay, 2022'de 7 bin 500 Starlink uydusuna izin veren ve toplam yetkilendirilmiş uydu sayısını 2031'e kadar 15 bine çıkaran kararın ardından geldi.

Musk, onay beklemek koşuluyla Starlink ağını nihayetinde 34 bin 400 uyduya genişletmeyi umuyor.

Görsel kaldırıldı.

En son karar, SpaceX'in hem Sabit Uydu Hizmeti (FSS) hem de Mobil Uydu Hizmeti (MSS) genelinde kapsama alanını daha da artırmak için daha fazla frekansta faaliyet göstermesine olanak tanıyacak.

Rakip uydu şirketleri, SpaceX'in kapsama alanını genişletme başvurusuna karşı çıkmış, Viasat ve GlobalStar geçen hafta başvuruyu engellemek için FCC'ye dilekçe vermişti.

Viasat'ın dilekçesinde, "SpaceX'in işletme yetkisinin bu önerilen genişlemesi, diğer operatörlerin sınırlı yörünge ve spektrum kaynaklarına rekabetçi bir şekilde erişmesini ve kullanmasını engelleme konusunda ona daha da büyük bir kabiliyet ve teşvik verecektir" denmişti.

Aynı zamanda, önerilen operasyonlar diğer spektrum kullanıcıları ve hizmet verdikleri müşteriler için aşılması mümkün olmayan parazit ve sinyal karışması riskleri yaratacak, diğer operatörlerin kıt spektral ve yörünge kaynaklarına adil bir şekilde erişmesini ve kullanmasını engelleyecek, rekabeti ve yeniliği baltalayacak ve engelleyecek ve kamuya başka şekillerde zarar verecektir.

FCC'nin 7 bin 500 Starlink uydusu için verdiği onay, uydu imhası ve çarpışma önlemeyle ilgili raporlama yükümlülüklerini de içeriyor.

Geçen ay SpaceX, yörüngede arıza yaşayan Starlink uydularından birinin kontrolünü kaybettiğini açıklamıştı.

Özel uzay şirketi ayrıca, bir başka Starlink uydusunun Çinli bir rakibin uydu fırlatmasıyla çarpışmaya 200 metre kadar yaklaştığını da bildirmişti.

Independent Türkçe