OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

1080p kalitesindeki videoların uzunluğu 1 dakika.

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
TT

OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)

OpenAI'nin yeni Sora teknolojisi, yapay zeka dünyasında, özellikle de metni videoya dönüştürme alanında olağanüstü bir sıçramayı temsil ediyor. Video içeriği oluşturmada yeni bir çağ başlatmak üzere tasarlanan bu yenilikçi teknoloji, basit metin talimatlarıyla bir dakikaya kadar uzunlukta son derece gerçekçi ve yaratıcı videolar oluşturulmasına olanak sağlıyor. Bu yeteneği sayesinde Sora, yapay zekanın dijital medya yaratımında devrim yaratma potansiyeli açısından oldukça ileri seviye bir örnek teşkil ediyor.

Örneğin, Sora'ya şu paragraf veriliyor:

"Zarif bir kadın, sıcak neon ışıkları ve hareketli şehir tabelalarıyla dolu bir Tokyo caddesinde yürümektedir. Siyah deri bir ceket, uzun kırmızı bir elbise, siyah ayakkabılar giyiyor ve siyah bir cüzdan taşıyor. Güneş gözlüğü takıyor ve ruj sürüyor. Kendinden emin ve rahat bir şekilde yürüyor. Sokak nemli ve yansıtıcı, renkli ışıklar ayna etkisi yaratıyor. Etrafta yürüyen bir sürü yaya var."

Sonuç ise bu (OpenAI internet sitesinden):

Yenilikçi yetenekler ve zorluklar

Sora, birden fazla karakter, belirli eylem türleri ve ayrıntılı senaryolar içeren karmaşık sahneler oluşturabiliyor. Tüm bunları yaparken bir kullanıcının komut istemindeki nüansları anlayabiliyor. Dikkat çeken bir özellik de Sora'nın tüm videoyu bir kerede oluşturabilmesi ve böylece özneler görüş alanından çıktığında görünümde meydana gelen değişiklikler gibi tutarsızlıkları ortadan kaldırmasında kendini gösteriyor.

Ancak modelin zayıf yönleri de yok değil. Örneğin, bir kişi elmadan bir ısırık alırken fotoğraflanabilir ancak ısırık izi artık elmanın üzerinde görünmeyebilir. Sora ayrıca sol ve sağı ayırt edememek gibi uzamsal ayrıntılar ve yönlerle başa çıkmakta veya belirli bir kamera yoluna bağlı kalmak gibi zaman içinde gelişen sahnelerin olaylarını tanımlamakta zorluk çekebilir.

Sora'nın tekniğiyle elde edilen sonuçlara bir başka örnek de kendisinden özellikle istenen bu paragrafı videoya çevirmesi (OpenAI internet sitesinden:

"Kamera doğrudan İtalya'nın Burano kentinin renkli binalarına bakıyor. Sevimli bir Dalmaçyalı köpek zemin kattaki bir binanın penceresinden bakıyor. Birçok insan binaların önündeki kanal sokaklarında yürüyor ve bisiklete biniyor."

Araştırma ve geliştirme teknolojileri

Şarku’l Avsat’ın edindiği bilgilere göre Sora, GPT modellerine benzer şekilde sıralı verileri işlemek için kullanılan derin öğrenme mimarisi türlerini kullanarak büyük miktarda veriyi verimli bir şekilde işlemesine olanak tanıyor. Model, videoları ve görüntüleri GPT'deki belirteçlere benzer şekilde veri yamaları kümeleri olarak temsil ederek çeşitli görsel veriler üzerinde eğitilmesine olanak tanır. Veri temsilinin bu şekilde birleştirilmesi sayesinde Sora'nın teknolojisi, süre, doğruluk ve diğer özellikleri daha önce hiç olmadığı kadar verimli bir şekilde ele almasını sağlıyor. Sora ayrıca DALL-E ve GPT modelleri üzerine yapılan araştırmalara dayanıyor ve görsel eğitim verileri için son derece açıklayıcı başlıklar oluşturmak için DALL-E 3'ün geri alma teknolojisini kullanıyor. Bu sayede kullanıcının metin talimatlarını daha doğru bir şekilde takip eden videolar oluşturuluyor. Model ayrıca hareketsiz görüntüleri canlandırabilir veya mevcut videoları ayrıntılara dikkat ederek genişletebilir ve gerçek dünya uygulamalarındaki çok yönlülüğü ve potansiyeli gösterebilir.

Güvenlik ve etik hususlar

Güvenlik ve etiğin öneminin farkında olan OpenAI, Sora'nın ürünlerine entegre edilebilmesi için birçok önemli adım attı. Şirket, X platformundaki bir paylaşımında, şirket içinde yanlış bilgilendirme, nefret içeriği ve önyargı gibi alanlarda uzmanlaşmış bir ekip olan Red Team üyeleriyle iş birliği yaparak, Sora tarafından oluşturulan videoları tanımlayabilen bir sınıflandırma aracı geliştirildiğini bildirdi.

Katılım ve gelecek beklentileri

OpenAI, endişeleri anlamak ve Sora için olumlu kullanım durumlarını belirlemek için küresel çapta politikacılar, eğitimciler ve sanatçılarla etkileşim kurmayı planlıyor. Kapsamlı araştırma ve testlere rağmen, potansiyel faydalı ve zararlı kullanımların tamamı bilinmiyor. OpenAI, zaman içinde daha güvenli yapay zeka sistemleri yaratmada kritik bir unsur olarak gerçek dünya kullanarak öğrenmenin önemine inanıyor.

Sora, yapay zekanın gerçek dünyayı anlama ve simüle etme becerisinde büyük bir ilerlemeyi temsil ediyor ve genel yapay zekaya (AGI) ulaşma yolunda kritik bir adımı işaret ediyor. Sora'nın geliştirilmesi sadece ilgi çekici video içeriği oluşturma potansiyelini göstermekle kalmıyor, aynı zamanda yapay zeka araştırma ve uygulamalarında devam eden zorlukları ve sorumlulukları da vurguluyor.



 Trump’ın Apple ve Samsung’a meydan okuyan telefonu gecikmeye takıldı: Altın renkli T1 hâlâ ortada yok

ABD Başkanı Donald Trump (AP)
ABD Başkanı Donald Trump (AP)
TT

 Trump’ın Apple ve Samsung’a meydan okuyan telefonu gecikmeye takıldı: Altın renkli T1 hâlâ ortada yok

ABD Başkanı Donald Trump (AP)
ABD Başkanı Donald Trump (AP)

İngiliz Financial Times gazetesi, ABD Başkanı Donald Trump’ın grubuna bağlı Trump Mobile şirketinin, altın renkli akıllı telefonunu bu yılın sonuna kadar piyasaya sürme planını ertelediğini yazdı.

Gazeteye göre bu gelişme, ABD’de üretilmiş bir cihazı 499 dolar fiyatla satışa sunarak Apple ve Samsung gibi amiral gemisi markalarla rekabet etmeyi hedefleyen proje için yeni bir gerileme anlamına geliyor. Ancak söz konusu hedefler daha sonra aşağı çekildi.

Şarku’l Avsat’ın Financial Times’’tan aktardığı habere göre Trump Mobile müşteri hizmetleri ekibinin kendilerine yaptığı açıklamada, son dönemdeki hükümetin kapanmasının telefonun lansmanında gecikmeye yol açtığını ve cihazın bu ay piyasaya sürülmeme ihtimalinin “yüksek” olduğunu belirtti.

Haziran ayında duyurulan T1 adlı cihaz, aylık 47,45 dolar ücretli bir mobil hat paketiyle birlikte tanıtılmış ve Trump ailesinin Donald Trump’ın Beyaz Saray’a dönüşünden faydalanmaya yönelik girişimlerinden biri olarak öne çıkmıştı.

Tanıtım süreci, Trump’ın Apple’ın Çinli üreticilere aşırı bağımlı olduğu yönündeki eleştirileri ve iPhone’ların ABD’de üretilmesi çağrılarıyla aynı döneme denk geldi. Trump, bu taleplerin karşılanmaması hâlinde Apple ve Samsung’a yüzde 25 gümrük vergisi uygulanabileceğini söylemişti.

dfgth
Trump markalı akıllı telefon... (AFP)

Trump Mobile, başlangıçta T1 telefonunun Ağustos ayında piyasaya sürüleceğini, ABD’de üretileceğini ve ön sipariş için 100 dolar depozito alınacağını açıklamıştı. Ancak bu iddia, tedarik zinciri analistleri ve sektör uzmanları tarafından şüpheyle karşılandı. Uzmanlar, günümüz koşullarında yalnızca ABD menşeli bileşenlerle geniş kitlelere hitap eden bir akıllı telefon üretmenin neredeyse imkânsız olduğunu vurguladı.

Araştırma şirketi IDC verilerine göre, iPhone’larda kullanılan bileşenlerin yüzde 5’inden azı hâlen ABD’de üretiliyor.

Duyurudan haftalar sonra Trump Mobile, “ABD’de üretim” iddiasından geri adım atarak tanıtım materyallerini güncelledi ve T1’in çıkış tarihini Ağustos 2025’ten yıl sonuna erteledi.

Son dönemde şirket, kendi telefonu yerine Apple ve Samsung markalarına ait ikinci el cihazları satışa sunmaya başladı. Trump Mobile, 2023’te çıkan iPhone 15’i 629 dolardan satarken, sitesinde bu cihazların “makul fiyatlı” olduğu belirtiliyor. Apple’ın geçen yıl piyasaya sürdüğü iPhone 16’nın sıfır fiyatı ise Apple’ın resmî sitesinde 699 dolar. Şirket ayrıca, 2024 başında çıkan Samsung Galaxy S24’ün ikinci el versiyonunu 459 dolardan satışa sunuyor; bu fiyat, Samsung’un kendi sitesindeki ikinci el fiyatı olan 489 doların biraz altında.

Trump Mobile ekibi, tanıtım etkinliğinden bu yana kamuoyuna ayrıntılı açıklama yapmadı. Başkanın oğulları Donald Trump Jr. ve Eric Trump, şirketin cep telefonu sektöründeki “mütevazı performansı” iyileştirmek amacıyla alanın önde gelen isimleriyle iş birliği yaptıklarını söyledi.

Şirkette üst düzey yönetici olarak Pat O’Brien, Eric Thomas ve Don Hendrickson tanıtıldı; ancak bu isimlerin geçmişleri hakkında başlangıçta sınırlı bilgi paylaşıldı. Trump Mobile, Financial Times’a yaptığı açıklamada, cihazlardan sorumlu başkan Eric Thomas’ın Utah eyaletinde Olympus Constructors adlı bir gayrimenkul şirketine sahip olduğunu, Pat O’Brien’ın ise Missouri merkezli bir sigorta şirketi olan InSurety Ventures’ın başkanı olduğunu ve Trump Mobile’ın müşteri hizmetleri hattını yönettiğini doğruladı.

th
T1 telefon (TrumpMobile.com)

Don Hendrickson’ın ise Florida merkezli, nispeten az bilinen bir sanal mobil ağ operatörü olan Liberty Mobile Wireless’ta başkan yardımcısı olarak görev yaptığı ve Trump Mobile paketinin bu şirket tarafından, Miami’deki Trump Tower’dan yönetildiği belirtildi. Haziran ayındaki tanıtım etkinliğinde O’Brien, Hendrickson’ın çağrı cihazları alanında deneyime sahip olduğunu ifade etmişti.


Çinli bilim insanları acıyı algılayabilen elektronik deri geliştirdi

Robotların insanlara teması giderek arttığı için çevrelerini algılama becerilerinin gelişmesi kritik önem taşıyor (Temsili/Unsplash)
Robotların insanlara teması giderek arttığı için çevrelerini algılama becerilerinin gelişmesi kritik önem taşıyor (Temsili/Unsplash)
TT

Çinli bilim insanları acıyı algılayabilen elektronik deri geliştirdi

Robotların insanlara teması giderek arttığı için çevrelerini algılama becerilerinin gelişmesi kritik önem taşıyor (Temsili/Unsplash)
Robotların insanlara teması giderek arttığı için çevrelerini algılama becerilerinin gelişmesi kritik önem taşıyor (Temsili/Unsplash)

Çinli araştırmacılar, insan sinir sisteminden ilham alan bir tasarımla acıyı hissedip tepki verebilen elektronik deri icat etti.

İnsanlar çok sıcak veya keskin bir şeye dokunduğunda duyusal sinirler doğrudan omuriliğe sinyaller gönderiyor ve beyin acıyı tam işlemeden önce, neredeyse anlık bir tepkiyle elin geri çekilmesini sağlıyor. Bu refleks, ciddi yaralanmaları önlediği için kritik rol oynuyor.

Öte yandan insansı robotlar genellikle merkezi işlem birimlerine bağlı çalışıyor. Sensör verileri merkezi işlem birimine iletilip analiz edildikten sonra motor komutlarına dönüştürülüyor. Bu gecikmeler, robotun mekanik aksamında ciddi hasarlara yol açabiliyor.

Robotların özellikle ev ve hastane gibi insanların bulunduğu ortamlarda daha çok faaliyet göstermesi nedeniyle çevreleriyle etkileşiminin iyileştirilmesi amaçlanıyor.

Hong Kong Şehir Üniversitesi'nden bilim insanları, nöromorfik robotik e-deri veya NRE-deri adını verdikleri yeni bir tasarımla robotların tehlikeyi algılama becerilerinde önemli bir gelişme kaydetti. Nöromorfik terimi, yapay sistemlerin insan sinir sisteminin çalışma biçimini taklit etmesini ifade ediyor.

Mevcut elektronik derilerin çoğu, teması algılayabilmesine karşın bunun hasar bırakabilecek bir şey olup olmadığını anlayamıyor.

NRE-deri ise duyusal bilgiyi sinir sistemine benzer şekilde işliyor. 

Bulguları hakemli dergi PNAS'te yayımlanan çalışmaya göre 4 katmandan oluşan derinin en dıştaki katmanı insandaki gibi koruyucu bir yüzey görevi görüyor.

Bunun altında da basıncı, kuvveti ve yapısal bütünlüğü sürekli izleyerek duyusal sinirler gibi davranan sensörler ve devreler var.

Temas gerçekleştiğinde deri, uygulanan basınç hakkında bilgi kodlayan elektriksel sinyaller üretiyor. Normal koşullar altında bu sinyaller merkezi işlemciye yönlendiriliyor.

Ancak basınç, önceden belirlenmiş hasar eşiğine ulaştığında yüksek voltajlı bir sinyal, merkezi işlemciyi atlayarak doğrudan robotun motorlarına gönderiliyor ve örneğin robot kolunu geri çekiyor.  

Bilim insanları, sistemin kolayca onarılabilmesini sağlayacak bir tasarım yaptı. Sistem hasar saptadığı durumlarda operatör bu parçayı çıkarıp yerine yeni donanımı kolayca takabiliyor. 

NRE-deri mevcut haliyle sadece basıncı hissederken, örneğin ısıya aynı tepkileri veremiyor. Ancak sonraki aşamalarda böyle becerilerin de eklenmesi muhtemel.

Araştırma ekibi sistemin hassasiyetini artırarak birden fazla dokunma noktasını işleyebilmesini amaçlıyor. 

Independent Türkçe, Interesting Engineering, Ars Technica, PNAS


OpenAI, tehlikeli yapay zeka için "Hazırlık Şefi" arıyor

Fotoğraf: Reuters
Fotoğraf: Reuters
TT

OpenAI, tehlikeli yapay zeka için "Hazırlık Şefi" arıyor

Fotoğraf: Reuters
Fotoğraf: Reuters

ChatGPT'nin yaratıcısı OpenAI, yapay zekanın tehlikeleriyle başa çıkmak için "hazırlık şefi" pozisyonunda çalışacak birini arıyor.

Şirketin CEO'su Sam Altman, şirketin geliştirdiği teknolojilerin ortaya koyduğu "gerçek zorluklarla" başa çıkmayı hedeflediklerini açıklarken, "Bu stresli bir iş olacak" dedi.

OpenAI, araçlarını tanıtmak ve yatırımı teşvik etmek için teknolojisinin gücünü ve tehlikesini abartmakla zaman zaman suçlanıyor. Ancak son bir yıldır gerçek endişelerin de konusu oluyor.

Bunlar arasında savunmasız kişilerin duygusal kriz zamanlarında yardım almak için ChatGPT gibi yapay zeka sistemlerine yönelmesi ve teknolojinin aslında bu ruh sağlığı sorunlarını daha da kötüleştirebileceği endişeleri yer alıyor.

Altman, yeni pozisyonun duyurusunda bu endişelere işaret etti. X'te, "2025'te, modellerin ruh sağlığı üzerindeki olası etkisinin ön izlemesini gördük. Modellerin kritik güvenlik açıklarını bulmaya başlayacak kadar bilgisayar güvenliğinde iyi hale geldiğini şimdi görüyoruz" diye yazdı.

Gelişen yetenekleri ölçmek için güçlü bir temelimiz var ancak bu yeteneklerin nasıl kötüye kullanılabileceği ve hem ürünlerimizde hem de dünyada bu olumsuzlukları nasıl sınırlayabileceğimiz konusunda daha incelikli bir anlayış ve ölçüme ihtiyaç duyduğumuz bir dünyaya giriyoruz; bu sayede hepimiz muazzam faydalardan yararlanabiliriz. Bu sorular zor ve emsal teşkil eden çok az örnek var; kulağa hoş gelen birçok fikrin bazı gerçek uç vakaları var.

OpenAI, yeni yapay zeka modellerinin tehlikelerinin "giderek karmaşıklaşan güvenlik önlemleri"yle sınırlandırılmasını sağlamayı amaçlayan hazırlık çalışmalarına halihazırda işaret etmişti. OpenAI'ın ilanına göre, yeni iş "güvenlik standartlarımızın geliştirdiğimiz sistemlerin yetenekleriyle denk olması için bu programı genişletecek, güçlendirecek ve yönlendirecek".

Aynı ilana göre işe alınan kişiye 555 bin dolarlık maaşın yanı sıra OpenAI'dan hisse de verilecek.

Independent Türkçe