OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

1080p kalitesindeki videoların uzunluğu 1 dakika.

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
TT

OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)

OpenAI'nin yeni Sora teknolojisi, yapay zeka dünyasında, özellikle de metni videoya dönüştürme alanında olağanüstü bir sıçramayı temsil ediyor. Video içeriği oluşturmada yeni bir çağ başlatmak üzere tasarlanan bu yenilikçi teknoloji, basit metin talimatlarıyla bir dakikaya kadar uzunlukta son derece gerçekçi ve yaratıcı videolar oluşturulmasına olanak sağlıyor. Bu yeteneği sayesinde Sora, yapay zekanın dijital medya yaratımında devrim yaratma potansiyeli açısından oldukça ileri seviye bir örnek teşkil ediyor.

Örneğin, Sora'ya şu paragraf veriliyor:

"Zarif bir kadın, sıcak neon ışıkları ve hareketli şehir tabelalarıyla dolu bir Tokyo caddesinde yürümektedir. Siyah deri bir ceket, uzun kırmızı bir elbise, siyah ayakkabılar giyiyor ve siyah bir cüzdan taşıyor. Güneş gözlüğü takıyor ve ruj sürüyor. Kendinden emin ve rahat bir şekilde yürüyor. Sokak nemli ve yansıtıcı, renkli ışıklar ayna etkisi yaratıyor. Etrafta yürüyen bir sürü yaya var."

Sonuç ise bu (OpenAI internet sitesinden):

Yenilikçi yetenekler ve zorluklar

Sora, birden fazla karakter, belirli eylem türleri ve ayrıntılı senaryolar içeren karmaşık sahneler oluşturabiliyor. Tüm bunları yaparken bir kullanıcının komut istemindeki nüansları anlayabiliyor. Dikkat çeken bir özellik de Sora'nın tüm videoyu bir kerede oluşturabilmesi ve böylece özneler görüş alanından çıktığında görünümde meydana gelen değişiklikler gibi tutarsızlıkları ortadan kaldırmasında kendini gösteriyor.

Ancak modelin zayıf yönleri de yok değil. Örneğin, bir kişi elmadan bir ısırık alırken fotoğraflanabilir ancak ısırık izi artık elmanın üzerinde görünmeyebilir. Sora ayrıca sol ve sağı ayırt edememek gibi uzamsal ayrıntılar ve yönlerle başa çıkmakta veya belirli bir kamera yoluna bağlı kalmak gibi zaman içinde gelişen sahnelerin olaylarını tanımlamakta zorluk çekebilir.

Sora'nın tekniğiyle elde edilen sonuçlara bir başka örnek de kendisinden özellikle istenen bu paragrafı videoya çevirmesi (OpenAI internet sitesinden:

"Kamera doğrudan İtalya'nın Burano kentinin renkli binalarına bakıyor. Sevimli bir Dalmaçyalı köpek zemin kattaki bir binanın penceresinden bakıyor. Birçok insan binaların önündeki kanal sokaklarında yürüyor ve bisiklete biniyor."

Araştırma ve geliştirme teknolojileri

Şarku’l Avsat’ın edindiği bilgilere göre Sora, GPT modellerine benzer şekilde sıralı verileri işlemek için kullanılan derin öğrenme mimarisi türlerini kullanarak büyük miktarda veriyi verimli bir şekilde işlemesine olanak tanıyor. Model, videoları ve görüntüleri GPT'deki belirteçlere benzer şekilde veri yamaları kümeleri olarak temsil ederek çeşitli görsel veriler üzerinde eğitilmesine olanak tanır. Veri temsilinin bu şekilde birleştirilmesi sayesinde Sora'nın teknolojisi, süre, doğruluk ve diğer özellikleri daha önce hiç olmadığı kadar verimli bir şekilde ele almasını sağlıyor. Sora ayrıca DALL-E ve GPT modelleri üzerine yapılan araştırmalara dayanıyor ve görsel eğitim verileri için son derece açıklayıcı başlıklar oluşturmak için DALL-E 3'ün geri alma teknolojisini kullanıyor. Bu sayede kullanıcının metin talimatlarını daha doğru bir şekilde takip eden videolar oluşturuluyor. Model ayrıca hareketsiz görüntüleri canlandırabilir veya mevcut videoları ayrıntılara dikkat ederek genişletebilir ve gerçek dünya uygulamalarındaki çok yönlülüğü ve potansiyeli gösterebilir.

Güvenlik ve etik hususlar

Güvenlik ve etiğin öneminin farkında olan OpenAI, Sora'nın ürünlerine entegre edilebilmesi için birçok önemli adım attı. Şirket, X platformundaki bir paylaşımında, şirket içinde yanlış bilgilendirme, nefret içeriği ve önyargı gibi alanlarda uzmanlaşmış bir ekip olan Red Team üyeleriyle iş birliği yaparak, Sora tarafından oluşturulan videoları tanımlayabilen bir sınıflandırma aracı geliştirildiğini bildirdi.

Katılım ve gelecek beklentileri

OpenAI, endişeleri anlamak ve Sora için olumlu kullanım durumlarını belirlemek için küresel çapta politikacılar, eğitimciler ve sanatçılarla etkileşim kurmayı planlıyor. Kapsamlı araştırma ve testlere rağmen, potansiyel faydalı ve zararlı kullanımların tamamı bilinmiyor. OpenAI, zaman içinde daha güvenli yapay zeka sistemleri yaratmada kritik bir unsur olarak gerçek dünya kullanarak öğrenmenin önemine inanıyor.

Sora, yapay zekanın gerçek dünyayı anlama ve simüle etme becerisinde büyük bir ilerlemeyi temsil ediyor ve genel yapay zekaya (AGI) ulaşma yolunda kritik bir adımı işaret ediyor. Sora'nın geliştirilmesi sadece ilgi çekici video içeriği oluşturma potansiyelini göstermekle kalmıyor, aynı zamanda yapay zeka araştırma ve uygulamalarında devam eden zorlukları ve sorumlulukları da vurguluyor.



Yapay zeka uygulamaları 1 milyar kullanıcıyı aştı

Fotoğraf: Unsplash
Fotoğraf: Unsplash
TT

Yapay zeka uygulamaları 1 milyar kullanıcıyı aştı

Fotoğraf: Unsplash
Fotoğraf: Unsplash

Yeni bir rapora göre ChatGPT, Claude ve Google Gemini gibi mobil yapay zeka uygulamalarının kullanıcı sayısı 1 milyarı geçti.

Bu kilometre taşına, OpenAI'ın ChatGPT'yi kullanıma açmasının üzerinden üç yıl bile  geçmeden ulaşıldı. ChatGPT, Kasım 2022'de piyasaya sürüldüğünde tarihin en hızlı büyüyen uygulaması olmuştu.

Tüketici bilgi firması Meltwater ve kreatif ajans We Are Social tarafından hazırlanan Digital 2026 raporunda, "Yapay zeka, erken benimseyenlerden kitlesel pazara yayılarak 'kritik eşiği geçiyor' dendi.

700 sayfalık rapor, bu eğilimin internetin geri kalanında da dalgalanma etkisi yarattığını ve geleneksel arama motorlarını kullananların sayısının artık düşüşte olduğunun altını çiziyor.

Veri analisti Simon Kemp, "Yapay zeka, kullanıcıların farklı türden soruları yanıtlamalarına ve yalnızca arama motorlarıyla yapabileceklerinden çok daha geniş bir ihtiyaç yelpazesini karşılamalarına giderek daha fazla olanak sağlıyor" dedi.

OpenAI'ın patronu Sam Altman'a göre yapay zekanın benimsenme oranları büyük ölçüde yaklaşık 800 milyon kullanıcısı olan ChatGPT sayesinde artıyor.

Bu rakam geçen yıl bu zamanlar 250 milyon civarındaydı ve Statista tarafından toplanan verilere göre 586 milyon kullanıcısı olan Elon Musk'ın X'inin önüne geçti

OpenAI, Duke Üniversitesi ve Harvard Üniversitesi'nden araştırmacılar geçen ay yayımladıkları makalede dünya yetişkin nüfusunun yaklaşık yüzde 10'unun ChatGPT kullandığını belirtmişti.

Araştırmacılar, "Yeni bir teknoloji için bu küresel yayılma hızının emsali yok" diye yazmıştı.

Pew Araştırma Merkezi'nin marşamba günü yayımladığı ayrı bir rapor, yapay zeka konusunda heyecandan çok endişe duyan kişi sayısının daha fazla olduğunu ortaya koydu.

25 ülkede 28 binden fazla kişinin görüşlerinin alındığı anket, insanların sadece yüzde 16'sının bu teknoloji konusunda endişeliden ziyade heyecanlı olduğunu ortaya koydu.

Raporun yazarları, "Yapay zekayla ilgili endişeler özellikle yetişkinlerin yaklaşık yarısının heyecandan çok endişe duyduğunu söylediği Birleşik Devletler, İtalya, Avustralya, Brezilya ve Yunanistan'da yaygın" diye yazdı.

Anket ayrıca, kişi başına düşen gayri safi yurtiçi hasılayla ölçülen bir ülkenin geliriyle yapay zeka farkındalığı arasında güçlü bir ilişki olduğunu ortaya koyuyor. Yüksek gelirli ülkelerdeki nüfus, daha az varlıklı ekonomilerdekilere kıyasla yapay zeka hakkında daha fazla bilgi sahibi olma eğiliminde.

Independent Türkçe


Starship, Teksas'tan yeni bir test uçuşuyla fırlatıldı

Starship uzay aracının on birinci uçuşu Teksas'taki Starbase üssünden gerçekleşti (Reuters)
Starship uzay aracının on birinci uçuşu Teksas'taki Starbase üssünden gerçekleşti (Reuters)
TT

Starship, Teksas'tan yeni bir test uçuşuyla fırlatıldı

Starship uzay aracının on birinci uçuşu Teksas'taki Starbase üssünden gerçekleşti (Reuters)
Starship uzay aracının on birinci uçuşu Teksas'taki Starbase üssünden gerçekleşti (Reuters)

Amerikalı milyarder Elon Musk'ın sahibi olduğu SpaceX, dün Teksas'taki Starbase'den Starship uzay aracının on birinci uçuşunu gerçekleştirdi. Bu test görevi, yeniden kullanılabilir uzay aracının uydu fırlatma ve nihayetinde insanları Ay ve Mars'a taşıma yeteneğini test etmeyi amaçlıyor.

Bir Süper Ağır itici roketin üzerine monte edilmiş Starship üst kademesinden oluşan uzay aracı, SpaceX'in Starbase'deki tesislerinden yaklaşık 23:20 GMT'de fırlatıldı. Starship üst kademesini uzaya gönderdikten sonra, Süper Ağır itici roket fırlatmadan yaklaşık 10 dakika sonra Meksika Körfezi'ne yumuşak bir iniş gerçekleştirdi.

SpaceX Başkanı Gwynne Shotwell, geçen ay Paris'te düzenlenen bir konferansta, "11. test uçuşunu başarılı kılmak için elimizden gelen her şeyi yaptık," dedi. "Ama bildiğiniz gibi, kimse ne olacağını bilmiyor, bu yüzden göreceğiz." Starship'in, 2027 yılına kadar NASA astronotlarını Ay'a indirmesi planlanıyor.

Roket, SpaceX'in mobil geniş bant internet sağlama hedefinde hayati rol oynayan daha büyük Starlink uydularının fırlatılması için büyük önem arzediyor. Bu uydular, Musk'ın Mars'a insan ve kargo gönderme vizyonunun temelini oluşturuyor.


"Arka kapı" tehlikesi: 250 dosya ChatGPT'yi zehirlemeye yetiyor

(Unsplash)
(Unsplash)
TT

"Arka kapı" tehlikesi: 250 dosya ChatGPT'yi zehirlemeye yetiyor

(Unsplash)
(Unsplash)

Anthony Cuthbertson Teknoloji Editör Yardımcısı @ADCuthbertson 

Araştırmacılar, OpenAI'ın ChatGPT'si ve Google'ın Gemini'ı gibi yapay zeka modellerinin, eğitim verilerine yalnızca küçük bir bozulmuş veri örneği eklenerek "zehirlenebileceği" uyarısını yaptı.

Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü, Alan Turing Enstitüsü ve yapay zeka firması Anthropic'in ortak yürüttüğü çalışma, 250 kadar az sayıda belgenin büyük dil modellerinin (LLM'ler) anlamsız metinler üretmesine yol açan bir "arka kapı" zafiyeti oluşturabileceğini ortaya koydu.

Bu açık özellikle endişe verici çünkü en popüler LLM'ler, kişisel internet siteleri ve blog yazıları da dahil internetteki herkese açık metinlerle önceden eğitiliyor. Bu da herhangi birinin yapay zeka modelinin eğitim verilerine dahil olabilecek içerik üretmesini mümkün kılıyor.

Anthropic, konuyu detaylandıran blog yazısında "Kötü niyetli aktörler, zehirlenme diye bilinen süreçte modelin istenmeyen veya tehlikeli davranışları öğrenmesini sağlamak için bu yayınlara belirli bir metin enjekte edebilir" dedi.

Arka kapı eklemek de bu saldırı türünden. Arka kapılar, modelden normalde gizli kalacak belirli bir davranışı tetikleyen özel ifadelerdir. Örneğin bir saldırgan komut isteminde olduğu gibi rasgele bir tetikleyici ifade içerdiğinde LLM'ler hassas verileri dışarı sızdıracak şekilde zehirlenebilir.

Bulgular yapay zeka güvenliğine dair endişelere yol açarken araştırmacılar, bunun teknolojinin hassas uygulamalarda kullanılma potansiyelini sınırladığını söylüyor.

Alan Turing Enstitüsü'nden Dr. Vasilios Mavroudis ve Dr. Chris Hicks, "Sonuçlarımız şaşırtıcı ve endişe vericiydi: Bir LLM'yi zehirlemek için gereken kötü niyetli belge sayısı (yaklaşık 250), modelin veya eğitim verilerinin boyutundan bağımsız olarak neredeyse sabitti" diye yazdı.

Başka bir deyişle, veri zehirleme saldırıları daha önce sanılandan daha uygulanabilir olabilir. Bir saldırgan için örneğin 250 zehirli Wikipedia makalesi yaratmak nispeten kolay olacaktır.

Riskler, "Poisoning attacks on LLMs require a near-constant number of poison samples" (LLM'lere yönelik zehirleme saldırıları neredeyse sabit sayıda zehir örneği gerektiriyor) başlıklı, hakem kontrolünden geçmemiş makalede detaylandırıldı.

The Independent yorum için Google ve OpenAI'la iletişime geçti.

Independent Türkçe, independent.co.uk/tech