OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

1080p kalitesindeki videoların uzunluğu 1 dakika.

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
TT

OpenAI’den metin komutlarından video oluşturma hizmeti: Sora

Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)
Sora modeli 1080p çözünürlükte film benzeri sahneler oluşturabiliyor. (Open AI)

OpenAI'nin yeni Sora teknolojisi, yapay zeka dünyasında, özellikle de metni videoya dönüştürme alanında olağanüstü bir sıçramayı temsil ediyor. Video içeriği oluşturmada yeni bir çağ başlatmak üzere tasarlanan bu yenilikçi teknoloji, basit metin talimatlarıyla bir dakikaya kadar uzunlukta son derece gerçekçi ve yaratıcı videolar oluşturulmasına olanak sağlıyor. Bu yeteneği sayesinde Sora, yapay zekanın dijital medya yaratımında devrim yaratma potansiyeli açısından oldukça ileri seviye bir örnek teşkil ediyor.

Örneğin, Sora'ya şu paragraf veriliyor:

"Zarif bir kadın, sıcak neon ışıkları ve hareketli şehir tabelalarıyla dolu bir Tokyo caddesinde yürümektedir. Siyah deri bir ceket, uzun kırmızı bir elbise, siyah ayakkabılar giyiyor ve siyah bir cüzdan taşıyor. Güneş gözlüğü takıyor ve ruj sürüyor. Kendinden emin ve rahat bir şekilde yürüyor. Sokak nemli ve yansıtıcı, renkli ışıklar ayna etkisi yaratıyor. Etrafta yürüyen bir sürü yaya var."

Sonuç ise bu (OpenAI internet sitesinden):

Yenilikçi yetenekler ve zorluklar

Sora, birden fazla karakter, belirli eylem türleri ve ayrıntılı senaryolar içeren karmaşık sahneler oluşturabiliyor. Tüm bunları yaparken bir kullanıcının komut istemindeki nüansları anlayabiliyor. Dikkat çeken bir özellik de Sora'nın tüm videoyu bir kerede oluşturabilmesi ve böylece özneler görüş alanından çıktığında görünümde meydana gelen değişiklikler gibi tutarsızlıkları ortadan kaldırmasında kendini gösteriyor.

Ancak modelin zayıf yönleri de yok değil. Örneğin, bir kişi elmadan bir ısırık alırken fotoğraflanabilir ancak ısırık izi artık elmanın üzerinde görünmeyebilir. Sora ayrıca sol ve sağı ayırt edememek gibi uzamsal ayrıntılar ve yönlerle başa çıkmakta veya belirli bir kamera yoluna bağlı kalmak gibi zaman içinde gelişen sahnelerin olaylarını tanımlamakta zorluk çekebilir.

Sora'nın tekniğiyle elde edilen sonuçlara bir başka örnek de kendisinden özellikle istenen bu paragrafı videoya çevirmesi (OpenAI internet sitesinden:

"Kamera doğrudan İtalya'nın Burano kentinin renkli binalarına bakıyor. Sevimli bir Dalmaçyalı köpek zemin kattaki bir binanın penceresinden bakıyor. Birçok insan binaların önündeki kanal sokaklarında yürüyor ve bisiklete biniyor."

Araştırma ve geliştirme teknolojileri

Şarku’l Avsat’ın edindiği bilgilere göre Sora, GPT modellerine benzer şekilde sıralı verileri işlemek için kullanılan derin öğrenme mimarisi türlerini kullanarak büyük miktarda veriyi verimli bir şekilde işlemesine olanak tanıyor. Model, videoları ve görüntüleri GPT'deki belirteçlere benzer şekilde veri yamaları kümeleri olarak temsil ederek çeşitli görsel veriler üzerinde eğitilmesine olanak tanır. Veri temsilinin bu şekilde birleştirilmesi sayesinde Sora'nın teknolojisi, süre, doğruluk ve diğer özellikleri daha önce hiç olmadığı kadar verimli bir şekilde ele almasını sağlıyor. Sora ayrıca DALL-E ve GPT modelleri üzerine yapılan araştırmalara dayanıyor ve görsel eğitim verileri için son derece açıklayıcı başlıklar oluşturmak için DALL-E 3'ün geri alma teknolojisini kullanıyor. Bu sayede kullanıcının metin talimatlarını daha doğru bir şekilde takip eden videolar oluşturuluyor. Model ayrıca hareketsiz görüntüleri canlandırabilir veya mevcut videoları ayrıntılara dikkat ederek genişletebilir ve gerçek dünya uygulamalarındaki çok yönlülüğü ve potansiyeli gösterebilir.

Güvenlik ve etik hususlar

Güvenlik ve etiğin öneminin farkında olan OpenAI, Sora'nın ürünlerine entegre edilebilmesi için birçok önemli adım attı. Şirket, X platformundaki bir paylaşımında, şirket içinde yanlış bilgilendirme, nefret içeriği ve önyargı gibi alanlarda uzmanlaşmış bir ekip olan Red Team üyeleriyle iş birliği yaparak, Sora tarafından oluşturulan videoları tanımlayabilen bir sınıflandırma aracı geliştirildiğini bildirdi.

Katılım ve gelecek beklentileri

OpenAI, endişeleri anlamak ve Sora için olumlu kullanım durumlarını belirlemek için küresel çapta politikacılar, eğitimciler ve sanatçılarla etkileşim kurmayı planlıyor. Kapsamlı araştırma ve testlere rağmen, potansiyel faydalı ve zararlı kullanımların tamamı bilinmiyor. OpenAI, zaman içinde daha güvenli yapay zeka sistemleri yaratmada kritik bir unsur olarak gerçek dünya kullanarak öğrenmenin önemine inanıyor.

Sora, yapay zekanın gerçek dünyayı anlama ve simüle etme becerisinde büyük bir ilerlemeyi temsil ediyor ve genel yapay zekaya (AGI) ulaşma yolunda kritik bir adımı işaret ediyor. Sora'nın geliştirilmesi sadece ilgi çekici video içeriği oluşturma potansiyelini göstermekle kalmıyor, aynı zamanda yapay zeka araştırma ve uygulamalarında devam eden zorlukları ve sorumlulukları da vurguluyor.



Yapay zeka "Bilmiyorum" demeyi öğrendi

Telefon ekranında gösterilen Grok, DeepSeek ve ChatGPT uygulamaları (AFP)
Telefon ekranında gösterilen Grok, DeepSeek ve ChatGPT uygulamaları (AFP)
TT

Yapay zeka "Bilmiyorum" demeyi öğrendi

Telefon ekranında gösterilen Grok, DeepSeek ve ChatGPT uygulamaları (AFP)
Telefon ekranında gösterilen Grok, DeepSeek ve ChatGPT uygulamaları (AFP)

Güney Koreli araştırmacılar, yapay zeka modellerinin nihayet, belirli konulara aşina olmadıklarını insan davranışına benzer şekilde kabul etmelerini sağlayacak yeni bir yöntem geliştirdi.

Kore İleri Bilim ve Teknoloji Enstitüsü'nden araştırmacılar, bu atılımın otonom sürüş ve tıp gibi alanlarda kullanılan yapay zeka modellerinin güvenilirliğini artırabileceğini söylüyor.

Önceki araştırmalar, özellikle tıbbi teşhis gibi alanlarda, bu araçların karar alma süreçlerinde kullanılmasının en büyük risklerinden birinin yapay zekanın "aşırı özgüveni" olduğunu ortaya koymuştu.

OpenAI'ın ChatGPT'si gibi yaygın kullanılan yapay zeka modellerinin, bilmediklerini kabul etmek yerine tahmin yapmaya teşvik edildikleri için "halüsinasyon gördükleri", yani bilgi uydurdukları gösterilmişti.

Şimdiyse araştırmacılar, yapay zekanın aşina olmadığı veya daha önce karşılaşmadığı bilgilerin farkında olmasını sağlayan ve sohbet robotlarının genel güvenilirliğini artıran bir yöntem geliştirdi.

Araştırmacılar, yapay zekada aşırı özgüvenin temel nedeninin, omurga altyapısını oluşturan yapay sinir ağlarını kullanarak ilk verilerden öğrenme biçimi olduğunu söylüyor.

Bu aşamada ortaya çıkan küçük hatalar, düzeltilmezse yayılabiliyor ve sonraki eğitim sırasında önemli hatalara neden olabiliyor.

Araştırmacılar, başlatma aşamasında bir sinir ağına rastgele veri girildiğinde, modelin hiçbir şey öğrenmemiş olmasına rağmen yüksek bir güven sergilediğini buldu.

Bu durum "halüsinasyona" yol açtı.

Bunu ele almak için araştırmacılar, insan beyninin sorunu çözme biçiminden ipuçları kullandıklarını söylüyor.

İnsanlarda beyin sinyalleri doğumdan önce bile dış uyaran olmaksızın üretiliyor, bu da sorunun üstesinden gelmeye yardımcı oluyor.

Bunu taklit eden bilim insanları, bir yapay zeka modelinin sinir ağı omurgasının, gerçek öğrenmeden önce rastgele gürültü girdileriyle kısa bir ön eğitimden geçtiği bir sistem geliştirdi.

Araştırmacılara göre bu süreç, yapay zekanın veri öğrenmeye başlamadan önce kendi belirsizliğini ayarlayarak kendisi için bir temel oluşturmasını sağlıyor.

Isınma süreci, yapay zeka modelinin başlangıç ​​güvenini şansa yakın düşük bir seviyeye ayarlamasına ve aşırı güven yanlılığını önemli ölçüde azaltmasını sağlayabilir.

Araştırmacılar, başka bir deyişle yöntemin modellerin önce "Henüz hiçbir şey bilmiyorum" durumunu öğrenmesine yardımcı olduğunu söylüyor.

Araştırmacılar, "Geleneksel modeller, eğitim sırasında karşılaşmadıkları veriler için bile yüksek güvenle yanlış cevaplar verme eğilimindeyken, ısınma eğitimi alan modeller, güvenlerini düşürme ve 'bilmediklerini' tanıma yeteneklerinde belirgin bir iyileşme gösterdi" diye açıkladı.

Bu, yapay zekanın "bildiklerini" "bilmediklerinden" ayırt etme yeteneğini geliştirmesini sağlayabilir.

Nature Machine Intelligence adlı akademik dergide yayımlanan çalışmanın yazarlarından Se-Bum Paik, "Bu çalışma, beyin gelişiminin temel ilkelerini birleştirerek, yapay zekanın kendi bilgi durumunu insanlara daha benzer bir şekilde tanıyabileceğini gösteriyor" dedi.

Bu önemli çünkü yapay zekanın yalnızca doğru cevabı ne sıklıkla verdiğini iyileştirmekle kalmayıp, ne zaman kararsız olduğunu veya yanılmış olabileceğini anlamasını sağlıyor.

Independent Türkçe


Ödül olmadan video oyunu oynayan maymunlar bilim insanlarını şoke etti

Japon makakları (AFP/Temsili)
Japon makakları (AFP/Temsili)
TT

Ödül olmadan video oyunu oynayan maymunlar bilim insanlarını şoke etti

Japon makakları (AFP/Temsili)
Japon makakları (AFP/Temsili)

Vishwam Sankaran Bilim ve Teknoloji Muhabiri 

Yeni bir araştırma kapsamında maymunların herhangi bir yiyecek ödülü olmadan, tamamen meraktan kendi istekleriyle dokunmatik ekranlı bir video oyununu uzun süre oynaması bilim insanlarını şaşkına çevirdi.

Araştırmacılara göre bulgular, merakın hayvan davranışını nasıl yönlendirdiğinin daha iyi anlaşılmasına yol açabilir.

Yiyecek veya çiftleşme fırsatları gibi dışsal ödüllerden bağımsız olarak işleyen merak duygusu, hayvanları çevrelerini keşfetmeye yönlendirir.

Ancak bir hayvanın çevresinin hangi kısımlarının diğerlerine göre daha fazla merak uyandırdığı tam olarak bilinmiyor.

Araştırmacılar, merakın aşırı basit veya karmaşık durumlardan kaçınırken, orta derecede karmaşık veya belirsiz uyaranlara yönelme eğiliminde olduğu varsayımında bulunuyor.

"Goldilocks ilkesi" denen bu kavram, insan merakını de şekillendiriyor.

Ancak hayvanlarda bu dürtüyü inceleyen çok az çalışma var.
 

Video oyunu oynayan maymun (KyotoU/Sakumi İki)​​​​​​​Video oyunu oynayan maymun (KyotoU/Sakumi İki)

Japonya'daki Kyoto Üniversitesi'nden bilim insanları, maymunlara dokunmatik ekranlı bir video oyunu vererek merakın nasıl işlediğini inceledi.

Video oyunları, insanların bilişsel yeteneklerini geliştirmesine ve yaşam kalitelerini artırmasına fayda sağlayan araçlar olarak son yıllarda öne çıkıyor.

Video oyunlarının laboratuvar ve hayvanat bahçelerindeki hayvanların ilgisini çekip çekemeyeceğini ve onların sağlık ve huzurunu iyileştirmeye yardımcı olup olamayacağını araştıran çalışmalar da yapılıyor.

Hakemli dergi iScience'ta yayımlanan çalışmanın yazarlarından Sakumi Iki, "Başlangıçta vahşi maymunların oyun davranışlarını inceliyordum, bu yüzden laboratuvardaki maymunlarda oyun davranışının doğal bir şekilde ortaya çıkabileceği durumlar yaratmayı uzun zamandır istiyordum" diye açıklıyor.

Araştırmacılar, bölgedeki Japon makaklarının merakını tam olarak ne tür uyaranların tetikleyebileceğini araştırdı.

Saklambaçtan esinlenerek dokunmatik ekran tabanlı bir oyun görevi geliştirdiler.

Bu oyunda maymun dokunmatik ekrandaki bir düğmeye bastığında, düğmeye bağlı olarak ekranın farklı bir yerinde bir kukla beliriyor.

Kuklanın ortaya çıkışı farklı gürültü seviyelerine göre değişirken, gürültü seviyesi yükseldikçe kukla daha zor tahmin edilen bir yerde görünüyor.

Bilim insanları maymunların orta ve düşük gürültüye, ardından orta ve yüksek gürültüye verdikleri tepkileri gözlemledi.

Maymunların, kuklanın biraz tahmin edilebilir ama yine de orta derecede belirsiz bir yerde belirmesini sağlayan orta gürültü düğmesini seçtiğini gördüler.

Bu da makakların tıpkı insanlar gibi, çok basit veya çok rastgele uyaranlara kıyasla, orta düzeyde belirsizliğe sahip uyaranları etkin bir şekilde keşfetme eğilimi gösterdiğine işaret ediyor.

Ayrıca maymunların oyunu oynamaya uzun süreler harcaması, oyunun meraklarını uyandırmada başarılı olduğu fikrini destekliyor.

Dr. Iki "Tipik bilişsel görevlerde maymunların motivasyonunu yüksek tutmak için genellikle onlara yiyecek ödülleri verilir; bu yüzden ödül olmadan oyuna ilgi göstereceklerinden pek emin değildim" diyor. 

Ancak şaşırtıcı bir şekilde, bazı maymunlar hiçbir ödül olmamasına rağmen bu oyunda neredeyse 100 deneme boyunca çalıştı.

Araştırmacılar gelecekteki çalışmalarda bu bulguları kullanarak maymunların merakını uyandıran daha fazla oyun geliştirmeyi umuyor.

Merakın arkasındaki sinirsel ve bilişsel mekanizmaları belirleyerek "bu olguyu daha kapsamlı bir şekilde anlamayı" hedefliyorlar.

Independent Türkçe,independent.co.uk/news


Yapay zeka destekli akıllı saat bayılmayı önceden tahmin ediyor

Araştırmacılar, Samsung Galaxy Watch 6 akıllı saatinin bayılma durumları için erken uyarı sistemi görevi görebileceğini belirtiyor (Samsung)
Araştırmacılar, Samsung Galaxy Watch 6 akıllı saatinin bayılma durumları için erken uyarı sistemi görevi görebileceğini belirtiyor (Samsung)
TT

Yapay zeka destekli akıllı saat bayılmayı önceden tahmin ediyor

Araştırmacılar, Samsung Galaxy Watch 6 akıllı saatinin bayılma durumları için erken uyarı sistemi görevi görebileceğini belirtiyor (Samsung)
Araştırmacılar, Samsung Galaxy Watch 6 akıllı saatinin bayılma durumları için erken uyarı sistemi görevi görebileceğini belirtiyor (Samsung)

Araştırmacılar, akıllı saatlerinden gelen verileri kullanarak kişinin bayılmak üzere olup olmadığını tahmin edebilen dünyanın ilk sistemini geliştirdi.

Chung-Ang Üniversitesi Hastanesi'nde 132 hastanın katıldığı klinik çalışmada, Samsung Galaxy Watch'la kullanıcının kalp atış hızından gelen biyosinyallerden yararlanan gerçek zamanlı bir uyarı sistemi geliştirildi.

Sistem, bilimsel olarak vazovagal senkop diye bilinen bayılma nöbetlerini, yüzde 80'den fazla doğrulukla 5 dakikaya kadar önceden tahmin edebildi.

Hastanenin Kardiyoloji Bölümü'nden araştırmayı yöneten Profesör Junhwan Cho, "Senkop hastalarının düşmelerden kaynaklanan travmalar yaşaması yaygın bir durum ve ekstrem vakalarda bazıları kırık veya beyin kanaması gibi ciddi şekilde yaralanıyor" dedi.

Bu teknolojinin sağlayacağı erken uyarı, hastalara güvenli bir pozisyona geçmeleri veya yardım çağırmaları için önceden zaman kazandırabilir ve bu da ikincil yaralanmaların görülme sıklığını önemli ölçüde azaltabilir.

sdvfrtbhn
Samsung ve Kore'deki Chung-Ang Üniversitesi Gwangmyeong Hastanesi'nin ortak klinik çalışmasında, Galaxy Watch 6'dan elde edilen verilerle kişinin bayılıp bayılmayacağını tahmin edilebildi (Samsung)

Araştırmacılar, hastalardan kalp atış hızı değişkenliği verilerini toplamak için Galaxy Watch 6'daki fotopletismografi (PPG) sensörünü kullandı.

Daha sonra bayılma nöbetinin meydana gelmek üzere olup olmadığını belirlemek için verileri analiz etmek adına yapay zeka algoritması kullanıldı.

Bu, ticari bir akıllı saatin bayılmaya yönelik erken tahmin sistemini başarıyla sunduğu ilk örnek.

Samsung'un sağlık alanındaki araştırma ve geliştirme çalışmalarını yöneten Jongmin Choi, "Bu çalışma, giyilebilir teknolojinin sağlık hizmetlerini 'hastalık sonrası bakım'dan 'önleyici bakım' modeline nasıl dönüştürebileceğinin bir örneği" dedi.

Kullanıcılarımızın daha sağlıklı günlük yaşamlar sürmelerini sağlayan teknolojik yeniliklere öncülük etmeye kararlıyız.

Teknoloji devi, sağlık izleme yeteneklerini akıllı saatlerine ve diğer giyilebilir teknoloji cihazlarına entegre etmeyi planlıyor.

Araştırma bulguları, European Heart Journal-Digital Health adlı akademik derginin son sayısında "Prediction of vasovagal syncope using artificial intelligence-enabled smartwatch photoplethysmography-derived heart rate variability" (Yapay zeka destekli akıllı saat fotopletismografisiyle elde edilen kalp atış hızı değişkenliği kullanılarak vazovagal senkopun tahmin edilmesi) başlıklı çalışmada yayımlandı.

Independent Türkçe