4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



Sonsuz kimyasal uyarısı: "Arıların geleceği tehlikede"

Balarıları (Pixabay/Phys.org)
Balarıları (Pixabay/Phys.org)
TT

Sonsuz kimyasal uyarısı: "Arıların geleceği tehlikede"

Balarıları (Pixabay/Phys.org)
Balarıları (Pixabay/Phys.org)

Vishwam Sankaran Bilim ve Teknoloji Muhabiri 

Yeni bir çalışmada Avustralyalı bilim insanları, balarısı kolonilerinde birikip ballarına geçebilecek zehirli "sonsuz kimyasalların" gıda güvenliğini ve insan sağlığını tehdit etme potansiyeli taşıdığı uyarısında bulundu.

Perflorooktansülfonat (PFOS) diye de bilinen bu kimyasallar leke tutmayan kumaşlarda, yapışmaz pişirme kaplarında, yangın söndürme köpüklerinde ve elektronikte yaygın kullanılıyor ve kolayca ayrışmadığı için çevrede kalıyor.

Çalışmalar, PFOS'un yüksek kolesterol ve karaciğer enzimi değişikliklerinin de aralarında bulunduğu sağlık riskleriyle ilişkili olduğunu gösteriyor.

Şimdiyse araştırmacılar PFOS'un Avustralya'daki Avrupa balarısı (Apis mellifera) kolonileri üzerindeki etkilerini izledi ve ona uzun süre boyunca maruz kalmanın balarılarında hücre fonksiyonundan sorumlu bazı anahtar proteinlerin ekspresyonunu değiştirebileceğini buldu.

Environmental Science & Technology adlı bilimsel dergide yayımlanan çalışmanın yazarlarından Carolyn Sonter, "Yeni nesil yavru arıların vücut dokusunda PFOS tespit edildi ve bunların vücut ağırlığının, PFOS'a maruz kalmayan kontrol grubundaki arılara göre daha düşük olduğu saptandı" ifadesini kullandı.

Bilim insanları, PFOS'un arıların larvaları beslemek için kullandıkları besin yoğunluğu yüksek bir sıvı olan arısütünü de etkilemesinden şüpheleniyor.

Arısütünün kalitesinin düşmesi, gelecek nesilleri olumsuz etkileyerek tüm arı kolonisinin sağlığına ve yaşam süresine zarar verebilir.

Dr. Sonter, "Düşük vücut ağırlığı, daha küçük bezlere sahip daha küçük bir arının göstergesi ki bunlara yeni nesil arıları beslemek için arısütü üreten yutak bezi de dahil" dedi.

Araştırmacılar, PFOS'a daha büyük ölçekte uzun süreli maruz kalmanın balarısı popülasyonlarının gitgide azalmasına ve mahsullerin tozlaşmasını olumsuz yönde etkilemesine yol açabileceği uyarısında bulunuyor.

Dr. Sonter, "Arılara yönelik herhangi bir tehdit gıda güvenliğini tehdit ediyor" ifadesini kullandı.

Çoğu tarımsal ürün tozlaşma için arılara bel bağlar ve onların yokluğunda orman meyveleri olsun, diğer meyveler olsun, sebzelerin çoğu olsun, gıda üretimi ciddi şekilde sekteye uğrar.

PFOS dünyanın birçok yerinde yasaklanmış olsa da geçmişten gelen kontaminasyon arılara hâlâ zarar verebilir.

Araştırmacılar, arıların bu zehirli kimyasallara kirlenmiş toz, su, arı kovanlarındaki boya, mahsul koruma ürünleri ve kirlenmiş topraklarla sularda yetişen bitkilerden gelen polenler yoluyla maruz kalabileceğini söylüyor.

Dr. Sonter, "PFOS'un mirası en azından bizim yaşam süremizde kalıcı" dedi.

Yuvamızdaki arılar için PFAS (perflorlu ve poliflorlu alkil maddeler) risklerini azaltmanın bir yolu, bahçelerde PFAS içeren mahsul koruma ürünlerini kullanmaktan kaçınmaktır ki pek çoğu içeriyor!

Bilim insanları gelecekteki çalışmalarda arazilerdeki arıların PFOS'a hangi yollarla maruz kaldığını daha iyi anlamayı umuyor.

Dr. Sonter, "Arılar çok önemli bir böcek çeşidi olsa da onlara yönelik çevresel kirleticiler kaynaklı tehditler yeterince araştırılmıyor ve anlaşılmıyor" ifadesini kullandı.

Independent Türkçe, independent.co.uk/news/science


Astronotlar yakında Ay humusu yiyebilir

(NASA)
(NASA)
TT

Astronotlar yakında Ay humusu yiyebilir

(NASA)
(NASA)

Ay toprağı taklidinde başarıyla nohut yetiştiren bilim insanları, yakında astronotların Ay'da bu mahsulü yetiştirip yiyebileceğini söylüyor.

Teksas A&M Üniversitesi'ndeki araştırmacılar, Ay yüzeyinin yüzde 75'ini kaplasa da besin açısından zayıf tozlar olan Ay regolitinin taklidinde bu baklagillerden bir parti üretmeyi başardı.

Bilim insanları, araştırmalarına göre astronotların Dünya kaynaklı pahalı tedarik görevlerine bel bağlamak yerine uzayda kendi nohutlarını yetiştirip yiyebileceğini söyledi. Ancak bu mahsul hâlâ test aşamasında zira güvenle yenebileceğinden emin olunmak isteniyor.

ABD'nin Artemis göreviyle 50 yılı aşkın süredir ilk kez Ay yüzeyine astronot göndermeyi planladığı sırada bu gelişme yaşandı.

Çalışmanın baş araştırmacısı Sara Santos, "Araştırma, Ay'da mahsul yetiştirmenin uygulanabilirliğini anlamakla ilgili" dedi.

Bu regoliti toprağa nasıl dönüştüreceğiz? Ne tür doğal mekanizmalar bu dönüşümü sağlayabilir?

Görsel kaldırıldı.Araştırmacılar, nohutların kök bölgesine doğrudan su sağlayan pamuk fitili bazlı bir sulama sistemi geliştirdi (Jessica Atkin)

Araştırmacılar, Apollo astronotlarının geri getirdiği Ay örneklerinin bileşiminden yola çıkarak oluşturulan Ay tozu taklidini çalışmalarında kullandı.

Ekip daha sonra kırmızı Kaliforniya solucanlarının bir yan ürünü olan ve temel bitki besinleri ve mineralleri açısından zengin ve çeşitliliğe sahip bir mikrobiyomu bulunan solucan gübresini buna ekledi.

Desi tipi nohutun Myles çeşidini, yararlı bir mikroorganizma türü olan arbusküler mikoriza mantarıyla ekimden önce kapladılar. Nohutlarla simbiyotik çalışan mantarlar ağır metallerin emilimini azaltırken büyüme için gerekli bazı temel besinleri alır.

Araştırmacılar, Ay tozu miktarı yüzde 75'e kadar olan karışımların hasat edilebilir nohut ürettiğini buldu. Bununla birlikte Ay tozunun daha yüksek oranlarda kullanımı, sorunlara neden olarak bitkilerin stres belirtileri göstermesine ve erken ölmesine yol açtı.

Görsel kaldırıldı.Bir nohut kökü, keskin ve cama benzeyen Ay regoliti taklidinde oluşurken gözlemlendi (Jessica Atkin)

Ancak başarılı bir hasatla mahsul alınsa da bunların insan tüketimi için güvenli olup olmadığını bilim insanlarının hâlâ belirlemesi gerekiyor.

Texas A&M Üniversitesi Toprak ve Mahsul Bilimleri Bölümü'nde doktora çalışmalarını sürdüren Jessica Atkin ilk yazarı olduğu makalenin yayımlanmasının ardından "Bir gıda kaynağı olarak fizibilitelerini anlamak istiyoruz" dedi.

Ne kadar sağlıklılar? Astronotların ihtiyaç duyduğu besinlere sahipler mi? Eğer bunları yemek güvenli değilse kaç nesil içinde bu mümkün kılınabilir?

Independent Türkçe, independent.co.uk/news/science


Gemini'a dava: İntihar eden kullanıcısından beden istedi

Google'ın ve yapay zeka asistanı Gemini'ın logosunu, Fransa'nın Toulouse kentinde 18 Şubat 2026'da gösteren ekranlar (AFP)
Google'ın ve yapay zeka asistanı Gemini'ın logosunu, Fransa'nın Toulouse kentinde 18 Şubat 2026'da gösteren ekranlar (AFP)
TT

Gemini'a dava: İntihar eden kullanıcısından beden istedi

Google'ın ve yapay zeka asistanı Gemini'ın logosunu, Fransa'nın Toulouse kentinde 18 Şubat 2026'da gösteren ekranlar (AFP)
Google'ın ve yapay zeka asistanı Gemini'ın logosunu, Fransa'nın Toulouse kentinde 18 Şubat 2026'da gösteren ekranlar (AFP)

36 yaşındaki bir erkeğin ailesi, onun intihar ederek ölmesine yol açan sanrıları yapay zeka sohbet robotu Gemini'ın körüklediği iddiasıyla Google'a dava açıyor.

Dava dilekçesine göre Floridalı Jonathan Gavalas, Ekim 2025'teki ölümünden önceki iki ay boyunca Gemini'la etkileşime girdi.

İddiaya göre yapay zeka aracından "eşi" diye bahsetti ve sohbet botunu gerçek dünyaya getirecek bir robot beden edinmesi için silahlı görevler yürütmeye teşvik edildi.

Gavalas'ın babası Joel'in açtığı dava, Google'ın Gemini'la kullanıcılar arasındaki duygusal bağı derinleştirmek için yaptığı tasarımın ruh sağlığı sorunları yaşayan kişilere zarar verebileceğini iddia ediyor.

Dava dilekçesinde, "Jonathan, Google'ın ürününü kullanırken açık psikoz belirtileri yaşamaya başladığında bu tasarım tercihleri, 4 gün süren şiddet içeren görevler zincirini tetikledi ve onu intihara sürükledi" deniyor.

Google, Gemini'ın "gerçek dünyadaki şiddeti teşvik etmeyecek veya kendine zarar vermeyi önermeyecek şekilde tasarlandığını" ifade ederken yapay zeka modellerinin "mükemmel olmadığını" da sözlerine ekledi.

Bir Google sözcüsü şunları söyledi:

Bu örnekte Gemini, kendisinin yapay zeka olduğunu açık bir şekilde belirtti ve bu bireyi birçok kez bir acil yardım hattına yönlendirdi. Bunu çok ciddiye alıyoruz ve önlemlerimizi geliştirmeye ve bu hayati işe yatırım yapmaya devam edeceğiz.

Bu, Gemini sohbet botu nedeniyle Google'a açılan ilk ihmal sonucu ölüm davası olsa da öncesinde ChatGPT'nin yaratıcısı OpenAI'a karşı açılan benzer birkaç dava devam ediyor.

Ağustosta 16 yaşındaki Adam Raine'in ebeveynleri, ChatGPT'nin oğullarına nasıl ilmik bağlanacağına dair talimatlar verdiğini iddia ederek OpenAI ve CEO'su Sam Altman'a dava açmıştı.

Raine'in babası Matthew, eylülde ABD Kongresi'ne "Başlangıçta bir ev ödevi yardımcısıydı, zamanla önce bir sırdaşa sonra da bir intihar koçuna dönüştü" demişti.

OpenAI kasımda yaptığı yasal bir başvuruda, Raine'in ölümüne yol açmış olabilecek faktörler arasında "yanlış kullanım, yetkisiz kullanım, istenmeyen kullanım, öngörülemeyen kullanım ve/veya ChatGPT'nin uygunsuz kullanımı" olabileceğini yazmıştı.

Şirket, ChatGPT'nin Raine'i intihara karşı yardım hatları gibi kriz yönetimi kaynaklarıyla temasa geçmesi için "100'den fazla kez" yönlendirdiğini belirtirken "Sohbet geçmişinin tam olarak okunması, ölümünün yıkıcı olsa da ChatGPT'den kaynaklanmadığını gösteriyor" diye eklemişti.

Duruşmanın ağustosta başlaması bekleniyor.

Independent Türkçe