4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



İnsan atası Lucy'yi avlayan devasa timsah keşfedildi

"Lucy'nin avcısı"nın illüstrasyonu (Tyler Stone/Iowa Üniversitesi)
"Lucy'nin avcısı"nın illüstrasyonu (Tyler Stone/Iowa Üniversitesi)
TT

İnsan atası Lucy'yi avlayan devasa timsah keşfedildi

"Lucy'nin avcısı"nın illüstrasyonu (Tyler Stone/Iowa Üniversitesi)
"Lucy'nin avcısı"nın illüstrasyonu (Tyler Stone/Iowa Üniversitesi)

Vishwam Sankaran Bilim ve Teknoloji Muhabiri 

Bilim insanları yarım ton ağırlığında, boyu 4,5 metreye varan ve muhtemelen Afrika coğrafyasında dolaşan atalarımıza dehşet salan, tarih öncesinden kalma yeni bir dev timsah türü keşfetti.

Başında belirgin bir çıkıntı bulunan, günümüz timsahlarının bu devasa akrabası 3 milyon yıl önce nehir ve göllerde sabırla pusuya yatarak insanların atalarına saldırıyordu.

Crocodylus lucivenator, yani Lucy'nin avcısı adı verilen timsahın soyu tükenmiş hominid türü Australopithecus afarensis'i avladığı neredeyse kesin. Lucy diye bilinen iskelet örneğinin 3,2 milyon yıl boyunca mükemmel bir şekilde korunması sayesinde Australopithecus afarensis, modern insanların en iyi incelenmiş atalarından biri.

Crocodylus lucivenator, günümüz Etiyopyası'ndaki nehirlerle dolu çalılık ve sulak alanlardan oluşan geniş bir bölgede yaşayan tek timsah türüydü.

Journal of Systematic Palaeontology'de yayımlanan araştırmaya göre timsahın maksimum uzunluğu 3,5 ila 4,5 metreyken, yetişkinlerin ağırlığı 270 ila 590 kilogramdı.

Bilim insanları, günümüz timsahları gibi pusuya yatan bir yırtıcı olan Lucy'nin avcısının, su içmeye gelenlere saldırmaya hazır şekilde su altında avını beklediğini söylüyor.

Iowa Üniversitesi'nden araştırmanın yazarı Christopher Brochu, "Ekosistemdeki en büyük avcıydı; aslan ve sırtlanlardan bile daha büyüktü ve o dönemde orada yaşayan atalarımız için en büyük tehditti" diyor.

Dr. Brochu şu ifadeleri kullanıyor: 

Bu timsahın Lucy'nin türünü avladığı neredeyse kesin. Belirli bir timsahın Lucy'yi yakalamaya çalışıp çalışmadığını asla bilemeyeceğiz ancak o, Lucy'nin türünü gördüğünde muhtemelen 'Akşam yemeği' diye düşünüyordu.

Araştırmacılar, 2016'da Etiyopya'nın başkenti Addis Ababa'da yer alan bir müzedeki örneklere dayanarak yeni türü tanımladı.

Daha sonra düzinelerce bireye ait kafatasları, dişler ve çene parçaları gibi belgelenmiş 121 kalıntıyı analiz ettiler.

Örneklerden birinin çenesindeki iyileşmiş birkaç yara izi, akranlarından biriyle boğuştuğuna işaret ediyor.

Dr. Brochu "Bu türün gerçekten tuhaf özellikleri bir arada barındırması karşısında hayrete düştüm" diyor.

Soyu tükenmiş bu timsahın kendine özgü fiziksel özelliklerinden biri, burnunun ortasındaki büyük çıkıntıydı. Bu özellik, Amerikan timsahında görülse de Afrika'daki Nil timsahında bulunmuyor.

Bilim insanları, erkek timsahların bu çıkıntıyı eş bulmak için kullandığını düşünüyor.

Dr. Brochu, "Bunu bazı modern timsahlarda da görebilirsiniz" diye açıklıyor. 

Erkek, dişi timsaha gösteriş yapmak için başını biraz aşağıya indirir.

Fosiller, Etiyopya'nın Afar bölgesindeki Hadar kazı alanından çıkarıldı.

Çalışmanın bir diğer yazarı Christopher Campisano, "Pliyosen dönemde Hadar, göl ve nehir sistemlerinin yanı sıra açık ve kapalı ormanlık alanlar, galeri ormanları, ıslak otlaklar ve çalılıklar gibi, zaman ve bölgeye göre değişen çeşitli habitatlardan oluşuyordu" diyor.

Dr. Campisano "İlginç bir şekilde bu timsah, bu süreç boyunca hayatta kalabilen birkaç türden biriydi" ifadelerini kullanıyor.

Independent Türkçe, independent.co.uk/news


Elon Musk, yapay zeka şirketini yenileme planlarını açıkladı

Elon Musk, sosyal medya platformu X'teki yapay zeka görüntü oluşturma özelliği nedeniyle eleştirilere maruz kalırken Londra'daki aktivistler, 13 Ocak 2026'da bu afişi astı (Justin Tallis/AFP)
Elon Musk, sosyal medya platformu X'teki yapay zeka görüntü oluşturma özelliği nedeniyle eleştirilere maruz kalırken Londra'daki aktivistler, 13 Ocak 2026'da bu afişi astı (Justin Tallis/AFP)
TT

Elon Musk, yapay zeka şirketini yenileme planlarını açıkladı

Elon Musk, sosyal medya platformu X'teki yapay zeka görüntü oluşturma özelliği nedeniyle eleştirilere maruz kalırken Londra'daki aktivistler, 13 Ocak 2026'da bu afişi astı (Justin Tallis/AFP)
Elon Musk, sosyal medya platformu X'teki yapay zeka görüntü oluşturma özelliği nedeniyle eleştirilere maruz kalırken Londra'daki aktivistler, 13 Ocak 2026'da bu afişi astı (Justin Tallis/AFP)

Anthony Cuthbertson Teknoloji Editör Yardımcısı @ADCuthbertson 

Elon Musk, sosyal medya platformu X ve yapay zeka sohbet botu Grok'u yöneten şirket xAI'ı baştan aşağı yenileme planlarını açıkladı.

Teknoloji milyarderi, Google ve OpenAI gibi rakiplerin "woke" yapay zeka modellerine karşı koymak amacıyla bu şirketi Mart 2023'te kurmuştu. Ancak üç yılın ardından eski çalışanların kaos ortamından bahsetmesi üzerine Musk, xAI'ın yönetilme biçiminden duyduğu pişmanlığı dile getirdi.

X'te "xAI ilk seferinde düzgün kurulmadı, bu yüzden temelden yeniden inşa ediliyor. Aynı şey Tesla'da da olmuştu" diye yazan Musk, elektrikli araba üreticisinin kadrosu ve yapısında ilk yıllarda gidilen büyük değişikliklere gönderme yaptı.

Musk, "birçok yetenekli kişinin" xAI'a katılma başvurusu yaptığını ancak kendilerine bir teklif, hatta mülakat bile sunulmadığını ekledi.

Milyarder "Özür dilerim" dedi. 

Barış Akış'la [xAI'ın işe alım müdürü] birlikte şirketin geçmişteki mülakatlarını inceliyoruz ve gelecek vaat eden adaylarla tekrar iletişime geçiyoruz.

Musk'ın gönderisi, eski çalışanların xAI'daki çalışma deneyimlerini paylaşarak şirketin yapısı ve yetkili personelin bir kısmı hakkında şikayetlerini dile getirmesine yol açtı.

Yapay zeka uzmanı Benjamin De Kraker şirkette çalıştığı Eylül 2024-Mart 2025 döneminde, Musk'tan gizlendiğini iddia ettiği "temel sorunlar"dan bahsetti.

X'te yaptığı paylaşımda, "xAI çalışanları heyecan ve hevesle işe başlıyordu ancak fikirlerden nefret eden yöneticiler, bu duyguları eziyordu" diye yazdı.

xAI'yı orta düzey yöneticiler ve işgüzarlarla doldurdular. Çalıştığım en DEI (Çeşitlilik, Eşitlik ve Kapsayıcılık) ve kurumsal yerlerden biriydi. Elon ve xAI'nın kazanmasını isteyerek geldim ve üzgün ayrıldım.

Diğer eski çalışanlar da Musk'ın yönetim tarzını eleştiriyor. The Verge'ün yakın tarihli bir haberinde, Musk'ın yapay zeka güvenliğine yaklaşımı ve bunun Grok'a uygulanmasıyla ilgili endişeler dile getirilmişti.

İsminin açıklanmasını istemeyen eski bir çalışan, "Şirkette hiçbir güvenlik önlemi yok; ne görüntü [modelinde] ne de sohbet botunda" demişti.

[Musk], modeli daha dengesiz hale getirmek için aktif çaba harcıyor çünkü ona göre güvenlik, bir anlamda sansür demek. Hayatta kalmak için Elon'un istediğini yapıp çeneni kapatman gerekiyor.

Independent Türkçe, independent.co.uk/tech


Teknoloji devleri, Beyaz Saray’a karşı Musk’ın rakibini destekliyor

Trump'ın Eylül 2025'te imzaladığı kararnameyle ABD Savunma Bakanlığı'nın adı "Savaş Bakanlığı" olarak değiştirilmişti (Reuters)
Trump'ın Eylül 2025'te imzaladığı kararnameyle ABD Savunma Bakanlığı'nın adı "Savaş Bakanlığı" olarak değiştirilmişti (Reuters)
TT

Teknoloji devleri, Beyaz Saray’a karşı Musk’ın rakibini destekliyor

Trump'ın Eylül 2025'te imzaladığı kararnameyle ABD Savunma Bakanlığı'nın adı "Savaş Bakanlığı" olarak değiştirilmişti (Reuters)
Trump'ın Eylül 2025'te imzaladığı kararnameyle ABD Savunma Bakanlığı'nın adı "Savaş Bakanlığı" olarak değiştirilmişti (Reuters)

ABD'deki teknoloji devleri, Beyaz Saray'la hukuki mücadelesinde yapay zeka şirketi Anthropic'e destek veriyor.

Aralarında Google, Microsoft, Apple ve Amazon gibi teknoloji devlerinin yer aldığı firmalar, Anthropic'in Washington yönetimine karşı açtığı davaya desteklerini açıkladı.

ABD Savunma Bakanlığı'yla (Pentagon), sohbet botu ChatGPT'nin yaratıcısı OpenAI'ın eski çalışanları tarafından 2021'de kurulan Anthropic arasındaki anlaşmazlık geçen ay basına yansımıştı.

Pentagon, firmanın hizmetlerini "tedarik zinciri güvenliği açısından riskli" sınıfına soktuğunu ilan etmişti.

Microsoft'tan yapılan açıklamada, hükümetin bu sınıflandırmasının "tüm teknoloji sektörünü etkileyecek olumsuz sonuçlar doğurabileceği" uyarısında bulunuldu.

Google, Apple, Amazon, Nvidia ve diğer birçok teknoloji şirketi tarafından finanse edilen, bu firmaların temsilciliğini üstlenen teknoloji savunuculuğu grubu İlerleme Odası (Chamber of Progress) de bir dilekçe yayımlayarak Anthropic'e destek verdi.

Dilekçede, Pentagon'un şirkete yönelik tavrı "öfke nöbeti" diye nitelenerek, bunun "zorlama, suç ortaklığı ve sessizlik kültürünü dayattığı" vurgulandı.

Gruptan 2025'te ayrılan Facebook'un sahibi Meta ise Anthropic'le Pentagon arasındaki tartışma hakkında henüz yorum yapmadı.

Pentagon, Anthropic'in yapay zeka sistemi Claude'u hukuki çerçeve dahilinde çok daha geniş kapsamda kullanmak istiyordu. Ancak şirket, kitlesel gözetim teknolojileri ve otonom silahlar gibi alanlarda kısıtlamalar uyguluyordu.

ABD Savunma Bakanı Pete Hegseth, 24 Şubat'ta Anthropic'e ültimatom vererek, firmanın yapay zeka hizmetlerini istedikleri gibi kullanmalarına müsaade edilmemesi halinde 27 Şubat'ta anlaşmalarının sonlanacağını söylemişti.

Anthropic'in CEO'su Dario Amodei ise Pentagon'un taleplerini "vicdanen kabul edemeyeceklerini" belirtmişti.

Bunun ardından ABD Başkanı Donald Trump, Anthropic'in federal kurumlara sağladığı hizmetlerin durdurulması talimatını vermişti. Pentagon'un daha sonra OpenAI'la anlaştığı açıklanmıştı.

Diğer yandan Anthropic'le sözleşmesini sonlandırmasına rağmen Amerikan ordusunun, İran savaşında şirketin Claude yazılımını kullandığı ortaya konmuştu. ABD, ocak ayında Venezuela'ya düzenlediği operasyonda da bu yazılımdan faydalanmıştı.

Independent Türkçe, BBC, Fortune