4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



OpenAI ilk cihazını 2026'da tanıtacak

OpenAI CEO'su Sam Altman, şirketin ilk cihazının son derece sade bir tasarıma sahip olacağını söylüyor (Reuters)
OpenAI CEO'su Sam Altman, şirketin ilk cihazının son derece sade bir tasarıma sahip olacağını söylüyor (Reuters)
TT

OpenAI ilk cihazını 2026'da tanıtacak

OpenAI CEO'su Sam Altman, şirketin ilk cihazının son derece sade bir tasarıma sahip olacağını söylüyor (Reuters)
OpenAI CEO'su Sam Altman, şirketin ilk cihazının son derece sade bir tasarıma sahip olacağını söylüyor (Reuters)

OpenAI, bu yılın ikinci yarısında ilk cihazını tanıtmaya hazırlanıyor. 

ChatGPT'nin yaratıcısı yapay zeka alanında öncü rol oynarken, bu zamana kadar herhangi bir donanım çıkarmadı. 

Ancak OpenAI CEO'su Sam Altman, geçen mayısta iPhone'un tasarımcısı Jony Ive'ın şirketini satın almalarından sonra bir cihaz yapabileceklerinin sinyalini vermişti.

Bu yapay zeka cihazının ne olduğu ve ne zaman çıkacağına dair spekülasyonlar sürerken, şirketin politika sorumlusu Chris Lehane'den açıklama geldi.

19 Ocak Pazartesi günü Axios House Davos'ta konuşan Lehane, teknolojiyi 2026'nın ikinci yarısında tanıtma planlarının "yolunda ilerlediğini" söyledi.

Lehane "2026'nın ikinci yarısı gibi bir dönemi hedefliyoruz" dedi ancak aygıtın bu yıl piyasaya sürülmesinin kesin olmadığını belirtti.

Bunun "en olası" tarih olduğunu ve "sürecin nasıl ilerlediğine bakacaklarını" da ekledi.

Lehane bu açıklamasıyla teknoloji dünyasında merak uyandırsa da cihazın kendisi hakkında ipucu vermedi.

Ive'la işbirliği içinde geliştirilen cihazın ne olacağına dair pek çok tahmin var.

Altman daha önce yaptığı bir açıklamada bunun, mevcut mobil teknolojiden radikal bir kopuşu temsil edeceğinin sinyalini vermişti.

OpenAI CEO'su donanımı "huzurlu" diye tanımlamış ve kullanıcıların sadeliği karşısında "şoke olacağını" söylemişti.

Bazıları yapay zeka cihazının, ekransız, küçük ve giyilebilir olacağını ve büyük ölçüde konuşma ve sesle kontrol edileceğini öne sürüyor. Örneğin broş, kulaklık veya tamamen yeni bir tür aygıt olabileceği düşünülüyor.

İnternetteki yaygın teorilerden biri de bunun bir kalem olacağı yönünde. Sosyal medyada dolaşan spekülasyonlara göre cepte taşınabilecek bu cihaz, kullanıcının çevresini algılamak için kamera ve mikrofon içerecek. 

Her ne kadar henüz kesin bir şey söylenemese de genel kanı, OpenAI'ın ses temelli ve ekransız bir tasarım tercih edeceği yönünde. Ekranı olan cihazların akıllı telefon ve saatler gibi ürünlerle rekabet etmesinin zorluğundan dolayı böyle bir tercih yapıldığı düşünülüyor.

Independent Türkçe, Axios, MSN, Android Central, Reddit


Çin'den "Ay saati": Einstein'ın teorisine yeni kanıt

Kütleçekim kuvveti nedeniyle Ay'da zaman daha hızlı akıyor (NASA)
Kütleçekim kuvveti nedeniyle Ay'da zaman daha hızlı akıyor (NASA)
TT

Çin'den "Ay saati": Einstein'ın teorisine yeni kanıt

Kütleçekim kuvveti nedeniyle Ay'da zaman daha hızlı akıyor (NASA)
Kütleçekim kuvveti nedeniyle Ay'da zaman daha hızlı akıyor (NASA)

Çinli bilim insanları Ay'daki zamanı takip eden bir yazılım geliştirdi. Model, Albert Einstein'ın teorilerine yeni bir kanıt sunuyor.

Einstein'ın görelilik teorisinin gösterdiği üzere kütleçekim veya yerçekimi, uzay-zaman dokusunu büküyor.

Bu nedenle zaman, evrenin her yerinde aynı şekilde işlemiyor. Bir nesnenin hızı ve yakınındaki cisimlerin kütleçekim kuvveti zamanın ilerlemesini etkiliyor. 

Kütleçekim kuvveti arttıkça zaman daha yavaş akarken, nesneyi çeken kuvvet azalınca zaman hızlanıyor. Örneğin bir dağın tepesinde zamanın daha hızlı geçmesinin nedeni de bu.

Ay'ın kütlesi ve buna bağlı olarak kütleçekim kuvveti Dünya'dan daha düşük olduğu için zaman uyduda farklı ilerliyor. Ay'daki bir gözlemci için Dünya merkezli bir saat, her Dünya gününde 58,7 mikrosaniye kaybediyor.

58,7 mikrosaniye önemsiz bir fark gibi görünse de Ay görevlerinde kritik önem taşıyor. Modern uzay araçları GPS'e benzer sistemlerle çalışıyor. Bu sistemler, bir radyo sinyalinin bir uydudan bir alıcıya ulaşması için geçen süreyi ölçerek konumu hesaplıyor. Küçük bir zamanlama hatası, iniş aracının konumunu kilometrelerce saptırabilir.

Bugüne kadar Ay'a kısa süreliğine ve nadir gidildiği için bu durum ciddi bir sorun arz etmedi. Ancak uyduya yapılan ziyaretlerin artması beklendiğinden zamanı daha doğru hesaplayacak araçlara ihtiyaç var. 

Nankin'deki Mor Dağ Gözlemevi ve Çin Bilim ve Teknoloji Üniversitesi'nden araştırmacılar, Ay zamanını ölçen, dünyanın kullanıma hazır ilk yazılımını geliştirdi.

Bilim insanları Ay'ın hareketine ilişkin hassas verileri kullanarak uyduyla Dünya arasındaki zaman farkının değişimini izleyerek işe başladı.

Ardından bu hesaplamaları, süreci otomatikleştiren bir yazılım paketine entegre ettiler. Bu sayede kullanıcılar, karmaşık hesaplamaları yapmaya gerek kalmadan iki gökcisminin zamanını doğrudan karşılaştırabiliyor.

Bulguları hakemli dergi Astronomy & Astrophysics'te yayımlanan çalışmaya göre yazılım, bin yıl sonra bile nanosaniye hassasiyetinde doğruluğunu koruyacak.

Bulgular, uzay-zaman dokusunun kütleçekimden etkilendiğini gösteren görelilik teorisini yüksek hassasiyetli ölçümlerle güçlü bir şekilde kanıtlıyor.

Araştırmacılar, bu teoriye dayanak geliştirdikleri Ay Saati Efemerisi (Lunar Time Ephemeris / LTE440) adlı modelin, gerçek uygulamalarda navigasyon sağlamadan önce daha fazla geliştirilmeye ihtiyaç duyduğunu söylüyor. 

Ay, uzay araçları ve insanlarla doldukça bu tür navigasyon araçları da daha önemli olacak. 

NASA, Ay'a 1972'den beri ilk kez düzenlenecek insanlı uçuşun roketini önceki günlerde fırlatma rampasına yerleştirmişti. Artemis II görevi kapsamında atılacak roketin en erken 6 Şubat'ta fırlatılması beklenirken, bu tarih nisana kadar uzayabilir.

Independent Türkçe, Interesting Engineering, IFLScience, South China Morning Post, Astronomy & Astrophysics, BBC Sky at Night Magazine


Erkeklerde toksik masküliniteyi ölçme yöntemi geliştirildi

(Unsplash)
(Unsplash)
TT

Erkeklerde toksik masküliniteyi ölçme yöntemi geliştirildi

(Unsplash)
(Unsplash)

Vishwam Sankaran Bilim ve Teknoloji Muhabiri 

"Toksik maskülinite"nin tanımını daraltan yeni bir araştırmaya göre bu sorunlu erkek davranışı, yalnızca erkeklerin küçük bir alt kümesinde görülen bir özellik.

Yeni Zelanda'da yaklaşık 15 bin heteroseksüel erkeğin katıldığı araştırma, 5 farklı maskülinite profili belirledi ve bunlardan yalnızca birinin "toksik" diye tanımlanabileceğini buldu. Toksik maskülinite, topluma zararlı olabilen baskınlık ve saldırganlık gibi klişeleşmiş erkek özelliklerini ifade eden, internette sıkça kullanılan bir terim.

Psikologlar, katılımcıların uyumsuzluk, narsisizm ve cinsel önyargı gibi "sorunlu maskülinite"yle bağlantılı 8 gösterge hakkında soruları yanıtladığı Yeni Zelanda Tutum ve Değerler Çalışması'ndan elde edilen verileri değerlendirdi.

Ayrıca, kadınlara karşı açıkça olumsuz tutumlar anlamına gelen düşmanca cinsiyetçilik ve görünüşte olumlu ancak kadınlara dair klişeleşmiş görüşleri kapsayan iyi niyetli cinsiyetçilik hakkında da soruları yanıtladılar.

Araştırmacılar, bu kişilik göstergeleri hakkındaki sorulara verdikleri yanıtlara dayanarak erkeklerin farklı alt gruplarını belirlemek için istatistiksel araçlar kullandı.

Rıza dışı dokunma örneği (Binghamton Üniversitesi ve New York Eyalet Üniversitesi/Eurekalert)
Rıza dışı dokunma örneği (Binghamton Üniversitesi ve New York Eyalet Üniversitesi/Eurekalert)

Analiz, 5 farklı erkeklik profili ortaya çıkardı. Erkeklerin yaklaşık yüzde 35'ini oluşturan en büyük grup, toksik özelliklerde düşük puan alırken, anket katılımcılarının yaklaşık yüzde 53'ünü oluşturan diğer iki büyük grup düşük ila orta düzeyde puan aldı.

"Atoksikler" diye nitelenen bu erkekler, "sorunlu maskülinite"nin 8 göstergesinde en düşük puanı aldı. Bu da sözkonusu tutumların olmayışına işaret ediyor.

Katılımcıların yaklaşık yüzde 7'si, orta düzeyde uyumsuzluk, narsisizm ve aile içi şiddeti önlemeye karşıtlık gösteren "iyicil toksik" diye nitelendi.

Çalışmaya göre bu bireyler, görünüşte olumlu ancak kısıtlayıcı kadın görüşleri ve yüksek cinsel önyargıyla karakterize edilen toksiklik sergiledi.
 

Farklı Erkeklik Türlerinin Profilleri (Deborah Hill Cone vd., Erkeklerin ve Maskülinitenin Psikolojisi (2026))

Farklı Erkeklik Türlerinin Profilleri (Deborah Hill Cone vd., Erkeklerin ve Maskülinitenin Psikolojisi (2026))

Katılımcıların yaklaşık yüzde 3'ünü oluşturan en küçük kategori, "düşmanca toksik" diye nitelendi. Bu kişiler uyumsuzluk, düşmanca cinsiyetçilik, aile içi şiddetin önlenmesine karşıtlık, narsisizm ve sosyal baskınlık yöneliminde en yüksek puanları aldı aldı.

Araştırmacılar, bu profilin, yaygın olarak anlaşılan "toksik maskülinite" tanımıyla en yakından örtüştüğünü söylüyor.

Çalışmada, "Böylece sorunlu erkekliği diğer yapıcı erkeklik biçimlerinden ayırma ihtiyacını gösteriyoruz" dendi.

Araştırmacılar, "Erkeklerin sadece küçük bir kısmı geleneksel toksik maskülinite biçimlerini sergiledi" sonucuna vardı ve "Erkekler toksik olmadan da 'erkeksi' olabilir" diye ekledi.

Sonuçlarımız bir bütün olarak ele alındığında, maskülinite kimliklerinin çeşitliliğini gösteriyor ve yıkıcı erkek tutumlarını ele almaya yönelik müdahalelerin, farklı toksisite biçimlerine karşı koyacak şekilde uyarlanması gerektiğini ortaya koyuyor.

Independent Türkçe, independent.co.uk/news/science