4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



Eski Twitter çalışanı platformu geri getirmek için kolları sıvadı

Fotoğraf: Reuters
Fotoğraf: Reuters
TT

Eski Twitter çalışanı platformu geri getirmek için kolları sıvadı

Fotoğraf: Reuters
Fotoğraf: Reuters

ABD merkezli bir girişim, Elon Musk devralmadan önceki Twitter'ın orijinal işlevlerini ve markasını hayata döndüren yeni bir sosyal ağ kurmaya çalışıyor.

Operation Bluebird adlı Virginia merkezli girişim, "terk edilmiş" Twitter ticari markalarını geri almasına izin verilmesi için ABD Patent ve Ticari Marka Ofisi'ne (USPTO) çoktan dilekçe sundu.

Musk'ın platformu 44 milyar dolarlık bir anlaşmayla devralmasından 9 ay sonra, Temmuz 2023'te Twitter'ın adı X olarak değiştirilmişti.

Şirket, X.com'a yönlendiren Twitter.com internet sitesinin hâlâ sahibi ancak eski kuruluşa ait tüm logoları veya referansları çevrimiçi ortamdan kaldırdı.

X ayrıca kuş odaklı terminolojiye gönderme yapan özellikleri de yeniden adlandırdı; örneğin "Birdwatch" (kuş gözlemi) adlı doğrulama programı artık "Topluluk Notları" diye biliniyor.

Operation Bluebird'ün twitter.new alan adına halihazırda sahip olması, ilgili kişilerin platformun muhtemel açılışından önce kullanıcı adı ayırtmasına olanak tanıyor.

İki tescilli marka avukatı Michael Peroff ve Stephen Coates bu girişimi yönetiyor. Coates daha önce 2014-2016'da Twitter'ın ticari marka, alan adı ve pazarlama müdür yardımcısı olarak görev yapmıştı.

Operation Bluebird'ün USPTO'ya yaptığı başvuruda "Twitter ve Tweet markaları, X Corp.'un ürünlerinden, hizmetlerinden ve pazarlamasından tamamen silindi, efsanevi kuş logosu fiilen terk edildi ve markayı kullanmaya devam etme niyeti sözkonusu değil" ifadeleri yer alıyor.

Bluebird işbu dilekçede, X Corp.'un Twitter markasındaki haklarından yasal olarak vazgeçtiği, tartışmalı markaların yeniden kullanılmasına dair hiçbir niyeti olmadığı, USPTO'ya yanlış beyan ve bildirimlerde bulunarak sahtekarlık yapmayı sürdürdüğü gerekçesiyle, tüm tartışmalı markaların iptalini talep etmektedir.

Dilekçede ayrıca şirketin isminin Twitter'dan X'e çevrilmesinden kısa süre önce Musk'ın yaptığı bir paylaşıma da değiniliyor.

Musk, 23 Temmuz 2023'te "Ve yakında Twitter markasına ve yavaş yavaş tüm kuşlara veda edeceğiz" diye yazmıştı.

Musk ve X'in USPTO dilekçesine yanıt vermek için şubata kadar vakti var. The Independent cevap hakkı için X'le temasa geçti.

Independent Türkçe


En zararlı" yapay zekalar listelendi

(Unsplash)
(Unsplash)
TT

En zararlı" yapay zekalar listelendi

(Unsplash)
(Unsplash)

Anthony Cuthbertson Teknoloji Editör Yardımcısı @ADCuthbertson 

Yeni bir araştırmaya göre yapay zeka şirketlerinin büyük çoğunluğu, teknolojinin getirdiği felaket risklerini yönetmekte başarısız.

Kâr amacı gütmeyen Future of Life Institute'teki yapay zeka güvenliği uzmanlarının değerlendirmesi, önde gelen 8 yapay zeka şirketinin "bu kadar güçlü sistemlerin gerektirdiği somut güvenlik önlemlerinden, bağımsız denetimden ve güvenilir uzun vadeli risk yönetimi stratejilerinden yoksun olduğunu" ortaya koydu.

Yapay Zeka Güvenlik Endeksi'nde en iyi puanları ABD şirketleri alırken, Anthropic, ChatGPT'nin yaratıcısı OpenAI ve Google DeepMind'ı geride bıraktı. Çin şirketleriyse genel olarak en düşük notları alırken, Alibaba Cloud, DeepSeek'in hemen arkasında yer aldı.

Varoluşsal risk değerlendirmesinde hiçbir şirket D'nin üzerinde not almazken, Alibaba Cloud, DeepSeek, Meta, xAI ve Z.ai, F notu aldı.

Araştırmada, "Varoluşsal güvenlik, sektörün temel yapısal başarısızlığı olmaya devam ediyor ve hızlanan yapay genel zeka/süper zeka hedefleriyle güvenilir kontrol planlarının yokluğu arasındaki giderek genişleyen uçurum her gün daha endişe verici hale geliyor" dendi.

Şirketler yapay genel zeka ve süper zeka hedeflerini hızlandırırken, hiçbiri felaket niteliğindeki kötüye kullanımı veya kontrol kaybını önlemek için güvenilir bir plan ortaya koyamıyor.

Önde gelen yapay zeka şirketlerine temel güvenlik konularında verilen puanlar (Future of Life Institute)Önde gelen yapay zeka şirketlerine temel güvenlik konularında verilen puanlar (Future of Life Institute)

Raporun yazarları, yapay zeka şirketlerinin kendi güvenlik değerlendirmelerinde daha şeffaf olmaları ve yapay zeka psikozu gibi daha acil zararlardan kullanıcıları korumak için daha fazla çaba göstermeleri çağrısında bulundu.

UC Berkeley'den bilgisayar bilimleri profesörü Stuart Russell, "Yapay zeka CEO'ları insanüstü yapay zekanın nasıl inşa edileceğini bildiklerini öne sürüyor ancak hiçbiri kontrolü kaybetmemizi nasıl önleyeceklerini gösteremiyor. Bu gelişmeden sonra insanlığın hayatta kalması artık bizim elimizde değil" dedi.

Nükleer reaktör gereksinimlerine uygun olarak, yıllık kontrol kaybı riskini yüz milyonda bire indirebileceklerine dair kanıt arıyorum. Bunun yerine, riskin onda bir, beşte bir, hatta üçte bir olabileceğini kabul ediyorlar ve bu sayıları ne haklı çıkarabiliyorlar ne de iyileştirebiliyorlar.

OpenAI temsilcisi, şirketin "sistemlere güçlü güvenlik önlemleri eklemek ve modelleri titizlikle test etmek" için bağımsız uzmanlarla çalıştığını belirtti.

Google sözcüsüyse şunları söyledi:

Sınır Güvenlik Çerçevemiz, güçlü sınır yapay zeka modellerinden kaynaklanan ciddi riskleri ortaya çıkmadan önce belirlemek ve azaltmak için özel protokoller sunuyor.

Modellerimiz daha gelişmiş hale geldikçe, kabiliyetlerimizle aynı hızda güvenlik ve yönetim konusunda yenilik yapmaya devam ediyoruz.

Independent, yorum için Alibaba Cloud, Anthropic, DeepSeek, xAI ve Z.ai'yla iletişime geçti.

Independent Türkçe, independent.co.uk/tech


NASA ve ESA'dan yeni 3I/ATLAS görüntüleri: İki kuyruğu var

Hubble Uzay Teleskobu, yıldızlararası kuyrukluyıldız 3I/ATLAS'ı 30 Kasım'da ikinci kez gözlemledi (NASA)
Hubble Uzay Teleskobu, yıldızlararası kuyrukluyıldız 3I/ATLAS'ı 30 Kasım'da ikinci kez gözlemledi (NASA)
TT

NASA ve ESA'dan yeni 3I/ATLAS görüntüleri: İki kuyruğu var

Hubble Uzay Teleskobu, yıldızlararası kuyrukluyıldız 3I/ATLAS'ı 30 Kasım'da ikinci kez gözlemledi (NASA)
Hubble Uzay Teleskobu, yıldızlararası kuyrukluyıldız 3I/ATLAS'ı 30 Kasım'da ikinci kez gözlemledi (NASA)

3I/ATLAS'ın yeni yayımlanan görüntüleri, yıldızlararası cismin aktivitesinin arttığını ve iki kuyruğu olduğunu ortaya çıkardı.

Oumuamua ve Borisov'dan sonra Güneş Sistemi'nde görülen ilk yıldızlararası cisim olan 3I/ATLAS, son aylarını sistemin iç kısımlarında ilerleyerek geçirdi.

Kuyrukluyıldız, Mars'a ve Güneş'e en yakın konumuna ekimde ulaştı.

Gökbilimcilerin çeşitli teleskoplarla aylardır takip ettiği cisim Dünya'ya en yakın konumuna yaklaşırken, NASA ve Avrupa Uzay Ajansı (ESA) yeni görüntülerini paylaştı.

Görüntüler, 3I/ATLAS'ın Güneş'e yaklaştığında çok parlak ve aktif hale gelerek uzaya büyük miktarda süblimleşmiş gaz ve toz püskürttüğünü ortaya koydu.

NASA'nın Hubble Uzay Teleskobu, 3I/ATLAS'ı keşfinden kısa bir süre sonra temmuzda gözlemleyen ilk araçlardan biriydi. 

Bilim insanları emektar teleskobu bir kez daha kuyrukluyıldızın gizemlerini açığa çıkarmak için kullandı. 

30 Kasım'da Hubble, gökcismini Dünya'dan 286 milyon kilometre uzaktayken görüntülemeyi başardı. 

Fotoğrafın merkezindeki parlak beyaz nokta, kuyrukluyıldızın çekirdeğini (ana gövdesi) ve etrafını saran parlak gaz ve toz atmosferi olan komayı gösteriyor.

Kuyrukluyıldızlar genellikle Güneş'e yaklaştıkça içlerindeki buzun ısınıp süblimleşmesiyle parlaklaşıyor. Yıldızın enerjisi bu gazı Güneş'ten uzağa doğru uzanan bir kuyruk haline getiriyor. Cismin Güneş'e bakan en sıcak tarafındaysa, yıldıza doğru eğimli gaz ve toz püskürmeleri meydana gelebiliyor.

Hubble'ın yeni görüntüsünde bu olguların ikisi de belli belirsiz görülebiliyor.

zxscdfrg
Juice aracı, 3I/ATLAS'ın iki kuyruğunu gözler önüne serdi (ESA)

NASA'nın yanı sıra ESA da Jüpiter'e doğru yol alan Juice aracının çektiği 3I/ATLAS görüntüsünü yayımladı.

Nisan 2023'te fırlatılan Juice, Jüpiter'in en büyük üç uydusu Ganymede, Calliston ve Europa'da yaşam belirtileri arayacak. 

2031'de hedefine ulaşması beklenen araç 2 Kasım'da Hubble'a kıyasla daha yakın bir mesafeden 3I/ATLAS'ın görüntüsünü yakaladı. 

Aslında Juice'un, kuyrukluyıldızın 66 milyon kilometre uzağından edindiği veriler Şubat 2026'dan önce bilim insanlarının eline geçmeyecek.

Ancak araştırmacılar yıldızlararası cisim hakkında daha fazla bilgi edinmek için verinin bir kısmını indirdi.

Yeni yayımlanan görüntüde, kuyrukluyıldızı çevreleyen komanın yanı sıra iki kuyruk seçiliyor: plazma kuyruğu ve toz kuyruğu.

ESA'dan yapılan açıklamada "Kuyrukluyıldızın koma diye bilinen, parlayan gaz halesini açıkça görmekle kalmıyor, aynı zamanda iki kuyruğa dair işaretler de görüyoruz" ifadeleri kullanılıyor: 

Kuyrukluyıldızın elektrik yüklü gazdan oluşan 'plazma kuyruğu' karenin tepesine doğru uzanıyor. Ayrıca çerçevenin sol alt kısmına doğru uzanan, küçük katı parçacıklardan oluşan daha soluk bir 'toz kuyruğu'nu da görebiliyoruz.

Güneş Sistemi'nde ortaya çıkan kuyrukluyıldızlar genellikle komanın yanı sıra bu iki kuyruğa da sahip oluyor. 

Bilim insanları şubat sonlarında daha fazla verinin gelmesiyle 3I/ATLAS hakkında daha net bilgiler edinmeyi umuyor.

Ayrıca Dünya'ya yaklaşan cisim, pek çok aracın yanı sıra James Webb Uzay Teleskobu tarafından da görüntülenecek. 

3I/ATLAS'ın, 19 Aralık'ta 270 milyon kilometre uzaklığa gelerek Dünya'ya en yakın mesafesine ulaşması bekleniyor.

Independent Türkçe, Live Science, CNN, ESA