4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



Binlerce yıllık DNA örnekleri, Doğu Asya halklarının tarihini baştan yazıyor

(Unsplash)
(Unsplash)
TT

Binlerce yıllık DNA örnekleri, Doğu Asya halklarının tarihini baştan yazıyor

(Unsplash)
(Unsplash)

Vishwam Sankaran Bilim ve Teknoloji Muhabiri 

Doğu Asya'nın nüfus tarihine ilişkin yeni ve ayrıntılı bir tablo sunan yeni bir araştırmaya göre insanlar, Sibirya'yla Çin'in kuzeyi arasında tahmin edilenden çok daha erken bir dönemde gidip geliyordu.

Sibirya, Moğolistan Platosu ve Çin'in kuzeyini kapsayan Kuzey Doğu Asya, insanlık tarihinde kilit rol oynadı.

Zengin su ve orman kaynakları, Baykal Gölü bölgesini erken dönem insan kültürünün ve teknolojik gelişmeler için muhtemelen kritik bir merkez haline getirdi.

Önceki araştırmalar, Avrasya Bozkırları ve Çin'in kuzeyindeki erken dönem insan topluluklarının, MÖ 3. binyılda pastoralizm ve metalurjinin yaygınlaşmasına kadar birbirleriyle çok fazla bağlantılı olmadığını öne sürüyordu. Bunun nedeni, iki bölgedeki insanlar arasında büyük ölçekli etkileşime dair güçlü ve doğrulanabilir kanıtların bulunmamasıydı.

Yeni çalışma 7 bin 700 yıl önce iki bölge arasında daha önce bilinmeyen bir  "kuzey-güney kültürel alışveriş koridoru" olduğunu ortaya çıkararak bu inancı alt üst etti.
 

Görsel kaldırıldı.Yan Dağı Bölgesi ve çevresindeki tarih öncesi gen akışı ve kültürel etkileşimin illüstrasyonu (Science China Press)

Çalışmada 7 bin 700 ila 4 bin 300 yıl öncesine ait üç arkeolojik kazı alanından elde edilen 42 antik genom incelendi.

Kilit önemdeki bir popülasyonun pastoralizmin yükselişinden binlerce yıl önce, Sibirya'nın Baykal Gölü bölgesiyle Çin'in kuzeyindeki Yan Dağı Bölgesi arasında köprü görevi gördüğü tespit edildi.

Hakemli dergi Science Bulletin'de yayımlanan son çalışmaya göre, Çin'in kuzeyindeki erken Taş Devri Sitaimengguying kazı alanından gelen bu nüfus, Baykal Gölü'ndeki popülasyonlarla bağlantılı belirgin bir genetik iz taşıyordu.

Jilin Üniversitesi'nden Yinqiu Cui, yazarları arasında yer aldığı çalışma hakkında "Sitaimengguying nüfusu kritik bir bağlantı" diyor.

Baykal bölgesinden gelen genetik izleri koruyup bu mirası Çin'in kuzeyindeki sonraki nüfuslara kadar izlememizi sağlayarak hayati bir aracı görevi gördüler.

Çalışmada Sitaimengguying ve Sibirya nüfusları arasındaki kültürel bağlara dikkat çekiliyor.

Örneğin Sitaimengguying'de keşfedilen yuvarlak tabanlı benzersiz kaplar, daha önce sadece Baykal Gölü bölgesinde görülmüştü.

Çin'deki kazı alanında erkeklerin yan yatırılarak uzuvları üst üste gelecek şekilde gömülme geleneği de Baykal Gölü çevresinde yaygındı.

Yan Dağı Bölgesi'nde ortaya çıkarılan insan kalıntılarından alınan genom örnekleri, nüfusların karıştığına dair ek kanıtlar sunuyor.

Çalışmanın bir diğer yazarı Choongwon Jeong, "Yan Dağı Bölgesi belli ki dinamik bir sınır hattı, gerçek bir etkileşim alanıydı" diyor. 

Bu, Yan Dağı Bölgesi'nin Doğu Asya'nın kuzeyinin genetik yapısını şekillendirmedeki merkezi rolünü vurguluyor.

Independent Türkçe, independent.co.uk/news


Bilim insanları "patlamış mısır" aromalı domates geliştirdi

Bezeril'deki Natais patlamış mısır fabrikasının laboratuvarındaki patlamış mısır (AFP)
Bezeril'deki Natais patlamış mısır fabrikasının laboratuvarındaki patlamış mısır (AFP)
TT

Bilim insanları "patlamış mısır" aromalı domates geliştirdi

Bezeril'deki Natais patlamış mısır fabrikasının laboratuvarındaki patlamış mısır (AFP)
Bezeril'deki Natais patlamış mısır fabrikasının laboratuvarındaki patlamış mısır (AFP)

Vishwam Sankaran Bilim ve Teknoloji Muhabiri 

Çinli bilim insanları gen düzenleme teknolojisiyle "patlamış mısır benzeri" aromalı yeni bir domates çeşidi üretti. Bu gelişme, nakliye ve depolama sırasında meyvenin lezzetinin kaybolması sorununu çözmeyi amaçlıyor.

Canlı rengi, mutfakta farklı şekillerde kullanılabilmesi ve besin değerleri nedeniyle sevilen domates, dünya çapında en çok yetiştirilen ve tüketilen gıdalardan biri.

Özellikle domatesin kokusu, gıdanın duyusal çekiciliğini önemli ölçüde artırarak tüketimini ve piyasa fiyatını etkiliyor.

Ancak domatesler, asmadan koparıldıktan hemen sonra başlayan metabolik değişiklikler nedeniyle aromalarını kaybetmeye başlayarak nakliye ve depolama sırasında lezzetlerini daha da yitiriyor.

Bilim insanları, CRISPR/Cas9 gen düzenleme teknolojisini kullanıp domates türlerindeki iki kilit geni aynı anda değiştirerek dünyanın ilk "olağanüstü aromatik domates bitkilerini" üretti.

Araştırmacılar, farklı domates çeşitlerindeki betain aldehit dehidrogenaz 2 (BADH2) adlı geni kesintiye uğrattı. Bu genin devre dışı bırakılmasının, "patlamış mısır benzeri" hoş aromadan sorumlu organik bileşik 2-asetil-1-pirolin (2-AP) birikimine yol açtığını tespit ettiler.

Bilim insanları daha sonra domatesleri tarayarak BADH2 geninin formlarını aradı, SlBADH1 ve SlBADH2 adlı iki varyant saptayıp bunların işlevini devre dışı bıraktı. Bu mutant türlerin önemli ölçüde daha yüksek 2-AP içeriği sergilediğini keşfettiler.

Journal of Integrative Agriculture'da yayımlanan çalışmanın yazarlarından Shengchun Xu, "CRISPR/Cas9 aracılı genom düzenleme teknolojisi, AC (Alisa Craig) çeşidindeki SlBADH1 ve SlBADH2 genlerinin tek tek veya her ikisinin birden devre dışı bırakılması için kullanıldı" diye açıklıyor.

Dr. Xu, "Bu sonuçlar, domateste 2-AP birikimini düzenlemede SlBADH2 baskın bir rol oynasa da SlBADH1'in de bu düzenleme sürecine kayda değer derecede katkı sağladığına işaret ediyor" diyor.

Araştırmacılar mutant türlerin; çiçeklenme zamanı, bitki boyu, meyve ağırlığı, glukoz, fruktoz, sakkaroz, sitrik ve malik asit gibi organik asitler veya C vitamini içeriği gibi temel özellikler bakımından yabani tipten belirgin biçimde ayrılmadığını saptadı.

Bilim insanlarına göre bu durum, mutant çeşitlerin "verim kaybı olmadan lezzet iyileştirme" hedefine ulaştığını gösteriyor.

Çalışmanın bir diğer yazarı Peng Zheng şu ifadeleri kullanıyor:

Devam eden çalışmalar, bu kokuyu seçkin ticari çeşitlere kazandırmayı amaçlıyor. Bu, kokulu pirinç çeşitleri gibi, lezzet karmaşıklığını artırarak tüketici tercihlerini ve piyasa değerini artırma potansiyeli taşıyor.

Independent Türkçe, independent.co.uk/news


Uzmanlar uyardı: İnsanları yapay zekadan koruma yöntemi ters tepebilir

Uzmanlar uyardı: İnsanları yapay zekadan koruma yöntemi ters tepebilir
TT

Uzmanlar uyardı: İnsanları yapay zekadan koruma yöntemi ters tepebilir

Uzmanlar uyardı: İnsanları yapay zekadan koruma yöntemi ters tepebilir

Yeni bir araştırma, yapay zekanın ruh sağlığımıza verdiği zararı en aza indirmeye yönelik kritik yöntemlerden birinin aslında durumu daha da kötüleştirebileceği uyarısı yapıyor.

Sohbet botlarının ruhsal sıkıntı ve hatta psikozda nasıl payı olabileceğiyle ilgili yaygın endişeler sürerken önerilerden biri de sohbet botlarının, insan olmadıklarını ve karşı tarafın bir sohbet botuyla konuştuğunu kullanıcılara düzenli şekilde hatırlatması.

Ancak araştırmacılar bu önerinin, halihazırda savunmasız kişilerin ruhsal sıkıntılarını artırarak durumu daha da kötüleştirebileceğini savunuyor.

Wisconsin-Milwaukee Üniversitesi'nden halk sağlığı araştırmacısı Linnea Laestadius yaptığı açıklamada, "Zaten sohbet etmek için bilerek sohbet botu tercih eden kullanıcıların karşılaştığı riskleri, zorunlu hatırlatmaların kayda değer derecede azaltacağını varsaymak hata olur" diyor. 

Halihazırda yalnız hisseden birine, destek gördüğünü ve yalnız olmadığını hissettiren tek şeyin bir insan olmadığını hatırlatmak, onu daha da yalnız hissettirerek ters tepebilir.

Bu uyarı, sohbet botlarını cinayet ve intiharla ilişkilendiren haberlerin ardından geldi. Sistemlerin yardımsever doğası ve hâlâ nispeten bilinmeyen ve öngörülemeyen yapıları nedeniyle, yapay zeka sohbet botları insanlara yardım etmek yerine onların sanrılarını veya zihinsel sağlık sorunlarını teşvik etmekle suçlanıyor.

Bazıları bu tür durumlarda insanlara bir sohbet botuyla konuştuklarını ve botun insan duygularını hissedemediğini hatırlatmanın yardımcı olabileceğini öne sürüyor. Ancak yeni çalışmanın yazarları, araştırmaların bunu göstermediğini savunuyor.

Laestadius, "Kullanıcılara bir insanla değil, sohbet botuyla konuştuğu hatırlatılsa bota bu kadar bağlanmayacakları ve algoritma tarafından manipüle edilmeyecekleri düşüncesi kulağa mantıklı gelse de mevcut kanıtlar bu fikri desteklemiyor" diyor.

Araştırmacılar ayrıca kullanıcıların, sırf insan olmadıkları için bu sistemlere ruhsal sıkıntılarını anlatıyor olabileceğini öne sürüyor. Michigan Eyalet Üniversitesi'nde medya ve teknoloji araştırmacısı olan yazar Celeste Campos-Castillo, "İnsan olmayanların, insanların aksine yargılamayacağı, alay etmeyeceği veya tüm okulu ya da işyerini onlara karşı kışkırtmayacağı inancı, sohbet botlarına içini dökmeye ve dolayısıyla bağlanmaya teşvik ediyor" ifadelerini kullanıyor.

Dahası, hatırlatmalar mevcut endişelerine ek olarak daha fazla sıkıntı yaratabilir. Kullanıcılar, kendilerini sohbet botuyla konuşmaya iten nedenlerin yanı sıra güvendikleri şeyden kökten farklı ve ayrı olduklarını hatırlamaktan dolayı da üzülebilir.

Laestadius, "Sohbet botlarının insan olmadığını kullanıcılara en iyi nasıl hatırlatabileceğimizi keşfetmek, kritik bir araştırma önceliği" diyor. 

Kullanıcıların ruh sağlığını en iyi şekilde korumak için hatırlatmaların ne zaman gönderilmesi ve ne zaman duraklatılması gerektiğini belirlememiz gerekiyor.

Çalışma, hakemli dergi Trends in Cognitive Sciences'ta yayımlanan "Reminders that chatbots are not human are risky" (Sohbet botlarının insan olmadığını hatırlatan bildirimler risk taşıyor) başlıklı yeni bir makalede anlatılıyor.

Independent Türkçe