4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



NASA, Artemis görevi için şair arayışında

(Reuters)
(Reuters)
TT

NASA, Artemis görevi için şair arayışında

(Reuters)
(Reuters)

Andrew Griffin 

NASA, Ay'a yönelik Artemis görevi ve diğer çalışmalarına destek olacak şairler ve başka yaratıcı hikaye anlatıcıları arıyor.

Uzay ajansı, yürüttükleri görevleri paylaşacak "sinemacılar, belgeselciler, şarkı yazarları, hikaye anlatıcıları, şairler ve diğerleriyle" çalışmak istiyor.

Bunlar arasında insanları Ay'a geri götürecek Artemis programının yanı sıra başka görevler de var. 2028'de Mars'a nükleer reaktör gönderme planları, Ay yüzeyinde üs inşa etme çalışmaları ve test uçuşları da bunlar arasında.

Ajans kamuoyuna yaptığı çağrıda bu çalışmaların, "NASA'nın görevlerine dair hikayeleri mümkün olduğunca geniş bir kitleyle paylaşmasını ve yeni nesil kaşiflere ilham vermesini" hedeflediğini belirtti.

Açıklamada başarılı içerik üreticilerinin, NASA'nın program tesislerine davet edileceği, "program ve görevler hakkında bilgi edineceği, personelle röportaj yapacağı ve programın içeriği ve onun bir parçası olmanın nasıl bir şey olduğunu birkaç gün boyunca deneyimleyeceği" söylendi.

Çalışma öncelikle ABD'deki içerik üreticilerine odaklansa da Amerikan ekiplerindeki uluslararası işbirlikçilerin de değerlendirmeye alınacağı ifade edildi. İlk turda en fazla 10 kişi veya ekibin yer alması bekleniyor ancak uzay ajansı daha fazla fırsatın ortaya çıkmasının muhtemel olduğunu belirtti.

İçerik üreticilerine çalışmaları karşılığında ödeme yapılmayacak. Bunun yerine NASA, çalışmanın "karşılıklı fayda" sağlayacağını umduğunu ve uzay ajansıyla üreticilerin kendi masraflarını kendilerinin karşılayacağını ifade etti.

NASA, ilgilenen herkesten haziran sonuna kadar tekliflerini sunmalarını istedi. Ajans, ilgilenenlerin tam olarak ne göndermesi gerektiğine dair bilgiler gibi ayrıntıları içeren bir teklif çağrısını internet sitesinde yayımladı.

Independent Türkçe,independent.co.uk/space


Çin bütün insansı robotlara kimlik numarası getiriyor

 Hangzhou'da halk, polis memuru olan insansı robotun yanından geçiyor (AFP)
Hangzhou'da halk, polis memuru olan insansı robotun yanından geçiyor (AFP)
TT

Çin bütün insansı robotlara kimlik numarası getiriyor

 Hangzhou'da halk, polis memuru olan insansı robotun yanından geçiyor (AFP)
Hangzhou'da halk, polis memuru olan insansı robotun yanından geçiyor (AFP)

Vishwam Sankaran Bilim ve Teknoloji Muhabiri 

Çin devlet televizyonu CCTV'ye göre Asya ülkesi, insansı robotlarını yaşam döngüleri boyunca daha iyi takip edebilmek amacıyla bu araçların hepsine eşsiz dijital kimlik numaraları getirmeyi planlıyor.

Çin sektörde hızlı bir büyüme hedeflerken bu program, yetkililerin insansı robot ürünlerini üretim aşamasından nihai geri dönüşümlerine kadar güvenlik riskleri açısından izlemesini sağlamak üzere tasarlandı.

Çinli yetkililer ayrıca insansı robotların nasıl yönetilmesi gerektiği ve bu eşsiz kimlik numaralarının nasıl takip edilebileceğine dair yeni yönergeler yayımladı.

Bu benzersiz insansı robot kimlikleri 4 bölümden oluşuyor. Bunlar arasında sınır ötesi sevkıyatları takip etmeye yarayan iki basamaklı bir kod ve robotu üreten Çinli firmayı tanımlayan 4 basamaklı bir kod da yer alıyor.

Yeni yönergeye göre 6 basamaklı bir ürün kodu insansı robotun türünü belirlerken, 17 basamaklı seri numarası ise her bir robotu birbirinden ayıracak.

Bu girişim halihazırda 100'den fazla Çinli üreticiyi kapsarken, 200 farklı modelden 28 binden fazla insansı robota dijital kimlik atandı.

Bütün bu programı, Çin Sanayi ve Bilgi Teknolojileri Bakanlığı bünyesindeki Çin İnsansı Robotik ve Bedenlenmiş Zeka Standardizasyonu (HEIS) yürütüyor.

Uzmanlara göre Çin'de insansı robotlar halihazırda çoğunlukla üniversiteler, araştırma laboratuvarları ve imalat sektöründe kullanılsa da ülke, yaşlı bakımı ve ev temizliği gibi ticari uygulamalar için geniş çaplı kullanıma sunmaya da hazırlanıyor.

Ülke ayrıca donanım tedarik zincirini hızla yerelleştirerek ABD menşeli Nvidia çiplerine bağımlılığını azaltıyor.

Yerel haberlere göre ülkede halihazırda kullanılan insansı robotlar tamamen otonom olmaktan uzak ve genellikle çeşitli görevleri yerine getirmek için gereken hassasiyet ve el becerisinden yoksun.

Bu robotlar çoğunlukla farklı sektörlerde sahaya özgü denemeler yapmak için kullanılıyor ancak uzmanlar, bu görevlerde bile robotların sınırlı el becerisi nedeniyle insanlara kıyasla sadece kısmen verimli olduklarını belirtiyor.

GigaAI, Unitree ve Agibot gibi şirketler, önemli donanım yenilikleriyle pazara öncülük ediyor.

Örneğin GigaAI, Çin'in ev işlerini yerine getirmek üzere geliştirilen ilk genel amaçlı insansı robotunu kısa süre önce tanıtmıştı.

GigaAI'ın SeeLight S1 robotu, Hubei İnsansı Robot İnovasyon Merkezi ve Hubei İnsansı Robotik Endüstri Birliği'yle işbirliği içinde üretildi. SCMP'nin haberine göre robotun 2027'nin ilk yarısında test edilmek üzere Vuhan'daki ailelere ücretsiz verilmesi planlanıyor.

Robotik şirketi, iki kollu ve tekerlekli insansı robotun sebze doğrama, yumurta kızartma ve çamaşır makinesini doldurma gibi çeşitli ev işlerini yaptığını gösteren bir videoyu WeChat'te yayımladı.

Independent Türkçe, independent.co.uk/tech


Apple, Siri'yi baştan aşağı değiştiriyor: Yenilikler neler?

Fotoğraf: AP
Fotoğraf: AP
TT

Apple, Siri'yi baştan aşağı değiştiriyor: Yenilikler neler?

Fotoğraf: AP
Fotoğraf: AP

Apple'ın odağına gizliliği alarak Siri'yi baştan aşağı yenilemeyi planladığı yeni bir haberde bildirildi. 

Apple, iki yıldır sanal asistanına yepyeni yetenekler kazandıracağına söz verirken, bunun için sistemin yenilenmesi gerekiyor.  Bu yeni özellikler arasında kullanıcının kişisel koşullarını anlama yeteneği de yer alacak. Böylece kullanıcılar, örneğin birinin uçağının ne zaman ineceğini sorabilecek ve sistem o kişinin kim olduğunu bilip seyahatiyle ilgili daha fazla bilgi edinebilecek.

Ancak bu yenileme ve Apple'ın yapay zeka alanındaki çabaları genel olarak bir dizi sorunla karşılaşırken özelliklerin çoğu ya geç geldi ya da hiç gelmedi. Buna Siri'deki değişiklikler de dahil.

Apple'ın bu yeni Siri sürümünü, gelecek ay düzenlenecek yıllık yazılım etkinliği Dünya Geliştiriciler Konferansı'nda (WWDC) piyasaya süreceği söylentileri dolaşıyor.

Bloomberg'ün yeni haberine göre Siri'nin yeni sürümü bir dizi özellikle birlikte geliyor ancak Apple, gizliliğe odaklanmasının, halihazırda yapay zekayı daha yoğun kullanan diğer rakiplerinden ayrışmanın anahtarı olacağını umuyor. Kullanıcıların sohbet geçmişlerini 30 gün veya bir yıl sonra otomatik olarak silmesine imkan vermenin de bu özellikler arasında yer alacağı raporda iddia ediliyor.

Diğer sohbet botları da sohbet geçmişlerini silme ve geçici sohbetler yapma olanağı sunsa da gizlilik politikaları daha belirsiz. Dahası, sohbet geçmişlerinin yıllarca saklanabilmesi ve hatta modelleri daha fazla eğitmek için kullanılabilmesi, kişisel verilerin sohbet botu içinde depolanma ihtimali olduğu anlamına geliyor.

Öte yandan bu geçmişler, cevapları kişiselleştirmeye ve daha ayrıntılı bir bağlam sağlamaya yarayabileceğinden kullanıcılara fayda sağlayabilir. Apple, gizliliğe yönelik katı inancının bazı yapay zeka özelliklerini zedelemesiyle ilgili geçmişte eleştirilerle karşılaşmıştı çünkü bu, ürünlerinin kullanıcılar hakkında daha az veriye sahip olduğu anlamına geliyordu. Ancak şirket, her ikisini de yapmanın mümkün olduğuna inandığını defalarca vurguladı.

Siri'deki değişikliklerle ilgili diğer söylentiler arasında, kullanıcıların sohbetlerini görebilecekleri bağımsız bir uygulama ve sanal asistanla etkileşim kurma yöntemlerinin yeniden tasarlanması yer alıyor.

Independent Türkçe