4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



Otomotiv devi, 2028'den itibaren insansı robotlarla üretim yapacak

Fotoğraf: Reuters
Fotoğraf: Reuters
TT

Otomotiv devi, 2028'den itibaren insansı robotlarla üretim yapacak

Fotoğraf: Reuters
Fotoğraf: Reuters

Otomobil üreticisi Hyundai, araba üretiminde 2028'den itibaren insansı robotlar kullanmayı planladığını açıkladı.

Güney Kore merkezli firma, üretimde insan benzeri robotları kullanan Tesla ve BYD gibi şirketlere katılacak. Firma, Las Vegas'taki Tüketici Elektroniği Fuarı'nda sergilediği Atlas adlı  modeli küresel ağına entegre etmeyi planladığını açıkladı.

Atlas’ı geliştiren robotik üretim şirketi Boston Dynamics’in çoğunluk hissesi Hyundai’ye ait.

Boston Dynamics, insanlar için güvenli olmayan ortamlarda çalışma, yakın inceleme ve veri yakalama gibi geniş bir kullanım yelpazesine sahip Spot adlı robot köpekle de tanınıyor.

4 ayak yerine iki ayak üzerinde dik yürüyen Atlas ise "dünyanın en dinamik insansı robotu" diye tanımlanıyor.

Boston Dynamics tarafından belirtilen özellikler arasında, Atlas'ın bitmeden önce kendi kendine değiştirebildiği 4 saat ömürlü bir pil, yeni görevler öğrenme yeteneği ve "personelin kullandığı iş istasyonlarında aynı ekipmanla çalışacak şekilde tasarlanmış olması" yer alıyor.

xsdfrg
Boston Dynamics'in Spot robotu (AFP)

Şirket ayrıca Atlas'ın, tam üretim rolünde ne kadar faydalı olacağını değerlendirmek adına "gerçek dünya sıralama görevlerinde saha testleri için Hyundai'yle bir müşteri tesisinde ilk adımlarını attığını" söylüyor.

Hyundai, robotların insan personelinin fiziksel yükünü hafifleteceğini ve güvenliği artırmak için potansiyel olarak tehlikeli görevleri üstleneceğini söyledi.

Bu açıklama, Hyundai'nin gelecek yıllarda ABD'ye 20 milyar dolardan fazla yatırım yapacağını açıklamasının ardından geldi. Şirket, ülkede otomobil üretimini genişletmeyi ve hem yapay zeka hem de otonom sürüş teknolojisine daha fazla yatırım yapmayı hedefliyor.

ABD'de, Google'ın ana şirketi Alphabet'in Waymo bölümü ve elektrikli araç üreticisi Tesla gibi firmalar, otonom sürüş operasyonlarına büyük yatırımlar yapıyor. Tesla ayrıca Optimus adında kendi insansı robotunu da yarattı ancak onu gerekli seviyede inşa etme ve çalıştırmada hâlâ zorluklarla karşılaşıyor. Elon Musk'ın yeni maaş planının bir parçası olarak bir milyon robot satılması planlanıyor. Musk'ın bu planla 10 yıl içinde servetini 1 trilyon dolara kadar yükseltmesi bekleniyor.

Hyundai'ye gelince, Başkan Yardımcısı Jaehoon Chang, insanların robotlar yüzünden işlerini kaybetme endişelerinin sürdüğünü kabul ederken, işgücünde entegrasyon çağının yaklaşık iki yıl sonra başlayacağını belirtti.

Başlangıçta kaç robotun görevlendirileceğine dair herhangi bir detay verilmedi.

Independent Türkçe


Güvenlik uzmanından yapay zeka uyarısı: Zamanımız kalmadı

Microsoft AI CEO'su Mustafa Süleyman da uygun düzenlemeler yapılmazsa, gelişen yapay zeka teknolojisinin gelecek birkaç yıl içinde "kontrol edilemez" hale gelebileceği uyarısında bulunmuştu (Reuters)
Microsoft AI CEO'su Mustafa Süleyman da uygun düzenlemeler yapılmazsa, gelişen yapay zeka teknolojisinin gelecek birkaç yıl içinde "kontrol edilemez" hale gelebileceği uyarısında bulunmuştu (Reuters)
TT

Güvenlik uzmanından yapay zeka uyarısı: Zamanımız kalmadı

Microsoft AI CEO'su Mustafa Süleyman da uygun düzenlemeler yapılmazsa, gelişen yapay zeka teknolojisinin gelecek birkaç yıl içinde "kontrol edilemez" hale gelebileceği uyarısında bulunmuştu (Reuters)
Microsoft AI CEO'su Mustafa Süleyman da uygun düzenlemeler yapılmazsa, gelişen yapay zeka teknolojisinin gelecek birkaç yıl içinde "kontrol edilemez" hale gelebileceği uyarısında bulunmuştu (Reuters)

Ünlü yapay zeka güvenliği uzmanı David Dalrymple, Guardian'a verdiği röportajda önemli bir uyarıda bulundu. 

Birleşik Krallık İleri Araştırma ve Bilimsel Buluş Ajansı (ARIA) yöneticilerinden Dalrymple, dünyanın mevcut risklere karşı hazırlanmak için yeterli zamana sahip olmayabileceğini vurguladı: 

İnsanların dünyadaki işleri gerçekleştirmek için yaptıklarını tamamen karşılayabilecek sistemler hakkında endişe duymalıyız. Medeniyet, toplum ve gezegenin kontrolü için hakim olmamız gereken tüm alanlarda yenileceğiz.

Dalrymple, eli kulağında olan teknolojik atılımlara dair devletle yapay zeka şirketleri arasında büyük bir anlayış farkı olduğunu söyledi:

Çok hızlı gelişmeler yaşanıyor ve güvenlik açısından bakıldığında bunların önüne geçmek için zamanımız kalmamış olabilir. 5 yıl içinde makinelerin ekonomik açıdan en değerli görevleri insanlara göre daha yüksek kaliteyle ve daha düşük maliyetle yapacağı, bilimkurgulara özgü bir fikir değil.

Dalrymple, kamu tarafından fonlansa da hükümetten bağımsız çalışan ARIA çatısı altında enerji gibi kritik alanlarda yapay zeka kullanımını denetleyecek sistemler geliştirdiklerini belirtti.

Yapay zekaya işaretle "Bunların güvenilir olduğunu varsayamayız. Ekonomik baskıyı göz önünde bulundurunca, bunları güvenilir bir şekilde geliştirmeyi sağlayacak bilime vakitlice kavuşamayacak gibi duruyoruz. O yüzden yapabileceğimiz en iyi ikinci şey, bunların kötü yanlarını kontrol edip azaltmak" dedi.

Independent Türkçe, Guardian, Mint


Çin'den Musk'ın Starlink uydularıyla ilgili uyarı

SpaceX'in 28 adet Starlink internet uydusu taşıyan Falcon 9 roketi, Vandenberg Uzay Kuvvetleri Üssü'nden fırlatılıyor (SpaceX)
SpaceX'in 28 adet Starlink internet uydusu taşıyan Falcon 9 roketi, Vandenberg Uzay Kuvvetleri Üssü'nden fırlatılıyor (SpaceX)
TT

Çin'den Musk'ın Starlink uydularıyla ilgili uyarı

SpaceX'in 28 adet Starlink internet uydusu taşıyan Falcon 9 roketi, Vandenberg Uzay Kuvvetleri Üssü'nden fırlatılıyor (SpaceX)
SpaceX'in 28 adet Starlink internet uydusu taşıyan Falcon 9 roketi, Vandenberg Uzay Kuvvetleri Üssü'nden fırlatılıyor (SpaceX)

Pekin, Elon Musk'ın yapay uydu ağı Starlink'in alçak Dünya yörüngesinde hızla genişlemesinin küresel çapta "ciddi güvenlik ve emniyet" endişeleri yarattığını söyleyerek Birleşmiş Milletler'i (BM) uyardı.

BM Güvenlik Konseyi'nin gayri resmi bir toplantısında konuşan Çin temsilcisi, "Ticari uzay faaliyetlerinin hızla yayılmasıyla birlikte, belirli bir ülkenin ticari yapay uydu ağının kontrolsüz yayılması, etkili bir düzenlemenin eksikliğinde ciddi güvenlik ve emniyet sorunlarına yol açıyor" dedi.

Pekin temsilcisi, 2021'de Starlink uydularıyla Çin uzay istasyonun neredeyse çarpışması gibi birkaç olayı örnek gösterdi.

İlk olarak SCMP'nin bildirdiği üzere temsilci, SpaceX'in Starlink uydularına atfen "Bu tür uydu ağları frekans-yörünge kaynaklarını [yörüngedeki tüm uyduların iletişim için paylaştığı veriler] dolduruyor ve çarpışma riskini kayda değer derecede artırıyor" ifadelerini kullandı.

Son zamanlarda yapılan bazı çalışmalar, SpaceX'in Starlink uyduları gibi mega yapay uydu ağları çağında yörüngedeki uydu sayısının hızla artmasıyla birlikte uydu çarpışmaları olasılığının da hızla arttığı uyarısında bulunuyor.

Halihazırda alçak Dünya yörüngesindeki 12 bin 955 aktif uydunun 8 bin 500'ü, yani bu araçlaın yüzde 66'sından fazlası SpaceX'in Starlink uydu ağının parçası.

SpaceX patronu Elon Musk, Starlink ağının nihayetinde 42 binden fazla uyduya sahip olabileceğini söylerken, şirketin halihazırda 12 bin uydu fırlatmaya izni var.

5 yıl kullanılacak şekilde tasarlanan bu uyduların her biri, daha sonra Dünya'nın atmosferinde kasten yakılacak.

Diğer yandan Çin'in Quianfan geniş bant ağı gibi projeleri, kendi mega internet uydu ağlarını fırlatarak SpaceX'e rakip olmayı planlıyor.

Şanghay eyaletinin desteklediği proje, küresel çapta geniş bant hizmeti sağlamak için 2030'a gelindiğinde 15 binden fazla uyduyu seri olarak üretip fırlatmayı hedefliyor.

2018'den bu yana alçak Dünya yörüngesi giderek kalabalıklaşırken, Çin temsilcisi ülkelere ticari uzay faaliyetlerine ilişkin düzenlemeleri daha iyi uygulamaları çağrısında bulundu.

Diplomat, bir Starlink uydusunun 2021'de "Çin'in uzay istasyonuna tehlikeli bir şekilde yaklaştığını... Çinli astronotların güvenliğini ciddi şekilde tehdit ettiğini" söyledi.

İsmi açıklanmayan temsilci yaptığı açıklamada şu ifadeleri kullandı: 

Yörünge kontrol kabiliyeti, uzaydaki duruma dair farkındalığı veya yeterli tepki süresi olmayan, gelişmekte olan ülkeler tarafından işletilen uzay araçları için bu şüphesiz büyük bir risk yaratıyor.

SpaceX, The Independent'ın yorum talebine henüz yanıt vermedi.

Pekin ayrıca ticari uyduların askeri keşif faaliyetleri ve savaş alanı iletişiminde giderek daha fazla kullanıldığını ve bunun "uzayda silahlanma yarışı riskini artırdığını" belirtti.

Diplomat, "ticari uzay faaliyetlerinin düzenlenme ve denetimini güçlendirmesi ve uluslararası toplumun endişelerine yanıt vermesi" için ABD'ye üstü kapalı çağrı yaptı.

Independent Türkçe