4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



Astronomi meraklıları tam ay tutulmasını izledi

Ürdün'ün başkenti Amman'daki Spor Şehri'nde teleskopla ay tutulmasını izleyen bir adam (Reuters)
Ürdün'ün başkenti Amman'daki Spor Şehri'nde teleskopla ay tutulmasını izleyen bir adam (Reuters)
TT

Astronomi meraklıları tam ay tutulmasını izledi

Ürdün'ün başkenti Amman'daki Spor Şehri'nde teleskopla ay tutulmasını izleyen bir adam (Reuters)
Ürdün'ün başkenti Amman'daki Spor Şehri'nde teleskopla ay tutulmasını izleyen bir adam (Reuters)

Astronomi meraklıları, dün başta Asya olmak üzere Avrupa ve Afrika'da da gözlenen tam ay tutulması sırasında "kanlı ay"ı görme fırsatı buldu. 

Suudi Arabistan'ın güneybatısındaki el-Baha semalarında gerçekleşen ay tutulması, ilgililer tarafından izlendi (SPA)Suudi Arabistan'ın güneybatısındaki el-Baha semalarında gerçekleşen ay tutulması, ilgililer tarafından izlendi (SPA)

Dünya'nın ayını kırmızıya boyayan bu olgu, Güneş, Dünya ve Ay'ın bu sırayla mükemmel bir şekilde hizalandığı ve Ay'ın dolunay olduğu zamanda meydana gelir.

Bu fenomeni gözlemlemek için en iyi fırsat Asya'da, özellikle Çin ve Hindistan'da, ayrıca Doğu Afrika ve Batı Avustralya sakinleri için vardı.

Tam ay tutulması GMT saatiyle 17:30'dan 18:52'ye kadar sürdü.

 İranlı kadın, Tahran'daki bir köprüde bulunan teleskopla tam ay tutulmasını izliyor (EPA)İranlı kadın, Tahran'daki bir köprüde bulunan teleskopla tam ay tutulmasını izliyor (EPA)

Avrupa ve Afrika'dakiler de akşamın erken saatlerinde ay doğarken, kısa süreli bir kısmi tutulma görme şansına sahip oldu. Ancak Amerika kıtasındakiler bu olayı göremedikleri için daha az şanslıydı.

Rusya'nın başkenti Moskova'daki yüzen köprüde gerçekleşen tutulmanın ardından (AP)Rusya'nın başkenti Moskova'daki yüzen köprüde gerçekleşen tutulmanın ardından (AP)

Ay, güneş ışınlarını engelleyen Dünya'nın gölgesine girerken kırmızıya döner ve beyaz parlaklığını yavaş yavaş kaybeder.

Belfast Üniversitesi'nde astrofizikçi olan Ray Milligan, aya ulaşan tek güneş ışığının “Dünya'nın atmosferinde yansıtılıp saçılan ışık” olduğunu belirtti.

 Bir kadın, Yunanistan'ın başkenti Atina'daki antik Atina Gözlemevi yakınlarında gerçekleşen tutulma sırasında teleskopla ayın fotoğrafını çekiyor (Reuters)Bir kadın, Yunanistan'ın başkenti Atina'daki antik Atina Gözlemevi yakınlarında gerçekleşen tutulma sırasında teleskopla ayın fotoğrafını çekiyor (Reuters)

Ancak, Milligan'a göre mavi dalga boyları kırmızı dalga boylarından daha kısadır ve bu nedenle Dünya'nın atmosferinden geçerken daha kolay dağılırlar. Milligan, “Ay'a kan kırmızısı rengini verenin bu olduğunu” ifade ediyor.

Şarku’l Avsat’ın edindiği bilgiye göre Güneş tutulmasını gözlemlemek için özel gözlükler gerekirken, ay tutulmasını gözlemlemek için sadece uygun hava koşulları, açık gökyüzü ve doğru konumda olmak yeterlidir.

Endonezya'nın başkenti Cakarta'da tam ay tutulması izleniyor (Reuters)Endonezya'nın başkenti Cakarta'da tam ay tutulması izleniyor (Reuters)

Mart ayında gözlemlenen tutulmanın ardından bu yılki ikinci tam ay tutulması olan olay, 12 Ağustos 2026'da gerçekleşmesi beklenen büyük güneş tutulmasının habercisi niteliğinde.

2006 yılından sonra Avrupa'da görülecek ilk tam güneş tutulması, İspanya ve İzlanda'da tamamen, diğer ülkelerde ise kısmen görülebilecek.


Apple, ChatGPT'ye rakip olmak için Siri'yi yenilemeyi planlıyor

Apple'ın geliştirdiği dijital asistan Siri, 14 Şubat 2025'te Fransa'nın güneybatısındaki Bordeaux kentinde bir akıllı telefon ekranında görülüyor (AFP)
Apple'ın geliştirdiği dijital asistan Siri, 14 Şubat 2025'te Fransa'nın güneybatısındaki Bordeaux kentinde bir akıllı telefon ekranında görülüyor (AFP)
TT

Apple, ChatGPT'ye rakip olmak için Siri'yi yenilemeyi planlıyor

Apple'ın geliştirdiği dijital asistan Siri, 14 Şubat 2025'te Fransa'nın güneybatısındaki Bordeaux kentinde bir akıllı telefon ekranında görülüyor (AFP)
Apple'ın geliştirdiği dijital asistan Siri, 14 Şubat 2025'te Fransa'nın güneybatısındaki Bordeaux kentinde bir akıllı telefon ekranında görülüyor (AFP)

Apple'ın ChatGPT gibi önde gelen yapay zeka sohbet botlarıyla rekabet edebilmek için Siri asistanını büyük ölçüde yenilemeyi planladığı bildirildi.

Bloomberg'ün haberine göre ABD merkezli teknoloji devi, yapay zeka destekli arama aracını kullanıma sunmak için Google'dan yardım istedi ve piyasaya çıkış tarihi gelecek yılın başları olarak belirlendi.

Şirket içinde World Knowledge Answers (Dünya Bilgisi Yanıtları) diye adlandırılan özellik, büyük dil modellerini (BDM) kullanarak ChatGPT'ye benzer işlevler sunacak.

Yöneticilerin "yanıt motoru" diye adlandırdığı bu yenilik; metin, fotoğraf, video ve ilgi çekici noktaları destekleyecek.

Bu adım, Apple'ın 2011'de iPhone'da sesli asistan olarak kullanıma sunduğu Siri için uzun süredir vaat edilen iyileştirmenin bir parçası.

Şirket, hazirandaki Dünya Çapında Geliştirici Konferansı (Worldwide Developer Conference / WWDC) sırasında Siri'nin yapay zeka destekli güncellemesinin 2026'ya erteleneceğini duyurmuştu. Yeni güncellemenin ayrıntılarını içeren çarşamba günkü haberin ardından Apple'ın hisseleri yaklaşık yüzde 5 yükseldi.

Apple'ın yazılım şefi Craig Federighi ağustosta, Cupertino merkezli şirketin en önemli önceliğinin Siri'nin geliştirilmesi olduğunu söylemişti.

Geçen ay bütün çalışanların katıldığı bir toplantıda konuşan yönetici, Apple'ın yapay zeka tekliflerini artırmak için üçüncü taraflarla görüştüğünü açıklamıştı.

Federighi "Bu gelişme bizi yalnızca duyurduğumuz yenilikleri değil, hayal ettiğimizden çok daha kapsamlı bir iyileştirmeyi sunabilecek konuma getirdi" demişti. 

İnsanların daha fazla ciddiye aldığı bir proje yok.

The Independent daha fazla bilgi için Apple'la temasa geçti ancak şirket genellikle piyasaya sürülmemiş ürünler hakkında yorum yapmıyor.

Yeni yapay zeka asistanı için olası bir platform, Apple'ın geliştirme aşamasında olduğu söylenen bir robot olabilir.

Siri'nin bu robota entegre edilerek, cihazın insan benzeri bir yüz kazanması planlanıyor. Cihaz prototiplerinde Apple'ın Finder logosunun hareketli bir versiyonunun kullanıldığı bildiriliyor.

Görsel kaldırıldı.


Apple, CEO Tim Cook'un "hayranlık uyandıran" diye nitelediği bir etkinlikle, gelecek salı günü en yeni iPhone 17 serisini tanıtacak ve Apple Watch ve AirPods serilerindeki güncellemeleri duyuracak.

Cihazların yeni biçim katsayılarıyla gelmesi beklenirken, iPhone, iPad, Mac, Apple Watch, Apple TV ve Car Play işletim sistemlerinde büyük bir revizyon da duyurulabilir.

Apple Etkinliği'nin canlı yayını 9 Eylül'de yerel saatle 10.00'da (TSİ 20.00) gerçekleşecek ve etkinliğin tamamı The Independent'ta aktarılacak.

Independent Türkçe


OpenAI'ın CEO'su, ölü internet teorisine hak verdi

Fotoğraf: Reuters
Fotoğraf: Reuters
TT

OpenAI'ın CEO'su, ölü internet teorisine hak verdi

Fotoğraf: Reuters
Fotoğraf: Reuters

ChatGPT'nin yaratıcısı OpenAI'ın CEO'su Sam Altman, "ölü internet teorisinde" biraz doğruluk payı olabileceğini öne sürdü.

Bu komplo teorisindeki fikre göre, internetteki içeriklerin ve gerçek kişiler gibi görünen profillerin çoğu aslında bilgisayarlar tarafından otomatik olarak oluşturuluyor ve internet büyük ölçüde "ölü" halde.

Teori sık sık çürütülse de son yıllarda yapay zeka sistemlerinin yaygınlaşması ve eskiden Twitter diye bilinen X gibi platformlarda botları engellemeye yönelik girişimlerin başarısız olması, bu fikre giderek daha fazla itibar edilmesine neden oluyor. 

Ve Altman da daha önce teoriye inanmamasına rağmen, bunda bir miktar haklılık payı olabileceğini öne sürdü.

Altman "Ölü internet teorisini hiç ciddiye almamıştım ama görünen o ki, şu anda büyük dil modelleri tarafından kullanılan çok sayıda twitter hesabı var" diye yazdı.

Büyük dil modelleri (BDM), ChatGPT ve Anthropic'in Claude'u gibi benzer ürünlerin arkasındaki teknolojiyi ifade ediyor.

Altman'ın OpenAI'ın başındaki rolü nedeniyle, uyardığı soruna doğrudan katkıda bulunduğunu öne süren kullanıcılar, bu açıklamaya büyük tepki gösterdi.

ChatGPT'nin 2022'nin sonlarında piyasaya sürülmesi, diğer birçok benzer sistemin internette kullanıma sunulmasına yol açtı ve hem gerçek hem de kötü niyetli kullanıcıların çevrimiçi platformlarda otomatik içerik ve gönderi oluşturmasını çok daha kolay hale getirdi.

Bazıları da Altman'ın tweet'inin, World Network'teki çalışmalarından kaynaklanmış olabileceğini öne sürüyor. Daha önce Worldcoin diye bilinen şirketi 2019'da kurmuştu. Şirket, insanların gözlerini tarayarak internette gerçek kimliklerini kanıtlamasını sağlayacak bir yöntem geliştirmeyi hedeflediğini belirtiyor. Bu, yapay zeka destekli sistemlerin çevrimiçi etkisini durdurmanın yolu olarak teşvik ediliyor.

Independent Türkçe