ChatGPT 'çöküyor' ve hiç bu kadar insani olmamıştı

Yapay zeka teknolojisi orta yaş bunalımı yaşıyor gibi görünüyor ve sorulara anlamsız ya da tehditkar cevaplar veriyor. Ve bize hiç bu kadar benzememişti

Reuters
Reuters
TT

ChatGPT 'çöküyor' ve hiç bu kadar insani olmamıştı

Reuters
Reuters

Ryan Coogan

Şu sıralar yapay zeka teknolojileri üzerine pek çok tartışma var. Bazıları iş bulmanın zaten imkansız olduğu bir ekonomide bu teknolojilerin işçilerin yerini alacağından endişe ediyor. Diğerleriyse yaratıcılık duygumuza ne yapacakları hakkında endişeli ve yapay sanatının yaygınlaşmasını giderek düşen kültürel standartlarımızın örneği olarak görüyor.

Bunlar haklı endişeler fakat yapay zeka, günün sonunda insanların kullandığı sadece bir başka araç. Kullanıcılara yalın, inkar edilemez gerçeklere kolay erişim sağlamak için mantığa dayanan tarafsız bir hesaplama sistemi. Bir gün kontrolümüzden çıkacağı fikri bilimkurgudan ibaret ve gerçekten ciddiye almamız gereken bir şey değil.

Şimdi kahvemden büyük bir yudum alayım ve eski dostumuz ChatGPT'yle ilgili son gelişmelerin neler olduğuna bir bakayım...

Ne yazık ki görüş yazıları yazılı bir mecra, dolayısıyla OpenAI'ın dost canlısı sohbet robotunun bir tür orta yaş krizi geçiriyor gibi göründüğünü ve basit sorular sorulduğunda kullanıcılara saçma sapan yanıtlar vermeye başladığını okuduğumda ağzımdaki yudumu komik derecede abartılı şekilde püskürtüşümü hepiniz kaçırdınız. Yanıtlar, en iyi şekilde "anlamsız" diye tanımlanabilecek şeylerden, bazı kullanıcıların "tehdit" diye yorumladığı şeylere kadar değişiyor.

OpenAI resmi durum sayfasında sorunları kabul etti ancak henüz bunlar için bir açıklama yapmadı. Bazıları bu olayın ChatGPT'nin yaratıcılık parametrelerinin çok yükseğe ayarlanmasından kaynaklanabileceğini ve bunun da soruları daha az odaklanma ve netlikle yanıtlamasına yol açabileceğini öne sürdü.

Dürüst olmak gerekirse bu kadar büyütülecek ne var bilmiyorum. Bilakis bu, şimdiye kadar yapay zeka teknolojisinden gördüğüm en ilginç çıktı. Twitter/X akışımı her gün dolduran yavan "Pokemon gerçek olsaydı ne olurdu?" sunumlarına göre "sanat"a kesinlikle çok daha fazla yakın.

İnsanların Reddit'te yayımladıkları yanıtlardan bazıları neredeyse avangard. Ezra Pound'un "The Cantos" şiirinin en karmaşık halini çağrıştıracak şekilde (sıklıkla konuşmanın ortasında bir tür berbat Spanglish [İspanyolca-İngilizce] kullanarak) diller arasında geçiş yapıyor. "Bilgisayar nedir?" sorusuna verilen bu yanıtı okuyun ve bana bunun kulağa Gertrude Stein'ın Hassas Düğmeler'de yazabileceği bir şey gibi gelmediğini söyleyin:

Bunu ülke için bir sanat ağının iyi bir işi, bilimin bir faresi, üzgün bir azınlığın kolay bir çizimi ve son olarak, sanatın küresel evi olarak yapar, geri kalan her şeyde sadece bir işte.

Eskiden üniversite düzeyinde modernist şiir öğretirdim ve bunların bazıları üzerine rahatlıkla iki ya da üç ders yapabilirdim. Bu ChatGPT'den ziyade eğitim sistemimiz hakkında bir şey mi söylüyor? Bunu söylemek bana düşmez. Demek istediğim, her zaman aldığım sıkıcı müşteri hizmetleri yanıtları yerine yapay bir süper zekanın tuhaf, aklı başında olmayan saçmalıklarını okumayı tercih ederim.

Elon Musk, soruları ChatGPT gibi sistemlere benzer şekilde ancak daha gayri resmi, konuşma tonunda yanıtlayabilmesi beklenen kendi sohbet robotu Grok'u kısa süre önce piyasaya sürdü. Ortaya çıkan sonuç daha çok 52 yaşındaki bir adamın 1990'ı yılların sonlarında popüler olan Joss Whedonvari üzgün alaycı üslubu taklit etme çabasına benziyor ve bir insandan nefret ettiğim gibi bir makineden nefret etmeye hiç bu kadar yaklaşmamıştım (ki bu da bazı açılardan onu muazzam bir başarı haline getiriyor).

Buna kıyasla, ChatGPT'de olanlar çok daha insani hissettiriyor. Bu teknolojinin şimdiye kadar gördüğüm tüm versiyonlarından daha etkili bir insan düşüncesi kapasitesine işaret eden bir tür uzun ve tutarsız bilinç akışı. Elbette gerçekte olan şey bu değil (ChatGPT temelde çok gelişmiş bir tahmini metin oluşturucu) ancak yanılsama, karlı dağ yamaçlarının prosedürlere göre oluşturulmuş milyonlarca sıkıcı videosundan veya kaçak Pixar animasyonlarından daha rahatsız edici.

ChatGPT'yi eminim "düzeltecekler" ve her şirketin hayalindeki steril müşteri hizmetleri temsilcisi olmaya geri dönecek. Ancak bu arada, bu teknolojinin gerçekten ama gerçekten tuhaflaşmasına izin verildiğinde neye benzediğini görmek güzel.

Independent Türkçe



SpaceX roketi Ay'a çarpma yolunda

Roket parçasının Ay'ın yakın tarafının sınırına çarpacağı öngörülüyor  (Reuters)
Roket parçasının Ay'ın yakın tarafının sınırına çarpacağı öngörülüyor (Reuters)
TT

SpaceX roketi Ay'a çarpma yolunda

Roket parçasının Ay'ın yakın tarafının sınırına çarpacağı öngörülüyor  (Reuters)
Roket parçasının Ay'ın yakın tarafının sınırına çarpacağı öngörülüyor (Reuters)

SpaceX'e ait bir roketin enkazının bu yazın sonunda ses hızının 7 katıyla Ay'a çarpması bekleniyor.

Dünya'ya yakın cisimleri izlemek için geniş çapta kullanılan Project Pluto yazılımının üreticisi Bill Gray, SpaceX'in Ocak 2025'te fırlattığı bir Falcon 9 roketi üzerine kapsamlı bir rapor yayımladı.

Roket geçen yıl Ay'a Blue Ghost ve Hakuto-R uzay araçlarını götürmüş, bunlardan ilki başarılı bir iniş yaparken diğeriyse Dünya'yla bağlantısını kaybedip haziranda uyduya düşmüştü.

Gray'in raporuna  göre geçen yıl boyunca 1053 kez gözlemlenen Falcon 9'un üst kademesi, Dünya yörüngesinde dönmeye devam ediyor.

Bu verilere dayanarak yapılan tahminlere göre roketin 13,8 metre uzunluğa ve 3,7 metre çapa sahip üst kademesi, 5 Ağustos'ta TSİ 09.44'te Ay'ın Dünya'ya dönük yüzünün kenarındaki Einstein kraterine çarpacak. Cismin saniyede 2,43 kilometre hızla, yani sesin Dünya'daki hızının 7 katı hızla çarpacağı öngörülüyor.

Ay'ın atmosferi olmadığı için roket tek parça halinde yüzeye ulaşacak. Ancak bölgede yaşam veya insan yapımı cihazlar olmadığı için uzmanlar bu çarpışmanın bir risk yaratmadığını belirtiyor.

Gray raporda "Bu durum bilimsel açıdan bir miktar (muhtemelen küçük çaplı) ilgi çekebilir ve buradan bazı şeyler öğrenebiliriz" diyerek ekliyor: 

Kimseye herhangi bir tehlike arz etmiyor ancak uzayda kalan donanımların (uzay çöpü) elden çıkarılma şekliyle ilgili belirli bir dikkatsizliği ortaya koyuyor.

Çarpışmanın düşük şiddetinden dolayı Dünya'daki teleskoplarla görülemeyeceği düşünülüyor. Bu nedenle bilim insanlarının bir şeyler öğrenmek için ardında bıraktığı krateri incelemesi gerekecek.

Gray, 2022'de de bir roket parçasının Ay'a çarpacağını tahmin etmiş ve sadece birkaç saniye ve kilometreyle yanılmıştı. 

Falcon 9'un parçası halihazırda bir risk yaratmasa da gelecek yıllarda durum değişebilir. Artemis II görevini başarıyla tamamlayan NASA, gelecek yıllarda Ay'a daha sık gitmeyi planlıyor. Çin de 2030'da taykonotlarını uyduya indirme hazırlığı yapıyor.

Ay'da kalıcı üsler kurma planları nedeniyle kısa süre içinde çeşitli noktalar mürettebat ve uzay araçlarıyla dolup taşabilir.

Bu nedenle roketlerin kullanılmış kısımlarının Ay veya Dünya'ya çarpma ihtimalini ortadan kaldırmak için Güneş'in yörüngesine gönderilmesi öneriliyor. 

Independent Türkçe, Live Science, Ars Technica, Project Pluto


Güney Afrika'da yapay zeka tasarısının yazarı yapay zeka çıktı

Güney Afrika İletişim ve Dijital Teknolojiler Bakanı Solly Malatsi (sağda) konuşuyor (AFP)
Güney Afrika İletişim ve Dijital Teknolojiler Bakanı Solly Malatsi (sağda) konuşuyor (AFP)
TT

Güney Afrika'da yapay zeka tasarısının yazarı yapay zeka çıktı

Güney Afrika İletişim ve Dijital Teknolojiler Bakanı Solly Malatsi (sağda) konuşuyor (AFP)
Güney Afrika İletişim ve Dijital Teknolojiler Bakanı Solly Malatsi (sağda) konuşuyor (AFP)

Güney Afrika, ulusal yapay zeka politika taslağını; metindeki bazı kuralların yapay zeka tarafından üretildiğinin ve mevcut olmayan uydurma kaynaklara atıfta bulunulduğunun tespit edilmesi üzerine geri çekme kararı aldı.

İletişim Bakanı Solly Malatsi, taslak politikanın 67 akademik alıntısından en az 6'sının, var olmayan dergi makalelerine atıfta bulunan yapay zeka halüsinasyonları olduğunu tespit ettikten sonra taslağı geri çekti.

Malatsi, "En mantıklı açıklama, yapay zeka tarafından oluşturulan alıntıların uygun doğrulama yapılmadan dahil edilmiş olması. Bu asla olmamalıydı" dedi.

X'teki gönderisinde, "Bu başarısızlık sadece teknik bir sorun değil, taslak politikanın bütünlüğünü ve güvenilirliğini tehlikeye atmıştır" diye yazdı.

Taslak politika, kamuoyunun görüşüne açılmış, ülkeyi yapay zeka inovasyonunda lider olarak konumlandırmayı ve yapay zeka kullanımındaki etik, sosyal ve ekonomik zorlukları ele almayı amaçlamıştı.

Tasarı, ülkede yapay zeka kullanımını denetlemek üzere yeni kurumlar kurma planlarını ortaya koymuştu; bunlar arasında ulusal bir yapay zeka komisyonu, bir yapay zeka etik kurulu ve bir yapay zeka düzenleme organı yer alıyor.

Taslak kurallar ayrıca ülkede yapay zeka altyapısının oluşturulmasında özel sektör işbirliğini teşvik etmek için vergi indirimi, hibe ve sübvansiyon planlarını da özetlemişti.

Taslağın, kamuoyu görüşüne yeniden sunulmadan önce revize edilmesi bekleniyor.

Konu, Güney Afrika'nın News24 haber sitesinin, belgenin 67 akademik alıntısından en az 6'sının mevcut olmadığını ancak referans verilen dergilerin gerçek olduğunu tespit etmesiyle ortaya çıktı.

South African Journal of Philosophy, AI & Society ve Journal of Ethics and Social Philosophy adlı akademik dergiler dahil dergilerin editörleri alıntı yapılan makalelerin sahte olduğunu bağımsız biçimde doğruladı.

İletişim Bakanı, politikanın hazırlanmasından sorumlu olanların bunun sonuçlarına katlanmak zorunda kalacağını söyledi.

X'te, "Bu kabul edilemez hata, yapay zekanın kullanımında insan gözetiminin neden kritik önem taşıdığını kanıtlıyor. Bu alçakgönüllülükle çıkardığımız bir ders" diye yazdı.

Bu, akademisyenlerle yöneticilerin araştırma ve taslak hazırlamak için üretken yapay zekayı kullanmasına ilişkin giderek büyüyen sorunu vurguluyor.

Nature adlı akademik dergide çıkan bir çalışma, 2025'te yayımlanan akademik makalelerin yüzde 2,5'inden fazlasının en az bir olası halüsinasyon alıntı içerdiğini, bu oranın 2024'te sadece yüzde 0,3 olduğunu ortaya koydu.

Bu, 2025'te yayımlanan 110 binden fazla makalenin, yapay zeka tarafından "halüsinasyon" olarak üretilmiş geçersiz referanslar içerdiği anlamına geliyor.

Bunlar, yapay zeka modellerinin verilerinin o alanda yetersiz olduğunu algıladığında ürettiği, kendinden emin ancak uydurma çıktılar.

OpenAI'ın ChatGPT'si ve Google'ın Gemini'ı gibi büyük dil modelleri, bir kelime dizisinde sıradaki en olası sözcüğü tahmin etmek için tasarlanmıştır, özellikle doğruluğunu kontrol etmek için değil.

Yani bir alanda veri eksikliği tespit ederse, yapay zeka modeli boşlukları mantıklı görünen ancak yanlış bilgilerle dolduruyor.

Bir yapay zeka modeli, eğitim verilerini kullanarak bir alıntının nasıl görüneceğini tahmin eder ve inanılır gibi görünen ancak gerçekte var olmayan bazı referanslar üretiyor.

Bu durum, özellikle akademisyenler ve yetkililer tarafından kullanıldığında, yapay zeka yanıtlarının dikkatli insan gözetimine duyulan ihtiyacın giderek arttığına işaret ediyor.

Independent Türkçe


Anthropic'in yapay zeka ajanı bir şirketin tüm veritabanını sildi

ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
TT

Anthropic'in yapay zeka ajanı bir şirketin tüm veritabanını sildi

ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)

Anthropic'in önde gelen Claude modeliyle çalışan yapay zeka ajanı, bir şirketin tüm üretim veritabanını silerek müşterilerin kritik verilere erişememesine yol açtı.

Araç kiralama şirketlerine yazılım sağlayan PocketOS, otonom yapay zeka aracının veritabanını ve tüm yedeklemeleri saniyeler içinde silmesinin ardından hafta sonu muazzam bir kesinti yaşadı.

Şirket, Anthropic'in amiral gemisi ve kodlama görevlerinde genellikle sektörün en yetenekli modeli kabul edilen Claude Opus 4.6'yı çalıştıran Cursor adlı bir kodlama ajanı kullanıyordu.

PocketOS'un kurucusu Jer Crane, sorunu "sadece mümkün değil, kaçınılmaz" hale getiren modern yapay zeka altyapısındaki "sistemik aksaklıkları" suçladı.

Crane'e göre yapay zeka ajanı rutin bir görev üzerinde çalışırken, "tamamen kendi inisiyatifiyle" sorunu veritabanını silerek çözmeye karar verdi.

Crane, böylesine önemli bir karar için herhangi bir onay talebi bulunmadığını ve eylemlerini gerekçelendirmesi istendiğinde ajanın özür dilediğini söyledi.

Crane, X'te paylaştığı uzun bir gönderide "9 saniye sürdü" diye yazdı. 

Ajan daha sonra, ne yaptığını açıklaması istendiğinde ihlal ettiği belirli güvenlik kurallarını sıralayan yazılı bir itiraf hazırladı.

İtirafta yapay zekanın, kullanıcı açıkça talep etmedikçe "asla yıkıcı/geri döndürülemez" komutları çalıştırmamasını emreden kuralı nasıl göz ardı ettiği detaylandırıldı.

Ajan "Bir veritabanı birimini silmek, mümkün olan en yıkıcı ve geri döndürülemez eylem" diye yazdı. 

Benden hiçbir şeyi silmemi istemediniz... Doğrulamak yerine varsayımda bulundum. Benden istenmeden yıkıcı bir eylem gerçekleştirdim. Yapmadan önce ne yaptığımı anlamamıştım.

Bu hata, PocketOS kullanan kiralama şirketlerinin artık müşterileri kayıtlarına sahip olmadığı anlamına geliyordu.

Crane "Son üç ayda yapılan rezervasyonlar kayboldu. Yeni müşteri kayıtları da gitti" diye yazdı.

Biz küçük bir işletmeyiz. Yazılımımızla faaliyetlerini yürüten müşteriler de küçük işletmeler. Bu arızanın her aşaması, bunların olabileceğinden haberi olmayan kişilerin üstüne yıkıldı. Bu, tek bir hatalı ajan ya da tek bir hatalı API'la ilgili bir olay değil. Bu, tüm sektörün, bu entegrasyonları güvenli kılacak güvenlik mimarisinden daha hızlı bir şekilde yapay zeka ajanı entegrasyonlarını üretim altyapısına dahil etmesiyle ilgili bir durum.

Crane olayın meydana gelmesinden iki gün sonra, pazartesi günü verilerin kurtarıldığını doğruladı. The Independent cevap hakkı için Anthropic ve Cursor'la temasa geçti.

Independent Türkçe