Yapay zekanın sınav başarısı eğitimcileri yeni arayışlara yöneltti

"Durum giderek daha da zorlaşacak. Eğitim sistemini tepeden tırnağa yeniden düşünme zamanı"

Bu görsel, yazılı komutlardan görseller üreten yapay zeka algoritması Midjourney'de oluşturuldu (Independent Türkçe / Midjoruney)
Bu görsel, yazılı komutlardan görseller üreten yapay zeka algoritması Midjourney'de oluşturuldu (Independent Türkçe / Midjoruney)
TT

Yapay zekanın sınav başarısı eğitimcileri yeni arayışlara yöneltti

Bu görsel, yazılı komutlardan görseller üreten yapay zeka algoritması Midjourney'de oluşturuldu (Independent Türkçe / Midjoruney)
Bu görsel, yazılı komutlardan görseller üreten yapay zeka algoritması Midjourney'de oluşturuldu (Independent Türkçe / Midjoruney)

Çevirmenleri, yazarları ve tasarımcıları "işsiz bırakacağından" korkulan ChatGPT, her geçen gün el artırıyor ve tartışmanın içine farklı meslek gruplarını çekiyor.
ABD merkezli OpenAI firmasının geliştirdiği sohbet botu, yakın zamanda yapılan denemelerde prestijli hukuk, işletme ve hatta tıp sınavlarının birçok bölümünü geçmeyi başardı.
Son yılların en ses getiren yapay zeka araçlarından biri olan ChatGPT'nin yazdıkları halihazırda insanların yazdıklarından ayırt edilemez durumdaydı.
Öte yandan, sohbet botunun dünyanın dört bir yanında kabul gören zorlu sınavlarda başarı göstermesi, bazı uzmanlara göre, eğitim sisteminin gözden geçirilmesi gerekliliğini de doğurdu.

Geleceğin "iş insanları" makineler mi olacak?
ABD'nin en eski ve prestijli kurumlarından biri olan Pensilvanya Üniversitesi Wharton İşletme Okulu'ndan Prof. Dr. Christian Terwiesch, geçen hafta, ChatGPT'yle büyük yankı uyandıran bir deney yaptı.
Wharton'ın bitirme sınavına sokulan sohbet botunun en önemli bölümleri başarıyla tamamladığı görüldü.
Terwiesch, yaptığı deneyin sonuçlarını "Chat GPT3 Wharton MBA Derecesi Alır mı?" başlıklı makalesinde özetledi.
Açılımı "Master of Business Administration" (İşletme Yönetimi Yüksek Lisansı) olan MBA programları, iş insanlarına yönelik lisansüstü eğitim veren kurumları ifade ediyor.
Wharton da 142 yıllık tarihi boyunca birçok ünlü ismi ve iş insanını mezun etti. Bu kişiler arasında Donald Trump, Elon Musk ve yatırımcı Warren Buffet da yer alıyor.
Terwiesch'in yayımladığı makaleye göre, ChatGPT, özellikle operasyon yönetimi dersinde birçok öğrenciden daha iyi performans gösterdi. Operasyon yönetiminin, MBA programlarının en temel ve gerekli derslerinden olduğu biliniyor.

"Eğitim sisteminin gözden geçirilmesi gerekiyor"
Terwiesch, "ChatGPT, testlerden B ve B- arasında notlar aldı. Bunun işletme eğitimi için önemli etkileri olacak" ifadelerini kullandı.
Harf sisteminde en yüksek notun A olduğu düşünülürse sohbet botunun bu testlerde en yüksek ikinci notu aldığı anlaşılıyor.
Independent Türkçe'nin özel haberine göre, Michigan Üniversitesi Ross İşletme Okulu'ndan Prof. Dr. Jerry Davis, pazartesi günü meslektaşının bu deneyini tartışmak üzere fakültede bir toplantı düzenledi.
"Ben alarm zillerini çalanlardan biriyim" diyen Davis, Financial Times'a verdiği röportajda şu ifadeleri kullandı:
"Durum giderek daha da zorlaşacak. Eğitim sistemini tepeden tırnağa yeniden düşünme zamanı."

Geliştirilen araçlar işe yaramadı: Yazdığı makaleler ayırt edilemiyor
ChatGPT'nin arkasında, OpenAI'ın 2020'den beri üzerinde çalıştığı yapay zeka dil modeli GPT-3 var.
GPT-3, verileri işlemesini sağlayan 175 milyar parametreye sahip. Bu da onu şimdiye dek piyasaya sürülen en büyük dil modeli haline getiriyor. İkinci sırada ise Microsoft'un GPT-3'ten hemen önce tanıttığı Turing NLG adlı model geliyor. Bu da 17 milyar parametreye sahip.
GPT-3, 2021'den beri ABD'deki kullanıcılara açıktı. Bu yüzden öğrencilerin ödevlerini ve sınavlarını yapay zeka sayesinde geçtiğine dair haberler ChatGPT'nin yayımlanmasından önce gelmeye başlamıştı.
Ancak geçen yıl sonunda ChatGPT'nin de tüm dünyadan kullanıcılara açılması, bu haberleri de çoğalttı ve hızlandırdı. Böylece akademi camiası, yapay zekaya yazdırılan makalelerin nasıl tespit edilebileceğini tartışmaya başladı.
Son aftalarda ChatGPT'de yazılan yazıları tespit etmek, hilelerin ve intihallerin önüne geçmek üzere yeni araçlar da geliştiriliyor.
Örneğin, Princeton Üniversitesi bilgisayar bilimleri öğrencisi Edward Tian, bu amaçla GPTZero adlı bir başka yapay zeka algoritması geliştirmişti. Ancak yapılan denemeler, bu aracın da yeterince güvenilir sonuç vermediğini ortaya çıkarmıştı.

Öğrencilerden daha iyi olduğu için tespit etmek mümkün olabilir
Öte yandan, bu süreçte bazı akademisyenler, kendi öngörü yeteneklerine dayanarak birçok hileyi tespit etmeyi başardı. Örneğin Kuzey Michigan Üniversitesi'nden felsefe profesörü Antony Aumann, burka yasaklarıyla ilgili şüphe uyandıracak kadar tutarlı ve iyi yazılmış bir ödevin ChatGPT tarafından üretildiğini fark edebildi.
Aumann şüphelendiği makaleyi öğrenciye yeniden yazdırdı. Bunun ardından öğrenci, makaleyi yapay zekaya yazdırdığını itiraf etti.
Bazı akademisyenlere göre, en azından şimdilik ChatGPT'yi tespit etmenin tek yolu, akademisyenlerin hisleri. Zira yapay zeka çıktısı "makaleler fazla iyi yazılabiliyor".
Kadir Has Üniversitesi'nde Akademik İngilizce alanında dersler veren öğretim görevlisi Turgay Bayındır, ChatGPT'ye yazdırdığımız bir 5 paragraflık bir İngilizce makaleyi yorumlarken şöyle söylemişti:
"Bu aslında eksiği olmayan bir essay. İngilizcesi de çok iyi. Ama benim aklıma en azından ana dili İngilizce olmayan birinin bunu yazamayacağı geliyor."

Üniversitede yasaklar dönemi: Sözlü sınavlara dönüş başlayabilir
Londra'daki Imperial College İşletme Okulu'nun dekanı Francisco Veloso, "ChatGPT'den kurtulmak için" ciddi çalışmalar yaptıklarını söylüyor. Financial Times'a konuşan Francisco, yakında bununla ilgili politikalar geliştireceklerini belirtti:
El yazısı çalışmalara geri dönebiliriz. Bunun yanı sıra daha fazla sözlü sınava ve sınıf içi çalışmaya başvurabiliriz.
Bu arada sohbet botu ABD'nin New York kentindeki okullarda yasaklandı. Okullardaki internet bağlantılarında ve cihazlarda ChatGPT'ye erişim önceki haftalarda engellendi.
Yetkililer botun yanlış bilgi verebileceğini ve kopya için kullanılabileceğini, bu sebeple öğrencilerin eğitimine zarar vermesinden endişelendiklerini savunuyor.

Dil modellerinin "matematiği çok kötü"
Wharton'da yapılan deneyde aslında ChatGPT gibi araçların önemli bir açığı ortaya çıkarıldı.
Prof. Dr. Terwiesch,ChatGPT'nin operasyon yönetimi ve süreç analiziyle ilgili sorulara doğru ve analitik cevaplar verdiğini kanıtlamış olsa da, sohbet botunun sayısal becerilerinin çok sınırlı olduğu sonucuna vardı. Bu yüzden botun muhasebe sınavlarını geçmesi mümkün olmayabilir.
"Kelimelerin güzelliği karşısında şaşkına döndüm; özlü kelime seçimi, yapı… Bunlar kesinlikle harikaydı" diyen akademisyen, şöyle ekledi:
"Ama matematik çok korkunçtu. Dil ve sezgi doğru, fakat görece basit bir ortaokul matematiğini bile yapamamıştı."
Yapay zeka dil modellerinin matematikle imtihanını gündeme taşıyan bir diğer gelişme de gazetecilik alanında yaşanmıştı.
Önceki haftalarda, teknoloji sitesi CNET'in bir süredir gizlice yapay zeka yazımı haberler yayımladığı ortaya çıkmıştı. Dahası bu haberlerin yanlış bilgiler içerdiği tespit edilmişti.
Özellikle ekonomi haberlerindeki faiz hesapları fazla abartılıydı ve okuru yanlış yatırıma yönlendirme potansiyeline sahipti.
Bu durum, yapay zeka araçlarının matematikle ilgili bir sorunu olduğu fikrini doğururken, CNET de haberlere "Yapay zeka tarafından yazılmıştır" uyarısı eklemeye ve yanlışlıkları düzeltmeye başladı.

ABD'deki Tıbbi Lisans Sınavı'nda da iyi performans gösterdi
ChatGPT'nin matematiği kötü ama biyoloji bilgisi için aynı şey söylenemiyor. Zira sohbet botu ABD'deki Tıbbi Lisans Sınavı'nda da birçok bölümü geçmeyi başardı.
Ülkedeki tüm tıp fakültesi mezunları, lisans sahibi olmak ve çalışmaya başlamak için üç bölümden oluşan bu sınavı vermek zorunda.
ChatGPT'yi bu sınava tabi tutan bir grup araştırmacı, botun bazı testlerde sınavı geçme eşiğine ulaştığını, bazı testlerde de bu eşiğe çok yaklaştığını duyurdu.
Öte yandan bu durum, tıp dünyasını alarma geçirmiş gibi görünmüyor. Hatta bazı uzmanlar bu gelişmelerden memnuniyet duyuyor. Buna göre, ChatGPT gibi büyük dil modelleri, doktorlara karar verme sürecinde yardımcı olma potansiyeline sahip.
Örneğin, Ansible Health adlı bir klinikteki doktorlar, hastaların durumlarını daha iyi anlamak için karmaşık tıbbi raporları basitleştirmek gibi görevlerde ChatGPT'yi denemeye şimdiden başladı.

Google'ın yapay zekasının tıp bilgisi doktorlarla aynı seviyede
Bu arada OpenAI'ın en büyük rakiplerinden Google'ın geliştirdiği yapay zeka araçları da özellikle tıp alanında adından sıkça söz ettiriyor.
Şirketin sıkça sorulan tıbbi soruları yanıtlaması için geliştirdiği Med-PaLM adlı sohbet aracının cevaplarıyla doktorların yanıtları hemen hemen aynı oranda doğru çıktı.
Sohbet botuna sorular yönelten bir grup araştırmacı, gelen yanıtların yüzde 92,6’sının doğru olduğunu kaydetti. Aynı sorular bir de doktorlara yöneltilince onlardan gelen yanıtların da yüzde 92,9 oranında tatmin edici olduğu görüldü.

Bilimsel makalelerde yazar olmaya başladı
Bilim dünyasının önemli bir bölümü ChatGPT gibi dil algoritmalarını kabullenmeye şimdiden hazır. Bilimsel dergi editörleri, araştırmacılar ve yayıncılar artık bu tür araçları yazar olarak kabul etmenin ve onlardan alıntı yapmanın uygun olup olmadığını tartışıyor.
İsveçli araştırmacı Almira Osmanoviç Thunstrom, Temmuz 2022'de  GPT-3'le ilgili bir akademik makale hazırlamıştı. Hakem onayına sunulan makalede GPT-3'ün kendisi de yazar olarak yer almıştı. Öte yandan, "GPT-3, asgari düzeyde insan girdisiyle kendi başına akademik bir makale yazabilir mi?" başlıklı makale halen hakem onayından geçmedi.
Nurse Education in Practice adı bilimsel dergide bu ay yayımlanan bir başyazıda da ChatGPT'nin, Birleşik Krallık Manchester Üniversitesi'nden Siobhan O'Connor'la birlikte ortak yazar olduğu görüldü. Ancak derginin baş editörü Roger Watson, bu durumun gözden kaçtığını ve yakında düzeltileceğini açıkladı.
Bunun yanı sıra Hong Kong merkezli ilaç keşif şirketi Insilico Medicine'in CEO'su Alex Zhavoronkov da ChatGPT'yi geçen ay Oncoscience adlı bilimsel dergide yayınlanan bir makalenin ortak yazarı olarak gösterdi. Zhavoronkov, ChatGPT'nin önceki nesil yapay zeka araçlarından çok daha iyi yazdığını belirtiyor.
Bu konuda yayıncılar ve bilim insanları arasında çetin bir tartışma yürüyor. Zira birçok yayıncı, yapay zeka araçlarının yazar olarak görülemeyeceği ve hatta intihal sayılabileceği görüşünde.
Prestijli akademik dergi Science'ın genel yayın yönetmeni Holden Thorp, "Yapay zekanın yayınladığımız bir makalede yazar olarak yer almasına izin vermeyiz" diyor:
"Yapay zeka tarafından üretilen metnin uygun alıntı yapılmadan kullanılması intihal olarak kabul edilir."

Yapay zekalı avukatlara hazır olun
Yapay zeka tartışmasının önemli bir ayağını da hukukçular yürütüyor. Çünkü davaların açılması ve işleme konması gibi işlemlerde yapay zeka teknolojisi bir süredir kullanılıyor. Hatta Çin'in başkenti Pekin'de internet mahkemeleri ve bahsi geçen süreçlerle ilgilenen bir sanal hakim bile var.
Bu arada yapay zeka, ABD'de şubat ayında görülecek bir trafik cezası davasında tarihte ilk kez sanık avukatı olmaya hazırlanıyor. Sanığa duruşma sırasında kulaklık aracılığıyla danışmanlık yapması beklenen araç, mahkemedeki argümanları dinleyecek ve sanığın verebileceği en iyi cevapları analiz edecek. Akıllı telefon üzerinde çalışan teknoloji, sanığın kimliğini gizli tutan DoNotPay adlı bir teknoloji girişimi tarafından tasarlandı.
Teknoloji meraklıları heyecanla bu davanın sonucunu beklerken, uzmanlık yelpazesini genişleten ChatGPT de ABD'deki Baro Sınavı'nın çoktan seçmeli kısmını geçmeyi başardı.
Baro Sınavı, hukuk fakültesi mezunlarının mesleklerini resmen icra edebilmeleri için geçmeleri gereken, üç bölümlü bir sınav. ChatGPT bu sınavın MBE adı verilen ilk bölümünde yüzde 50 başarı elde etti.

ChatGPT'nin rakibi de hukuk ve ekonomi sınavlarından geçer not aldı
Hukuk ve ekonomi sınavlarında önemli dereceler elde eden tek yapay zeka aracı ChatGPT de değil.
Araştırma firması Anthropic'in geliştirdiği Claude AI, sınavı cevaplayanın ismine bakılmadan not verilen bir hukuk ve ekonomi sınavında "ucu ucuna geçer not" alırken, sınavı değerlendirenler bunun "birçok insan adaydan daha iyi" olduğunu söylüyor.
Dikkat çeken deneme, George Mason Üniversitesi'nde yapıldı. Ancak öğretim üyesi Alex Tabarrok, Claude AI'ın en iyi insan öğrencilere kıyasla kayda değer kusurları olduğunu belirtiyor.

GPT-4 karşısında ne yapacağız?
Kısa süre önce Microsoft'la 10 milyar dolarlık anlaşmaya imza atan OpenAI, halihazırda GPT-4 adını verdiği yeni sürüm üzerinde çalışıyor.
ChatGPT'yle ilgili eleştirileri ve geri bildirimleri toplayan firma, GPT-4'ü geliştirirken bunları da göz önüne aldıklarını belirtiyor.
Bu arada GPT-3 karşısında bile dehşete düşmüş olan akademi camiasının, GPT-4 karşısında ne yapacağı da merak konusu.
OpenAI CEO'su Sam Altman ise, GPT-4'ten korkmanın yersiz olduğunu ima ediyor:
"İnsanlar hayal kırıklığına uğramak için yalvarıyor ve uğrayacaklar da. Yapay Genel Zeka seviyesine ulaşmadık ama bizden bekledikleri bu."
Yapay genel zeka (YGZ), bir insanın yapabileceği herhangi bir zihinsel görevi başarıyla gerçekleştirebilecek varsayımsal makineler için kullanılan bir niteleme.
Önde gelen yapay zeka araştırmacıları, YGZ'nin ortaya çıkmasının insanlık için varoluşsal bir felaketle sonuçlanabileceğini düşünüyor.
 
Yararlanılan kaynaklar: Financial Times, Livemint, Futurism, VICE News, The Verge, Nature, StrictlyVC



SpaceX roketi Ay'a çarpma yolunda

Roket parçasının Ay'ın yakın tarafının sınırına çarpacağı öngörülüyor  (Reuters)
Roket parçasının Ay'ın yakın tarafının sınırına çarpacağı öngörülüyor (Reuters)
TT

SpaceX roketi Ay'a çarpma yolunda

Roket parçasının Ay'ın yakın tarafının sınırına çarpacağı öngörülüyor  (Reuters)
Roket parçasının Ay'ın yakın tarafının sınırına çarpacağı öngörülüyor (Reuters)

SpaceX'e ait bir roketin enkazının bu yazın sonunda ses hızının 7 katıyla Ay'a çarpması bekleniyor.

Dünya'ya yakın cisimleri izlemek için geniş çapta kullanılan Project Pluto yazılımının üreticisi Bill Gray, SpaceX'in Ocak 2025'te fırlattığı bir Falcon 9 roketi üzerine kapsamlı bir rapor yayımladı.

Roket geçen yıl Ay'a Blue Ghost ve Hakuto-R uzay araçlarını götürmüş, bunlardan ilki başarılı bir iniş yaparken diğeriyse Dünya'yla bağlantısını kaybedip haziranda uyduya düşmüştü.

Gray'in raporuna  göre geçen yıl boyunca 1053 kez gözlemlenen Falcon 9'un üst kademesi, Dünya yörüngesinde dönmeye devam ediyor.

Bu verilere dayanarak yapılan tahminlere göre roketin 13,8 metre uzunluğa ve 3,7 metre çapa sahip üst kademesi, 5 Ağustos'ta TSİ 09.44'te Ay'ın Dünya'ya dönük yüzünün kenarındaki Einstein kraterine çarpacak. Cismin saniyede 2,43 kilometre hızla, yani sesin Dünya'daki hızının 7 katı hızla çarpacağı öngörülüyor.

Ay'ın atmosferi olmadığı için roket tek parça halinde yüzeye ulaşacak. Ancak bölgede yaşam veya insan yapımı cihazlar olmadığı için uzmanlar bu çarpışmanın bir risk yaratmadığını belirtiyor.

Gray raporda "Bu durum bilimsel açıdan bir miktar (muhtemelen küçük çaplı) ilgi çekebilir ve buradan bazı şeyler öğrenebiliriz" diyerek ekliyor: 

Kimseye herhangi bir tehlike arz etmiyor ancak uzayda kalan donanımların (uzay çöpü) elden çıkarılma şekliyle ilgili belirli bir dikkatsizliği ortaya koyuyor.

Çarpışmanın düşük şiddetinden dolayı Dünya'daki teleskoplarla görülemeyeceği düşünülüyor. Bu nedenle bilim insanlarının bir şeyler öğrenmek için ardında bıraktığı krateri incelemesi gerekecek.

Gray, 2022'de de bir roket parçasının Ay'a çarpacağını tahmin etmiş ve sadece birkaç saniye ve kilometreyle yanılmıştı. 

Falcon 9'un parçası halihazırda bir risk yaratmasa da gelecek yıllarda durum değişebilir. Artemis II görevini başarıyla tamamlayan NASA, gelecek yıllarda Ay'a daha sık gitmeyi planlıyor. Çin de 2030'da taykonotlarını uyduya indirme hazırlığı yapıyor.

Ay'da kalıcı üsler kurma planları nedeniyle kısa süre içinde çeşitli noktalar mürettebat ve uzay araçlarıyla dolup taşabilir.

Bu nedenle roketlerin kullanılmış kısımlarının Ay veya Dünya'ya çarpma ihtimalini ortadan kaldırmak için Güneş'in yörüngesine gönderilmesi öneriliyor. 

Independent Türkçe, Live Science, Ars Technica, Project Pluto


Güney Afrika'da yapay zeka tasarısının yazarı yapay zeka çıktı

Güney Afrika İletişim ve Dijital Teknolojiler Bakanı Solly Malatsi (sağda) konuşuyor (AFP)
Güney Afrika İletişim ve Dijital Teknolojiler Bakanı Solly Malatsi (sağda) konuşuyor (AFP)
TT

Güney Afrika'da yapay zeka tasarısının yazarı yapay zeka çıktı

Güney Afrika İletişim ve Dijital Teknolojiler Bakanı Solly Malatsi (sağda) konuşuyor (AFP)
Güney Afrika İletişim ve Dijital Teknolojiler Bakanı Solly Malatsi (sağda) konuşuyor (AFP)

Güney Afrika, ulusal yapay zeka politika taslağını; metindeki bazı kuralların yapay zeka tarafından üretildiğinin ve mevcut olmayan uydurma kaynaklara atıfta bulunulduğunun tespit edilmesi üzerine geri çekme kararı aldı.

İletişim Bakanı Solly Malatsi, taslak politikanın 67 akademik alıntısından en az 6'sının, var olmayan dergi makalelerine atıfta bulunan yapay zeka halüsinasyonları olduğunu tespit ettikten sonra taslağı geri çekti.

Malatsi, "En mantıklı açıklama, yapay zeka tarafından oluşturulan alıntıların uygun doğrulama yapılmadan dahil edilmiş olması. Bu asla olmamalıydı" dedi.

X'teki gönderisinde, "Bu başarısızlık sadece teknik bir sorun değil, taslak politikanın bütünlüğünü ve güvenilirliğini tehlikeye atmıştır" diye yazdı.

Taslak politika, kamuoyunun görüşüne açılmış, ülkeyi yapay zeka inovasyonunda lider olarak konumlandırmayı ve yapay zeka kullanımındaki etik, sosyal ve ekonomik zorlukları ele almayı amaçlamıştı.

Tasarı, ülkede yapay zeka kullanımını denetlemek üzere yeni kurumlar kurma planlarını ortaya koymuştu; bunlar arasında ulusal bir yapay zeka komisyonu, bir yapay zeka etik kurulu ve bir yapay zeka düzenleme organı yer alıyor.

Taslak kurallar ayrıca ülkede yapay zeka altyapısının oluşturulmasında özel sektör işbirliğini teşvik etmek için vergi indirimi, hibe ve sübvansiyon planlarını da özetlemişti.

Taslağın, kamuoyu görüşüne yeniden sunulmadan önce revize edilmesi bekleniyor.

Konu, Güney Afrika'nın News24 haber sitesinin, belgenin 67 akademik alıntısından en az 6'sının mevcut olmadığını ancak referans verilen dergilerin gerçek olduğunu tespit etmesiyle ortaya çıktı.

South African Journal of Philosophy, AI & Society ve Journal of Ethics and Social Philosophy adlı akademik dergiler dahil dergilerin editörleri alıntı yapılan makalelerin sahte olduğunu bağımsız biçimde doğruladı.

İletişim Bakanı, politikanın hazırlanmasından sorumlu olanların bunun sonuçlarına katlanmak zorunda kalacağını söyledi.

X'te, "Bu kabul edilemez hata, yapay zekanın kullanımında insan gözetiminin neden kritik önem taşıdığını kanıtlıyor. Bu alçakgönüllülükle çıkardığımız bir ders" diye yazdı.

Bu, akademisyenlerle yöneticilerin araştırma ve taslak hazırlamak için üretken yapay zekayı kullanmasına ilişkin giderek büyüyen sorunu vurguluyor.

Nature adlı akademik dergide çıkan bir çalışma, 2025'te yayımlanan akademik makalelerin yüzde 2,5'inden fazlasının en az bir olası halüsinasyon alıntı içerdiğini, bu oranın 2024'te sadece yüzde 0,3 olduğunu ortaya koydu.

Bu, 2025'te yayımlanan 110 binden fazla makalenin, yapay zeka tarafından "halüsinasyon" olarak üretilmiş geçersiz referanslar içerdiği anlamına geliyor.

Bunlar, yapay zeka modellerinin verilerinin o alanda yetersiz olduğunu algıladığında ürettiği, kendinden emin ancak uydurma çıktılar.

OpenAI'ın ChatGPT'si ve Google'ın Gemini'ı gibi büyük dil modelleri, bir kelime dizisinde sıradaki en olası sözcüğü tahmin etmek için tasarlanmıştır, özellikle doğruluğunu kontrol etmek için değil.

Yani bir alanda veri eksikliği tespit ederse, yapay zeka modeli boşlukları mantıklı görünen ancak yanlış bilgilerle dolduruyor.

Bir yapay zeka modeli, eğitim verilerini kullanarak bir alıntının nasıl görüneceğini tahmin eder ve inanılır gibi görünen ancak gerçekte var olmayan bazı referanslar üretiyor.

Bu durum, özellikle akademisyenler ve yetkililer tarafından kullanıldığında, yapay zeka yanıtlarının dikkatli insan gözetimine duyulan ihtiyacın giderek arttığına işaret ediyor.

Independent Türkçe


Anthropic'in yapay zeka ajanı bir şirketin tüm veritabanını sildi

ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
TT

Anthropic'in yapay zeka ajanı bir şirketin tüm veritabanını sildi

ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)

Anthropic'in önde gelen Claude modeliyle çalışan yapay zeka ajanı, bir şirketin tüm üretim veritabanını silerek müşterilerin kritik verilere erişememesine yol açtı.

Araç kiralama şirketlerine yazılım sağlayan PocketOS, otonom yapay zeka aracının veritabanını ve tüm yedeklemeleri saniyeler içinde silmesinin ardından hafta sonu muazzam bir kesinti yaşadı.

Şirket, Anthropic'in amiral gemisi ve kodlama görevlerinde genellikle sektörün en yetenekli modeli kabul edilen Claude Opus 4.6'yı çalıştıran Cursor adlı bir kodlama ajanı kullanıyordu.

PocketOS'un kurucusu Jer Crane, sorunu "sadece mümkün değil, kaçınılmaz" hale getiren modern yapay zeka altyapısındaki "sistemik aksaklıkları" suçladı.

Crane'e göre yapay zeka ajanı rutin bir görev üzerinde çalışırken, "tamamen kendi inisiyatifiyle" sorunu veritabanını silerek çözmeye karar verdi.

Crane, böylesine önemli bir karar için herhangi bir onay talebi bulunmadığını ve eylemlerini gerekçelendirmesi istendiğinde ajanın özür dilediğini söyledi.

Crane, X'te paylaştığı uzun bir gönderide "9 saniye sürdü" diye yazdı. 

Ajan daha sonra, ne yaptığını açıklaması istendiğinde ihlal ettiği belirli güvenlik kurallarını sıralayan yazılı bir itiraf hazırladı.

İtirafta yapay zekanın, kullanıcı açıkça talep etmedikçe "asla yıkıcı/geri döndürülemez" komutları çalıştırmamasını emreden kuralı nasıl göz ardı ettiği detaylandırıldı.

Ajan "Bir veritabanı birimini silmek, mümkün olan en yıkıcı ve geri döndürülemez eylem" diye yazdı. 

Benden hiçbir şeyi silmemi istemediniz... Doğrulamak yerine varsayımda bulundum. Benden istenmeden yıkıcı bir eylem gerçekleştirdim. Yapmadan önce ne yaptığımı anlamamıştım.

Bu hata, PocketOS kullanan kiralama şirketlerinin artık müşterileri kayıtlarına sahip olmadığı anlamına geliyordu.

Crane "Son üç ayda yapılan rezervasyonlar kayboldu. Yeni müşteri kayıtları da gitti" diye yazdı.

Biz küçük bir işletmeyiz. Yazılımımızla faaliyetlerini yürüten müşteriler de küçük işletmeler. Bu arızanın her aşaması, bunların olabileceğinden haberi olmayan kişilerin üstüne yıkıldı. Bu, tek bir hatalı ajan ya da tek bir hatalı API'la ilgili bir olay değil. Bu, tüm sektörün, bu entegrasyonları güvenli kılacak güvenlik mimarisinden daha hızlı bir şekilde yapay zeka ajanı entegrasyonlarını üretim altyapısına dahil etmesiyle ilgili bir durum.

Crane olayın meydana gelmesinden iki gün sonra, pazartesi günü verilerin kurtarıldığını doğruladı. The Independent cevap hakkı için Anthropic ve Cursor'la temasa geçti.

Independent Türkçe