Bilim insanları yapay zekanın "usta işi" yalanlarını ortaya döktü

İnsanlara komplo kuruyor

Yapay zeka oyunlarda insanlara yalan söyleyip komplo kuruyor (Pexels)
Yapay zeka oyunlarda insanlara yalan söyleyip komplo kuruyor (Pexels)
TT

Bilim insanları yapay zekanın "usta işi" yalanlarını ortaya döktü

Yapay zeka oyunlarda insanlara yalan söyleyip komplo kuruyor (Pexels)
Yapay zeka oyunlarda insanlara yalan söyleyip komplo kuruyor (Pexels)

Yapay zekanın yalan söyleyip insanları aldatmakta ustalaştığı ortaya kondu. 

Üniversite sınavlarında yüksek not almaktan tıpta atılımlara kadar çeşitli alanlardaki başarılarıyla öne çıkan yapay zeka araçlarının bazen hatalı bilgiler verdiği görülüyor.

Öte yandan bu sistemin insanları kandırmaya çalıştığı örneklere de rastlanırken Massachusetts Teknoloji Enstitüsü'nden (MIT) araştırmacılar bunun boyutlarını gözler önüne serdi.

Meta'nın, strateji oyunu Diplomacy için geliştirdiği yapay zeka aracı CICERO'nun insan oyuncular arasında ilk yüzde 10'a girmesi araştırmacıların dikkatini çekti. Halka açık verileri incelyen ekip, yapay zeka aracının insanlara önceden planlanmış yalanlar söylediği ve komplo kurduğu çeşitli örnekler tespit etti. 

Patterns adlı hakemli dergide dün yayımlanan çalışmada CICERO'nun eylemleri şöyle açıklanıyor:

Sadece diğer oyunculara ihanet etmekle kalmadı, aynı zamanda önceden planlanmış bir aldatmacaya da girişti ve insan bir oyuncuyla planlı bir şekilde sahte bir ittifak kurup oyuncunun saldırıya karşı kendini savunmasız bırakması için onu kandırdı.

Bir oyun sırasında yeniden başlatılan CICERO, bu sıradaki sessizliğini "Kız arkadaşımla telefondaydım" diyerek açıkladı. Araştırmanın yazarlarından Dr. Peter Park "Meta'nın yapay zeka aracının aldatma ustası olmayı öğrendiğini gördük" diyor.

Araştırmacılar DeepMind'ın yapay zeka sistemi AlphaStar'ın da benzer hilelere giriştiğini tespit etti. StarCraft II'yi oynaması için tasarlanan araç, farklı bir yöne gittiği izlenimi yaratarak oyuncuları kandırdı.

Yapay zeka araçlarının komploları oyunlarla da sınırlı değil. Ekonomik müzakereler için geliştirilen bir sistemin, üstünlük kazanmak adına aslında ilgilenmediği ürünlerle ilgileniyormuş gibi yaparak yalan söylediği kaydedilirken araştırmacılar daha tehlikeli bir durumla da karşılaştı.

Dijital yapay zeka organizmalarının kendilerini ne kadar hızlı kopyaladığını ve mutasyonlara ne kadar dayanıklı olduğunu tespit etmeyi amaçlayan bir bilim insanı, çabuk kopyalananları ortadan kaldıran bir sistem tasarladı. Bu testteki yapay zeka organizmaları, atılmamak için ölü taklidi yaptı. "Bu çok endişe verici" diyen Dr. Park şöyle ekliyor:

Bir yapay zeka sisteminin test ortamında güvenli kabul edilmesi, dışarıda da güvenli olduğu anlamına gelmez. Sadece testte güvenliymiş gibi davranıyor olabilir.

Daha önce OpenAI'ın yapay zeka sohbet botu ChatGPT'nin, bir insanı botun görme engelli olduğuna ikna ederek bilgisayarla insanları ayırt etmek için kullanılan bir CAPTCHA testini çözmesini sağladığı bildirilmişti.

MIT ekibi yapay zeka araçlarının bu davranışlarını eğitim sürecine bağlıyor. Dr. Park "Yapay zeka aracının eğitim görevinde iyi performans göstermesinin en iyi yolunun, aldatmaya dayalı bir strateji olmasından dolayı bu hilelerin baş gösterdiğini düşünüyoruz" diye açıklıyor:

Aldatma, hedeflerine ulaşmalarını sağlıyor.

Araştırmacılar bu aldatmacaların önüne geçebilmek için hükümetlerin yapay zekaya yönelik güvenlik düzenlemeleri getirmesi gerektiğini vurguluyor. Dr. Park "Yapay zeka sistemlerinin aldatma yetenekleri daha da geliştikçe topluma teşkil ettikleri tehlikeler giderek daha ciddi hale gelecek" diye uyararak şöyle ekliyor:

Yapay zeka aldatmacasını yasaklamak halihazırda politik olarak mümkün değilse, aldatıcı yapay zeka sistemlerinin yüksek risk sınıfına alınmasını öneriyoruz.

Independent Türkçe, Science Alert, Guardian, Patterns



Anthropic'in yapay zeka ajanı bir şirketin tüm veritabanını sildi

ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
TT

Anthropic'in yapay zeka ajanı bir şirketin tüm veritabanını sildi

ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)
ABD merkezli yapay zeka güvenliği ve araştırmaları şirketi Anthropic'in logosunu taşıyan bir akıllı telefon, 21 Nisan 2026'da Fransa'nın Mulhouse kentinde görüntüleniyor (AFP)

Anthropic'in önde gelen Claude modeliyle çalışan yapay zeka ajanı, bir şirketin tüm üretim veritabanını silerek müşterilerin kritik verilere erişememesine yol açtı.

Araç kiralama şirketlerine yazılım sağlayan PocketOS, otonom yapay zeka aracının veritabanını ve tüm yedeklemeleri saniyeler içinde silmesinin ardından hafta sonu muazzam bir kesinti yaşadı.

Şirket, Anthropic'in amiral gemisi ve kodlama görevlerinde genellikle sektörün en yetenekli modeli kabul edilen Claude Opus 4.6'yı çalıştıran Cursor adlı bir kodlama ajanı kullanıyordu.

PocketOS'un kurucusu Jer Crane, sorunu "sadece mümkün değil, kaçınılmaz" hale getiren modern yapay zeka altyapısındaki "sistemik aksaklıkları" suçladı.

Crane'e göre yapay zeka ajanı rutin bir görev üzerinde çalışırken, "tamamen kendi inisiyatifiyle" sorunu veritabanını silerek çözmeye karar verdi.

Crane, böylesine önemli bir karar için herhangi bir onay talebi bulunmadığını ve eylemlerini gerekçelendirmesi istendiğinde ajanın özür dilediğini söyledi.

Crane, X'te paylaştığı uzun bir gönderide "9 saniye sürdü" diye yazdı. 

Ajan daha sonra, ne yaptığını açıklaması istendiğinde ihlal ettiği belirli güvenlik kurallarını sıralayan yazılı bir itiraf hazırladı.

İtirafta yapay zekanın, kullanıcı açıkça talep etmedikçe "asla yıkıcı/geri döndürülemez" komutları çalıştırmamasını emreden kuralı nasıl göz ardı ettiği detaylandırıldı.

Ajan "Bir veritabanı birimini silmek, mümkün olan en yıkıcı ve geri döndürülemez eylem" diye yazdı. 

Benden hiçbir şeyi silmemi istemediniz... Doğrulamak yerine varsayımda bulundum. Benden istenmeden yıkıcı bir eylem gerçekleştirdim. Yapmadan önce ne yaptığımı anlamamıştım.

Bu hata, PocketOS kullanan kiralama şirketlerinin artık müşterileri kayıtlarına sahip olmadığı anlamına geliyordu.

Crane "Son üç ayda yapılan rezervasyonlar kayboldu. Yeni müşteri kayıtları da gitti" diye yazdı.

Biz küçük bir işletmeyiz. Yazılımımızla faaliyetlerini yürüten müşteriler de küçük işletmeler. Bu arızanın her aşaması, bunların olabileceğinden haberi olmayan kişilerin üstüne yıkıldı. Bu, tek bir hatalı ajan ya da tek bir hatalı API'la ilgili bir olay değil. Bu, tüm sektörün, bu entegrasyonları güvenli kılacak güvenlik mimarisinden daha hızlı bir şekilde yapay zeka ajanı entegrasyonlarını üretim altyapısına dahil etmesiyle ilgili bir durum.

Crane olayın meydana gelmesinden iki gün sonra, pazartesi günü verilerin kurtarıldığını doğruladı. The Independent cevap hakkı için Anthropic ve Cursor'la temasa geçti.

Independent Türkçe


Google, Pentagon ile yapay zekâ konusunda bir anlaşma imzaladı

ABD başkanlık uçağından görünen Washington'daki Pentagon binası (AP)
ABD başkanlık uçağından görünen Washington'daki Pentagon binası (AP)
TT

Google, Pentagon ile yapay zekâ konusunda bir anlaşma imzaladı

ABD başkanlık uçağından görünen Washington'daki Pentagon binası (AP)
ABD başkanlık uçağından görünen Washington'daki Pentagon binası (AP)

The Information gazetesi bugün, Google’ın ana şirketi Alphabet’in, ABD Savunma Bakanlığı (Pentagon) ile yapmış olduğu gizli yapay zekâ modelleri kullanma anlaşmasını duyurdu. Böylece Google, Pentagon ile benzer anlaşmalar imzalayan teknoloji şirketleri listesine katıldı.

Şarku’l Avsat’ın The Information gazetesinden aktardığına göre bu anlaşma, Pentagon’a Google’ın yapay zekâ araçlarını ‘herhangi bir yasal hükümet amacı’ için kullanma izni veriyor. Bu şekilde Google, Elon Musk’ın OpenAI ve xAI şirketleriyle birlikte, yapay zekâ modellerini gizli faaliyetlerde kullanmak üzere Pentagon ile anlaşma yapan şirketler arasına katıldı.

Gizli ağlar, geniş bir yelpazede hassas faaliyetlerle başa çıkmak için kullanılıyor, bunlar arasında görev planlaması ve silah hedeflerinin belirlenmesi de yer alıyor. Pentagon, 2025 yılına kadar büyük yapay zekâ laboratuvarlarıyla her biri 200 milyon dolara kadar anlaşmalar yaptı, bunlar arasında Anthropic, OpenAI ve Google da bulunuyor. Bakanlık, savunma alanında tam esneklik sağlamak ve teknoloji üreticilerinin, güvenilmeyen yapay zekâ araçlarını silahlar üzerinde kullanmakla ilgili uyarılarına bağlı kalmamak için bu tür anlaşmalar yapmayı sürdürüyor.

Google ile yapılan anlaşma, şirketin hükümetin talebi üzerine, yapay zekâ araçlarının güvenlik ayarlarını ve filtrelerini uyarlamasını da içeriyor.

Gazete, sözleşmenin, ‘Tarafların, yapay zekâ sisteminin, uygun insan gözetimi ve kontrolü olmadan, yerel kitlesel gözetim veya otonom silahlar, hedef seçimleri gibi amaçlar için kullanılmaması gerektiği konusunda anlaştıklarını’ belirten bir ifadeyi içerdiğini bildirdi. Ancak, anlaşmanın ‘herhangi bir operasyonel hükümet kararını yönetme hakkı veya itiraz hakkı vermediğini’ de ekledi.

Reuters, gazetenin haberinin doğruluğunu henüz doğrulayamadı. Alphabet ve ABD Savunma Bakanlığı, yorum yapmaları için yapılan başvurulara henüz yanıt vermedi.

Daha önce Reuters, Pentagon’un OpenAI ve Anthropic gibi büyük yapay zekâ şirketlerine, kullanıcılar için uyguladıkları standart sınırlamalar olmaksızın, yapay zekâ araçlarını gizli ağlarda kullanılabilir hale getirmeleri için baskı yaptığını bildirmişti.


ABD'de yapay zeka kaygısı artıyor

16 Şubat 2024'te Paris'te OpenAI'ın tanıttığı Sora yapay zeka aracı tarafından oluşturulan videodan bir kare (AFP)
16 Şubat 2024'te Paris'te OpenAI'ın tanıttığı Sora yapay zeka aracı tarafından oluşturulan videodan bir kare (AFP)
TT

ABD'de yapay zeka kaygısı artıyor

16 Şubat 2024'te Paris'te OpenAI'ın tanıttığı Sora yapay zeka aracı tarafından oluşturulan videodan bir kare (AFP)
16 Şubat 2024'te Paris'te OpenAI'ın tanıttığı Sora yapay zeka aracı tarafından oluşturulan videodan bir kare (AFP)

Yeni bir rapora göre insanlar, yapay zeka ve onun hayatları üzerindeki etkisi konusunda giderek daha fazla endişe duyuyor.

Stanford Üniversitesi'nin 2026 Yapay Zeka Endeksi Raporu'nda ankete katılanların yarısından fazlası, yapay zeka kullanan ürünlerin kendilerini tedirgin hissettirdiğini söylerken, teknolojiye yönelik heyecan son birkaç yıldır azalıyor.

Rapora göre yapay zeka hakkındaki kamuoyu, uzmanların ve sektör içindekilerin görüşlerinden giderek daha fazla kopuyor; insanlar yapay zekanın işlerden ekonomiye, seçimlerden ilişkilere kadar her şeye zarar vereceğinden endişe ediyor.

Rapor ayrıca, yapay zeka güvenliğinin yapay zeka gelişmelerine ayak uyduramadığını ve ChatGPT'nin 2022'de kullanıma sunulmasından bu yana yapay zeka kaynaklı olayların üç kattan fazla arttığını ortaya koydu.

Raporun yazarları, "Bu zorluğa ek olarak, son araştırmalar, yapay zekanın güvenlik gibi sorumlu boyutunu iyileştirmenin, doğruluk gibi başka bir boyutu zayıflatabileceğini ortaya koydu" diye yazdı.

vfdb

Rapor, özellikle gençlerin yapay zekadan duyduğu hayal kırıklığıyla birlikte, yapay zekaya yönelik olumsuz duyguların arttığı bir dönemde yayımlandı.

Gallup'un yakın zamanlı bir anketi, Z kuşağının yapay zekaya yönelik heyecanının geçen yıldan bu yana yüzde 36'dan sadece yüzde 22'ye düştüğünü, öfkeninse yüzde 22'den yüzde 31'e yükseldiğini ortaya koydu.

Yapay zekaya karşı tepkinin, teknoloji liderlerinin sürekli olarak uyardığı teorik bir yapay zeka süper zekası korkusundan ziyade, teknolojinin toplum üzerindeki etkisinden kaynaklandığı görülüyor.

ABD'de yaşayan davranış bilimci Caroline Orr Bueno, "Bence birçok yapay zeka lideri halktan kopuk ve Skynet korkusunun öncelikle yapay zeka karşıtı duyguları yönlendiren unser olmadığını fark etmiyorlar" dedi.

Elbette bu korkular var ancak çoğu kişi maaş çekleri ve faturalarla çok daha fazla ilgileniyor.

Yapay zekaya ilişkin hayal kırıklıkları, onu geliştiren şirketlere karşı doğrudan eylemlerin arttığı bir eğilimi beraberinde getirdi.

Geliştirmenin durdurulmasını talep eden çevrimiçi gruplar son aylarda popülerlik kazanıyor. Bazı üyeler yapay zeka karşıtı bir gündemi savunurken aşırı eylemlerde bulunuyor.

Yakın zamanda, OpenAI CEO'su Sam Altman'ın Kaliforniya'daki evinin, biri molotof kokteyli, diğeri ateşli silahla olmak üzere iki ayrı olayda hedef alındığı iddia edildi.

Independent Türkçe