Bilim insanları yapay zekanın "usta işi" yalanlarını ortaya döktü

İnsanlara komplo kuruyor

Yapay zeka oyunlarda insanlara yalan söyleyip komplo kuruyor (Pexels)
Yapay zeka oyunlarda insanlara yalan söyleyip komplo kuruyor (Pexels)
TT

Bilim insanları yapay zekanın "usta işi" yalanlarını ortaya döktü

Yapay zeka oyunlarda insanlara yalan söyleyip komplo kuruyor (Pexels)
Yapay zeka oyunlarda insanlara yalan söyleyip komplo kuruyor (Pexels)

Yapay zekanın yalan söyleyip insanları aldatmakta ustalaştığı ortaya kondu. 

Üniversite sınavlarında yüksek not almaktan tıpta atılımlara kadar çeşitli alanlardaki başarılarıyla öne çıkan yapay zeka araçlarının bazen hatalı bilgiler verdiği görülüyor.

Öte yandan bu sistemin insanları kandırmaya çalıştığı örneklere de rastlanırken Massachusetts Teknoloji Enstitüsü'nden (MIT) araştırmacılar bunun boyutlarını gözler önüne serdi.

Meta'nın, strateji oyunu Diplomacy için geliştirdiği yapay zeka aracı CICERO'nun insan oyuncular arasında ilk yüzde 10'a girmesi araştırmacıların dikkatini çekti. Halka açık verileri incelyen ekip, yapay zeka aracının insanlara önceden planlanmış yalanlar söylediği ve komplo kurduğu çeşitli örnekler tespit etti. 

Patterns adlı hakemli dergide dün yayımlanan çalışmada CICERO'nun eylemleri şöyle açıklanıyor:

Sadece diğer oyunculara ihanet etmekle kalmadı, aynı zamanda önceden planlanmış bir aldatmacaya da girişti ve insan bir oyuncuyla planlı bir şekilde sahte bir ittifak kurup oyuncunun saldırıya karşı kendini savunmasız bırakması için onu kandırdı.

Bir oyun sırasında yeniden başlatılan CICERO, bu sıradaki sessizliğini "Kız arkadaşımla telefondaydım" diyerek açıkladı. Araştırmanın yazarlarından Dr. Peter Park "Meta'nın yapay zeka aracının aldatma ustası olmayı öğrendiğini gördük" diyor.

Araştırmacılar DeepMind'ın yapay zeka sistemi AlphaStar'ın da benzer hilelere giriştiğini tespit etti. StarCraft II'yi oynaması için tasarlanan araç, farklı bir yöne gittiği izlenimi yaratarak oyuncuları kandırdı.

Yapay zeka araçlarının komploları oyunlarla da sınırlı değil. Ekonomik müzakereler için geliştirilen bir sistemin, üstünlük kazanmak adına aslında ilgilenmediği ürünlerle ilgileniyormuş gibi yaparak yalan söylediği kaydedilirken araştırmacılar daha tehlikeli bir durumla da karşılaştı.

Dijital yapay zeka organizmalarının kendilerini ne kadar hızlı kopyaladığını ve mutasyonlara ne kadar dayanıklı olduğunu tespit etmeyi amaçlayan bir bilim insanı, çabuk kopyalananları ortadan kaldıran bir sistem tasarladı. Bu testteki yapay zeka organizmaları, atılmamak için ölü taklidi yaptı. "Bu çok endişe verici" diyen Dr. Park şöyle ekliyor:

Bir yapay zeka sisteminin test ortamında güvenli kabul edilmesi, dışarıda da güvenli olduğu anlamına gelmez. Sadece testte güvenliymiş gibi davranıyor olabilir.

Daha önce OpenAI'ın yapay zeka sohbet botu ChatGPT'nin, bir insanı botun görme engelli olduğuna ikna ederek bilgisayarla insanları ayırt etmek için kullanılan bir CAPTCHA testini çözmesini sağladığı bildirilmişti.

MIT ekibi yapay zeka araçlarının bu davranışlarını eğitim sürecine bağlıyor. Dr. Park "Yapay zeka aracının eğitim görevinde iyi performans göstermesinin en iyi yolunun, aldatmaya dayalı bir strateji olmasından dolayı bu hilelerin baş gösterdiğini düşünüyoruz" diye açıklıyor:

Aldatma, hedeflerine ulaşmalarını sağlıyor.

Araştırmacılar bu aldatmacaların önüne geçebilmek için hükümetlerin yapay zekaya yönelik güvenlik düzenlemeleri getirmesi gerektiğini vurguluyor. Dr. Park "Yapay zeka sistemlerinin aldatma yetenekleri daha da geliştikçe topluma teşkil ettikleri tehlikeler giderek daha ciddi hale gelecek" diye uyararak şöyle ekliyor:

Yapay zeka aldatmacasını yasaklamak halihazırda politik olarak mümkün değilse, aldatıcı yapay zeka sistemlerinin yüksek risk sınıfına alınmasını öneriyoruz.

Independent Türkçe, Science Alert, Guardian, Patterns



OpenAI'dan türünün ilk örneği araştırma: İnsanlar ChatGPT'yi nasıl kullanıyor?

26 Şubat 2025'te Fransa'nın Bretonya bölgesindeki Kerlouan'da bir telefonun ekranında, OpenAI'ın yapay zeka aracı ChatGPT'nin logosu görünüyor (AFP)
26 Şubat 2025'te Fransa'nın Bretonya bölgesindeki Kerlouan'da bir telefonun ekranında, OpenAI'ın yapay zeka aracı ChatGPT'nin logosu görünüyor (AFP)
TT

OpenAI'dan türünün ilk örneği araştırma: İnsanlar ChatGPT'yi nasıl kullanıyor?

26 Şubat 2025'te Fransa'nın Bretonya bölgesindeki Kerlouan'da bir telefonun ekranında, OpenAI'ın yapay zeka aracı ChatGPT'nin logosu görünüyor (AFP)
26 Şubat 2025'te Fransa'nın Bretonya bölgesindeki Kerlouan'da bir telefonun ekranında, OpenAI'ın yapay zeka aracı ChatGPT'nin logosu görünüyor (AFP)

Türünün ilk örneği bir araştırma, OpenAI'ın son derece popüler yapay zeka sohbet botu ChatGPT'nin aslında nasıl kullanıldığını ortaya koydu.

OpenAI'a göre yapay zeka aracı 2022'de piyasaya sürüldüğünden bu yana 700 milyondan fazla kullanıcıya, yani "dünyanın yetişkin nüfusunun yaklaşık yüzde 10'una" ulaştı. Bu dev kullanıcı kitlesinin uygulamayı nasıl kullandığına dair bilgiler bugüne kadar büyük ölçüde anekdotlarla sınırlıydı.

OpenAI'ın Ekonomik Araştırma ekibi ve Harvard ekonomisti David Deming'in yürüttüğü yeni araştırmada, tüketici kullanımını izlemek için ChatGPT'yle yapılan 1,5 milyon sohbet analiz edildi.

OpenAI bulguların, konuşmaların genellikle "hem kişisel hem de profesyonel kullanım yoluyla ekonomik değer yaratan" günlük görevlere odaklandığını gösterdiğini belirtirken, şirket yapay zekanın insanlar için "temel bir hak" olarak değerlendirilmesi çağrısı yapıyor.

OpenAI, çalışmayı duyurduğu blog paylaşımında "ChatGPT'nin tüketici kullanımı büyük ölçüde günlük görevleri yerine getirmekle ilgili" diye yazıyor.

Sohbetlerin dörtte üçü pratik bilgi, bilgi arama ve yazma üzerine odaklanıyor. Yazma, işle ilgili en yaygın görevken, kodlama ve kendini ifade etme niş faaliyetler olarak kalıyor.

Görsel kaldırıldı.


Bu, ChatGPT'nin dahili mesaj verilerine dayanan ilk çalışma ve OpenAI, kullanıcı verilerini korumak için gizlilik koruma tekniklerinin kullanıldığını belirtiyor.

Araştırmacılar, çoğu kişinin ChatGPT'yi işle ilgili olmayan görevler ve sorgular için kullandığını, yalnızca yüzde 30'unun aracı profesyonel amaçlarla kullandığını ortaya koydu.

Araştırmacılar çalışmada, "Bulgularımız genel itibarıyla, ChatGPT'nin küresel ekonomi üzerinde geniş tabanlı bir etkisi olduğuna işaret ediyor" diye yazıyor.

İş dışı kullanımın daha hızlı artması, üretken yapay zeka kullanımından elde edilen refah kazanımlarının kayda değer boyutlara varabileceğini gösteriyor... İş kullanımı kapsamındaysa, görünüşe göre kullanıcıların halihazırda ChatGPT'yi sadece iş görevlerini doğrudan yerine getiren bir teknoloji gibi değil, danışman veya araştırma asistanı olarak kullanarak değer elde ettiğini bulduk.

Çalışmadaki beklenmedik bulgulardan biri, erkek ve kadınların ChatGPT'yi farklı nedenlerle kullanmasıydı.

Genellikle kadın isimlerine sahip kullanıcılar, yapay zeka aracını pratik bilgi ve yazma desteği için kullanma eğilimindeyken, tipik olarak maskülen isimlere sahip kullanıcılar daha çok teknik yardım ve multimedya için kullanıyor.

ChatGPT, Kasım 2022'de piyasaya sürüldüğünden bu yana çok hızlı büyümesine rağmen, halihazırda rakiplerinden gelen önemli bir rekabetle karşı karşıya.

Google'ın yapay zeka sohbet botu Gemini, kısa süre önce ChatGPT'yi geçerek Birleşik Krallık ve ABD'de en popüler iPhone uygulaması olmuştu.

Teknoloji devi yeni kullanıcı sayısındaki ani artışı, DALL-E gibi OpenAI araçlarının birçok sınırlamasını aşan Nano Banana adlı yeni görüntü modelinin başarısına bağlamıştı.

Independent Türkçe


Yeni çalışmaya göre yapay zeka, nefret söylemini ayırt edemiyor

Fotoğraf: Unsplash
Fotoğraf: Unsplash
TT

Yeni çalışmaya göre yapay zeka, nefret söylemini ayırt edemiyor

Fotoğraf: Unsplash
Fotoğraf: Unsplash

Yeni çalışmaya göre yapay zeka, nefret söylemini ayırt edemiyor

Pensilvanya Üniversitesi (UPenn) araştırmacıları tarafından yürütülen çalışma, sosyal medya platformlarının içerikleri denetlemek için kullandığı Open AI, Google ve DeepSeek'in ayrımcı içeriği farklı standartlarla tanımladığını ortaya koydu.

Araştırmacılar, çevrimiçi ortamda neyin söylenip neyin söylenemeyeceğini belirleme sorumluluğuna sahip 7 yapay zeka denetim sistemini analiz etti.

UPenn Annenberg İletişim Okulu'ndan Doçent Yphtach Lelkes şunları söyledi:

Araştırmamız, nefret söylemi söz konusu olduğunda, bu kararları yönlendiren yapay zekanın son derece tutarsız olduğunu gösteriyor. Yani kuralların görünmez, hakemin ise bir makine olduğu yeni bir dijital sansür biçimiyle karşı karşıyayız.

Findings of the Association for Computational Linguistics adlı akademik dergide yayımlanan çalışmada, yaklaşık 125 demografik gruba yönelik hem tarafsız terimler hem de hakaret içeren 1,3 milyon ifade incelendi.

Modeller, bir ifadenin nefret söylemi olarak değerlendirilip değerlendirilmeyeceği konusunda farklı kararlar veriyordu. Araştırmacılar, tutarsızlıkların güveni zedeleyebileceği ve önyargı algısı yaratabileceği için bunun önemli bir toplumsal mesele olduğunu belirtiyor.

Etnik köken, din veya cinsel yönelim temelinde önyargı ifade eden küfürlü veya tehditkar bir söylemlere nefret söylemi deniyor.

Çalışmanın araştırmacısı, Annenberg doktora öğrencisi Neil Fasching şunları söyledi:

Araştırma, içerik denetleme sistemlerinin aynı nefret söylemi içeriklerini değerlendirirken önemli tutarsızlıklar gösterdiğini; bazı sistemlerin içeriği zararlı olarak işaretlerken, bazılarının kabul edilebilir bulduğunu gösteriyor.

Fasching, en büyük tutarsızlıkların, sistemlerin gruplar hakkındaki ifadeleri eğitim düzeyi, ekonomik sınıf ve kişisel çıkarlara göre değerlendirmelerinde olduğunu ve bunun "bazı toplulukları çevrimiçi zararlara karşı diğerlerinden daha savunmasız" bıraktığını söyledi.

Irk, toplumsal cinsiyet ve cinsel yönelim temelinde gruplar hakkındaki ifadelerin değerlendirilmesi daha benzerdi.

Oxford Üniversitesi'nden teknoloji ve düzenleme profesörü Dr. Sandra Wachter, araştırmanın konunun ne kadar karmaşık olduğunu ortaya koyduğunu söyledi.

Bu dengeyi tutturmak zor çünkü insanlar olarak kabul edilebilir bir konuşmanın nasıl olması gerektiğine dair net ve somut standartlarımız yok. İnsanlar standartlar konusunda anlaşamıyorsa, bu modellerin farklı sonuçlar vermesi benim için şaşırtıcı değil ancak bu zararı ortadan kaldırmıyor. Üretken Yapay Zeka, insanların kendilerini bilgilendirmesi için çok popüler bir araç haline geldiğinden, teknoloji şirketlerinin sunduğu içeriğin zararlı değil, doğru, çeşitli ve tarafsız olmasını sağlama sorumluluğu olduğunu düşünüyorum. Büyük teknoloji büyük sorumluluk da getiriyor.

Analiz edilen 7 modelden bazıları içerik sınıflandırmak için tasarlanmışken, diğerleri daha geneldi. Bunlardan ikisi OpenAI, ikisi Mistral, Claude 3.5 Sonnet, DeepSeek V3 ve Google Perspective API'dandı.

Yorumlarını almak üzere tüm moderatörlerle iletişime geçildi.

Independent Türkçe


Astronomi meraklıları tam ay tutulmasını izledi

Ürdün'ün başkenti Amman'daki Spor Şehri'nde teleskopla ay tutulmasını izleyen bir adam (Reuters)
Ürdün'ün başkenti Amman'daki Spor Şehri'nde teleskopla ay tutulmasını izleyen bir adam (Reuters)
TT

Astronomi meraklıları tam ay tutulmasını izledi

Ürdün'ün başkenti Amman'daki Spor Şehri'nde teleskopla ay tutulmasını izleyen bir adam (Reuters)
Ürdün'ün başkenti Amman'daki Spor Şehri'nde teleskopla ay tutulmasını izleyen bir adam (Reuters)

Astronomi meraklıları, dün başta Asya olmak üzere Avrupa ve Afrika'da da gözlenen tam ay tutulması sırasında "kanlı ay"ı görme fırsatı buldu. 

Suudi Arabistan'ın güneybatısındaki el-Baha semalarında gerçekleşen ay tutulması, ilgililer tarafından izlendi (SPA)Suudi Arabistan'ın güneybatısındaki el-Baha semalarında gerçekleşen ay tutulması, ilgililer tarafından izlendi (SPA)

Dünya'nın ayını kırmızıya boyayan bu olgu, Güneş, Dünya ve Ay'ın bu sırayla mükemmel bir şekilde hizalandığı ve Ay'ın dolunay olduğu zamanda meydana gelir.

Bu fenomeni gözlemlemek için en iyi fırsat Asya'da, özellikle Çin ve Hindistan'da, ayrıca Doğu Afrika ve Batı Avustralya sakinleri için vardı.

Tam ay tutulması GMT saatiyle 17:30'dan 18:52'ye kadar sürdü.

 İranlı kadın, Tahran'daki bir köprüde bulunan teleskopla tam ay tutulmasını izliyor (EPA)İranlı kadın, Tahran'daki bir köprüde bulunan teleskopla tam ay tutulmasını izliyor (EPA)

Avrupa ve Afrika'dakiler de akşamın erken saatlerinde ay doğarken, kısa süreli bir kısmi tutulma görme şansına sahip oldu. Ancak Amerika kıtasındakiler bu olayı göremedikleri için daha az şanslıydı.

Rusya'nın başkenti Moskova'daki yüzen köprüde gerçekleşen tutulmanın ardından (AP)Rusya'nın başkenti Moskova'daki yüzen köprüde gerçekleşen tutulmanın ardından (AP)

Ay, güneş ışınlarını engelleyen Dünya'nın gölgesine girerken kırmızıya döner ve beyaz parlaklığını yavaş yavaş kaybeder.

Belfast Üniversitesi'nde astrofizikçi olan Ray Milligan, aya ulaşan tek güneş ışığının “Dünya'nın atmosferinde yansıtılıp saçılan ışık” olduğunu belirtti.

 Bir kadın, Yunanistan'ın başkenti Atina'daki antik Atina Gözlemevi yakınlarında gerçekleşen tutulma sırasında teleskopla ayın fotoğrafını çekiyor (Reuters)Bir kadın, Yunanistan'ın başkenti Atina'daki antik Atina Gözlemevi yakınlarında gerçekleşen tutulma sırasında teleskopla ayın fotoğrafını çekiyor (Reuters)

Ancak, Milligan'a göre mavi dalga boyları kırmızı dalga boylarından daha kısadır ve bu nedenle Dünya'nın atmosferinden geçerken daha kolay dağılırlar. Milligan, “Ay'a kan kırmızısı rengini verenin bu olduğunu” ifade ediyor.

Şarku’l Avsat’ın edindiği bilgiye göre Güneş tutulmasını gözlemlemek için özel gözlükler gerekirken, ay tutulmasını gözlemlemek için sadece uygun hava koşulları, açık gökyüzü ve doğru konumda olmak yeterlidir.

Endonezya'nın başkenti Cakarta'da tam ay tutulması izleniyor (Reuters)Endonezya'nın başkenti Cakarta'da tam ay tutulması izleniyor (Reuters)

Mart ayında gözlemlenen tutulmanın ardından bu yılki ikinci tam ay tutulması olan olay, 12 Ağustos 2026'da gerçekleşmesi beklenen büyük güneş tutulmasının habercisi niteliğinde.

2006 yılından sonra Avrupa'da görülecek ilk tam güneş tutulması, İspanya ve İzlanda'da tamamen, diğer ülkelerde ise kısmen görülebilecek.