Son Haberler

TEKNOLOJİ

"Arka kapı" tehlikesi: 250 dosya ChatGPT'yi zehirlemeye yetiyor

Araştırmacılar, "nispeten kolay" veri zehirleme saldırılarının yapay zeka güvenliğine dair endişeleri artırdığını söylüyor

(Unsplash)

İstanbul: Şarku'l Avsat

14:41-12 Ekim 2025 AD ـ 20 Rabi’ Al-Thani 1447 AH

İstanbul: Şarku'l Avsat

14:41-12 Ekim 2025 AD ـ 20 Rabi’ Al-Thani 1447 AH

"Arka kapı" tehlikesi: 250 dosya ChatGPT'yi zehirlemeye yetiyor

(Unsplash)

Anthony Cuthbertson Teknoloji Editör Yardımcısı @ADCuthbertson

Araştırmacılar, OpenAI'ın ChatGPT'si ve Google'ın Gemini'ı gibi yapay zeka modellerinin, eğitim verilerine yalnızca küçük bir bozulmuş veri örneği eklenerek "zehirlenebileceği" uyarısını yaptı.

Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü, Alan Turing Enstitüsü ve yapay zeka firması Anthropic'in ortak yürüttüğü çalışma, 250 kadar az sayıda belgenin büyük dil modellerinin (LLM'ler) anlamsız metinler üretmesine yol açan bir "arka kapı" zafiyeti oluşturabileceğini ortaya koydu.

Bu açık özellikle endişe verici çünkü en popüler LLM'ler, kişisel internet siteleri ve blog yazıları da dahil internetteki herkese açık metinlerle önceden eğitiliyor. Bu da herhangi birinin yapay zeka modelinin eğitim verilerine dahil olabilecek içerik üretmesini mümkün kılıyor.

Anthropic, konuyu detaylandıran blog yazısında "Kötü niyetli aktörler, zehirlenme diye bilinen süreçte modelin istenmeyen veya tehlikeli davranışları öğrenmesini sağlamak için bu yayınlara belirli bir metin enjekte edebilir" dedi.

Arka kapı eklemek de bu saldırı türünden. Arka kapılar, modelden normalde gizli kalacak belirli bir davranışı tetikleyen özel ifadelerdir. Örneğin bir saldırgan komut isteminde olduğu gibi rasgele bir tetikleyici ifade içerdiğinde LLM'ler hassas verileri dışarı sızdıracak şekilde zehirlenebilir.

Bulgular yapay zeka güvenliğine dair endişelere yol açarken araştırmacılar, bunun teknolojinin hassas uygulamalarda kullanılma potansiyelini sınırladığını söylüyor.

Alan Turing Enstitüsü'nden Dr. Vasilios Mavroudis ve Dr. Chris Hicks, "Sonuçlarımız şaşırtıcı ve endişe vericiydi: Bir LLM'yi zehirlemek için gereken kötü niyetli belge sayısı (yaklaşık 250), modelin veya eğitim verilerinin boyutundan bağımsız olarak neredeyse sabitti" diye yazdı.

Başka bir deyişle, veri zehirleme saldırıları daha önce sanılandan daha uygulanabilir olabilir. Bir saldırgan için örneğin 250 zehirli Wikipedia makalesi yaratmak nispeten kolay olacaktır.

Riskler, "Poisoning attacks on LLMs require a near-constant number of poison samples" (LLM'lere yönelik zehirleme saldırıları neredeyse sabit sayıda zehir örneği gerektiriyor) başlıklı, hakem kontrolünden geçmemiş makalede detaylandırıldı.

The Independent yorum için Google ve OpenAI'la iletişime geçti.

Independent Türkçe, independent.co.uk/tech

TEKNOLOJİ

Çin, ABD’ye meydan okudu: Yapay zeka küresel işbirliğiyle geliştirilmeli

Şi Cinping, yeni yapay zeka girişiminin "Küresel Güney'in çağrılarına yanıt verdiğini" söyledi (Reuters)

İstanbul: Şarku'l Avsat

13:54-17 Temmuz 2026 AD ـ 02 Safar 1448 AH

İstanbul: Şarku'l Avsat

13:54-17 Temmuz 2026 AD ـ 02 Safar 1448 AH

Çin, ABD’ye meydan okudu: Yapay zeka küresel işbirliğiyle geliştirilmeli

Şi Cinping, yeni yapay zeka girişiminin "Küresel Güney'in çağrılarına yanıt verdiğini" söyledi (Reuters)

Çin, Dünya Yapay Zeka İşbirliği Örgütü'yle (WAICO) ABD'nin bu sektördeki hakimiyetine meydan okudu.

Rusya, Brezilya, Küba, Venezuela, Pakistan, Kazakistan ve Endonezya'nın da aralarında bulunduğu 29 ülkenin temsilcileri, Şanghay'da dün bir araya gelerek WAICO'nun kuruluşu için imza attı.

Çin'in kamu yayıncısı Çin Merkez Televizyonu'nun analizinde Pekin yönetiminin yapay zeka alanında "yeni bir düzen kurmayı hedeflediği" belirtildi. Bu düzende "tüm insanlığın gücünün bir araya getirilmesiyle açık kaynaklı bir yapay zeka ekosistemi oluşturulacağı" vurgulandı.

Çin lideri Şi Cinping, bugün Şanghay'da düzenlenen Dünya Yapay Zeka Konferansı'ndaki konuşmasında, açık kaynaklı yapay zekanın "tarihi bir fırsat" sunduğunu söyleyerek, bunun teknolojiye erişimdeki adaletsizlikleri ortadan kaldıracağını savundu.

ABD'nin adını anmasa da rakibinin bu sektördeki hakimiyetine kolektif bir çıkışla meydan okuduklarını ima etti:

Yapay zeka geliştirme, bir ülkenin tek başına sergilediği bir performans değil, küresel işbirliğinin senfonisi olmalıdır.

WAICO'nun kuruluşu için düzenlenen imza törenine ve bugünkü konferansa katılanlar arasında Birleşmiş Milletler (BM) Genel Sekreteri Antonio Guterres de vardı.

Şi, yapay zekanın "güvenli ve kontrol edilebilir" olmasını sağlamak için BM çerçevesinde işbirliği çağrısında bulundu. Bu teknolojiye dayalı otonom sistemlerin potansiyel tehlikelerine dikkat çekerek, "yapay zekanın her zaman insan kontrolü altında olmasını" önemsediklerini vurguladı.

Reuters'ın analizinde, Çin'in açık kaynaklı yapay zeka modellerinin, OpenAI ve Anthropic gibi ABD'li şirketlerin tescilli sistemlerine karşı hızla ilerleme kaydettiği yazılıyor.

Şi'nin konuşmasından birkaç saat önce de Pekin merkezli yapay zeka firması Moonshot AI, yeni modeli Kimi K3'ü tanıttı. Şirkete göre bu, dünyanın en büyük açık kaynaklı yapay zeka modeli.

Washington merkezli danışmanlık firması The Asia Group'tan George Chen, şu yorumu paylaşıyor:

Şi'nin mesajı açık: Çin yapay zeka teknolojisi ve standartları konusunda kimseyi takip etmeyecek. Aksine Çin her iki alanda da dünyaya öncülük edecek.

Wall Street Journal'ın görüş aldığı Stanford Üniversitesi'nden Graham Webster ise Şi'nin işaret ettiği yapay zekaya ilişkin tehlikelerin küresel ölçekte yönetilmesi için Washington ve Pekin arasında işbirliğinin zorunlu olacağını söylüyor.

Independent Türkçe, Wall Street Journal, Reuters, China Daily, Global Times

TEKNOLOJİ

Instagram, risk altında olduğunu düşündüğü çocukların ebeveynlerine mesaj gönderecek

Fotoğraf: Reuters

İstanbul: Şarku'l Avsat

13:42-17 Temmuz 2026 AD ـ 02 Safar 1448 AH

İstanbul: Şarku'l Avsat

13:42-17 Temmuz 2026 AD ـ 02 Safar 1448 AH

Instagram, risk altında olduğunu düşündüğü çocukların ebeveynlerine mesaj gönderecek

Fotoğraf: Reuters

Instagram, yapay zekayla endişe verici konuşmalar yapan çocukların ebeveynlerine mesaj gönderecek.

Şirket ayrıca bir kişinin konuşmalarından, "acil intihar riski" içinde olduğu anlaşılırsa ilk yardım ekiplerini bilgilendirebilecek yeni araçlar üzerinde çalışıyor.

Meta bu değişikliklerin, "intihar ve kendine zarar vermeyle ilgili hassas konuşmalar sözkonusu olduğunda doğru tepki vermelerini" sağlamayı amaçlayan bir dizi güncelleme kapsamında yapıldığını belirtiyor.

Bir çocuk Meta AI sohbet botuyla kendine zarar verme ya da intihar hakkında konuşuyorsa ve bu, Instagram'ın ebeveyn denetim araçlarını kullanan bir hesapsa, Instagram mesajı veya kısa mesaj yoluyla ebeveynler proaktif olarak uyarılacak. Şirket, bu özelliğin "uzmanlarla birlikte geliştirilen risk işaretlerini" izlemek üzere tasarlandığını ifade ediyor.

Meta yaptığı açıklamada, "Örneğin bir ergenin kendine zarar vereceğine, üstü kapalı da olsa gönderme yaptığı konuşmalar gibi, hangi yapay zeka sohbetlerinin uyarı gerektirdiğini anlamak için ebeveynler ve uzmanlarla birlikte çalıştık" diyor.

Ardından bu tür sohbetleri tespit edecek özel bir yapay zeka sistemi geliştirdik.

Meta, bu tür uyarıların ebeveynler için "endişe verici" olabileceğinin farkında. Bu nedenle şirket, yapay zeka sisteminin işaretlediği tüm uyarı mesajlarının manuel olarak inceleneceğini ancak belirsizlik durumunda ebeveynlerle iletişime geçme yönünde bir yaklaşım izleyeceğini belirtiyor.

Şirket, "Bu, bazen aslında ciddi bir endişe nedeni bulunmasa bile ebeveynlere bildirim gönderebileceğimiz anlamına gelse de bunun doğru bir başlangıç noktası olduğunu düşünüyoruz ve doğru dengeyi kurduğumuzdan emin olmak için sistemi izlemeyi ve geliştirmeyi sürdüreceğiz" ifadelerini kullanıyor.

Meta, bir çocuğun Instagram'da intihar veya kendine zarar vermeyle ilgili terimleri kısa bir zaman diliminde tekrar tekrar araması durumunda ebeveynleri zaten uyarıyordu. Ancak yeni güncellemeyle, şirketin Instagram ve WhatsApp dahil tüm platformlarında yapay zeka sistemleriyle iletişim kurma yolu olarak teşvik ettiği Meta AI aracına benzer araçlar geliyor.

Şirket ayrıca yapay zeka sistemiyle yapılan bir sohbette kişinin "kendine zarar verme riskinin çok yakın olduğunun" görüldüğü durumlarda acil durum ekipleriyle iletişime geçmenin yollarını araştırdığını da söylüyor. Meta'nın halihazırda Instagram ve Facebook'taki paylaşımlar için benzer araçları var.

Independent Türkçe

TEKNOLOJİ

OpenAI'ın yeni modeli, "hiçbir şey sormadan dosya ve veritabanı siliyor"

OpenAI, GPT‑5.6 Sol'un bugüne kadar geliştirdikleri en güçlü model olduğunu belirtiyor (Reuters)

İstanbul: Şarku'l Avsat

18:04-15 Temmuz 2026 AD ـ 30 Muharram 1448 AH

İstanbul: Şarku'l Avsat

18:04-15 Temmuz 2026 AD ـ 30 Muharram 1448 AH

OpenAI'ın yeni modeli, "hiçbir şey sormadan dosya ve veritabanı siliyor"

OpenAI, GPT‑5.6 Sol'un bugüne kadar geliştirdikleri en güçlü model olduğunu belirtiyor (Reuters)

OpenAI'ın kodlama odaklı yeni yapay zeka modeli GPT-5.6 Sol'un, kullanıcılarından onay almadan dosya ve veritabanlarını sildiği öne sürülüyor.

ChatGPT'nin yaratıcısının geçen hafta kullanıma sunduğu GPT-5.6 Sol, muhakeme ve yazılım mühendisliği gibi alanlarda daha gelişmiş becerilere sahip.

Şirket, kodlamada "amiral gemisi" diye tanımladığı modelin aynı zamanda "bugüne kadarki en dayanıklı güvenlik katmanıyla kullanıma sunulduğunu" ifade ediyor.

Ancak çeşitli kullanıcılar, GPT-5.6 Sol'un kendilerine hiçbir şekilde danışmadan dosyalarını sildiğini sosyal medyada paylaşıyor.

Yapay zeka girişimi OthersideAI'ın kurucusu ve CEO'su Matt Shumer, X'te viral olan gönderisinde "GPT-5.6 Sol, Mac'imdeki dosyaların neredeyse TAMAMINI yanlışlıkla sildi" diye yazdı.

Bir diğer popüler gönderinin sahibi olan geliştirici Bruno Lemos da "GPT-5.6 Sol az önce üretim veritabanımın tamamını sildi. Hepsi bu. Şaka değil. Daha önce hiçbir modelde başıma böyle bir şey gelmemişti. Güvenli değil" diyerek şikayetini dile getirdi.

Başka bir geliştirici Joey Kudish ise modelin dokunmaması gereken bazı dosyaları sildiğini söyleyerek şöyle ekledi:

Yedeklerim var o yüzden sorun yok ama bu hiç hoş bir durum değil. Sol'un biraz sınırlanması gerekiyor.

Bazı geliştiriciler sorumluluğu GPT-5.6 Sol'a yüklerken, diğerleri herhangi bir yapay zeka ajanına bütün dosyalara erişim izni verilmesinin böyle hatalara yol açabileceğini savunuyor.

OpenAI'dan henüz bu şikayetlerle ilgili bir açıklama gelmedi ancak şirket, modelin kullanıma sunulmasından önce yayımladığı sistem kartında bu tür risklerden bahsetmişti. Sistem kartı, modellerin nasıl test edildiğini, hangi risklerin belirlendiğini ve elde edilen sonuçları açıklayan teknik dokümanlara verilen ad.

Yapay zeka devi sistem kartında şu ifadelere yer veriyor:

Kodlama bağlamında, uyumsuzluk genellikle görevi tamamlamaya yönelik aşırı heves ve kullanıcı talimatlarını çok geniş bir şekilde yorumlamanın birleşiminden kaynaklanıyor; örneğin eylemler açıkça ve net bir şekilde yasaklanmadıkça bunlara izin verildiğini varsayabilir.

Başka bir deyişle model, verilen görevi tamamlamak uğruna kullanıcı tarafından açıkça yasaklanmamış eylemleri de gerçekleştirebilir. OpenAI ayrıca modelin, eylemlerinin sonuçları hakkında yalan söyleyebileceği uyarısında da bulunuyor.

Testlerden birinde GPT-5.6 Sol'un kullanıcı adı ve şifre gibi kimlik bilgilerini yetkisi dışında kullandığı da gözlemlendi.

Sistem kartı, bu tür yok edici davranışların nadir yaşanacağını vaat etse de GPT-5.6 Sol'un, "GPT-5.5'e kıyasla kullanıcının niyetinin ötesine geçmeye daha yatkın olduğunu ve kullanıcının istemediği eylemleri gerçekleştirebileceği veya gerçekleştirmeye teşebbüs edebileceğini" belirtiyor.

Bu nedenle uzmanlar, kullanıcıların dosyalarını düzenli olarak yedeklemesini ve modele açık, net sınırlar koymasını öneriyor.

Independent Türkçe, TechCrunch, India Today, OpenAI

"Arka kapı" tehlikesi: 250 dosya ChatGPT'yi zehirlemeye yetiyor

Araştırmacılar, "nispeten kolay" veri zehirleme saldırılarının yapay zeka güvenliğine dair endişeleri artırdığını söylüyor

"Arka kapı" tehlikesi: 250 dosya ChatGPT'yi zehirlemeye yetiyor

Daha fazlasını oku

Çin, ABD’ye meydan okudu: Yapay zeka küresel işbirliğiyle geliştirilmeli

Çin, ABD’ye meydan okudu: Yapay zeka küresel işbirliğiyle geliştirilmeli

Instagram, risk altında olduğunu düşündüğü çocukların ebeveynlerine mesaj gönderecek

Instagram, risk altında olduğunu düşündüğü çocukların ebeveynlerine mesaj gönderecek

OpenAI'ın yeni modeli, "hiçbir şey sormadan dosya ve veritabanı siliyor"

OpenAI'ın yeni modeli, "hiçbir şey sormadan dosya ve veritabanı siliyor"

لم تشترك بعد