"Arka kapı" tehlikesi: 250 dosya ChatGPT'yi zehirlemeye yetiyor

Araştırmacılar, "nispeten kolay" veri zehirleme saldırılarının yapay zeka güvenliğine dair endişeleri artırdığını söylüyor

(Unsplash)
(Unsplash)
TT

"Arka kapı" tehlikesi: 250 dosya ChatGPT'yi zehirlemeye yetiyor

(Unsplash)
(Unsplash)

Anthony Cuthbertson Teknoloji Editör Yardımcısı @ADCuthbertson 

Araştırmacılar, OpenAI'ın ChatGPT'si ve Google'ın Gemini'ı gibi yapay zeka modellerinin, eğitim verilerine yalnızca küçük bir bozulmuş veri örneği eklenerek "zehirlenebileceği" uyarısını yaptı.

Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü, Alan Turing Enstitüsü ve yapay zeka firması Anthropic'in ortak yürüttüğü çalışma, 250 kadar az sayıda belgenin büyük dil modellerinin (LLM'ler) anlamsız metinler üretmesine yol açan bir "arka kapı" zafiyeti oluşturabileceğini ortaya koydu.

Bu açık özellikle endişe verici çünkü en popüler LLM'ler, kişisel internet siteleri ve blog yazıları da dahil internetteki herkese açık metinlerle önceden eğitiliyor. Bu da herhangi birinin yapay zeka modelinin eğitim verilerine dahil olabilecek içerik üretmesini mümkün kılıyor.

Anthropic, konuyu detaylandıran blog yazısında "Kötü niyetli aktörler, zehirlenme diye bilinen süreçte modelin istenmeyen veya tehlikeli davranışları öğrenmesini sağlamak için bu yayınlara belirli bir metin enjekte edebilir" dedi.

Arka kapı eklemek de bu saldırı türünden. Arka kapılar, modelden normalde gizli kalacak belirli bir davranışı tetikleyen özel ifadelerdir. Örneğin bir saldırgan komut isteminde olduğu gibi rasgele bir tetikleyici ifade içerdiğinde LLM'ler hassas verileri dışarı sızdıracak şekilde zehirlenebilir.

Bulgular yapay zeka güvenliğine dair endişelere yol açarken araştırmacılar, bunun teknolojinin hassas uygulamalarda kullanılma potansiyelini sınırladığını söylüyor.

Alan Turing Enstitüsü'nden Dr. Vasilios Mavroudis ve Dr. Chris Hicks, "Sonuçlarımız şaşırtıcı ve endişe vericiydi: Bir LLM'yi zehirlemek için gereken kötü niyetli belge sayısı (yaklaşık 250), modelin veya eğitim verilerinin boyutundan bağımsız olarak neredeyse sabitti" diye yazdı.

Başka bir deyişle, veri zehirleme saldırıları daha önce sanılandan daha uygulanabilir olabilir. Bir saldırgan için örneğin 250 zehirli Wikipedia makalesi yaratmak nispeten kolay olacaktır.

Riskler, "Poisoning attacks on LLMs require a near-constant number of poison samples" (LLM'lere yönelik zehirleme saldırıları neredeyse sabit sayıda zehir örneği gerektiriyor) başlıklı, hakem kontrolünden geçmemiş makalede detaylandırıldı.

The Independent yorum için Google ve OpenAI'la iletişime geçti.

Independent Türkçe, independent.co.uk/tech



Elon Musk, Twitter davasında uzlaşmaya gitti

Fotoğraf: Reuters
Fotoğraf: Reuters
TT

Elon Musk, Twitter davasında uzlaşmaya gitti

Fotoğraf: Reuters
Fotoğraf: Reuters

Teknoloji milyarderi Elon Musk, kıdem tazminatlarıyla ilgili anlaşmazlıkta kendisine 128 milyon dolardan fazla tazminat istemiyle dava açan işten çıkarılmış Twitter yöneticileriyle uzlaşmaya vardı.

Musk, Ekim 2022'de Twitter'ı satın aldığında CEO Parag Agrawal, Finans Direktörü Ned Segal, Hukuk Direktörü Vijaya Gadde ve Baş Hukuk Müşaviri Sean Edgett dahil çalışanlar arasında büyük bir tasfiye gerçekleştirmişti.

Bu eski yöneticiler Mart 2024'te, Musk'a ve yeniden markalaştırdığı X sosyal medya platformuna, kendilerine ödenmesi gerektiğine inandıkları kıdem tazminatını karşılamak üzere 128 milyon dolardan fazla toplu bir meblağ için dava açmıştı.

Geçen hafta teslim edilen ve ilk olarak çarşamba günü The Verge tarafından haberleştirilen mahkeme belgelerinde, Musk ve X'in davada "belirli koşulların yerine getirilmesini gerektiren" bir uzlaşmaya vardığı ortaya çıktı.

Belgelerde uzlaşma miktarına yer verilmedi. The Independent yorum için Musk ve davacıların avukatlarına ulaştı.

Musk, Nisan 2022'de Twitter'ı satın almayı kabul etmiş ancak birkaç ay sonra satın alma işleminden vazgeçeceğini söylemişti. Twitter, anlaşmayı tamamlamaya zorlamak için teknoloji devine dava açacak kadar ileri gitmişti.

Musk o sonbaharda 44 milyar dolarlık anlaşmayı tamamladıktan sonra Agrawal ve diğer üst düzey çalışanları hızla kovmuştu. Davaya göre yöneticiler Musk'ı, "özel bir öfke" duyduğu bir grubun kıdem tazminatları için daha fazla para ödemekten kaçınmaya çalışmakla suçladı.

Grup davada, "Musk Davacıların kıdem tazminatlarını ödemek istemediğine karar verdiği için, onları sebepsiz yere işten çıkardı, ardından sahte bir neden uydurdu ve çeşitli şirketlerinin çalışanlarını kararını onaylamaları için atadı" dedi.

asdfer
Musk, başlangıçta anlaşmadan caymaya çalıştıktan sonra Twitter'ı satın almayı kabul etmişti (AFP)

Dava, Walter Isaacson'ın Musk hakkındaki biyografisine atıfta bulunuyor. Biyografide teknoloji devinin Twitter anlaşmasını yöneticilerin hisse senedi opsiyonlarını hak etmelerini önlemek için bir gün erken sonuçlandırdığını söylüyor.

Isaacson, Musk'ın "bu gece sonuçlandırmakla yarın sabah yapmak arasında kurabiye kavanozundaki farkın 200 milyon dolar" olduğunu söylediğini aktarıyor.

Ağustosta Musk ve X'in işten çıkarılan yaklaşık 6 bin işçinin kıdem tazminatı konusunda 500 milyon dolarlık davada "prensipte" uzlaşmaya vardığı açıklanmıştı.

Reuters'ın haberine göre, Twitter'ın yan haklar programlarını denetleyen Courtney McMillian ve operasyon müdürü Ronald Cooper tarafından açılan davada, çoğu çalışanın temel ücretlerinin iki ayını ve işte geçirdikleri her tam yıl için bir haftalık ücret almaları beklenirken, en fazla bir aylık kıdem tazminatı teklif edildiği, işten çıkarılan pek çok işçiye ise hiçbir ek ödeme yapılmadığı öne sürülmüştü.

Independent Türkçe


OpenAI, ChatGPT’yi uygulama merkezine dönüştürüyor

ChatGPT, 800 milyondan fazla kullanıcısıyla dünyanın en popüler yapay zeka sohbet botu (AFP)
ChatGPT, 800 milyondan fazla kullanıcısıyla dünyanın en popüler yapay zeka sohbet botu (AFP)
TT

OpenAI, ChatGPT’yi uygulama merkezine dönüştürüyor

ChatGPT, 800 milyondan fazla kullanıcısıyla dünyanın en popüler yapay zeka sohbet botu (AFP)
ChatGPT, 800 milyondan fazla kullanıcısıyla dünyanın en popüler yapay zeka sohbet botu (AFP)

OpenAI, dünyanın en büyük bazı uygulamalarıyla ortaklık kurarak ChatGPT kullanıcılarının çalma listeleri oluşturma veya emlak ilanlarını arama gibi görevleri gerçekleştirmesine olanak tanıdı.

800 milyondan fazla kullanıcısıyla dünyanın en popüler yapay zeka sohbet botu, artık sohbetlerde ilgili uygulamaları öne çıkaracak.

OpenAI bir blog yazısında, "ChatGPT doğru anda bir uygulama önerdiğinde veya isimlerini belirttiğinde bunları keşfedebilirsiniz" ifadelerini kullandı.

ChatGPT kullanıcıları için uygulamalar sohbette onlara eşlik eder ve bağlama uyum sağlayarak daha fazla şey yaratmalarına, öğrenmelerine ve uygulamalarına yardımcı olur... ChatGPT'deki bu yeni nesil uygulamaların büyüsü, haritalar, çalma listeleri ve sunumlar gibi tanıdık ve etkileşimli öğeleri, sohbet yoluyla etkileşim kurmanın yeni yollarıyla harmanlamasında yatıyor.

Booking.com, Expedia, Spotify ve Zillow gibi uygulamalar ChatGPT'ye bağlanabilecek ve kullanıcıların uygulama üzerinden görevler gerçekleştirmesine ve soru sormasına olanak tanıyacak.

OpenAI'ın bunun nasıl çalışabileceğine dair sunduğu birkaç örnekte kullanıcılar, yapay zeka sohbet botundan Spotify'da bir parti için çalma listesi oluşturmasını veya Zillow'da emlak ilanları aramasını istedi.

OpenAI'ın bahsettiği gelecekteki işbirlikleri arasında DoorDash, Instacart ve Uber var ve diğer uygulama geliştiricileri de hizmetlerini yeni bir yazılım seti aracılığıyla entegre edebilecek.

OpenAI CEO'su Sam Altman, şirketin yıllık geliştirici konferansında, "ChatGPT'nin, insanların ilerleme kaydetmesi, daha üretken, daha yaratıcı olması, daha hızlı öğrenmesi ve hayatlarında yapmaya çalıştıkları her şeyi daha iyi yapması için harika bir yol sunmasını istiyoruz" dedi.

Bu, kullanıcıların sohbet edebileceği, etkileşimli, uyarlanabilir ve kişiselleştirilmiş yeni nesil uygulamaların önünü açacak.

Yakın zamanda yapılan bir OpenAI hisse senedi satışı, şirketin değerini 500 milyar dolara çıkarmış ve onu, Elon Musk'ın SpaceX'ini geride bırakarak dünyanın en değerli özel şirketi haline getirmişti. Bu, şirketin henüz kâr elde etmemiş olmasına rağmen gerçekleşti.

OpenAI geliştirici konferansındaki bir soru-cevap oturumunda Altman, yapay zeka sektörünü "bir nevi coşkulu" diye nitelendirdi ancak "gerçek değer yaratılacağını" iddia etti.

Yeni özellik halihazırda sadece AB dışındaki ChatGPT kullanıcılarının erişimine açık.

Independent Türkçe


"Mucize malzeme" devrimiyle güneş panelinde verimlilik rekoru kırıldı

Perovskit, ultra verimli güneş panelleri aracılığıyla yenilenebilir enerjiye geçişi hızlandırma potansiyeli taşıyor (Reuters)
Perovskit, ultra verimli güneş panelleri aracılığıyla yenilenebilir enerjiye geçişi hızlandırma potansiyeli taşıyor (Reuters)
TT

"Mucize malzeme" devrimiyle güneş panelinde verimlilik rekoru kırıldı

Perovskit, ultra verimli güneş panelleri aracılığıyla yenilenebilir enerjiye geçişi hızlandırma potansiyeli taşıyor (Reuters)
Perovskit, ultra verimli güneş panelleri aracılığıyla yenilenebilir enerjiye geçişi hızlandırma potansiyeli taşıyor (Reuters)

Avustralya'nın Sidney kentindeki bilim insanları, yeni bir güneş paneli türünde verimlilik rekoru kırdı.

Bu çığır açıcı adım, telekomünikasyondan yenilenebilir enerjiye kadar her şeyde muazzam bir gelişim potansiyeli nedeniyle "mucize malzeme" diye övülen perovskit kullanılarak atıldı.

Sidney Üniversitesi'nden bir ekip, üçlü bağlantılı perovskit-perovskit-silikon tandem güneş piliyle yüzde 27,06 verimlilik elde ederken, aynı zamanda malzeme için yeni dayanıklılık standartları belirledi.

Sidney Üniversitesi Nano Enstitüsü ve Fizik Departmanı'nda öğretim üyesi olan ve çalışmaya liderlik eden Anita Ho-Baillie, "Güneş enerjisi araştırmaları için heyecan verici bir dönem" diyor.

Perovskitler, verimliliği tek başına silikonun sınırlarının ötesine taşıyabileceğimizi şimdiden gösteriyor. Bu gelişmeler, düşük karbonlu bir geleceğe güç sağlayacak daha ucuz ve daha sürdürülebilir güneş enerjisine yaklaştığımız anlamına geliyor.

Perovskitler, geleneksel güneş panellerinde kullanılan silikonla birlikte istiflendiklerinde güneş ışığı spektrumunun daha fazlasını yakalayabildikleri için fotovoltaik araştırmalarda giderek daha fazla kullanılıyor.

Yeni nesil malzeme aynı zamanda daha uygun maliyetli ancak silikon bazlı güneş panellerinden daha hızlı bozulma eğilimi gösterdiği için laboratuvar ortamının ötesinde ölçeklendirilmesi zor olabilir.

Yeni rekor, perovskit malzemenin kimyasının yeniden düzenlenmesi ve üçlü bağlantı tasarımının elden geçirilmesiyle kırıldı.

Yapılan iyileştirmeler, güneş pilinin arıza ve bozulma eğilimini azaltarak teknolojinin ticarileştirilmesinin önündeki engellerin aşılmasında önemli adımlar olarak kayda geçti.

Öğretim üyesi Ho-Baillie, "Bu güneş pillerinin hem performansını hem de dayanıklılığını iyileştirdik" diyor.

Bu, yalnızca büyük ve istikrarlı perovskit cihazların mümkün olduğunu değil, aynı zamanda muazzam bir verimlilik artışı potansiyeli taşıdığını da gösteriyor.

Yeni güneş pili testlerde, ışık altında 400 saatten uzun süre durmadan çalıştıktan sonra verimliliğinin yüzde 95'ini korumayı başardı.

Bu çığır açıcı gelişme, salı günü Nature Nanotechnology adlı bilimsel dergide yayımlanan "Tailoring nanoscale interfaces for perovskite-perovskite-silicon triple-junction solar cells" (Perovskit-perovskit-silikon üçlü bağlantılı güneş pilleri için nanometre ölçeğinde arayüzlerin uyarlanması) başlıklı makalede yayımlandı.

Independent Türkçe