Çin'in yapay zeka atılımı: "Düşünebilen model, OpenAI'yı geride bıraktı"

ABD'nin çip kısıtlamaları Asya devini durduramıyor

ABD, gelişmiş yapay zeka teknolojilerinin Çin'e girmesini daha sıkı kontrol etme hazırlığı yapıyor (Reuters)
ABD, gelişmiş yapay zeka teknolojilerinin Çin'e girmesini daha sıkı kontrol etme hazırlığı yapıyor (Reuters)
TT

Çin'in yapay zeka atılımı: "Düşünebilen model, OpenAI'yı geride bıraktı"

ABD, gelişmiş yapay zeka teknolojilerinin Çin'e girmesini daha sıkı kontrol etme hazırlığı yapıyor (Reuters)
ABD, gelişmiş yapay zeka teknolojilerinin Çin'e girmesini daha sıkı kontrol etme hazırlığı yapıyor (Reuters)

Çin merkezli teknoloji şirketi DeepSeek, yeni yapay zeka modelini açık kaynaklı olarak yayımladı. Şirket yeni araçlarının, OpenAI'ın benzer modellerini geride bıraktığını öne sürüyor.

DeepSeek, Kasım 2024'te önizleme versiyonunu kullanıma sunduğu R1 serisini, açık bir MIT lisansı altında 20 Ocak Pazartesi günü piyasaya sürdü. 

MIT lisansı sayesinde yapay zeka modelinin kodu incelenebiliyor, değiştirilebiliyor ve ticari olarak kullanılabiliyor. 

R1, OpenAI'ın geçen yıl çıkan o1 serisi gibi "düşünebilen" veya "mantık yürüten" yapay zeka sınıfında yer alıyor. 

ChatGPT gibi geniş dil modellerinden farklı çalışan bu araçlar, verdikleri yanıtların doğruluğunu kontrol ediyor ve bu nedenle cevap vermeleri biraz daha zaman alıyor. Ancak hata yapma ihtimalini azaltan "düşünce zinciri" sistemi, özellikle bilimsel çalışmalarda ciddi fayda sağlıyor. 

DeepSeek, R1'in matematik, kelime problemleri ve programlama gibi testlerde OpenAI'ın o1'inden daha iyi performans gösterdiğini bildiriyor. Şirketin verilerine göre R1'in geride kaldığı testlerde bile iki model arasında çok az fark var.

Diğer yandan Ars Technica, yapay zeka testlerinin gerçek performansı her zaman yeterince iyi yansıtmadığını ve bu sonuçların henüz bağımsız bir şekilde doğrulanmadığını ifade ediyor.

R1 ailesinin en gelişmiş versiyonu 671 milyar parametre içeriyor. Parametreler temelde modelin problem çözme becerilerinin ne kadar iyi olduğunu gösteriyor. 

Şirket, R1'in 1,5 milyarla 70 milyar parametre arasında değişen "damıtılmış" versiyonlarını da yayımladı. Bunların en küçüğü dizüstü bilgisayarda çalışabilirken, en gelişmiş versiyonu daha güçlü bir donanım gerektiriyor. 

TechCrunch'a göre DeepSeek'in yeni yapay zeka ailesi, performansının yanı sıra o1'den yüzde 90 civarında daha ucuza satılmasıyla da öne çıkıyor. Ayrıca açık kaynaklı modeller genellikle o1 gibi muadillerinin gerisinde kaldığı için R1, teknoloji meraklılarının dikkatini çekti. 

George Mason Üniversitesi'nde yapay zeka alanında çalışan Dean Ball, X'teki gönderisinde şöyle yazdı:

DeepSeek'in damıtılmış modellerinin etkileyici performansı, çok yetenekli muhakeme cihazlarının yaygın bir şekilde çoğalmaya devam edeceği ve yukarıdan aşağıya herhangi bir kontrol rejiminin gözünden uzakta, yerel donanımlarda çalıştırılabileceği anlamına geliyor.

Yeni yapay zeka modelinin, Çin merkezli diğer araçlar gibi karşılaştığı bir sorun var. Asya ülkesindeki yasalara göre "temel sosyalist değerleri içermesi" gereken araçlar, Tayvan'ın özerkliği gibi belirli konular hakkında yanıt vermiyor. Ancak model bulutta değil, Çin dışında yerel olarak çalıştırıldığında böyle bir sınırlama yaşanmıyor. 

ABD ve Çin arasındaki yapay zeka yarışı

DeepSeek'in son serisi, ABD'nin yapay zeka teknolojilerini Çin'e satışına daha fazla kısıtlama getirmeyi düşündüğü bir dönemde çıktı. 

Çin'deki şirketlerin gelişmiş yapay zeka çipleri satın alması daha önce engellenmişti. Ancak görevden ayrılan Joe Biden yönetiminin teklif ettiği yeni düzenlemeler yürürlüğe girerse kısıtlamaların kapsamı genişleyecek. Uzmanlar bu değişikliğin, Çin'in özellikle Ortadoğu'daki ülkeler aracılığıyla ABD çiplerine erişmesini engellemeyi amaçladığını söylüyor. 20 Ocak'ta göreve başlayan Donald Trump, bu teklifle ilgili henüz yorum yapmadı.

Ancak son gelişmelere bakılırsa ABD'nin kısıtlamaları Çin merkezli teknolojilerin önüne geçemiyor. 

TechCrunch, DeepSeek'in yanı sıra Çin merkezli Alibaba ve Kimi'nin de o1'i geride bıraktığı öne sürülen yapay zeka modelleri geliştirdiğini aktarıyor. 

Ayrıca DeepSeek, Aralık 2024'te DeepSeek-V3 adlı başka bir yapay zeka modelini piyasaya sürmüştü. ChatGPT'ye rakip olan araç, GPT-4o ve Anthropic'in Claude Sonnet 3.5'ini yakalamış, Meta ve Alibaba teknolojilerini geride bırakmıştı. 

Şirket, V3'ü sadece iki ayda 5,5 milyon dolara geliştirdiğini öne sürüyor. Uzmanlar bu miktarın, Silikon Vadisi'nde üretilen araçlara harcananın çok altında kaldığını ifade ediyor.

New York Times'a göre ABD'nin kısıtlamalarının, Çinli bilim insanlarını daha yaratıcı yöntemler bulmaya itmesiyle gelişmiş teknolojiler ortaya çıkıyor olabilir. 

ChatGPT'nin eğitim verilerini işlemek için 10 bin Nvidia GPU'ya ihtiyaç duyduğu tahmin edilirken, DeepSeek mühendisleri V3'ün sadece 2 bin çiple eğitildiğini söylüyor.

OpenAI'ın stratejik ortaklarından Microsoft'un CEO'su Satya Nadella, bu hafta İsviçre'nin Davos kentinde düzenlenen Dünya Ekonomik Forumu'nda "Çin'deki gelişmeleri çok ama çok ciddiye almalıyız" ifadelerini kullandı.

Independent Türkçe, TechCrunch, Ars Technica, Live Science, New York Times, CNN



Gazze, İsrail'in yapay zeka teknolojilerini test ettiği bir alana dönüştü

İsrail ordusunun Matzpen teknoloji birimi (Reuters)
İsrail ordusunun Matzpen teknoloji birimi (Reuters)
TT

Gazze, İsrail'in yapay zeka teknolojilerini test ettiği bir alana dönüştü

İsrail ordusunun Matzpen teknoloji birimi (Reuters)
İsrail ordusunun Matzpen teknoloji birimi (Reuters)

İnci Mecdi

İsrail tarafından geliştirilen ve 7 Ekim 2023 tarihinden bu yana Gazze’deki savaş sırasında Hamas liderlerinin yerini tespit etmek için kullanılan yapay zeka (AI) teknolojileri, özellikle de İsrail'e askeri bir avantaj sağlayan bu teknolojilerin kullanılmasının feci sonuçları göz önüne alındığında, giderek artan etik kaygılara yol açıyor.

İsrailli ve ABD’li yetkililerin ABD merkezli New York Times (NYT) gazetesine verdiği bilgilere göre İsrailli subaylar yapay zeka tabanlı askeri teknolojiyi ilk kez 2023 yılının sonlarında, 7 Ekim 2023 saldırılarının planlanmasına yardımcı olan Hamas’ın üst düzey liderlerinden İbrahim el-Bayari'ye suikast düzenlemek için kullandı. İsrail istihbaratı, Gazze Şeridi'nin altındaki tünellerde saklandığına inanılan Bayari’nin yerini başlangıçta tespit edemedi. Bu da on yıl önce savaşta kullanılmadan geliştirilmiş olan aracı geliştirmek için yeni bir teşvik sağladı. İçeridekilere göre Birim 8200 mühendisleri yapay zekayı bu araca dahil etmekte gecikmedi. İsrail kısa süre içinde Bayari'nin aramalarını dinleyebildi ve aramaların yapıldığı yerin yaklaşık konumunu veren sesli yapay zeka aracını test etti. İsrail bu bilgiyi kullanarak 31 Ekim 2023'te bölgeyi hedef alan hava saldırıları düzenledi ve Bayari'yi öldürdü.

“The Studio”

Ancak İsrail'in savaş sırasında kullandığı yapay zeka teknolojileri önemli sivil kayıplara yol açtı. Şarku’l Avsat’ın Londra merkezli çatışma izleme kuruluşu Airwars'tan aktardığı verilere göre Bayari'ye yapılan saldırıda 125'ten fazla sivil öldü. Kimliklerinin gizli kalması şartıyla NYT’ye konuşan ABD ve İsrailli dokuz yetkilinin açıklamalarına göre Bayari suikastı için düzenlenen hava saldırısında 125'ten fazla sivil öldürüldü. Bunun için kullanılan sonik araç, İsrail'in Gazze'deki savaşı yapay zeka destekli askeri teknolojileri dünyanın daha önce hiç görmediği bir hızda test etmek ve uygulamak için nasıl kullandığının sadece bir örneğiydi.

İsrail, geçtiğimiz 18 ay boyunca kısmen gizlenmiş ya da yaralanmış olan yüzleri gerçek kimliklerle eşleştirmek için yapay zekayı yüz tanıma yazılımına da entegre etti. Potansiyel hava saldırısı hedeflerini gruplandırmak için yapay zekayı kullandı. İki kaynağa göre, mesajları, sosyal medya gönderilerini ve Arapça diğer verileri toplayıp analiz edebilen bir sohbet robotunu güçlendirmek için Arapça bir yapay zeka modeli oluşturdu.

NYT'ye konuşan ve söz konusu teknolojiler hakkında bilgi sahibi olan kişilere göre bu çabaların çoğu Birim 8200'de görevlendirilen askerler ile Google, Microsoft ve Meta gibi teknoloji şirketlerinde çalışan yedek askerler arasında bir ortaklığın da önünü açtı. Kaynaklar, Birim 8200'ün bir inovasyon merkezi ve uzmanların yapay zeka projeleriyle eşleştirildiği bir yer olan The Studio'yu oluşturduğunu söyledi.

Yedek askerler

İsrailli yetkililer, Hamas'ın 7 Ekim 2023'te İsrail'e sınır ötesi saldırılar düzenleyerek bin 200'den fazla kişiyi öldürmesi ve 250’den fazla kişiyi rehin almasının ardından, Birim 8200 ile The Studio’daki yedek askerler arasındaki iş birliğinin hızla yeni yapay zeka teknolojileri geliştirmesine izin verildiğini açıkladı. Yatırımcıları şirketlerle buluşturan ve kâr amacı gütmeyen İsrailli bir kuruluş olan Startup Nation Central'ın CEO'su Avi Hasson, META, Google ve Microsoft'ta çalışan İsrailli yedek askerlerin insansız hava araçları (İHA) ve veri füzyonu (bilgi bütünleştirme) alanlarında inovasyonu teşvik eden kilit unsurlar haline geldiğini söyledi. Yedek subaylar teknik bilgi birikimi ve orduda bulunmayan kilit teknolojilere erişim sağladılar.

İsrail ordusu İHA filosunu güçlendirmek için de hızla yapay zekayı kullandı. İsrail ordusuyla birlikte çalışan bir yazılım ve yürüyüş şirketi olan XTEND’ın kurucusu ve CEO'su Aviv Shapira, hedefleri uzaktan tanımlayan ve takip eden İHA’lar geliştirmek için yapay zeka algoritmalarının kullanıldığını söyledi.

İsrailli ve ABD'li yetkililere göre İsrail yapay zeka tabanlı cephaneliğini geliştirmek için yarışırken bile, bu teknolojilerin kullanılması bazen yanlış kimliklere, tutuklamalara ve sivil ölümlerine yol açtı. Bazıları, gözetimin artmasına ve sivillerin öldürülmesine yol açabilecek yapay zekanın etik sonuçları hakkında tartışırken Avrupalı ve ABD'li savunma yetkilileri, başka hiçbir ülkenin mevcut savaşlar sırasında yapay zeka araçlarını denemede İsrail kadar aktif olmadığını ve bu teknolojilerin gelecekteki savaşlarda nasıl kullanılabileceğine ve nasıl başarısız olabileceklerine dair bir fikir verdiğini söyledi.

Geniş dil modeli

The Studio tarafından geliştirilen araçlardan biri de geniş dil modeli olarak bilinen Arapça yapay zeka modeliydi. Konuyla ilgili bilgi sahibi İsrailli subaylara göre ülkede onlarca yıldır Arapça konuşulan lehçelerde ele geçirilmiş kısa mesajlar (SMS), telefon görüşmeleri ve sosyal medya paylaşımları bulunuyor. Bu yüzden İsrailli subaylar savaşın ilk birkaç ayında geniş bir dil modeli oluşturdular ve Arapça sorgular yapmak için bir chatbot geliştirdiler. ABD’li ve İsrailli yetkililerin dördü, aracın multimedya veri tabanlarıyla entegre edilerek analistlerin görüntü ve videolar üzerinde karmaşık aramalar yapabilmelerinin sağlandığını söyledi.

İsrailli üç subaya göre İsrail geçtiğimiz eylül ayında Hizbullah lideri Hasan Nasrallah'a suikast düzenlediğinde, bahsi geçen chatbot Arap dünyasındaki tepkileri analiz etti. Teknoloji, halkın tepkilerini ölçmek için Lübnan'daki farklı lehçeleri ayırt ederek İsrail'in karşı saldırı başlatmak için kamuoyu baskısı olup olmadığını değerlendirmesine yardımcı oldu. Ancak iki subaydan biri, chatbotun bazen İngilizceden Arapçaya çevrilen bazı modern argo terimleri ve kelimeleri tanımlayamadığını, bunun da farklı lehçelerde uzman İsrailli istihbarat subaylarının çalışmasını gözden geçirip düzeltmesini gerektirdiğini belirtti.

İsrailli iki istihbarat yetkilisine göre chatbot bazen yanlış cevaplar verdi. Aynı yetkililer, chatbotun örneğin tüfekleri boru olarak gösterdiğini, ancak yapay zeka aracının araştırma ve analizi büyük ölçüde hızlandırdığını söylediler.

İsrail ayrıca 7 Ekim 2023 saldırılarından sonra Gazze Şeridi'nin kuzeyi ve güneyi arasında kurulan geçici kontrol noktalarına, Filistinlilerin yüksek çözünürlüklü görüntülerini tarayıp yapay zeka destekli yüz tanıma yazılımına gönderme özelliğine sahip kameralar yerleştirmeye başladı. Ancak sistem, zaman zaman yüzleri gizlenmiş kişileri tanımlamakta zorlandı. Bu durum, yüz tanıma sistemi tarafından yanlışlıkla teşhis edilen Filistinlilerin tutuklanmasına ve sorgulanmasına yol açtı.