Çin'in yapay zeka atılımı: "Düşünebilen model, OpenAI'yı geride bıraktı"

ABD'nin çip kısıtlamaları Asya devini durduramıyor

ABD, gelişmiş yapay zeka teknolojilerinin Çin'e girmesini daha sıkı kontrol etme hazırlığı yapıyor (Reuters)
ABD, gelişmiş yapay zeka teknolojilerinin Çin'e girmesini daha sıkı kontrol etme hazırlığı yapıyor (Reuters)
TT

Çin'in yapay zeka atılımı: "Düşünebilen model, OpenAI'yı geride bıraktı"

ABD, gelişmiş yapay zeka teknolojilerinin Çin'e girmesini daha sıkı kontrol etme hazırlığı yapıyor (Reuters)
ABD, gelişmiş yapay zeka teknolojilerinin Çin'e girmesini daha sıkı kontrol etme hazırlığı yapıyor (Reuters)

Çin merkezli teknoloji şirketi DeepSeek, yeni yapay zeka modelini açık kaynaklı olarak yayımladı. Şirket yeni araçlarının, OpenAI'ın benzer modellerini geride bıraktığını öne sürüyor.

DeepSeek, Kasım 2024'te önizleme versiyonunu kullanıma sunduğu R1 serisini, açık bir MIT lisansı altında 20 Ocak Pazartesi günü piyasaya sürdü. 

MIT lisansı sayesinde yapay zeka modelinin kodu incelenebiliyor, değiştirilebiliyor ve ticari olarak kullanılabiliyor. 

R1, OpenAI'ın geçen yıl çıkan o1 serisi gibi "düşünebilen" veya "mantık yürüten" yapay zeka sınıfında yer alıyor. 

ChatGPT gibi geniş dil modellerinden farklı çalışan bu araçlar, verdikleri yanıtların doğruluğunu kontrol ediyor ve bu nedenle cevap vermeleri biraz daha zaman alıyor. Ancak hata yapma ihtimalini azaltan "düşünce zinciri" sistemi, özellikle bilimsel çalışmalarda ciddi fayda sağlıyor. 

DeepSeek, R1'in matematik, kelime problemleri ve programlama gibi testlerde OpenAI'ın o1'inden daha iyi performans gösterdiğini bildiriyor. Şirketin verilerine göre R1'in geride kaldığı testlerde bile iki model arasında çok az fark var.

Diğer yandan Ars Technica, yapay zeka testlerinin gerçek performansı her zaman yeterince iyi yansıtmadığını ve bu sonuçların henüz bağımsız bir şekilde doğrulanmadığını ifade ediyor.

R1 ailesinin en gelişmiş versiyonu 671 milyar parametre içeriyor. Parametreler temelde modelin problem çözme becerilerinin ne kadar iyi olduğunu gösteriyor. 

Şirket, R1'in 1,5 milyarla 70 milyar parametre arasında değişen "damıtılmış" versiyonlarını da yayımladı. Bunların en küçüğü dizüstü bilgisayarda çalışabilirken, en gelişmiş versiyonu daha güçlü bir donanım gerektiriyor. 

TechCrunch'a göre DeepSeek'in yeni yapay zeka ailesi, performansının yanı sıra o1'den yüzde 90 civarında daha ucuza satılmasıyla da öne çıkıyor. Ayrıca açık kaynaklı modeller genellikle o1 gibi muadillerinin gerisinde kaldığı için R1, teknoloji meraklılarının dikkatini çekti. 

George Mason Üniversitesi'nde yapay zeka alanında çalışan Dean Ball, X'teki gönderisinde şöyle yazdı:

DeepSeek'in damıtılmış modellerinin etkileyici performansı, çok yetenekli muhakeme cihazlarının yaygın bir şekilde çoğalmaya devam edeceği ve yukarıdan aşağıya herhangi bir kontrol rejiminin gözünden uzakta, yerel donanımlarda çalıştırılabileceği anlamına geliyor.

Yeni yapay zeka modelinin, Çin merkezli diğer araçlar gibi karşılaştığı bir sorun var. Asya ülkesindeki yasalara göre "temel sosyalist değerleri içermesi" gereken araçlar, Tayvan'ın özerkliği gibi belirli konular hakkında yanıt vermiyor. Ancak model bulutta değil, Çin dışında yerel olarak çalıştırıldığında böyle bir sınırlama yaşanmıyor. 

ABD ve Çin arasındaki yapay zeka yarışı

DeepSeek'in son serisi, ABD'nin yapay zeka teknolojilerini Çin'e satışına daha fazla kısıtlama getirmeyi düşündüğü bir dönemde çıktı. 

Çin'deki şirketlerin gelişmiş yapay zeka çipleri satın alması daha önce engellenmişti. Ancak görevden ayrılan Joe Biden yönetiminin teklif ettiği yeni düzenlemeler yürürlüğe girerse kısıtlamaların kapsamı genişleyecek. Uzmanlar bu değişikliğin, Çin'in özellikle Ortadoğu'daki ülkeler aracılığıyla ABD çiplerine erişmesini engellemeyi amaçladığını söylüyor. 20 Ocak'ta göreve başlayan Donald Trump, bu teklifle ilgili henüz yorum yapmadı.

Ancak son gelişmelere bakılırsa ABD'nin kısıtlamaları Çin merkezli teknolojilerin önüne geçemiyor. 

TechCrunch, DeepSeek'in yanı sıra Çin merkezli Alibaba ve Kimi'nin de o1'i geride bıraktığı öne sürülen yapay zeka modelleri geliştirdiğini aktarıyor. 

Ayrıca DeepSeek, Aralık 2024'te DeepSeek-V3 adlı başka bir yapay zeka modelini piyasaya sürmüştü. ChatGPT'ye rakip olan araç, GPT-4o ve Anthropic'in Claude Sonnet 3.5'ini yakalamış, Meta ve Alibaba teknolojilerini geride bırakmıştı. 

Şirket, V3'ü sadece iki ayda 5,5 milyon dolara geliştirdiğini öne sürüyor. Uzmanlar bu miktarın, Silikon Vadisi'nde üretilen araçlara harcananın çok altında kaldığını ifade ediyor.

New York Times'a göre ABD'nin kısıtlamalarının, Çinli bilim insanlarını daha yaratıcı yöntemler bulmaya itmesiyle gelişmiş teknolojiler ortaya çıkıyor olabilir. 

ChatGPT'nin eğitim verilerini işlemek için 10 bin Nvidia GPU'ya ihtiyaç duyduğu tahmin edilirken, DeepSeek mühendisleri V3'ün sadece 2 bin çiple eğitildiğini söylüyor.

OpenAI'ın stratejik ortaklarından Microsoft'un CEO'su Satya Nadella, bu hafta İsviçre'nin Davos kentinde düzenlenen Dünya Ekonomik Forumu'nda "Çin'deki gelişmeleri çok ama çok ciddiye almalıyız" ifadelerini kullandı.

Independent Türkçe, TechCrunch, Ars Technica, Live Science, New York Times, CNN



Bilim insanları "boş boş oturan" robot süpürgelere başka işler yaptırmayı önerdi

Bilim insanları, robot süpürgelerin çalışmadığı süreyi en aza indirmek amacıyla bir Roomba'yı evcil hayvanlarla oynamak da dahil 4 yeni görevi yerine getirecek şekilde yeniden programladı (Unsplash)
Bilim insanları, robot süpürgelerin çalışmadığı süreyi en aza indirmek amacıyla bir Roomba'yı evcil hayvanlarla oynamak da dahil 4 yeni görevi yerine getirecek şekilde yeniden programladı (Unsplash)
TT

Bilim insanları "boş boş oturan" robot süpürgelere başka işler yaptırmayı önerdi

Bilim insanları, robot süpürgelerin çalışmadığı süreyi en aza indirmek amacıyla bir Roomba'yı evcil hayvanlarla oynamak da dahil 4 yeni görevi yerine getirecek şekilde yeniden programladı (Unsplash)
Bilim insanları, robot süpürgelerin çalışmadığı süreyi en aza indirmek amacıyla bir Roomba'yı evcil hayvanlarla oynamak da dahil 4 yeni görevi yerine getirecek şekilde yeniden programladı (Unsplash)

Araştırmacılar, robot süpürgelerin bitki sulamak gibi basit ev işlerini yapacak şekilde modifiye edilebileceğini ortaya koydu.

Bath Üniversitesi'ndeki bilgisayar bilimcilerden oluşan bir ekip, bir Roomba'yı, boşta kaldığı saatlerde faydasını en üst düzeye çıkarmak amacıyla 4 yeni görevi yerine getirecek şekilde yeniden programladı.

Yeni işlevler arasında telefonları şarj etmek, evcil hayvanların canlı görüntüsünü sağlamak, ekranları duvarlara yansıtmak ve rahatsızlık verebilecek kişileri engellemek yer alıyor.

Araştırmacılar robot süpürgenin nispeten basit bazı değişikliklerle gerçekleştirebileceği, üzerine takılı bir lazer kalemle kedilerle oynamak ve arabadan eve alışveriş torbası taşımak gibi yüzün üzerinde görev belirledi. 

Bath Üniversitesi Bilgisayar Bilimleri Bölümü'nde doktora öğrencisi olan ve modifikasyonları bulan Yoshiaki Shiokawa "Elektrikli robot süpürgeler ve çim biçme makineleri gibi mobil ev robotları sınırlı, tek görevli cihazlar olarak algılanıyor ancak pratik görevlerde yeterince kullanılmadıklarına dair güçlü bir argüman var. Günün büyük bir bölümünde boş boş oturuyorlar" diyor.

Onları bir dizi ek işlevi yerine getirmek üzere evde fiziksel olarak gezinecek şekilde programlayarak kullanımlarını temel görevlerinin ötesine taşımalıyız. Roomba'lar ev asistanlarına dönüştürülebilseydi hanelerin ne kadar daha verimli çalışacağını bir düşünün.

Shiokawa, robot süpürgelerin halihazırda günde ortalama sadece 1 saat 47 dakika temizlik yaptığını, bunun da büyük miktarda değerlendirilmeyen potansiyel anlamına geldiğini belirtiyor.

Araştırmacılar tarafından önerilen diğer uygulamalar arasında kayıp eşyaları aramak, kargoları alıp teslim etmek ve "kart oyunu oynamak" var.

Benzer işlevler robotik çim biçme makineleri gibi diğer ev robotlarına da eklenebilir.

Bath Bilgisayar Bilimleri Bölümü öğretim üyesi Dr. Adwait Sharma, "Boş durdukları vakit, değer katan etkileşimler için benzersiz fırsatlar sunuyor ve günlük hayatımıza sorunsuz bir şekilde uyum sağlayabilen uyarlanabilir robotlara ve entegre sistemlere yönelik artan ihtiyaçla uyumluluk gösteriyor" diyor.

Örneğin bir robot süpürge boş zamanlarını ev güvenliğini izlemek, bitkileri sulamak veya oturan yaşlı bir kişinin ayağa kalkmasına yardım etmek için kullanabilir. Bu görevler robotun gelişmiş sensörlerinin yanı sıra hareket kabiliyetinden de yararlanır.

vfgbhyju
Araştırmacılar robot süpürgeler için 104 potansiyel uygulama belirledi ( Bath Üniversitesi)

Bilim insanları geliştirilmiş robotu "Beyond vacuuming: How can we exploit domestic robots’ idle time?" (Süpürmenin ötesinde: Ev robotlarının boş zamanlarından nasıl faydalanabiliriz?) başlıklı yeni bir makalede detaylandırıyor.

Çalışma bu hafta Japonya'nın Yokohama kentinde düzenlenen CHI Bilgisayar Sistemlerinde İnsan Faktörleri Konferansı'nda sunuldu.

Independent Türkçe