4 soruda Meta'nın en gelişmiş yapay zeka modeli Llama 3.1 405B

Meta üretken yapay zeka alanını, açık kaynaklı bir yöne çekmek istiyor (Reuters)
Meta üretken yapay zeka alanını, açık kaynaklı bir yöne çekmek istiyor (Reuters)
TT

4 soruda Meta'nın en gelişmiş yapay zeka modeli Llama 3.1 405B

Meta üretken yapay zeka alanını, açık kaynaklı bir yöne çekmek istiyor (Reuters)
Meta üretken yapay zeka alanını, açık kaynaklı bir yöne çekmek istiyor (Reuters)

Meta bugüne kadar çıkardığı en gelişmiş geniş dil modeli Llama 3.1 405B'yi dün piyasaya sürdü. 

Şirketin "dünyanın en büyük ve becerikli açık temel modeli" olduğunu öne sürdüğü yeni araç, ChatGPT gibi rakiplerini yakalamış görünüyor. 

Meta'nın önceki modellerinde olduğu gibi, Llama 3.1 405B; Amazon Web Services, Azure ve Google Cloud gibi bulut platformlarından indirilip kullanılabiliyor. 

Aynı aileden diğer araçların güncellenmiş versiyonlarıyla beraber tanıtılan Llama 3.1 405B, teknoloji meraklıları arasında heyecan dalgasına yol açtı. 

Öte yandan Meta'nın önceki modelleri gibi ücretsiz olan yeni model, bazı soru işaretlerini de beraberinde getirdi. 

Yeni aracın özelliklerinden şirketin tartışmalara yol açan açık kaynak kullanımına kadar, Llama 3.1 405B'yle ilgili bilinenleri derledik.

1) Neler yapabiliyor?

Llama 3.1 405B, yüksek kalitede bilgisayar kodu yazmanın yanı sıra daha önceki modellerden daha karmaşık matematik problemlerini çözebiliyor. 

Yeni modelin en çok göze çarpan özelliklerinden biriyse dil kapasitesi. Farklı dillerde eğitilen araç; İngilizce, Almanca, Fransızca, İtalyanca, Portekizce, Hintçe, İspanyolca ve Tayca iletişim kurabiliyor. 

Bu Facebook'un çatı kuruluşu için önemli bir adım olsa da rakibi OpenAI'ın ChatGPT'si 80'den fazla dilde sorguları yanıtlıyor. 

Llama 3.1 405B, 405 milyar parametresiyle açık kaynaklı yapay zeka modelleri arasında öne çıkıyor. Yapay zeka alanında bir modelin problem çözme becerisini gösteren parametre, modelin eğitim sırasında öğrendiği değişkenleri ifade ediyor.

Meta'nın Llama modellerinin en büyük rakipleri arasında yer alan ChatGPT-4'ün 1 trilyon parametresi olduğu bildirilmişti.

Modelin piyasaya sürülmesiyle beraber yayımlanan bir araştırmada, Llama 3.1 405B'nin bazı alanlarda OpenAI'ın GPT-4o'su ve Anthropic'in Claude 3.5 Sonnet'ini yakaladığı veya geride bıraktığı görüldü.

Örneğin matematik alanındaki bir testte Meta'nın modeli 73,8 alırken, GPT-4o 76,6 ve Claude 3.5 Sonnet ise 71,1 puana ulaştı.

Matematik, fen ve beşeri bilimlerdeki konuları kapsayan başka bir testte yeni araç 88,6, GPT-4o 88,7 ve Claude 3.5 Sonnet de 88,3 puan aldı.

Llama 3.1 405B aynı zamanda önceki sürümlerden daha geniş bir bağlam penceresine sahip. Bağlam penceresi, bir yapay zeka modelinin cevap üretmeden önce ne kadar girdiyi işleyebileceğini ifade ediyor.

Yani yeni model daha uzun metinleri inceleyebiliyor veya özetini çıkarabiliyor. 

Meta'nın en yeni aracı halihazırda sadece yazılı metinlerle çalışabiliyor. Fakat dün yayımlanan makalede, fotoğraf ve videoları da tanıyabilen araçların geliştirildiği ifade ediliyor.

2) Ne kadar "açık" kaynaklı?

Meta en yeni yapay zeka aracını, aynı aileden Llama 3.1 8B ve Llama 3.1 70B adlı daha küçük iki sürümün geliştirilmiş versiyonlarıyla birlikte çıkardı. Nisanda piyasaya sürülen bu araçlar daha düşük parametrelere sahip fakat bağlam pencereleri 405B'yle aynı. 

Şirket yaptığı açıklamada "Artık açık kaynağın öncülük ettiği yeni bir çağ başlatıyoruz" ifadelerini kullanarak ekledi: 

Dünyanın en büyük ve en becerikli açık temel modeli olduğuna inandığımız Meta Llama 3.1 405B'yi herkesin kullanımına açık olarak yayımlıyoruz.

Temel model, bir modelin başka yapay zeka uygulamalarını geliştirmede kullanılabileceği anlamına geliyor. 

Modelin açık kaynaklı olması ücret ödemeden ulaşılabileceğini ifade etse de sektörde aracın ekonomik getirisine dair ciddi şüpheler var. 

Bunların başında Llama araçlarını çalıştırmak için gereken grafik işlemci birimi (GPU) sayısı geliyor. Modeller çok büyük olduğu için bir tane GPU'nun yetmediği söyleniyor. Örneğin Llama 3'ün 70 milyar parametreli versiyonu, iki adet üst düzey Nvidia GPU'yla çalıştırılabiliyor. 

Bu durum hem daha fazla GPU'ya para ödenmesini hem de yapay zeka işlemlerinin bunlar arasında bölünmesini gerektiriyor. 

Meta bu sorunu çözmek adına çeşitli şirketlerle işbirliği yapıyor. Örneğin donanım şirketi Groq, Nvidia'nın GPU'larına alternatif olarak ürettiği çiplerle hem masrafları azaltıyor hem de yapay zeka aracını hızlandırıyor.

Fakat kullanıcılar bu uygulamayı, OpenAI, Anthropic ve Google Gemini gibi tescilli bir modele erişmeye benzetiyor. Daha önce bazı geliştiriciler Llama 3.1 70B'yi kullanmanın, daha yetenekli ChatGPT-4'ten daha maliyetli olduğunu öne sürmüştü. 

Meta'nın yapay zeka modellerinin esasen ne kadar açık kaynaklı olduğuyla ilgili en önemli tartışmalardan biri de ticari lisanslamadan çıkıyor. 

Şirketin önceki Llama sürümlerinde modeli indirip kullanmak ücretsizken, başka yapay zeka uygulamalarını geliştirmek için ayrı bir lisans alınması gerekiyordu. Bu kısıtlama sektörde tepkilere yol açmış ve Meta'nın "açık kaynaklı yazılım" ifadesini çarpıttığı dile getirilmişti.

Halihazırda Llama 3.1 405B'nin böyle bir lisans gerektirip gerektirmeyeceği bilinmiyor. 

3) Sektöre yön verebilir mi? 

Meta'nın CEO'su Mark Zuckerberg dün yayımladığı mektubunda "Gelecek yıldan itibaren, ilerideki Llama modellerinin sektörün en gelişmiş modelleri olmasını bekliyoruz" diye yazarak şöyle ekliyor:

Ancak bundan önce bile Llama açıklık, değiştirilebilirlik ve maliyet verimliliği alanlarında lider konumda.

Teknoloji devi, rakiplerini yakalamak adına ücretsiz yapay zeka modelleri piyasaya sürerek başarılı bir yolda ilerliyor gibi görünüyor. Şirkete göre bugüne kadar Llama modelleri 300 milyondan fazla kez indirildi ve bunlardan en az 20 bin yapay zeka uygulaması geliştirildi. 

Meta üretken yapay zeka alanını açık kaynaklı bir yere çekmeye çalışıyor fakat Llama modelleri, üst düzey problemleri çözmede diğer araçların becerilerine yetişemiyor. Öte yandan bazı teknoloji yazarları bu çabaların, Meta'nın "üretken yapay zekayla eş anlamlı hale gelme" hedefine katkı sağladığını düşünüyor. 

Zuckerberg her ne kadar geleceğe umutlu baksa da diğer şirketlerin çalışmaları ümitlerini suya düşürebilir. 

Google halihazırda sadece metin ya da görüntü üretmekle kalmayıp eyleme geçebilen Project Astra adlı yapay zeka aracı üzerine çalışıyor. Modelin sonbaharda deneme amaçlı bazı kullanıcılara sunulacağı söylenirken, OpenAI'ın hazırladığı GPT-5'in de bu özelliğe sahip olması bekleniyor. 

Meta'nın modellerinin ek masraflar yaratmasının yanı sıra açık kaynaklı modellerle ilgili ciddi güvenlik endişeleri de var. 

Örneğin sisteme yerleştirilen güvenlik kalkanlarının kaldırılması, açık kaynaklarda daha kolay. Ayrıca daha büyük modeller daha yüksek bir risk yaratırken, biyolojik silah tarifi önermek veya kötü amaçlı yazılım kodu geliştirmek daha muhtemel hale geliyor. 

4) Sentetik veri kullanımı neden tepki topluyor?

Llama 3.1 405B, daha önceki bazı modeller gibi 16 bin adet Nvidia H100 GPU ve 15 trilyon jeton (token) içeren verisetiyle eğitildi. 

Yapay zeka alanında jetonlar, kelime bölümlerini ifade ediyor. 15 trilyon jetonsa yaklaşık 75 milyar kelimeye denk geliyor. 

Şirket aynı zamanda sentetik veri, yani insan tarafından değil, başka yapay zeka araçları tarafından oluşturulan verileri de kullandı. 

OpenAI ve Anthropic gibi şirketler de bu tarz verileri kullanma yolları ararken, bu çabalar sektörde eleştirilerle karşılaşıyor. 

Sentetik verilerin, kullanıcıların gizliliğini koruma ve daha geniş bir veri kümesine sahip olma gibi faydaları var.

Öte yandan bunun, yapay zeka modellerinin gerçek dünyayla ilgili sorunları çözmede geri kalmasına yol açacağı düşünülüyor. Ayrıca sentetik verilerin, modelleri daha yanlı hale getireceğinden endişeleniliyor. 

Meta, Llama 3.1 405B'nin eğitildiği verileri "dikkatle dengelediğini" öne sürse de bunların tam olarak nereden geldiğini açıklamadı. 

Bu verilerinin ayrıntıları fikri mülkiyetle ilgili davalara yol açabileceğinden şirketler bunları gizli tutmak durumda kalabiliyor. 

Meta'nın araçlarını Facebook ve Instagram göderileriyle eğitmesi tartışmalara yol açarken, telifli içerikleri kullanması da ayrı bir problem yaratıyor. 

Geçen yıl aralıkta Reuters, avukatların uyarılarına rağmen şirketin telifli elektronik kitapları kullandığını bildirmişti. Ayrıca geçen yıl bazı yazarlar, OpenAI ve Meta'ya telif hakkı ihlali gerekçesiyle dava açmıştı.

Independent Türkçe, TechCrunch, Fortune, Reuters, Register, Meta, Forbes, Gazete Duvar



Coldplay skandalındaki kadın, dudak uçuklatan ücretle tavsiye veriyor

Kristin Cabot ve patronu Andy Byron, Coldplay konserinde sarmaş dolaş halde yakalanmıştı (@calebu2/TMX)
Kristin Cabot ve patronu Andy Byron, Coldplay konserinde sarmaş dolaş halde yakalanmıştı (@calebu2/TMX)
TT

Coldplay skandalındaki kadın, dudak uçuklatan ücretle tavsiye veriyor

Kristin Cabot ve patronu Andy Byron, Coldplay konserinde sarmaş dolaş halde yakalanmıştı (@calebu2/TMX)
Kristin Cabot ve patronu Andy Byron, Coldplay konserinde sarmaş dolaş halde yakalanmıştı (@calebu2/TMX)

Owen Scott ABD Muhabiri 

Coldplay konseri sırasında öpücük kamerasına yakalanarak kötü bir ün kazanan insan kaynakları yöneticisi, "hikayesini geri kazanma" konuşmasının biletleri için 875 dolar talep ediyor.

53 yaşındaki Kristin Cabot, evli patronu Andy Byron'la sarmaş dolaş görüntülerinin stadyum ekranlarında canlı yayımlanması üzerine aniden eğildikten sonra Nisan 2025'te internet mimine dönüşmüştü.

Artık viral olan videoda Coldplay'in solisti Chris Martin stadyum hoparlörlerinden "Ya gizli ilişki yaşıyorlar ya da çok utangaçlar" demişti.

Olayın ardından Cabot ve Byron dünya çapında manşetlere taşınmış, birçok kişi ilişkileri hakkında spekülasyonlar yürütmüştü.

Artık Cabot, "hikayesini" nasıl geri kazandığını anlatan konuşmalar yapıyor ancak onun söylediklerini dinlemek isteyen katılımcıların 875 dolar gibi dudak uçuklatan bir ücret ödemesi gerekiyor.

Etkinliğin açıklamasında, "Medyanın olumsuz merceği altındaki kadınların uzun süredir maruz kaldığı toplumsal ayıplamanın şiddetini Cabot ilk elden deneyimledi; aynı durumdaki erkekler genellikle bundan paçayı sıyırıyor gibi görünüyor" ifadeleri yer alıyor.

Cabot, Byron'la birlikte Jumbotron'da yakalandığında eşinden ayrılmıştı ancak patronu evliydi.

İki çocuk annesi Cabot skandalın ardından verdiği bir dizi röportajda, bu mim yüzünden "iş bulamadığını" söylemişti.

New York Times'a verdiği röportajda skandaldan "birkaç High Noons"u (alkollü içki markası -çn.) sorumlu tutan Cabot, daha sonra Britanya gazetesi The Times'a kendisini "kızıl harfle" (Scarlet Letter; zina yaptığı için boynuna kızıl bir "A" harfi asılarak toplumdan uzaklaştırılan bir kadını konu alan Nathaniel Hawthorne romanı -çn.) damgalanmış gibi hissettiğini açıklamıştı.

PRWeek'in 2026 Kriz İletişimi Konferansı’nda yapacağı konuşmasının ana konusu, bu mecazi "kızıl harfi" nasıl üstünden attığını açıklamak olacak gibi görünüyor.

Cabot'ın internette yükselen eleştirilere karşı koymak için hizmetlerinden yararlandığı halkla ilişkiler uzmanı Dini von Mueffling, kendisine sahnede eşlik edecek.
 

Görsel kaldırıldı.Öpücük kamerası videosunun ardından işe aldığı halkla ilişkiler uzmanı Dini von Mueffling, Cabot'a sahnede eşlik edecek (PRWeek)


Etkinliğin açıklaması şöyle devam ediyor:

Bu oturumda Astronomer'ın eski insan kaynakları direktörü Cabot ve onun halkla ilişkiler temsilcisi, sektörün efsane ismi Dini von Mueffling, Cabot'ın kendi hikayesini kontrol altına alıp yeniden yazmasını sağlayan (hem kısa hem de uzun vadeli) stratejileri paylaşacak.

16 Nisan'da Washington D.C.'de düzenlenecek konferansta başka şirketler ve hayır kurumları da etkinlikte konuşma yapma hazırlıklarını sürdürüyor.

Bu oluşumlardan biri, LGBTQ+ bireylerin intiharını önlemeye odaklanan, kâr amacı gütmeyen Trevor Project.

ABD'nin başkentinin göz alıcı halkla ilişkiler etkinliğine katılan bir diğer şirket Blackbird.AI ise yapay zekanın krizleri büyütme tehlikesi üzerine bir konuşma yapacak.

Independent Türkçe, independent.co.uk/arts-entertainment


Okyanus tabanının altında tatlı su kaynağı olduğu doğrulandı

Çökelti örneklerinin alındığı yerler (Avrupa Okyanus Sondaj Araştırmaları Konsorsiyumu)
Çökelti örneklerinin alındığı yerler (Avrupa Okyanus Sondaj Araştırmaları Konsorsiyumu)
TT

Okyanus tabanının altında tatlı su kaynağı olduğu doğrulandı

Çökelti örneklerinin alındığı yerler (Avrupa Okyanus Sondaj Araştırmaları Konsorsiyumu)
Çökelti örneklerinin alındığı yerler (Avrupa Okyanus Sondaj Araştırmaları Konsorsiyumu)

Uluslararası bir keşif gezisi, okyanus tabanının altındaki gizli tatlı su rezervlerini ilk kez kapsamlı bir şekilde belgeleyerek, çok az anlaşılan bir sisteme dair yeni bilgiler sundu.

Su, gezegenimizin yüzeyinin yaklaşık yüzde 70'ini oluştursa da aynı zamanda yeraltı su kaynaklarında da depolanıyor.

Birçok kıyı topluluğu, tatlı su ihtiyaçları için bu su kaynaklarına bağımlı.

Yeraltındaki su kaynaklarının, deniz tabanının altında tatlı, hafif tuzlu su bölgelerine doğru açık denize gittiği biliniyordu ancak bunlar şimdiye kadar neredeyse hiç keşfedilmemişti.

Uluslararası Okyanus Keşif Programı 501 Seferi, deniz tabanının yaklaşık 200 metre altındaki bir bölgede tatlılaşmış suyu belgeledi ve örnekledi. New England kıyılarının açıklarında okyanus tabanının altından alınan çökelti örnekleri, ilk kez açık deniz tatlı su sistemlerinin varlığını doğruladı.

Araştırmacılar, bulguların dünyanın dört bir yanındaki benzer gizli su kaynaklarına daha fazla ışık tutabileceğini söyledi.

Devam eden çalışmalarda, bilim insanları, su kaynaklarını yerinde tutan ve su geçirmez tabakalar diye bilinen kumlu katmanlar da dahil olmak üzere, tortularda depolanan suyu örneklemeyi umuyorlar.

grthy
Uluslararası Okyanus Keşif Programı 501 Seferi, New England kıyılarının açıklarında okyanus tabanının altından tortu örnekleri aldı (Avrupa Okyanus Sondaj Araştırmaları Konsorsiyumu)

Colorado Maden Okulu'ndan jeolog Brandon Dugan, "Tatlılaşmış suyun hem denizel hem karasal tortularda, birden fazla tortu türünde bulunduğunu görmek bizi heyecanlandırdı" dedi.

Bu kadar farklı malzemelerdeki tatlı su, suyun hangi koşullarda buraya yerleştiğini anlamamıza yardımcı olacak.

Araştırmacılar, birçok kıyı bölgesinin tatlı su kaynakları için yeraltı suyuna bağımlı olması nedeniyle, bulguların toplum için büyük önem taşıdığını söylüyor.

ABD'nin kuzeydoğu kıyıları, açık deniz tatlı su rezervlerine sahip olduğu düşünülen en çok incelenen alanlardan biri. Tahminler, New Jersey ve Maine arasındaki Atlantik kıta kenarı boyunca yaklaşık 1300 kilometreküp depolanmış tatlı su olabileceğini gösteriyor.

ds67ı
Bilim insanları, tortu örneklerini renk ve yapı bakımından tanımlamak için Toprak Renk Şeması'nı kullanıyor (Avrupa Okyanus Sondaj Araştırmaları Konsorsiyumu)

Bunu daha iyi anlamak için, araştırmacılar New York'un her yıl 1,5 kilometreküp tatlı su, yani yaklaşık 1,5 trilyon litre kullandığını söylüyor.

Leicester Üniversitesi'nden sedimentolog Sarah Davies, "501 Seferi, başından beri yenilikçi oldu; okyanus sondaj topluluğu genelinde yeni araçlar, yeni yöntemler ve yeni işbirlikleri getirdi" dedi.

13 ülkeden yaklaşık 40 araştırmacının devam eden çalışmaları, besin maddelerinin dünyanın kıta sahanlığı tortularında nasıl döngüye girdiğini ve bu süreçlerin okyanus ekosistemlerini nasıl şekillendirdiğini ortaya çıkarabilir.

Dr. Davies, "Karadaki çalışmalar bu ivmeyi sürdürüyor ve örnekler şimdiden heyecan verici bir hikaye ortaya koyuyor" dedi.

Independent Türkçe


NASA, Jüpiter'in gerçek boyutunu ortaya çıkardı: "Ders kitaplarının güncellenmesi gerekecek"

Jüpiter, Güneş Sistemi'ndeki diğer tüm gezegenleri içine alabilecek kadar büyük (ESA)
Jüpiter, Güneş Sistemi'ndeki diğer tüm gezegenleri içine alabilecek kadar büyük (ESA)
TT

NASA, Jüpiter'in gerçek boyutunu ortaya çıkardı: "Ders kitaplarının güncellenmesi gerekecek"

Jüpiter, Güneş Sistemi'ndeki diğer tüm gezegenleri içine alabilecek kadar büyük (ESA)
Jüpiter, Güneş Sistemi'ndeki diğer tüm gezegenleri içine alabilecek kadar büyük (ESA)

NASA'nın Juno uzay aracı, Güneş Sistemi'nin en büyük gezegeni Jüpiter'in sanılandan biraz daha küçük ve basık olduğunu tespit etti.

Bir gaz devi olan Jüpiter büyük ölçüde hidrojen ve helyumdan oluşuyor. 

Daha önce NASA'nın Pioneer ve Voyager görevlerinden elde edilen veriler, devasa gezegenin ekvatordaki çapının 142 bin 984 kilometre, bir kutbundan ötekine olan uzunluğunun da 133 bin 708 kilometre olduğunu gösteriyordu.

Ancak İsrail'deki Weizmann Bilim Enstitüsü'nden araştırmacılar bu ölçümlerin tam isabetli olmadığını belirledi.

NASA'nın aracı Juno, 2016'dan beri Jüpiter'in yörüngesinde. Görev süresi 2021'de uzatılınca rotası değiştirilen Juno, Dünya'dan bakıldığında Jüpiter'in arkasından geçişler yapmaya başladı.

Bu sayede gezegenin büyüklüğünü daha net bir şekilde hesaplamak mümkün oldu. Aracın, Jüpiter'in arkasından Dünya'ya gönderdiği radyo sinyallerinin Jüpiter'in arkasından geçerken bükülmesi ya da zayıflaması, gezegenin boyutunu ölçmeye yarıyor.

Juno'nun ham verilerini işlemek için gereken teknikleri geliştiren Maria Smirnova "Radyo sinyallerinin, Jüpiter'in atmosferinden geçerken nasıl büküldüğünü izledik. Böylece bu bilgileri Jüpiter'in sıcaklık ve yoğunluğuna ilişkin ayrıntılı haritalara dönüştürdük ve dev gezegenin şekli ve boyutuna ilişkin şimdiye kadarki en net resmi elde ettik" diye açıklıyor.

Bulguları hakemli dergi Nature Astronomy'de 2 Şubat Pazartesi yayımlanan çalışmaya göre Jüpiter'in ekvatordaki çapı sanılandan 8 kilometre, kutupları arasındaki uzunluk da 24 kilometre daha küçük.

Çalışmanın yazarlarından Yohai Kaspi "Ders kitaplarının güncellenmesi gerekecek" diyor. 

Jüpiter'in boyutu elbette değişmedi; değişen, onu ölçme yöntemimiz.

Devasa bir gezegen için birkaç kilometrelik bir farkın önem taşımayacağı düşünülebilir ancak bilim insanları durumun böyle olmadığını söylüyor.

Araştırmayı yöneten Eli Galanti, "Bu birkaç kilometre çok önemli" diyor. 

Yarıçaptaki küçük değişimle, Jüpiter'in iç yapısını gösteren modellerimiz hem kütleçekim verileriyle hem de atmosferik ölçümlerle çok daha iyi uyum sağladı.

Jüpiter, gaz devi gezegenleri anlamada bir standart sunduğu için bu veriler Güneş Sistemi'nin ötesindeki gaz devleri hakkında daha iyi bir fikir sahibi olmaya katkı sağlıyor.

Independent Türkçe, Reuters, Space.com, NatureAstronomy