Facebook platformunun sahibi olan Meta Platforms şirketi salı günü, onlarca dildeki konuşmaları tercüme etme ve sesli olarak aktarma yeteneğine sahip, gerçek zamanlı iletişimi mümkün kılan ve diller arasındaki engelleri ortadan kaldıran araçlar için potansiyel bir yapı taşını teşkil eden bir yapay zeka modeli çıkardı.
Reuters haber ajansına göre, şirket bir açıklamasında, SeamlessM4T modelinin, daha önce ayrı modellerde mevcut olan teknolojileri birleştirerek, yaklaşık 100 dilde metinden sesli çevirinin yanı sıra 35’ten fazla dilde konuşmadan konuşmaya çeviriyi destekleyebildiğini söyledi.
Meta CEO’su Mark Zuckerberg, bu araçların, şirketin geleceği üzerine bahse girdiği bir dizi bağlantılı sanal dünya olan Metaverse’de dünyanın dört bir yanından kullanıcılar arasındaki etkileşimi kolaylaştırmasını hayal ettiğini söyledi.
Açıklamada, Meta’nın modeli ticari olmayan amaçlarla kamuya açık hale getireceği ve Facebook, Instagram, WhatsApp ve Threads uygulamalarına entegre edileceği duyuruldu.
Reuters’a göre, sosyal medya devi, bu yıl bazı ücretsiz AI modellerini yayınladı. Bunların arasında, Microsoft’un sahibi olduğu OpenAI ile Alphabet’in sahibi olduğu Google tarafından satılan ve tescillenen modeller için ciddi bir zorluk teşkil eden LLaMA adlı dev bir dil modeli de bulunuyor.
Zuckerberg, kamuya açık bir yapay zeka sisteminin Meta’nın çıkarına olduğunu zira şirketin, modeli görüntüleme ve kullanma hakkı için ücret almak yerine, sosyal platformlarında doğrudan tüketiciye yönelik araçların oluşturulması gibi büyük kaynaklar toplayarak daha fazla kazanç elde edeceğini söylüyor.
Sektörün geri kalanı gibi Meta da modellerini beslemek için kullandığı eğitim verileriyle ilgili hukuki sorularla yüzleşiyor.
Temmuz ayında Sarah Silverman ile diğer iki yazar, Meta ve OpenAI’ye karşı telif hakkı ihlali davaları açarken, iki şirketi, kitaplarını izinsiz yapay zeka eğitim verisinde kullanmakla suçladı.
Meta araştırmacıları bir makalede, SeamlessM4T modeli için herhangi bir depo tanımlamaksızın, 4 milyon saatlik ‘kamuya açık bir web veri deposundan alınan ham sesten’ eğitim verileri topladıklarını söyledi.
Bir Meta sözcüsü ise ses verilerinin kaynağı hakkındaki sorulara yanıt vermedi.
Makalede, metinsel verilerin geçen yıl oluşturulan ve Wikipedia ve ilgili sitelerdeki içerikte kullanılan veri tabanlarından geldiğini belirtti.