Yapay zeka büyük kurumlara ve şirketlere sızıyor

Yeni tasarımlar, mahremiyet ve veri gizliliğini sağlamak için hassas bir denge gerektiriyor.
Yeni tasarımlar, mahremiyet ve veri gizliliğini sağlamak için hassas bir denge gerektiriyor.
TT

Yapay zeka büyük kurumlara ve şirketlere sızıyor

Yeni tasarımlar, mahremiyet ve veri gizliliğini sağlamak için hassas bir denge gerektiriyor.
Yeni tasarımlar, mahremiyet ve veri gizliliğini sağlamak için hassas bir denge gerektiriyor.

Morgan Stanley'de çalışan binlerce finans danışmanın bu yılın ortasında yapay zeka ile tasarlanmış yeni bir iletişim aracına sahip olması bekleniyor.

600'e yakın çalışanın kullandığı araç, "Apple, IBM ve Microsoft'un yatırım senaryolarını karşılaştırabilir misiniz?" ve “Bu vakaların her biri için riskler nelerdir?” gibi sorulara yanıt veriyor. Danışman, örneğin müşterinin değerli bir tablosu varsa ne yapılabileceğini de sorabiliyor ve böylece bilgi aracı kendisine izleyebileceği adımların bir listesinin yanı sıra şirket içinden yardımcı olacak bir uzmanın adını veriyor.

Analiz ve yenilik

Morgan Stanley'nin Servet Yönetimi bölümünün analitik, veri ve inovasyon başkanı Jeff McMillan açıklamasında "Yapmaya çalıştığımız şey, her müşteriyi veya finansal danışmanı herhangi bir konuda gerçek zamanlı olarak daha akıllı, daha bilgili bir uzman haline getirmek" dedi.

Uzmanlar, yapay zekanın zaman içinde yaratacağından daha fazla işi yok edip etmeyeceği konusunda farklı görüşlerde olabilir. Ancak kesin olan, yapay zekanın, çoğu çalışanın bilgi alanlarında çalışma şeklini değiştirecek olması. Zira yapay zeka, ihtiyaç duydukları becerilere ve çoğu şirketteki iş ihtiyacına göre ayarlamalar yapacak. Günümüzde girişimciler, çalışanları yeni yapay zeka araçlarının orta vadede yaratabileceği engellere hazırlarken teknolojiden nasıl faydalanacaklarını da bilmek durumundalar.

Yavaş hareket etmek, geçmişte internetten tam olarak veya doğru hızda yararlanmayan şirketlerde olduğu gibi, verimlilik, müşteri hizmetleri ve son olarak rekabet gücü açısından kazanç kaybına neden olabilir.

Ancak aynı zamanda girişimciler, yapay zekanın kötü şöhretli hataları ve önyargılarına karşı dikkatli olmalı ve çalışanlar için nelere yol açabileceğini dikkatlice düşünmeli. Finans şirketlerinde yapay zekanın yeteneklerini analiz etmede uzmanlaşmış, gelişmekte olan Evident şirketinin kurucusu ve CEO’su olan Alexandra Mousavizadeh, konuyla ilgili olarak “Çalışma alanınız ne olursa olsun, şirketinizin ağırlıklı olarak yapay zekaya güvenen şirketlerden biri olduğunu düşünmelisiniz” dedi.

Morgan Stanley'nin danışmanlar aracına güç veren yapay zeka türü ‘üretken yapay zeka’ olarak biliniyor ve analiz ettiği bilgileri kullanarak metin, resim, ses ve video gibi içerikler oluşturabiliyor.

Şarku’l Avsat’ın edindiği bilgilere göre söz konusu yapay zeka, soruları yanıtlamanın yanı sıra e-postalar yazmak, slayt gösterileri yapmak ve uzun belgeleri özetlemek gibi sayısız başka şekilde kullanılabiliyor. Ön araştırmalar, üretken yapay zeka kullanılarak geliştirilen araçların birçok görevi hızlandırabileceğini ve çalışan üretkenliğini artırabileceğini gösteriyor.

Çalışanların performansının yükseltilmesi

Örneğin MIT ve Stanford Üniversitesi'nden araştırmacılar, kendilerine yanıt sağlayan bir yapay zeka aracıyla donatılmış müşteri destek personelinin her saat yüzde 14 daha fazla müşteri sorunu çözdüğünü ortaya koydu.

Ancak bu aracın kazanımları eşit olarak dağıtılmadı. Araç, yetenekli meslektaşlarının uygulamalarını etkili bir şekilde algıladığı ve yaydığı için deneyimsiz çalışanlar üretkenliklerinde önemli sıçramalar yaptı. Massachusetts Institute of Technology'nin yakın tarihli bir araştırması, yapay zekanın, başlangıçta işlerinde vasıfsız olan işçilerin kendileriyle daha vasıflı işçiler arasındaki farkı azalttığını ve yapay zekayı kullandıklarında daha kısa sürede daha iyi performans gösterdiğini buldu.

Exponential View araştırma grubunun başkanı Azim Azhar bu çalışmaların sonuçlarının şu tek bir noktada birleştiğini söyledi:

"Bugün artık bir kişinin pozisyonunda performansı sayesinde elde ettiği kazanımlar azaldı çünkü (ChatGPT) kullanan genç çalışanlar ve yılların tecrübesine sahip olanlar kadar iyi performans gösteriyor."

Araştırma sahadaki uygulamaları içerecek şekilde genişlerse, bazı şirketleri daha genç çalışanlara yatırım yapmaya ve yıllardır çalışan daha pahalı çalışanları işten çıkarmaya teşvik edebilir.

Hatta bazı şirketler, yapay zeka araçlarının beklenen etkisine göre işe alım kararları vermeye bile başladı. IBM kısa süre önce, insan kaynakları gibi önümüzdeki birkaç yıl içinde yapay zekanın yerini alabilecek bazı pozisyonlarda işe alımı yavaşlattığını veya durdurduğunu açıkladı. PwC Global Tax & Legal Service CTO'su (Baş Teknoloji Sorumlusu) Pevek Sharma, yapay zekanın sağladığı hız ve kazanımların müşteri beklentilerini yükselttiğine belirtti. Sharma, ‘çalışanların iş gücü becerilerini yenilemeye ve yapay zekaya yönelik açık talebi karşılayacak kadar hızlı bir şekilde anlamalarını sağlamaya özen gösterilmesi gerektiğine’ dikkat çekti.

PwC, önümüzdeki birkaç ay içinde tüm hukuk danışmanlarına yapay zeka destekli bir konuşma aracı sunmak için avukatlar için çeşitli araçlar geliştiren bir AI girişimi olan Harvey ile birlikte çalışıyor. Şirket ayrıca teknolojisini vergi ve insan kaynakları uzmanlarını da içerecek şekilde genişletmeyi planlıyor.

Sharma, PwC'nin hedefinin, çalışanlarına şirketin deneyimlerinden elde edilen yanıtları sağlamanın ötesinde, nihayetinde müşteri verilerinin de analiz edilmesine bağlı olacak yeni içgörüler üretmeye geçtiğini açıkladı. Yapay zeka nihayet örneğin birleşme fikrini düşünen iki şirket arasındaki tüm sözleşmeleri kaydedebilir, örneğin PwC uzmanlarının belirli türdeki yetkileri ve riskleri araştırmasına olanak tanır.

Genel olarak büyük şirketlerin, teknolojiyi işlerine uyarlayabilen yapay zeka konusunda bilgili teknik personele yatırım yapması gerekiyor. Mousavizadeh, birçok şirketin ChatGBT'yi kullanamayacağını çünkü onu çalıştırmak için temel yapı taşlarına, yani içerik ve veri yönetimine sahip olmadıklarını vurguladı.

Söz konusu şirketlerin ayrıca teknik uzmanlık gerektirmeyen rollerde profesyonelleri işe alması veya eğitmesi gerekiyor. McMillan ve diğer yöneticiler, yapay zeka platformlarının, kullanıcıların en iyi sonuçları almasını sağlamak için bilgi ve bilgi kaynaklarının ince ayarını yapmaktan sorumlu insanların yardımıyla sürekli ‘ayarlanması’ gerektiğini söylüyor. Bu ayarlama, yeni bir mühendis grubuna olan ihtiyaca işaret ediyor.

Özellik ve gizlilik

Morgan Stanley ve PwC, içeriden öğrenilen materyallerden yararlanan yapay zeka destekli konuşma araçlarının kendi sürümlerini geliştiren şirketler arasında yer alıyor. Mahremiyet, gizlilik, doğruluk ve fikri mülkiyet haklarıyla ilgili endişeler, birçok şirketin çalışanlarının ChatGPT ve diğer yapay zeka araçlarına erişimini engelleyerek Samsung'a olanlardan kaçınmak istiyor. Çünkü raporlar, yarı iletken bölümündeki çalışanların GPT Sohbeti kullanarak bir toplantıdan hassas kod ve notlar paylaştığını gösterdi. Şirket yöneticileri, bazı yapay zeka araçlarında yerleşik olarak bulunan sık sık yapılan hatalar ve önyargılar konusunda da endişeleniyor.

Ancak, kullanıcıların soruları veya komutları sade bir dille yazmasına izin veren üretici yapay zeka araçlarından yararlanma fırsatı kısmen görevi bu araçların şirketin çalışma şeklini nasıl değiştirebileceğini göstermek olan daha geniş bir teknik olmayan çalışan grubunu bir araya getirmeyi gerektiriyor. Azhar açıklamasını "Çalışanlarınızın, kendi becerilerini ve şirketinizin dahili becerilerini geliştirmeye başlayabilmeleri için bu araçları gerçekten düzenli bir şekilde kullanmaları gerekiyor" diyerek sonlandırdı.



4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI