4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
TT

4 soruda OpenAI'ın "düşünebilen" yeni yapay zeka serisi

OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)
OpenAI'ın son modeli o1'in fiyatı, bazı kullanıcıların tepkisini çekiyor (Reuters)

OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. 

Strawberry diye de bilinen yeni serinin o1-preview (ön izleme) ve o1-mini diye iki sürümü mevcut.

Model henüz sadece ChatGPT Plus ve Team kullanıcılarının yanı sıra 5. seviye API katmanına hak kazanan geliştiricilerin erişimine peyderpey açılıyor.

ChatGPT Enterprise ve Edu üyelerinin de gelecek haftadan itibaren araca erişebileceğini belirten şirket, ileride o1-miniyi bütün kullanıcılara ücretsiz sunmayı planlıyor. Fakat bunun için henüz bir tarih verilmedi.

Daha önceki modellerine 2,3,4 gibi isimler veren OpenAI, son serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve bu nedenle o1 adını seçtiklerini belirtiyor.

Tabii bütün bunların bir bedeli var. Kullanımı mayısta çıkan öncülü GPT-4o'dan üç kat daha masraflı olan o1-preview'un geliştiricilere maliyeti 1 milyon girdi jetonu (token) başına 15 dolar, 1 milyon çıktı jetonu başına da 60 dolar.

Veri birimlerini ifade eden jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor. 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. 

OpenAI, o1-mini versiyonun yüzde 80 daha ucuz olduğunu belirtiyor fakat bu sürüm diğeri kadar geniş bir bilgi yelpazesine sahip değil. 

Peki şirketin ön izleme veya bir ön sürüm olduğunu belirttiği o1, öncüllerinden farklı olarak neyi yapabiliyor, neyi yapamıyor ve insanlığın kendi bilişsel seviyesini geçen yapay zeka inşa etme çabasında nasıl bir adıma işaret ediyor?

1) Gerçekten düşünebiliyor mu?

Teknoloji sektöründeki en temel tartışmalardan biri, yapay zeka araçlarının becerilerini "düşünme" veya "muhakeme" gibi ifadelerle tanımlama etrafında dönüyor. 

Geniş dil modellerinin, devasa büyüklükte bilgi kümeleriyle eğitildiği ve sorgulara verdikleri cevaplarda bu veriler üzerinden olasılık temelli tahmin yürüttükleri göz önüne alınırsa, bazı uzmanların "düşünme" ifadesine itirazlarında haklılık payı var. 

Öte yandan bu araçlar insan beyni gibi akıl yürütme becerisine gittikçe daha fazla yaklaşıyor. 

OpenAI, o1 serisinin sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor.

Sisteme girilen soru karşısında "Düşünüyorum" gibi yanıtlar vermesi, gerçekten o sırada düşündüğü izlenimi yaratsa da o1'in insanlar gibi akıl yürüttüğünü söylemek mümkün değil. 

OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçimini insanlarınkiyle bir tutmadıklarını söylüyor. 

Arayüz ise yeni modelin problemleri çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla bu şekilde tasarlanmış.

o1'i önceki OpenAI uygulamalarından ayıran temel özelliğiyse eğitilme biçiminde yatıyor. 

Eğitim bilimci ve öğretmenlerin aşina olabileceği pekiştirmeli öğrenme denen bu yöntem, doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında da ceza verilmesi ilkesine dayanıyor.

Bu sayede deneme yanılmayla ilerleyen yapay zeka aracının, doğru yanıtlara ulaşma becerisi gelişiyor. Sorguları işlerken, insanların sorunları adım adım inceleyerek çözmesine benzer bir "düşünce zinciri" kullanıyor.

OpenAI, aracı "düşünmeye" iten bu yöntemin, doğruluğunu artırdığını ifade ediyor. 

2) Hangi alanlarda kullanılacak?

Karmaşık muhakeme görevlerinde kayda değer bir ilerlemeye ve yeni bir yapay zeka yeteneği seviyesine işaret ediyor. Bu nedenle sayacı tekrar 1'e sıfırlıyor ve bu seriye OpenAI o1 adını veriyoruz.

OpenAI'ın bu ifadelerle tanıttığı o1'in, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlamada daha iyi bir performans sergilemesi bekleniyor. Ayrıca o1-mini, daha küçük bir sürüm olmasına karşın özellikle kod üretmesi amacıyla geliştirildi. 

Yeni model kodlama ve matematikte sonuca ulaşma sürecini detaylandırdığı için bu alanlarda öğretmenlik yapma becerisinin önceki versiyonlardan daha iyi olması bekleniyor. 

Şirketin baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirterek kendisinin üniversitede matematik okuduğunu ekliyor.

OpenAI yeni modelin ayrıca bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağını ifade ediyor. 

Ayrıca yapılan testlerde fizik, kimya ve biyolojinin bazı alanlarında doktora öğrencileriyle yarıştığı kaydedildi.

Şirketin baş bilim insanı Dr. Jakub Pachocki ve OpenAI teknik çalışanı Szymon Sido, New York Times'a yaptıkları sunumda, sohbet botunun çengel bulmacadan çok daha karmaşık akrostiş bulmacasını çözdüğü görüldü.

Yapay zeka aracı aynı zamanda doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak hastalığı teşhis etti.

3) GPT-4o'dan daha mı iyi?

Daha önceki modeller internetteki bilgilerle eğitildiği ve internette epey yanlış bilgi olduğu için hata yapma ihtimalleri artıyor. o1'in eğitilme biçimiyse bu hataları çok daha düşük seviyeye indirmesini sağlıyor. 

Yeni modelin; ses, görüntü ve yazıyla iletişim kuran GPT-4o'dan çok daha iyi performans gösterdiği alanlar olsa da bazı konularda gerisinde kalıyor. 

İki aracı da lise seviyesindeki Uluslararası Matematik Olimpiyatı'na sokan OpenAI, o1'in soruların yüzde 83'ünü, GPT-4o'nun ise sadece yüzde 13'ünü doğru çözdüğünü ifade ediyor. 

Thomson Reuters'tan yeni modeli test eden Pablo Arredondo, TechCrunch'a yaptığı açıklamada yasal belgeleri analiz etme ve hukuk fakültesine giriş sınavında da daha başarılı olduğunu söylüyor.

Strawberry takma adına sahip o1'in GPT-4o'yu geride bıraktığı bir diğer alan ise "strawberry" (çilek) kelimesinde kaç tane "r" harfi olduğunu bulmak.

Bu soruya "iki" yanıtını veren ChatGPT'nin önceki sürümleri internette alay konusu olmuştu. 

İlk başta çok zor bir görev gibi görünmese de yapay zeka araçları kelimeleri harf harf değil, jetonlar şeklinde işlediği için bu tip basit işlerde zorlanabiliyorlar. 

Ancak o1, daha detaylı düşünmesi ve kendisini kontrol etmesinden dolayı bu soruya doğru yanıtı vermeyi başardı. 

Öte yandan yeni model, internette arama yapma, metin ve görsel işleme gibi özelliklere henüz sahip değil. Ayrıca gerçek dünya hakkında GPT-4o kadar bilgisi de yok. 

Pennsylvania Üniversitesi Wharton İşletme Okulu'nda yapay zeka üzerine çalışan Ethan Mollick "Açıkçası o1-preview her şeyde daha iyi değil. Örneğin GPT-4o'dan daha iyi bir yazar değil" diyerek ekliyor: 

Ancak planlama gerektiren görevlerde ciddi değişiklikler sözkonusu.

OpenAI, yeni modelinde halüsinasyon sorununu da çözmeyi henüz başaramadı. Yapay zeka sohbet botlarının bazı bilgileri "uydurmasını" ifade eden halüsinasyon, bu araçların temel sorunu olmaya devam ediyor.

Modeli test eden Mollick, zorlu bir bulmacayı çözdüğünü ancak ipuçlarından birini uydurduğunu söylüyor. 

Yine de Tworek, "Bu modelin daha az halüsinasyon gördüğünü fark ettik" diyerek ekliyor: 

Ancak sorun hâlâ devam ediyor. Halüsinasyonları çözdüğümüzü söyleyemeyiz.

Son modelin bir diğer eksikliği de sorgulara yavaş cevap vermesi. Diğer sürümler neredeyse anında yanıtı sunarken, muhtemelen düşünme süresinden dolayı o1'in cevap vermesi çok daha uzun zaman alıyor.

Örneğin Mollick, bulmacayı çözmesinin 108 saniye sürdüğünü ifade ediyor.

OpenAI modelin ön izleme versiyonu olduğunu belirtirken, uzmanlar o1'in sonraki versiyonlarının hızlanmasını umuyor. 

4) İnsanlığa tehdit oluşturabilir mi?

Bazı yapay zeka araçları eğitimleri sırasında farklı kelimelerin beraber kullanılma sıklıklarını analiz ederek sözcüklerin birbirine yakınlığını tahmin ediyor. Örneğin "kedi" ve "köpek" kelimeleri birlikte daha sık kullanıldığı için yakın anlamlara sahip olmaları gerektiği sonucuna varıyor.

Bu modellerin "yapay zeka" ve "tehdit" ifadeleri arasında da böyle bir ilişki kurmuş olması muhtemel. 

Her yeni modelin piyasa sürülmesiyle akla gelen ilk sorulardan biri insanlığa varoluşsal bir tehdit yaratıp yaratmayacağı.

Sektörün önde gelen bazı isimleri bu tehlikeye karşı uyarırken bazı uzmanlar yapay zeka araçlarının nasıl kullanıldığının daha önemli olduğunu vurguluyor.

OpenAI'ın son sürümüyle bu araçların insan gibi düşünme becerisine bir adım daha yaklaşması da endişeleri artırabilir.

Ancak bu yazıdan da anlaşılabileceği üzere, o1'in becerileri henüz korkutucu bir düzeyin yakınından bile geçmiyor. 

Ars Technica'nın ifade ettiği gibi bir bulmacadaki 8 ipucunu çözmesi 108 saniye süren ve bir cevapta halüsinasyon gören bir yapay zeka modelinin potansiyel tehlike olduğunu söylemek abartıya kaçar. 

Öte yandan OpenAI'ın yanı sıra Meta ve Google gibi şirketlerin de çabaları ve son yıllardaki hızlı gelişmeler göz önüne alınırsa, insan seviyesine ulaşan yapay zeka araçları çok uzak olmayabilir.

Independent Türkçe, TechCrunch, Verge, Ars Technica, New York Times, OpenAI



Vizyon 2030: Geleneksel yönetimden küresel dijital liderliğe geçiş öyküsü

Vizyon 2030: Geleneksel yönetimden küresel dijital liderliğe geçiş öyküsü
TT

Vizyon 2030: Geleneksel yönetimden küresel dijital liderliğe geçiş öyküsü

Vizyon 2030: Geleneksel yönetimden küresel dijital liderliğe geçiş öyküsü

Suudi Arabistan, Vizyon 2030 kapsamında dijital dönüşüm ve bilgi ekonomisi alanında başlattığı süreci kararlılıkla sürdürüyor. Ülke, gelişmiş dijital altyapısına ve uzun yıllara dayanan bilgi birikimine dayanarak geleceğin ekonomilerinde rekabet gücünü artırmayı hedefliyor. Bu dönüşümün, ekonomik çeşitliliği artırma, yeni istihdam alanları oluşturma ve genç nüfusu güçlendirme amacı taşıyan ulusal bir vizyonla desteklendiği belirtiliyor. Söz konusu strateji, inovasyon, araştırma ve teknolojiye dayalı entegre bir ekosistem inşa edilmesi üzerine kurulurken, Suudi Arabistan’ın küresel ölçekte bilgi temelli ekonomiler arasında konumunu güçlendirmeyi amaçlıyor.

Kağıtsız hükümet

Suudi Arabistan, Vizyon 2030 kapsamında yürüttüğü dijital dönüşüm sürecinin bir parçası olarak ‘kâğıtsız hükümet’ politikasını hayata geçirdi. Söz konusu uygulama, vatandaşların kamu hizmetlerine erişimini kolaylaştırmak amacıyla farklı sektörleri kapsayan tek bir dijital platform sistemi üzerine inşa edildi. Adalet, sağlık, turizm, yatırım, konut, lojistik ve gayrimenkul gibi birçok alanın entegre edildiği bu platformlar sayesinde işlemlerin dijital ortamda yürütülmesi sağlanıyor. Bu yaklaşımın, işlem sürelerini önemli ölçüde kısalttığı ve bürokratik süreçleri basitleştirdiği belirtiliyor. Böylece vatandaşlar, ülkede yaşayan yabancılar, yatırımcılar ve ziyaretçiler; fiziksel olarak bir kuruma gitmeden işlemlerini tamamlayabiliyor.

vefrthyju
Beem devlet uygulamasının Dijital Hükümet Forumu’nda tanıtımı (Suudi Arabistan Dijital Hükümet Otoritesi)

‘Bütünleşik Hükümet’ programı

Suudi Arabistan Dijital Hükümet Otoritesi, 2022 yılında Bütünleşik Hükümet programını başlattı. Programın amacı, dijital dönüşüm sürecini hızlandırmak, kamu kurumları arasındaki entegrasyon seviyesini yükseltmek ve vatandaşlara daha bütüncül bir dijital hizmet deneyimi sunarak kamu kaynaklarının dijital alanda daha verimli kullanılmasını sağlamak olarak açıklandı.

Bu dönüşümün somut sonuçlarından biri olarak ‘Balady Platform’ öne çıktı. Platformun, 37 farklı kamu platformunun kapatılmasına katkı sağladığı ve yüzde 80’in üzerinde bir entegrasyon başarısına ulaştığı belirtildi. Ayrıca ‘LOGISTI Platform’ 200’den fazla hizmet sunarak dikkat çekerken, ‘Sehhaty Platform’ ise 30 milyondan fazla kullanıcıya hizmet vererek geniş bir kullanıcı kitlesine ulaştı.

Uluslararası yapay zekâ merkezi

Suudi Arabistan, yapay zekâ alanında da küresel ölçekte ileri bir merkez konumunu güçlendirdi. Ülkenin enerji kaynakları, gelişmiş dijital altyapısı ve veri merkezleri sayesinde, yapay zekâ teknolojileri için cazip bir yatırım ve geliştirme üssü haline geldiği belirtiliyor.

Bu kapsamda, yapay zekâ teknolojilerinin yerelleştirilmesini hedefleyen ulusal bir girişim olarak HUMAIN projesi hayata geçirildi. Proje, Arapça içerik üretimini destekleyen büyük dil modelleri geliştirmeyi ve veri merkezlerinde ileri yapay zekâ uygulamalarını işletmeyi amaçlıyor. Bu çerçevede özellikle Dammam’daki yapay zekâ altyapıları da öne çıkan unsurlar arasında yer alıyor.

fbnyju
Riyad’da düzenlenen Geleceğe Yatırım Girişimi Konferansı sırasında Suudi yapay zekâ şirketi HUMAIN’in standını inceleyen ziyaretçiler (AFP)

Ayrıca ülke, insan kaynağı kapasitesini artırmak için eğitim sistemine yapay zekâ derslerinin entegre edilmesine ve öğrencilere ile ulusal yeteneklere yönelik eğitim programlarının başlatılmasına yatırım yapıyor. Bu adımların, gelecek nesillerin dijital ekonomiye ve yapay zekâ temelli sektörlere hazırlığını güçlendirmeyi hedeflediği ifade ediliyor.

HUMAIN şirketi

HUMAIN, 2025 yılında resmen faaliyete geçirilerek yapay zekâ alanında kapsamlı çözümler geliştirmeye başladı. Şirketin geliştirdiği projeler arasında Arapça destekli akıllı bir asistan, ileri düzey büyük dil modelleri ve tamamen yapay zekâ ile çalışan bir işletim sistemi yer alıyor. Ayrıca Suudi Arabistan içinde geliştirilen donanım ve teknolojilerin de bu ekosisteme entegre edildiği belirtiliyor. HUMAIN’in hizmetlerinin yüz binlerce kullanıcıya ulaştığı, aktif kullanıcı sayısının 300 bini aştığı ifade ediliyor. Şirketin faaliyet alanının 5 farklı pazara yayıldığı ve 150’den fazla dijital uygulama ve hizmeti desteklediği de aktarılan bilgiler arasında yer alıyor.

Dijital adalet sektöründeki dönüşüm

Suudi Arabistan’da yargı alanında dijital hizmetler, kayda değer bir dönüşüm sürecinden geçti. Bu kapsamda 160’tan fazla elektronik hizmet sunularak yıllık yaklaşık 90 milyon kâğıt kullanımının önüne geçildiği bildirildi. Dijitalleşme sayesinde 65 milyon fiziksel başvurunun da ortadan kalktığı ifade ediliyor. Ayrıca 200 milyondan fazla gayrimenkul belgesinin dijital ortama aktarıldığı, e-dava sisteminin uygulanmasıyla dava süreçlerinin ortalama süresinin yüzde 79 oranında azaldığı belirtildi. Bu süreçte ‘Virtual Enforcement Court’ ve ‘Virtual Notary’ gibi uygulamalar da hayata geçirildi.

gthyju
Suudi Arabistan Adalet Bakanı Dr. Velid es-Samani, Dijital Hükümet Forumu’nda yaptığı konuşmada (SPA)

Söz konusu gelişmelerin, gelişmiş dijital altyapı ve güvenli bir dijital ekosistem üzerine inşa edildiği vurgulanıyor. Bu dönüşümün, hizmet sunumunun ötesine geçerek kullanıcı deneyimini iyileştirmeyi ve bürokratik karmaşıklığı azaltmayı hedeflediği belirtiliyor.

Dijital ve bilgi ekonomisi

Suudi Arabistan, dijital ve bilgi ekonomisi alanında geleceğin yükselen ekonomileri arasında yerini güçlendirmeye devam ediyor. Ülke, bu kapsamda kapsamlı bir yasal ve kurumsal ekosistem geliştirerek teknoloji ve inovasyon temelli büyüme modelini destekliyor. Bu çerçevede Suudi Arabistan Fikri Mülkiyet Otoritesi (SAIP), Araştırma, Geliştirme ve İnovasyon Kurumu ve Suudi Uzay Ajansı gibi kurumlar oluşturuldu. Ayrıca İletişim, Uzay ve Teknoloji Komisyonu yeniden yapılandırılırken, bilgi teknolojileri sektörünü geliştirmek amacıyla Ulusal Bilgi Teknolojileri Geliştirme Programı da hayata geçirildi. Bunun yanı sıra araştırma ve inovasyon merkezlerinin rolü güçlendirildi. Bu kapsamda Kral Abdullah Bilim ve Teknoloji Üniversitesi (KAUST) ile Kral Abdulaziz Bilim ve Teknoloji Şehri (KACST) gibi kurumlar, bilimsel araştırma ve teknolojik yeniliklerin geliştirilmesinde önemli merkezler olarak öne çıkıyor.

Siber güvenlik

Suudi Arabistan, siber güvenliği ulusal güvenliğin bir parçası olarak ele alan ulusal bir çerçeve oluşturdu. Bu yaklaşımın ekonomik ve sosyal istikrarı desteklemeyi, teknoloji şirketlerini güçlendirmeyi ve dijital hizmetlerin büyümesini hızlandırmayı hedeflediği bildirildi. Söz konusu strateji, Suudi Arabistan Veri ve Yapay Zekâ Kurumu (SDAIA) ve Ulusal Siber Güvenlik Otoritesi (NCA) gibi kurumların kurulmasıyla desteklendi. Ayrıca, siber alanda çocukların korunmasına yönelik uluslararası girişimler de bu sürece dahil edildi. Bu adımların, Suudi Arabistan’ın teknoloji, yapay zekâ ve siber güvenlik alanlarında küresel liderliğini pekiştirmesine katkı sağladığı ifade ediliyor.

rgthy
Suudi Arabistan Veri ve Yapay Zekâ Kurumu’nun (SDAIA) LEAP Fuarı’ndaki standı (SPA)

Dijital ekonomi pazarı

Suudi Arabistan’da dijital dönüşümün ekonomik göstergelere de güçlü şekilde yansıdığı bildirildi. Ülkede dijital ekonomi pazarının büyüklüğünün 745,98 milyar riyale (198,9 milyar dolar) ulaştığı, iletişim ve bilgi teknolojileri pazarının ise 199 milyar riyal seviyesine çıktığı kaydedildi. Söz konusu büyüme, dijital sektörün ölçeğini ve olgunlaşma hızını ortaya koyarken, Suudi Arabistan merkezli çok sayıda teknoloji şirketinin de ‘milyar dolarlık şirket’ statüsüne yükseldiği ifade edildi. Bu gelişmeler, dijital ekonominin büyümesini hızlandırırken sektörün daha olgun ve küresel rekabete açık bir yapıya evrildiğine işaret ediyor.

Küresel endekslerde lider konumda

Uluslararası ileri göstergelerin, Suudi Arabistan’ın dijital ve teknolojik alanda elde ettiği konumu güçlendirdiği bildirildi. Buna göre ülke, iletişim ve teknoloji gelişim endeksinde dünya birincisi olurken, küresel rekabet raporuna göre siber güvenlik endeksinde üst üste ikinci kez yine dünya birinciliğini elde etti. Ayrıca Stanford Üniversitesi tarafından hazırlanan endekste, yapay zekâ alanında kadınların güçlendirilmesi kategorisinde de küresel ölçekte ilk sırada yer aldı. Bu sonuçların, Suudi Arabistan’ın dijitalleşme, siber güvenlik ve yapay zekâ alanlarında küresel liderlik iddiasını pekiştirdiği değerlendiriliyor.

bghyju
LEAP Fuarı’ndaki bilgi ekranının önünde duran bir kadın (SPA)

Suudi Arabistan, Uluslararası Telekomünikasyon Birliği (ITU) tarafından yayımlanan 2025 Dijital Hazırlık Endeksi’nde dünya birincisi oldu.

Bölgesel düzeyde ise Yapay Zekâ Güvenlik Endeksi’nde birinci sırada yer alırken, küresel sıralamada 11. basamağa yükseldi. Ayrıca süper bilgisayar alanında Şahin 3 süper bilgisayarı ile bölgesel liderliğini koruyan Suudi Arabistan, dünya genelinde 18. sıraya yerleşti.

Oxford Insights raporuna göre ülke, yapay zekâya hazır hükümetler endeksinde de bölgesel olarak ilk sırada bulunuyor.

Küresel göstergeler açısından Suudi Arabistan; dijital hükümet olgunluk endeksinde dünya ikincisi, yapay zekâ iş büyüme oranında ve önde gelen yapay zekâ model sayısında dünya üçüncüsü konumunda yer aldı. Stanford Üniversitesi verilerine göre ayrıca dünyada öncü yapay zekâ modelleri geliştiren 7 ülke arasında bulunuyor.

Bunun yanında G20 ülkeleri arasında iletişim ve teknoloji düzenlemeleri gelişmişlik endeksinde ikinci sırada, e-devlet gelişiminde altıncı sırada ve sürdürülebilir kalkınma için kalite altyapısı endeksinde ise 20. sırada yer aldığı kaydedildi.


Google, kodlamanın yüzde 75'ini artık yapay zekanın yaptığını açıkladı

Fotoğraf: Reuters
Fotoğraf: Reuters
TT

Google, kodlamanın yüzde 75'ini artık yapay zekanın yaptığını açıkladı

Fotoğraf: Reuters
Fotoğraf: Reuters

Google CEO'suna göre şirkette yazılan yeni bilgisayar kodlarının çoğunu artık yapay zeka üretiyor.

Las Vegas'ta düzenlenen Google Cloud Next 2026 konferansında konuşan Sundar Pichai, kodların yaklaşık yüzde 75’inin yapay zeka tarafından üretilerek mühendisler tarafından onaylandığını açıkladı.

Bu rakam, 2024'teki yüzde 25 ve 2025'teki yüzde 50'ye kıyasla artışa işaret ediyor.

Pichai "Bir süredir Google'da şirket içi kod oluşturmak için yapay zeka kullanıyoruz" dedi.

Şimdi tamamen ajan tabanlı iş akışlarına geçiyoruz. Mühendislerimiz tamamen otonom dijital görev güçlerini koordine ediyor, ajanları devreye sokuyor ve inanılmaz şeyler başarıyor.

Google patronu, yapay zeka ajanlarının karmaşık bir kod taşıma görevini insan mühendislerden 6 kat daha hızlı tamamlayabilmesi örneğini verdi.

Bu gelişme, teknoloji şirketlerinin yapay zekayı iş akışlarına muazzam ölçekte entegre etmeye yönelik daha geniş bir eğilimin parçası.

Bu hafta yayımlanan bir habere göre Meta, yeni yapay zeka sistemlerini çalışanların işlerini yapmak üzere eğitmek amacıyla, personelin fare hareketlerini, tıklamalarını ve klavye vuruşlarını kaydetmek için bir takip yazılımı kullanmaya başlıyor.

Facebook ve Instagram'ın sahibi şirkette paylaşılan kurum içi yazışmada, insanların bilgisayarlarla etkileşim kurma biçimini taklit etmeyi amaçlayan Model Capability Initiative (Model Yetenek Girişimi / MCI) adlı yeni bir araç seti anlatılıyor.

Reuters'ın aktardığı üzere Meta Teknoloji Direktörü Andrew Bosworth ayrı bir yazışmada çalışanlara, "Hedeflediğimiz vizyon, işlerin esasen ajanlarımız tarafından yapıldığı, bizim rolümüzün ise onlara yön vermek, onları denetlemek ve gelişmelerine yardım etmek olduğu bir vizyon" demişti.

Meta, çalışanlarını günlük işlerinde de mümkün olduğunca fazla yapay zeka kullanmaya teşvik eden birkaç büyük teknoloji şirketinden biri.

Meta ve ChatGPT'nin yaratıcısı OpenAI'daki şirket içi sıralama tablolarının, çalışanları aylık token (jeton) tüketimlerine göre sıraladığı öne sürülüyor; bu, kullandıkları yapay zeka işlem gücü miktarını ifade ediyor.

"Tokenmaxxing" denen bu eğilim, bu kadar yoğun yapay zeka kullanımının finansal ve çevresel maliyetinin yanı sıra performans ölçütü olarak gerçek değerinden dolayı da eleştirilere maruz kalıyor.

Linear Baş İşletme Görevlisi Christina Cordova, X'te "Mühendisleri token harcamalarına göre sıralamak, benim pazarlama ekibimi en çok para harcayanlara göre sıralamam gibi bir şey" diye yazdı. 

Yüksek tüketim oranını yüksek başarı oranıyla karıştırmayın.

Independent Türkçe


Cook’un mirası ile Ternus’un hırsı arasında... Apple’ın geleceğini belirleyecek 7 kritik konu

 Manhattan’daki bir binada yer alan Apple logosu (DPA)
Manhattan’daki bir binada yer alan Apple logosu (DPA)
TT

Cook’un mirası ile Ternus’un hırsı arasında... Apple’ın geleceğini belirleyecek 7 kritik konu

 Manhattan’daki bir binada yer alan Apple logosu (DPA)
Manhattan’daki bir binada yer alan Apple logosu (DPA)

Küresel teknoloji sektörünün dengelerini değiştirebilecek kritik bir gelişmede, Apple bugün yaptığı resmî açıklamayla, Tim Cook’un yıl içinde CEO görevinden ayrılacağını duyurdu. Cook’un, yönetimden tamamen çekilmek yerine şirket içinde İcra Kurulu Başkanı görevine geçeceği belirtildi. Şirketin yeni CEO’su ise son yıllarda Apple’ın ürün mühendisliğindeki dönüşümünde kilit rol oynayan John Ternus olacak. Ternus’un, 1 Eylül itibarıyla görevi devralacağı açıklandı. Bu değişimle birlikte Apple, trilyonlarca dolarlık piyasa değerini yöneten yeni bir liderlik dönemine girerken, şirketin özellikle yapay zekâ, donanım rekabeti ve küresel regülasyon baskıları gibi alanlarda ciddi stratejik sınamalarla karşı karşıya olduğu değerlendiriliyor.

grtbgb
Tim Cook, ocak ayında Los Angeles’ta düzenlenen Amerikan Film Enstitüsü Ödülleri etkinliğine katıldı. (Reuters)

Tim Cook’un mirası ve ‘sahneye çıkışının’ zamanlaması

Wall Street’teki analistler, Tim Cook’un bu dönemde görevden ayrılmasını ‘hesaplanmış bir dönüşüm’ olarak değerlendiriyor. Cook’un on yılı aşkın liderliği boyunca şirketi dünyanın en büyük finansal teknoloji devine dönüştürdüğüne dikkat çeken uzmanlar, Apple’ın aynı zamanda yapay zekâ stratejisi açısından kritik bir yeniden yapılanma sürecinden geçtiğini vurguladı. Analistlere göre Cook’un ayrılığı, şirketin bu zorlu dönüşüm döneminde yeni bir vizyon ve ivme arayışının parçası. Artan rekabet ve yapay zekâ alanında net bir stratejik çerçeve sunma baskısının, yönetimde ‘yeni kan’ ihtiyacını hızlandıran temel etken olduğu ifade ediliyor.

gbgb
John Ternus, Apple’ın her yıl düzenlediği Dünya Geliştiriciler Konferansı’nda konuşuyor. (Arşiv – Reuters)

Ternus’un tahtı kurtarmak için izlediği yol haritası

Ternus’un piyasalardaki şüpheleri giderebilmesi ve hızlı bir şekilde güven inşa edebilmesi için, kısa sürede çözmesi gereken yedi kritik ve tartışmalı başlık bulunduğu ifade ediliyor:

1- Yapay zekâ ikilemi: ‘Takip eden’ konumdan ‘egemenlik’ aşamasına geçiş

En acil ve öncelikli görev, Apple Intelligence sistemini kullanıcıların satın alma kararlarında belirleyici bir faktör haline getirmek olarak görülüyor. Ternus, Apple ile Google arasında yürütülen stratejik iş birliği kapsamında Gemini modelinin Apple sistemlerine entegre edilmesi için yıllık yaklaşık 1 milyar dolarlık anlaşmayı sürdürürken, şirketin aynı zamanda kendi yapay zekâ altyapısını geliştirmek zorunda olduğu belirtiliyor. Uzmanlara göre Ternus’tan beklenen asıl dönüşüm, dışa bağımlılığı azaltarak ‘sistem egemenliği’ oluşturması ve Siri’yi yalnızca bir sesli asistan olmaktan çıkarıp, yüz milyonlarca kullanıcının günlük yaşamında aktif rol oynayan kapsamlı bir dijital merkez haline getirmesi.

2- ‘Geleceğin cihazı’ inovasyonu… iPhone dönemi sona mı eriyor?

Ternus, ‘bir sonraki büyük ürünü’ ortaya koyma konusunda ciddi bir baskı altında bulunuyor. Apple için özellikle, eski tasarımcısı Jonathan Ive ile bağlantılı ekiplerin OpenAI bünyesinde yeni donanım girişimlerine yönelmesi, rekabeti daha da görünür hale getiriyor. Bu tablo, Ternus’u klasik akıllı telefon konseptini aşan, tamamen yeni bir cihaz geliştirme zorunluluğuyla karşı karşıya bırakıyor. Sektörde beklentiler, yalnızca katlanabilir bir iPhone’un ötesine geçen, kullanıcı alışkanlıklarını yeniden tanımlayacak radikal bir ürün üzerinde yoğunlaşıyor.

3- İş gücünde yeniden yapılanma

Teknoloji devlerinde görülen yeniden yapılanma dalgasına paralel olarak, Ternus’un Apple içinde de kapsamlı bir organizasyon değişikliğine gitmesi bekleniyor. Amazon, Meta ve Oracle gibi şirketlerin uyguladığı iş gücü azaltma politikalarına benzer şekilde, Apple’ın da 160 binden fazla çalışanı arasında özellikle geleneksel departmanlarda küçülmeye gidebileceği değerlendiriliyor. Bu tür bir yeniden yapılandırmanın, kaynakların yapay zekâ ve büyüme odaklı alanlara kaydırılması amacı taşıdığı ve yatırımcılar tarafından kârlılığı artıracak bir adım olarak görüldüğü ifade ediliyor.

4- Apple TV+ için stratejik karar aşaması

Apple TV+, 2019’dan bu yana içerik üretimine yaklaşık 30 milyar dolar yatırım yaptı. Buna rağmen platformun, büyük ses getiren yapımlar üretme konusunda sınırlı başarı elde ettiği değerlendiriliyor. Yeni yönetimin önündeki kritik soru ise net: Apple, Netflix ve Amazon ile rekabet etmek için büyük içerik satın almaları ve agresif büyüme stratejileri mi izleyecek, yoksa bu alandan kademeli olarak çekilerek maliyetleri mi azaltacak?

5- ‘Üst yönetim mutfağının’ yeniden kurulması

Ternus’un, göreve gelmesinin ardından kendi yönetim ekibini oluşturması bekleniyor. Apple’da CEO değişiklikleri genellikle üst düzey departman başkanlıklarında da zincirleme değişimleri beraberinde getiriyor. Yatırımcılar, yeni ekipte genç, yenilikçi ve özellikle yazılım ile yapay zekâ odaklı isimlerin öne çıkmasını bekliyor. Bu beklenti, şirketin uzun yıllardır sürdürdüğü donanım ve tasarım merkezli yaklaşımın yerini daha teknoloji ve algoritma ağırlıklı bir stratejiye bırakacağı yönündeki öngörülerle de örtüşüyor.

6- Beyaz Saray diplomasisi

Tim Cook, Washington’daki siyasi dalgalanmalarla başa çıkma konusunda güçlü bir diplomasi geliştirmiş ve Donald Trump ile yakın ilişkiler kurarak Apple’ı gümrük vergileri gibi risklerden korumayı başarmıştı. Ancak Ternus için bu alanda benzer bir deneyim bulunmuyor. Bu nedenle yeni CEO’nun, ABD yönetimiyle hızlı şekilde doğrudan ilişkiler kurarak şirketin küresel tedarik zincirlerini etkileyebilecek siyasi riskleri en aza indirmesi gerektiği ifade ediliyor.

frbfgrb
ABD Başkanı Donald Trump, geçtiğimiz ağustos ayında Beyaz Saray’da Tim Cook ile tokalaşıyor. (AFP)

7- ‘Omaha’nın bilge yatırımcılarının’ güvenini kazanmak

Berkshire Hathaway, yaklaşık 62 milyar dolarlık payıyla Apple’ın en büyük hissedarı konumunda bulunuyor. Şirketin yönetiminde Warren Buffett’ın ardından Greg Abel’in öne çıkmasıyla birlikte, yeni dönemde Ternus’un bu yatırım çevresiyle güçlü bir ilişki kurması kritik görülüyor. Analistlere göre bu ilişki, Apple hisselerinin kriz dönemlerinde tarihsel olarak sahip olduğu istikrarın korunması açısından önemli bir unsur olacak. Yatırımcı güveninin sürdürülebilmesi için Ternus’un hem finansal çevrelerle hem de şirketin uzun vadeli stratejik ortaklarıyla uyumlu bir iletişim geliştirmesi gerektiği ifade ediliyor.

Sonuç olarak Ternus, yalnızca bir donanım mühendisi olarak yükselen bir isim değil; aynı zamanda yoğun bir teknolojik dönüşüm sürecinde küresel ölçekte dev bir şirketi yönetecek lider konumunda bulunuyor. Başarısı, Apple’ın tasarım geleneğini yazılım ve yapay zekâ devrimiyle birleştirme kapasitesine bağlı görülürken, piyasanın bu dönüşüm için fazla zaman tanımayacağı değerlendiriliyor.