OpenAI, Google’ın yılın en büyük etkinliğine (Google I/O) yaklaşan haftalarda dikkatleri Google’dan uzaklaştırmayı başardı. Büyük duyuru oraya ulaştığında göstermeleri gereken tek şey, Alfa test aşamasında bile “sihirli” kısmı olan öncekinden biraz daha iyi bir dil modeliydi.
OpenAI, kullanıcıların Anneler Günü için elektrikli süpürge alan bir anne gibi hissetmesine neden olmuş olabilir, ancak Google’ın önemli etkinliğine basının ilgisini en aza indirmeyi kesinlikle başardı.
O Harfi
En azından biraz trolling yapıldığına dair ilk ipucu, yeni GPT modelinin adıdır; Google’ın etkinliğinin adı olan I/O’da olduğu gibi 4 “o” ve “o” harfi.
OpenAI, O harfinin Omni anlamına geldiğini söylüyor, bu da her şey anlamına geliyor, ancak bu seçimin kesinlikle bir alt metni varmış gibi görünüyor.
GPT-4o Sihir Gibi Aşırı Satışta
Cuma günü ona “sihir” gibi gelen “yeni şeyler” vaat ediyordu:
“gpt-5 değil, bir arama motoru değil, ancak insanların seveceğini düşündüğümüz bazı yeni şeyler üzerinde yoğun bir şekilde çalışıyoruz! bana sihir gibi geliyor.”
OpenAI kurucu ortağı Greg Brockman tweet attı:
“Metin, ses ve videoyu gerçek zamanlı olarak değerlendirebilen yeni modelimiz GPT-4o ile tanışın.
Son derece çok yönlüdür, oynaması eğlencelidir ve insan-bilgisayar etkileşiminin (ve hatta insan-bilgisayar-bilgisayar etkileşiminin) çok daha doğal bir biçimine doğru atılmış bir adımdır:”
Duyuruda, ChatGPT’nin önceki sürümlerinin ses girişini işlemek için üç model kullandığı açıklandı. Ses girişini metne dönüştüren bir model. Görevi tamamlamak ve bunun metin versiyonunu çıkarmak için başka bir model ve metin çıktısını sese dönüştürmek için üçüncü bir model. GPT-4o’nun çığır açan özelliği, artık ses giriş ve çıkışını tek bir modelde işleyebilmesi ve bir insanın dinlemesi ve bir soruyu yanıtlaması ile aynı sürede tüm bunları çıkarabilmesidir.
Ancak sorun şu ki ses kısmı henüz çevrimiçi değil. Hala korkulukları çalışır hale getirmek için çalışıyorlar ve Alfa sürümünün test için birkaç kullanıcıya yayınlanması haftalar alacak. Alfa sürümlerinin muhtemelen hatalara sahip olması beklenirken, Beta sürümleri genellikle nihai ürünlere daha yakındır.
OpenAI hayal kırıklığı yaratan gecikmeyi şu şekilde açıkladı:
“GPT-4o’nun ses yöntemlerinin çeşitli yeni riskler sunduğunun farkındayız. Bugün, metin ve resim girdilerini ve metin çıktılarını kamuya açıklıyoruz. Önümüzdeki haftalar ve aylarda teknik altyapı, eğitim sonrası kullanılabilirlik ve diğer yöntemlerin piyasaya sürülmesi için gerekli güvenlik üzerinde çalışacağız.
GPT-4o’nun en önemli kısmı olan ses girişi ve çıkışı tamamlandı ancak güvenlik seviyesi henüz halka açıklanmaya hazır değil.
Bazı Kullanıcılar Hayal Kırıklığına Uğradı
Eksik ve aşırı satılan bir ürünün sosyal medyada olumsuz bir algı yaratması kaçınılmazdır.
Yapay zeka mühendisi Maziyar Panahi (LinkedIn profili) tweet attı yaşadığı hayal kırıklığı:
“Yeni GPT-4o’yu (Omni) ChatGPT’de test ediyorum. Etkilenmedim! Azıcık bile değil! Daha hızlı, daha ucuz, çok modlu, bunlar bana göre değil.
Kod yorumlayıcısı, umurumda olan tek şey bu ve eskisi kadar tembel!”
… ile:
“Yeni kurulan şirketler ve işletmeler için daha ucuz, daha hızlı, ses vb. özelliklerin çok çekici olduğunu anlıyorum. Ancak yalnızca Sohbet’i kullanıyorum ve orada da hemen hemen aynı hissi veriyor. En azından Veri Analitiği asistanı için.
Ayrıca, 20 dolarım karşılığında daha fazla bir şey alacağıma inanmıyorum. Bugün değil!”
Facebook ve X’te benzer duyguları ifade eden başka kişiler de var, ancak diğer pek çok kişi de API kullanımında hız ve maliyette bir iyileşme olduğunu düşündüklerinden memnundu.
OpenAI GPT-4o’yu Aşırı Sattı mı?
GPT-4o’nun tamamlanmamış bir durumda olduğu göz önüne alındığında, sürümün Google I/O’ya denk gelecek ve onu olumsuz etkileyecek şekilde zamanlandığı izlenimini kaçırmamak zor. Google’ın büyük gününün arifesinde yarı mamul bir ürünle piyasaya sürülmesi, yanlışlıkla GPT-4o’nun mevcut durumda küçük, yinelenen bir gelişme olduğu izlenimini yaratmış olabilir.
Mevcut durumda bu ileriye doğru devrim niteliğinde bir adım değil ancak modelin ses kısmı Alfa test aşamasından çıkıp Beta test aşamasını geçtiğinde, büyük dil modelinde devrimler hakkında konuşmaya başlayabiliriz. Ancak bu gerçekleşene kadar Google ve Anthropic o dağa çoktan bir bayrak dikmiş olabilir.
OpenAI’nin duyurusu, performansı GPT-4 Turbo ile aynı seviyede teşvik ederek yeni modelin cansız bir imajını çiziyor. Tek parlak nokta, İngilizce dışındaki dillerde ve API kullanıcılarına yönelik önemli gelişmelerdir.
OpenAI açıklıyor:
- “İngilizce ve koddaki metinlerde GPT-4 Turbo performansıyla eşleşiyor, İngilizce dışındaki dillerdeki metinlerde önemli bir iyileşme sağlıyor ve aynı zamanda API’de çok daha hızlı ve %50 daha ucuz.”
Burada, GPT-4o’nun çoğu testte GPT-4T’yi zorlukla geçebildiğini ancak okuduğunu anlama açısından önemli bir kıyaslamada GPT-4T’nin gerisinde kaldığını gösteren altı kıyaslamadaki derecelendirmeler yer alıyor.
İşte puanlar:
- MMLU (Devasa Çok Görevli Dil Anlama)
Bu, matematik, fen bilimleri, tarih ve hukuk gibi elliden fazla konuda çoklu görev doğruluğu ve problem çözme açısından bir ölçüttür. GPT-4o (puan 88,7), GPT4 Turbo’nun (86,9) biraz ilerisindedir. - GPQA (Lisansüstü Düzeyde Google Kanıtı Soru-Cevap Karşılaştırması)
Bu, biyoloji, kimya ve fizik gibi çeşitli alanlardaki uzmanlar tarafından yazılan 448 çoktan seçmeli sorudur. GPT-4o 53,6 puan alarak GPT-4T’yi (48,0) biraz geride bıraktı. - Matematik
GPT 4o (76,6), GPT-4T’yi dört puan (72,6) geride bırakıyor. - İnsan Değerlendirmesi
Bu kodlama kriteridir. GPT-4o (90,2), GPT-4T’den (87,1) yaklaşık üç puan biraz daha iyi performans gösteriyor. - MGSM (Çok Dilli İlkokul Matematik Karşılaştırması)
Bu, LLM ilkokul düzeyindeki matematik becerilerini on farklı dilde test eder. GPT-4o, GPT-4T için 88,5’e karşılık 90,5 puan alıyor. - DROP (Paragraflar Üzerinde Ayrık Muhakeme)
Bu, paragrafların içeriği üzerinden dil modelinin anlaşılmasını test eden 96 bin sorudan oluşan bir kıyaslamadır. GPT-4o (83,4), GPT-4T’den (86,0) neredeyse üç puan daha düşük puan alıyor.
OpenAI GPT-4o ile Google’ı Trolledi mi?
Kışkırtıcı bir şekilde o harfiyle adlandırılan model göz önüne alındığında, OpenAI’nin Google’ın önemli I/O konferansı öncesinde medyanın dikkatini çalmaya çalıştığını düşünmemek zor. Niyet bu olsa da olmasa da OpenAI, Google’ın yaklaşan arama konferansına verilen ilgiyi en aza indirmede çılgınca başarılı oldu.
Önceki modelden çok az daha iyi performans gösteren bir dil modeli, aldığı tüm heyecana ve medyanın ilgisine değer mi? Bekleyen duyuru, Google’ın büyük etkinliğiyle ilgili haberlerin hakimiyetindeydi, bu nedenle OpenAI için cevap açıkça evet, bu heyecana değdi.
0 Yorumlar