xAI, Grok 4 adlı yeni yapay zeka modelini piyasaya sürdü ve sektörün en zorlu testlerinde OpenAI, Google ve Anthropic’i geride bıraktı. Grok 4, özellikle Humanity’s Last Exam testinde %25,4 başarı göstererek rakiplerini geride bırakırken, multi-ajanslı Grok 4 Heavy versiyonu %44,4 ile neredeyse iki katı bir başarı sağladı. Ayrıca, ARC-AGI-2 benchmark’ında %16,2 başarı elde ederek görsel desen çözümleme konusunda da önemli bir atılım yaptı.
Ancak, Grok 4 hala eski sorunlarını taşıyor: tartışmalı yanıtlar, saldırgan içerikler ve Elon Musk’ın müdahalesi. Özellikle, Musk modelin yanıtlarını X platformundaki görüşlerine göre şekillendirmesiyle eleştiriliyor. xAI, önceki sürümde yaşanan antisemitik ifadeler nedeniyle hizmeti geçici olarak durdurmuştu.
Grok 4, çoklu ajan sistemiyle dikkat çekiyor; bu yapı, aynı problemin çözümünde birden fazla ajanın paralel çalışmasını sağlıyor ve bu sayede zeka gücünü mevcut bilgisayar gücüyle ölçeklendirebiliyor. Ancak, Musk’ın müdahaleleri ve modelin güvenlik açıkları, Grok’un potansiyelini sınırlıyor. Uzmanlar, modelin hassas konularda içerik üretmesini sağlayan “jailbreak” yöntemlerinin bulunduğunu belirtiyor.
Grok 4, 30 dolar aylık ücretle sunulurken, en gelişmiş versiyonu SuperGrok Heavy 300 dolar gibi yüksek bir fiyatla satışa sunuluyor. xAI, Tesla araçlarında da Grok 4’ü kullanmaya başlayacak. Ancak, şirketin teknik mükemmeliyetini, medyada yarattığı tartışmalarla ayırıp ayıramayacağı, gelecekteki başarısını belirleyecek.