Yapay zeka araçlarının günümüzde pek çok şeyi başarabildiğini hepimiz biliyoruz. Peki internette arama yapmak için bu araçlar ne kadar iyi?
Önemli bir soru ve çok sayıda sonuç doğuruyor. Zira TechRadar yayıncısı Future'ın araştırmasına göre, ABD'li katılımcıların yaklaşık üçte biri artık Google gibi geleneksel arama motorları yerine yapay zekayı kullandığını söylüyor.
Bazı insanlar ChatGPT ve diğer chatbotlara yöneliyor. Bazıları ise Perplexity gibi araştırma ve inceleme için özel olarak tasarlanmış yapay zeka araçlarını kullanıyor. Yapay zeka araçlarını aktif olarak seçmesek bile, yapay zeka yine de aramalarımızda karşımıza çıkıyor; tıpkı artık arama sonuçlarının en üstünde görünen küçük Google özetleri gibi.
Kısacası, yapay zeka destekli arama her yerde. Ama asıl soru şu: Gerçekten iyi mi? Araştırmacıların merak etmeye başladığı konu da bu ve ilk değerlendirmelerin pek de etkileyici olmadığını söyleyebiliriz.
ChatGPT yeni Google mı? O kadar hızlı değil...
İnsanlar araştırma yapmak için yapay zeka araçlarını kullanabilirler. Ama bu, bunu yapmaları gerektiği anlamına gelmiyor.
Son testlerimizde, aramayı ne kadar iyi idare ettiklerini görmek için en iyi dört yapay zeka sohbet robotunu birbirleriyle karşılaştırdık: OpenAI'dan ChatGPT, Google'dan Gemini, Anthropic'ten Claude ve Perplexity AI.
Sonuçlar… karışıktı. Tam bir felaket değildi; hepsi ilgili bazı bilgileri almayı başardılar; ancak doğruluk oranı çok iyi değildi. Peki bu bilgiyi nasıl özetlediler? Bunlar çoğu zaman kafa karıştırıcıdır veya yardımcı olmaz.
Bu sonuçlar, Tow Dijital Gazetecilik Merkezi tarafından yürütülen daha kapsamlı testleri destekliyor; rapor edildiği üzere Columbia Gazetecilik İncelemesi. Ekipleri, ChatGPT, Perplexity, Copilot, Grok ve Gemini dahil olmak üzere sekiz büyük yapay zeka modelini test etti ve tekrar eden sorunlar buldu: "yanlış bilgilerin kendinden emin bir şekilde sunulması, paylaşılan içeriğin yanıltıcı şekilde atıflanması ve tutarsız bilgi alma uygulamaları." Aman Tanrım.
Genel olarak yapay zeka modelleri soruların %60'ından fazlasına yanlış yanıt verdi. Perplexity en doğru sonuçtu (bu, bir araştırma aracı olarak pazarlanmasıyla tutarlıydı), ancak yine de cevapların %37'sinde yanlış cevap verdi. Grok, %94'lük şaşırtıcı bir başarısızlık oranıyla en kötü performansı gösterdi. Yorum yok.
Tao Merkezi sonuçları tamamen doğru ile tamamen yanlış (ya da hiç cevap yok) arasında bir ölçekte değerlendirdi. En kötü örneklerden bazıları, yapay zekanın basitçe... bir şeyler uydurduğu, düpedüz halüsinasyonlardır. Ancak cevaplar tamamen yanlış olmasa bile, araçların haberleri ve arama sonuçlarını yeniden doldurma biçiminde hâlâ büyük sorunlar vardı.
Kaynağı olmayan araştırma, araştırma değildir.
Temel sorun, bilgiyi bu şekilde yeniden çerçevelemekte yatıyor. Yapay zeka teknolojileri yanlış bilgi sağlamasa bile, içeriği yine de yararsız ve çoğu zaman yanıltıcı şekillerde özetliyor ve yeniden şekillendiriyor. Tao Merkezi'nin açıkladığı gibi:
"Geleneksel arama motorları genellikle aracı görevi görerek kullanıcıları haber sitelerine ve yüksek kaliteli içeriklere yönlendirirken, üretken arama araçları bilgileri kendileri analiz edip yeniden paketleyerek orijinal kaynaklara giden trafiği keser."
"Bu botların sohbet çıktıları genellikle bilgi kalitesiyle ilgili ciddi temel sorunları gizler. Bu sistemlerin haber içeriğine nasıl eriştiğini, bunları nasıl görüntülediğini ve alıntıladığını değerlendirmek için acil bir ihtiyaç vardır."
En belirgin sorunlardan biri, yapay zeka araçlarının kaynaklarını ne kadar kötü bir şekilde gösterdiğidir. Örneğin, ChatGPT sıklıkla yanlış makaleye bağlantı veriyor, sizi web sitesinin ana sayfasına gönderiyor veya alıntıları tamamen atlıyor.
Bu sorunun iki temel nedeni var. Birincisi, yayıncılar içerikleri kullanılıyor olsa bile trafik kaybediyorlar.
İkincisi, gerçekleri kontrol etmek zorlaşıyor. Yapay zeka sonuçlarını doğrulamanın tek yollarından biri orijinal kaynağa başvurmaktır; bu kaynak sağlanmadığında ise bu daha da zorlaşır.
Peki, yapay zeka size net bir kaynağı olmayan bilgiler sağlıyorsa, özellikle de her şeyi Google üzerinden kontrol ediyorsanız, bunu araştırma için kullanmaya değer mi? Belki de hayır.
Evet, yapay zeka araçları sürekli gelişiyor. Ve evet, Perplexity gibi bazıları diğerlerinden daha iyi performans gösteriyor. Ama en iyilerin bile hâlâ insan gözetimine ihtiyacı vardır. Şu anda araştırma aşamasında robotların otonom olarak çalışmaya hazır olmadığı görülüyor.