Yapay zekâ sohbet botlarının “insan gibi” konuşma becerisinin kaynağı netleşti. Statista’nın haziran ayında yayımladığı verilere göre ChatGPT ve benzeri dil modelleri, eğitim sürecinde en çok Reddit içeriklerinden besleniyor. Araştırmada Reddit’in, yapay zekâların referans aldığı kaynaklar arasında yüzde 40,1 ile ilk sırada yer aldığı belirtildi.

Yapay Zeka-7

FORUMLARDAN ÖĞRENİYOR

Yani yapay zekalar ansiklopedilerden, akademik verilerden ya da resmi raporlardan çok, insanların birbirine laf soktuğu tartışma forumlarından öğreniyor. Bu da demek oluyor ki yapay zekalar artık doğrudan forum tartışmalarıyla eğitiliyor. Ekşi Sözlük benzeri bu bilgi havuzunda mizah, öfke ve öznel yorumlar daha ön planda. Bir anlamda yapay zeka modelleri biraz Reddit forumu, biraz da Ekşi Sözlük yazarı karışımı bir karaktere sahip.

BAŞKA NERELERDEN ÖĞRENİYOR?

Verilere göre Reddit’in ardından ikinci sırada yüzde yüzde 26,3 ile Wikipedia, üçüncü sıradaysa YouTube ( yüzde 23,5) yer aldı. Ardından Google (yüzde 23,2), Yelp (yüzde 21), Facebook (yüzde 19,9) ve Amazon (yüzde 18,7) geliyor.

Bu arada Reuters’a göre, Google, 2024 yılında Reddit’le veri paylaşımı anlaşması yaptı ve bu veriler için yıllık 60 milyon dolar ödemeyi kabul etti. Aynı yıl OpenAI de ChatGPT’yi beslemek için Reddit ile benzer bir anlaşmaya imza attı.

Kaynak: HABER MERKEZİ