Un studiu important dezvăluie că multe evaluări ale AI supralicitează adevăratele sale capacități.
Un studiu recent, realizat de Institutul Internetului de la Oxford în colaborare cu peste treizeci de instituții, a examinat 445 de benchmark-uri utilizate pentru evaluarea inteligenței artificiale (AI). Acesta evidențiază o problemă importantă: multe dintre testele existente nu