Intelligenza artificiale alla lavagna per le prove d’esame

Il mese di giugno è il mese delle prove d’esame, anche per gli studenti cinesi, che il 7 giugno hanno affrontato goakao, un test per l’ammissione all’università della durata di due giorni, considerato il più difficile e importante esame della vita.

Quest’anno insieme agli studenti ha partecipato anche AI-MATHS, un sistema di intelligenza artificiale sviluppato dalla Chengdu Zhunxingyunxue Technology, azienda cinese specializzata in nuove tecnologie. Ai-MATHS ha completato la prova di matematica che agli studenti umani richiede in media un paio d’ore in soli 22 minuti, con un punteggio di 105 su 150.

L’amministratore delegato di CZT, Lin Hui, ha spiegato che gli ingegneri hanno allenato Ai-MATHS per oltre due anni durante i quali gli hanno fornito informazioni di ogni tipo, gli hanno “insegnato” a rispondere a oltre 10.000 domande.

Il sistema ai non deve solo, però, saper fare i conti, ma deve essere in grado di risolvere problemi usando il ragionamento, per esempio il problema dei polli e dei conigli: in una gabbia ci sono polli e conigli. In totale gli animali hanno 44 teste e 124 zampe. Quanti sono i polli? E quanti i conigli? Per risolvere correttamente la prova occorre recuperare, dalle proprie conoscenze, un dato non esplicitato nel quesito: quante zampe ha un coniglio e quante un pollo…

AI-MATHS, un supercomputer formato da un cluster di 10 server, ha affrontato il test dopo gli studenti, in completa solitudine e scollegato da Internet.

«La prima difficoltà che il sistema si troverà ad affrontare è la comprensione del linguaggio naturale con cui sono formulate le domande», ha spiegato Lin Hui nei giorni prima dell’esame, «poi dovrà ragionare, capire che cosa gli si chiede e formulare una risposta.»
In realtà nell’ultima simulazione d’esame la macchina non era stata proprio da 10 e lode: aveva infatti totalizzato solo 93 punti su 150 contro i 106 che realizzano in media gli studenti in carne e ossa. Secondo Fu Hongguang, il responsabile dello sviluppo di AI-MATHS, il sistema ha avuto difficoltà a comprendere correttamente parole come “investimento” o “welfare”.

L’obiettivo dei ricercatori è quello di portare AI-MATHS a totalizzare 150 punti su 150 entro il 2020: «A quel punto potremo usarlo per la formulazione di nuovi modelli in medicina, epidemiologia o finanza» ha spiegato alla stampa Hui.

Fonte: