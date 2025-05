OpenAI ha pubblicato un report sui modelli di intelligenza artificiale o3 e o4-mini, evidenziando un incremento generale delle allucinazioni. Questo fenomeno, noto agli esperti del settore, rappresenta una delle sfide più complesse. Le allucinazioni si manifestano attraverso risposte credibili ma inventate, e rimangono un problema irrisolto nonostante i progressi tecnologici. Secondo OpenAI, il modello o3 ha mostrato allucinazioni nel 33% dei casi nel test PersonQA e nel 51% nel test SimpleQA. Il modello o4-mini ha registrato tassi ancora più preoccupanti, con il 41% in PersonQA e il 79% in SimpleQA. GPT-4.5, un aggiornamento di ChatGPT, ha migliorato la situazione, mostrando allucinazioni nel 37,1% dei casi in SimpleQA.

Le allucinazioni derivano dal funzionamento dei modelli linguistici, i quali non ragionano come gli esseri umani, ma generano la sequenza di parole più probabile basata sui dati di addestramento. Quando non hanno informazioni solide, producono risposte errate. Le cause principali includono set di dati incompleti e problematiche nei meccanismi di addestramento. Le aziende si trovano di fronte a queste sfide, poiché le allucinazioni ostacolano l’adozione delle tecnologie in settori sensibili come medicina e diritto. Alcune strategie per contenere il problema includono insegnare ai modelli a riconoscere l’incertezza, permettendo l’accesso a documenti esterni e migliorando l’addestramento con dati di qualità. Nonostante i progressi, le allucinazioni rimangono un limite significativo per i chatbot AI, con la necessità continua di soluzioni affidabili per rafforzare la fiducia degli utenti.