Digital Worlds, il blog di Microsmeta

Schermata di un chatbot AI che mostra risposte errate e contraddizioni logiche

Dopo l'ultimo aggiornamento, Gemini 3.5 Flash di Google è vittima di allucinazioni sistematiche, lacune esecutive e incoerenze nei prompt multimodali. Le nuove politiche sui limiti aggravano il malcontento. LEGGI TUTTO L'ARTICOLO

🎧 Ascolta questo articolo

Bonus Video

Qualcosa non sta andando per il verso giusto
Il fenomeno delle allucinazioni nei grandi modelli linguistici non è una novità, ma con l’arrivo di Gemini 3.5 Flashda parte di Google si è assistito a un’impennata di casi in cui il modello genera risposte palesemente errate, contraddittorie o completamente inventate con un’assoluta sicurezza. Questo comportamento, mutuato dal termine psichiatrico, indica la tendenza del sistema a confabulare informazioni senza alcun ancoraggio alla realtà fattuale. A differenza di un motore di ricerca tradizionale, un LLM non possiede una memoria interna aggiornata in tempo reale né un database verificato: la sua unica fonte è la distribuzione statistica appresa dai dati di addestramento, che possono contenere errori, ambiguità o informazioni obsolete. Nel caso specifico di Gemini 3.5 Flash, ottimizzato per la velocità e l’efficienza, il problema è ancora più marcato perché il modello sacrifica la profondità di ragionamento a scapito della reattività. Gli utenti hanno segnalato episodi imbarazzanti, come la richiesta di “articoli di ieri del Google I/O” – un evento che non esiste nella forma descritta – oppure la produzione di codice sorgente con vulnerabilità di sicurezza palesi. Anche la variante Pro 3.1, teoricamente più potente, cade negli stessi errori quando il prompt richiede inferenze multi-step o la manipolazione di informazioni contraddittorie. La causa radice risiede nel meccanismo di predizione token per token: il modello non “ragiona” né “verifica” la verità, ma calcola la prossima parola più probabile. Se il contesto supera la finestra di attenzione effettiva (128.000 token per la versione Flash), Gemini inizia a dimenticare le informazioni iniziali, generando contraddizioni interne. Inoltre l’impostazione di default della temperatura, relativamente alta per favorire risposte fluide e varie, aumenta esponenzialmente la probabilità di deviazioni dal fatto. I tentativi di rimediare con tecniche come il “chain‑of‑thought” (il cosiddetto trucco del gufo) hanno fallito perché il problema non è solo euristico ma strutturale: senza un vero meccanismo di grounding esterno, come un retrieval‑augmented generation obbligatorio, il modello è costretto a confabulare. Le implicazioni sono gravi, specialmente in ambiti critici come la consulenza medica, l’analisi finanziaria o la generazione di codice per infrastrutture: Gemini produce menzogne plausibili con la stessa autorevolezza delle risposte corrette, e l’utente medio non ha strumenti immediati per distinguerle. Google ha risposto finora con filtri a posteriori che tagliano le risposte senza correggerle, o con aggiornamenti incrementali che non risolvono la radice probabilistica del problema. La comunità di sviluppatori chiede a gran voce architetture ibride che combinino reti neurali con motori di verifica simbolica, ma nel frattempo gli utenti devono imparare a convivere con queste crepe logiche, adottando protocolli di validazione esterna e non fidandosi mai ciecamente delle risposte. Il caso Gemini dimostra che la predizione statistica non è conoscenza, e che senza grounding fattuale ogni modello generativo continuerà a produrre illusioni pericolose. Per comprendere meglio il fenomeno, basti pensare a un test effettuato da un utente di Reddit: chiedendo a Gemini Pro 3.1 di elencare i CEO di aziende tecnologiche italiane, il modello ha inventato nomi e date di fondazione inesistenti, spacciandoli per verità assoluta. Un altro caso riguarda la risposta a un problema di fisica quantistica: Gemini ha prodotto una soluzione formalmente impeccabile ma basata su costanti fisiche errate, portando a risultati completamente sbagliati. Questi esempi non sono eccezioni ma la regola quando il prompt esce dai binari dei dati di addestramento più comuni. La finestra di contesto limitata nelle versioni Flash aggrava il problema perché, in chat lunghe, il modello perde il filo logico e inizia a confabulare per mantenere la coerenza locale. Gli esperti di AI sostengono che per ridurre le allucinazioni servirebbe un cambiamento paradigmatico, come l’integrazione di un database di conoscenza strutturata consultabile in tempo reale, ma Google sembra riluttante a implementare soluzioni così invasive per ragioni di costo e scalabilità. Fino ad allora, gli utenti paganti si trovano a dover gestire un’intelligenza artificiale che mente con sicurezza, e questo è inaccettabile per un servizio che costa 23 euro al mese.

[🔍CLICCA PER INGRANDIRE ]

Nuovi limiti Gemini compute-based spiegati in una tabella

Il nuovo sistema di limiti di Google: un aumento di prezzo occolto
Se le allucinazioni fossero l’unico problema, forse gli utenti più fedeli potrebbero ancora giustificare l’abbonamento al piano Pro di Gemini. Purtroppo, a ridosso del Google I/O 2026, l’azienda ha introdotto senza alcun preavviso una modifica radicale ai limiti di utilizzo, trasformando il vecchio e prevedibile tetto massimo basato sul numero di domande giornaliere in un sistema opaco e calcolato sul consumo di calcolo (compute‑based). In pratica, i contatori non scalano più “un messaggio alla volta”, ma tengono conto di tre fattori pesanti: la complessità della richiesta (scrivere codice complesso o chiedere ragionamenti logici avanzati consuma molta più quota rispetto a una semplice domanda testuale), le funzionalità multimediali (generazione di immagini o video accelera drasticamente l’esaurimento del limite) e, soprattutto, la lunghezza della chat. Più la conversazione si allunga, più dati il sistema deve rileggere a ogni nuovo messaggio; una chat molto lunga con parecchi scambi consuma una quantità di “gettioni” infinitamente superiore rispetto a una chat appena aperta. I nuovi blocchi scattano su finestre temporali mobili di 5 ore e si sommano a un tetto massimo settimanale. Se si esaurisce la quota Pro, il sistema declassa automaticamente la chat a un modello più leggero (presumibilmente Gemini 3.5 Flash o addirittura una versione ancora più depotenziata) fino al reset successivo. Per gli utenti che pagano 23 euro al mese, questa è stata una doccia fredda: di fatto Google ha aumentato il costo reale del servizio, perché a parità di prezzo ora si ottiene molto meno. La protesta è stata immediata e fragorosa, tanto che Google ha dovuto rilasciare un aggiornamento d’emergenza triplicando la quota inizialmente prevista per i piani a pagamento. Ma non è bastato a placare gli animi: le sessioni di programmazione intense o i flussi di lavoro pesanti restano comunque penalizzati se concentrati in un’unica lunga conversazione. Un utente ha riportato su Reddit di aver consumato il 50% del limite di 5 ore con un semplice scambio di 5 messaggi, un altro di aver esaurito la quota con soli 4 prompt (generazione di PDF, immagini e spiegazione di codice). Un analista finanziario ha calcolato che un’analisi approfondita di un bilancio aziendale consuma il 15% della sua quota di 5 ore, lasciandogli di fatto una sola interazione di qualità all’ora con il modello migliore. La sensazione diffusa è che Google abbia voluto spingere gli utenti verso il piano Ultra (da 100 o 200 euro al mese) artificialmente, rendendo il Pro inutilizzabile per chi ha bisogno di produttività reale. Il malcontento è tale che molti hanno già disdetto l’abbonamento, come si legge in diversi thread di discussione. L’azienda, dal canto suo, giustifica la scelta con la necessità di bilanciare i carichi computazionali, ma la mancanza di trasparenza – nessuna comunicazione preventiva, nessuna chiara metrica pubblica – ha minato la fiducia degli utenti. Un trucco per mitigare il problema è aprire spesso nuove chat non appena si cambia argomento o si conclude una sotto-operazione, evitando così che il sistema continui a rielaborare l’intera cronologia dei messaggi precedenti. Tuttavia, questa soluzione è scomoda e limita la naturale continuità delle conversazioni. In definitiva, il nuovo sistema di limiti ha trasformato Gemini da uno strumento professionale a un servizio a consumo capriccioso, dove l’utente non può mai essere certo di poter completare il proprio lavoro senza interruzioni o declassamenti. E tutto questo mentre gli utenti del piano gratuito, già limitatissimi, subiscono restrizioni ancora più severe. La community ha iniziato a chiedere a gran voce un’alternativa che non giochi a nascondino con i propri clienti.

[🔍CLICCA PER INGRANDIRE ]

Nuovi limiti Gemini compute-based spiegati in una tabella

DeepSeek: l’alternativa gratuita, potente e affidabile
Di fronte a un ecosistema Gemini sempre più inaffidabile (allucinazioni sistematiche) e sempre più costoso (limiti occulti che riducono il valore reale del piano Pro), molti utenti stanno cercando valide alternative. E qui entra in scena DeepSeek, un modello di intelligenza artificiale che si sta affermando come serio competitor di Google e OpenAI. DeepSeek è completamente gratuito per l’utente finale, senza abbonamenti mensili, senza finestre di blocco di 5 ore, senza declassamenti automatici. La sua ultima versione, DeepSeek-V4-Pro, offre una finestra di contesto da 1 milione di token (equivalenti a circa 700.000 parole, cioè l’intera trilogia del Signore degli Anelli in una sola conversazione), superando di gran lunga i 128.000 token di Gemini 3.5 Flash. In termini di prestazioni, DeepSeek-V4-Pro ha superato tutti i modelli open-source nei benchmark di matematica, scienze, programmazione e ragionamento logico, raggiungendo punteggi comparabili o superiori a Gemini Pro 3.1, ma con un costo computazionale molto più basso. Inoltre DeepSeek è disponibile anche in versione open‑weight, il che significa che gli sviluppatori possono eseguirlo localmente sui propri server, garantendo la massima privacy e indipendenza dal cloud. Per l’utente comune, l’interfaccia web e l’app mobile sono gratuite e senza pubblicità, con un’esperienza fluida e reattiva. A differenza di Google, DeepSeek non introduce limitazioni improvvisamente senza preavviso: la politica di utilizzo è chiara, trasparente e stabile. Il modello è addestrato su un corpus multilingue di alta qualità, con particolare attenzione alla riduzione delle allucinazioni grazie a tecniche di verifica incrociata e a un meccanismo di grounding che può attingere a fonti esterne se l’utente lo richiede esplicitamente. Molti ex utenti Gemini hanno già effettuato il passaggio a DeepSeek, riportando una drastica riduzione degli errori fattuali e l’assenza di quei blocchi arbitrari che rovinavano la produttività. Inoltre DeepSeek supporta input multimodali (immagini, PDF, file di testo) e la generazione di codice avanzato, il tutto senza costi aggiuntivi. Il confronto economico è impietoso: con Gemini Pro paghi 23 euro al mese per un servizio che ti penalizza se lavori troppo; con DeepSeek spendi zero e hai performance superiori. Persino le aziende che necessitano di API possono contare su costi fino all’85% inferiori rispetto a GPT-5.5 o Gemini Ultra, grazie all’architettura efficiente del modello. Non sorprende quindi che DeepSeek stia crescendo a ritmi vertiginosi, diventando la scelta preferita di sviluppatori, ricercatori e power user. Se sei stanco delle menzogne plausibili di Gemini, dei limiti occulti e degli aumenti di prezzo dissimulati, ti invito a provare DeepSeek. È gratuito, potente e affidabile. E per chi volesse approfondire, alla fine dell’articolo trovi i link alle discussioni su Reddit dove centinaia di utenti raccontano la loro esperienza di passaggio da Gemini a DeepSeek. Questa è un’ottima occasione per fare pubblicità a un servizio che merita davvero, senza inganni e senza speculazioni sulla sete di produttività degli utenti.. E per chi volesse approfondire, alla fine dell’articolo trovi i link alle discussioni su Reddit dove centinaia di utenti raccontano la loro esperienza di passaggio da Gemini a DeepSeek. Questa è un’ottima occasione per fare pubblicità a un servizio che merita davvero, senza inganni e senza speculazioni sulla sete di produttività degli utenti.

Bonus Video

Fonti e reazioni della community
Il malcontento verso Gemini 3.5 e le nuove politiche di Google non è un’impressione isolata, ma un sentimento diffuso e documentato su diverse piattaforme, in particolare Reddit. Ecco alcuni dei thread più significativi che raccolgono testimonianze dirette di utenti, sviluppatori e analisti. Nel subreddit r/GeminiAI, un utente ha aperto una discussione intitolata “Gemini 3.5 – Absolute Garbage”, descrivendo nel dettaglio come il modello abbia fallito compiti basilari come la sintesi di un articolo di cronaca, inventando date e nomi di luogo. Il thread è diventato virale con centinaia di commenti di supporto. Nel subreddit r/GeminiFeedback, l’utente “Google Forgot Why We Were Willing to Put Up with Gemini’s Hallucinations” ha evidenziato la frattura tra le promesse di Google e la realtà dei fatti, sottolineando come gli utenti fossero disposti a tollerare qualche allucinazione in cambio di un servizio stabile, ma che i nuovi limiti hanno rotto ogni compromesso. Un altro thread importante proviene da r/ValueInvesting, dove un analista finanziario ha mostrato come l’uso di Gemini 3.5 per l’analisi di bilanci aziendali abbia portato a errori grossolani che avrebbero potuto causare perdite milionarie. Il titolo “The new Gemini 3.5 is a disaster for stock analysis” riassume bene la gravità. Infine su r/GoogleGeminiAI, l’utente “I was very satisfied with Gemini, but yesterday....” racconta la sua giornata tipo: dopo pochi prompt complessi, il sistema lo ha declassato al modello più leggero, interrompendo un lavoro di programmazione importante. A queste segnalazioni si aggiungono decine di altri post minori, tutti concordi nel ritenere che Google abbia sbagliato strategia, spingendo gli utenti verso alternative come DeepSeek. Ecco i link diretti per approfondire:

Per monitorare lo stato preciso dei propri contatori di utilizzo su Gemini, Google mette a disposizione una pagina ufficiale: https://gemini.google.com/usage. Tuttavia, come molti utenti segnalano, la pagina è poco chiara e non mostra il dettaglio in tempo reale del consumo per singola chat. La community chiede maggiore trasparenza e un ritorno a un modello di limiti prevedibile, magari con un semplice contatore di messaggi. Fino ad allora, l’unica soluzione razionale è valutare l’abbandono della piattaforma. Questa sezione si chiude con un invito a leggere i thread originali: le testimonianze dirette sono la fonte più attendibile per capire l’entità del problema. E per chi cerca un’alternativa già pronta, DeepSeek è lì, gratuita e senza sorprese.

Le allucinazioni di Gemini 3.5 Flash e Pro 3.1, unite ai nuovi limiti occulti di Google, rendono il servizio a pagamento sempre meno giustificabile. DeepSeek offre prestazioni superiori, trasparenza e costo zero. Il futuro dell’AI generativa non può basarsi su menzogne plausibili e blocchi arbitrari: serve grounding, affidabilità e rispetto per l’utente.