Le conclusioni dell’articolo su Phi-4 mi avevano lasciato di sasso. Come era possibile che un modello come Phi-4 Reasoning Plus, che dispone della bellezza di 14.7 miliardi di parametri a 4 bit e che è stato addestrato su problemi di tipo scientifico ed in particolare di matematica, potesse aver fallito così miseramente?
Chi mi conosce sa che uso gli LLM (Large Language Models, ovvero modelli linguistici di grandi dimensioni) per quello in cui servono davvero, ma sono scettico, anzi molto scettico, sul fatto che siano davvero intelligenti o che possano risolvere qualunque problema, come ci ripetono tutti i giorni quelli di OpenAI, di Microsoft, di Google o di Meta. I quali, guarda caso, sugli LLM hanno investito (o buttato, vedete voi) una quantità indegna di dollari e hanno tutto l’interesse a spingere chiunque ad usarli in modo parossistico.
– Immagine generata dall’IA di Microsoft Designer.
Undici anni fa, quando ho iniziato a scrivere in questo spazio personale, non avrei mai pensato di rimanere per tutto questo tempo su WordPress.com, una piattaforma di blogging comoda ed affidabile, che però è sempre stata poco adatta al mio modo di lavorare. Con il tempo ho imparato a convivere con questi limiti, ma l’idea di cambiare non mi ha mai abbandonato.
– Fonte: Henrique S. Ruzzon su Unsplash.
Mentre scrivevo il post precedente mi sono imbattuto in questo articolo del 14 marzo 2022, The Bird Process In Mac OS X, che si trovava ai primissimi posti dei risultati di Google.
Non leggetelo, è soltanto un cumulo di sciocchezze e di figure senza senso. Con il senno di poi avrei dovuto capirlo già dal titolo – chi usa ancora “Mac OS X” nel 2022? – e dalla mezza immagine di Flappy Bird, ma sono stato ingenuo e ci ho messo un po’ ad accorgermi che c’era qualcosa che non andava.
– Fonte: Afrah su Unsplash.
I sistemi di intelligenza artificiale moderni vengono addestrati con enormi quantità di dati, perché l’idea di fondo è che più dati ci sono, meglio è. Esempio tipico è ChatGPT, a cui è stato fatto leggere e digerire praticamente tutto lo scibile umano, o almeno tutto lo scibile umano presente su internet. Ma, nonostante questa montagna di conoscenza, ChatGPT non capisce quello che legge, e nelle sue risposte mette solo in fila una parola dopo l’altra, calcolando la probabilità che una nuova parola segua quella che ha appena generato.1
– Fonte: Donald Giannatti su Unsplash.
Chiunque ne sappia un po’ di queste faccende lo aveva capito da tempo: i modelli linguistici di grandi dimensioni (Large Language Models, LLM), come GPT-3/4 di OpenAI, da cui deriva la stella del momento ChatGPT, o come LLaMA di Facebook, Alpaca di Stanford e compagnia bella, non hanno un futuro, sono troppo complicati, avidi di risorse e costosi per essere sostenibili a lungo termine.
Esiste un modo per aggirare il blocco a ChatGPT deciso del Garante per la privacy ancora più semplice del metodo descritto nell’ultimo post, che ci permette di continuare ad usare il nostro solito browser senza dover trafficare con Opera, VPN e compagnia bella (grazie Paoloo per la segnalazione!).
Dobbiamo solo andare sul sito di Poe.com,
Si può commentare una cretinata? Come la decisione del Garante per la privacy, che ha bandito ChatGPT dal territorio nazionale, aprendo contestualmente la solita “istruttoria” che finirà, come sempre, in una gigantesca bolla di sapone?
Secondo il Garante, ChatGPT mette i nostri dati personali a rischio, cosa in parte condivisibile, ma dov’era il Garante negli ultimi 10 anni quando Google, Facebook, Microsoft e compagnia bella hanno fatto strame impunemente dei nostri dati personali?
Negli ultimi mesi ChatGPT ha riempito le pagine dei giornali e del web, oscurando quello che è stato per mesi uno dei giocattoli preferiti dei nerd di tutto il mondo, la generazione di immagini tramite intelligenza artificiale.
Abbiamo giocato per mesi con DALL-E, con Crayon o con StableDiffusion, strumenti che funzionano online o che richiedono l’uso della linea di comando o l’esecuzione del codice sorgente originale.
Ho colto al volo l’occasione dell’anniversario della presentazione dell’iPad per far scrivere a ChatGPT un post sull’argomento. Io mi sono limitato a qualche notarella tecnica e a un breve commento finale.
Domanda: Scrivi un post per un blog in tono tecnico sul recente anniversario della presentazione dell’iPad.