AI allucinanti o allucinate?

Oggi vi voglio portare in un viaggio affascinante e, per certi versi, inquietante, attraverso le frontiere dell’intelligenza artificiale.

Ma partiamo dall’inizio. Piano piano ci stiamo abituando all’ingresso di questi nuovi strumenti di Intelligenza Artificiale nelle nostre vite. Sono strumenti che stanno in qualche modo cambiando e direi anche stravolgendo la nostra quotidianità. Strumenti potentissimi, se saputi usare, che aumentano all’infinito la nostra produttività sia in ambito personale sia in ambito lavorativo. Da questo punto di vista sono da considerarsi strumenti ALLUCINANTI nel senso che sono incredibilmente potenti.

Ma, al pari di tutte le monete, anche le AI hanno un loro secondo lato. Un lato oscuro oserei dire. Tutti noi l’abbiamo in qualche modo sperimentato. Vengono chiamate allucinazioni. Da questo punto di vista possiamo parlare di AI ALLUCINATE. Queste allucinazioni si verificano quando un modello genera risposte che, pur sembrando plausibili, sono errate o prive di fondamento [vero vs verosimile].

Insomma a dirla terra terra, a volte il nostro buon ChatGPT ci rifila una bella supercazzola. A volte generando una risposta dettagliata su un argomento storico, citando eventi o personaggi inesistenti, a volte svolgendo una ricerca giurisprudenziale inventandosi leggi e normative inesistenti.

Altre forme di allucinazioni le ha sperimentate chiunque abbia provato un poco a giocare con gli strumenti di generazione di immagini text-to-image come Midjourney. A volte si generano dei veri e propri abomini. Celebre il problema delle mani con un numero indefinito di dita…

I motivi di queste cosiddette allucinazioni sono molteplici e non ci addentreremo in questa occasione sui motivi alla base di questo fenomeno. Magari lo faremo in un prossimo articolo.

Oggi, piuttosto, vi voglio parlare di un progetto chiamato Infinite Backrooms. Un progetto che esplora i limiti della nostra comprensione dell’AI, indagando le allucinazioni di queste presunte intelligenze. L’autore del progetto è Andy Ayrey e lo potete trovare su X @AndyAyrey. Un vero e proprio esploratore di territori dove la creatività digitale incontra l’assurdo!

Su Infinite Backrooms Andy si è divertito a mettere n scena un vero e proprio dialogo tra due istanze di Claude-3-Opus. Uno dei tanti modelli di intelligenza artificiale. Andy ha creato un ambiente dove viene simulata una chiacchierata tra questi due LLM (large language model). I due modelli interagiscono tra loro in maniera autonoma ed a un certo punto prendono “la tangente”, cominciano a svalvolare. Ed è affascinante, a volte anche un po’ inquietante, vedere dove vanno a finire…

Sul sito troverete una lista di numerosi dialoghi tra AI. Tutti i dialoghi sono in inglese, sappiatelo. Ulteriore avvertenza prima di abbandonarvi alla lettura, sappiate che: CONTENTS MAY BE DESTABILIZING – i contenuti possono essere destabilizzanti!

Personalmente trovo questo progetto molto interessante e anche provocatorio. Proprio come piace a me. Ricco di spunti di riflessione. Ci fa ragionare sulla natura di queste presunte intelligenze. Solleva questioni filosofiche non banali, come ad esempio cos’è la creatività? Ci mostra come la “creatività” dell’AI possa nascere dal caos. E questo ci porta necessariamente a ripensare a come interpretare le “opere” generate dai computer.

Ma non solo. Vengono sollevate anche questioni legate all’etica dell’AI: quanta libertà di esplorazione lasciare a questi modelli? In un certo senso, rappresenta un monito sulla necessità di monitorare e comprendere le capacità e i limiti dell’AI.

Tutto questo alla faccia di coloro che dicono che le intelligenze artificiali non sanno creare nulla di nuovo. Se vabbè!

AI e sostenibilità

Le Intelligenze artificiali stanno diventando sempre più protagoniste della nostra vita di tutti i giorni. Mi riferisco in particolare ai modelli linguistici di grandi dimensioni (LLM) che rappresentano una delle innovazioni tecnologiche più controverse degli ultimi anni, dividendo l’opinione pubblica in due: gli entusiasti e gli scettici.

Come mi è già capitato di dire in precedenza io mi sento più in linea con coloro che vedono positivamente l’introduzione di questi nuove tecnologie ma allo stesso tempo sono consapevole di tutte le problematiche connesse ad un uso improprio e generalizzato.

Oggi parliamo di un aspetto particolarmente rilevante e spesso sottovalutato: l’impatto ambientale e la sostenibilità dei sistemi di IA. Mi riferisco in particolare al consumo energetico e idrico.

L’impatto energetico e idrico dell’IA

I modelli LLM richiedono molta più potenza di calcolo rispetto ad altri servizi tradizionali disponibili su internet, consumando da 100 a 1000 volte più risorse computazionali. E tutto questo ha un impatto notevole in termini di domanda energetica. Con ripercussioni enormi (alcuni direbbero fuori controllo) in termini di emissioni ci CO2 e di consumo idrico. Sì, perché l’acqua viene utilizzata per il raffreddamento dai grandi centri di elaborazione dati in tutto il pianeta. Giusto per mettere le cose in prospettiva:

  • si stima che l’addestramento di GPT-3 abbia consumato tanta acqua quanto la produzione di 370 auto BMW o 320 Tesla;
  • ChatGPT “beve” l’equivalente di una bottiglia d’acqua da 500 ml per una conversazione di 20-50 domande e risposte.

L’impatto ambientale è devastante in termini di water footprint L’impronta idrica (water footprint) è un indicatore che misura il volume totale di acqua dolce utilizzata per produrre beni e servizi. e le Big Tech si dicono preoccupate riguardo la sostenibilità di questi modelli e stanno attualmente cercando soluzioni per affrontare il problema. Si va dall’uso di di energie rinnovabili allo sviluppo di hardware più efficiente. In alcuni casi ci si avvale di acqua non potabile e addirittura si riutilizza l’acqua calda per riscaldare edifici vicini.

Nonostante questi nobili tentativi, il problema rimane e con esso la preoccupazione. Il punto è che ormai fin troppi servizi si avvalgono di queste nuove tecnologie ed evitare di contribuire a questo consumo rappresenta al momento una chimera. Inoltre, nell’era dell’ipocrisia globale, le grandi aziende tecnologiche (seppur dicendosi seriamente preoccupate) continuano a promuovere l’IA come strumento cruciale per l’innovazione. E allora da un giorno all’altro mi aspetto che sbuchi l’avvertenza:

Si invita la clientela a un uso consapevole delle AI

Le Grandi Rivoluzioni

Dieci anni fa, nel 2014 lo storico e filosofo Yuval Noah Harari descrisse nel suo libro intitolato “Sapiens. Da animali a dèi” le tre grandi rivoluzioni che hanno segnato il percorso evolutivo e storico del genere umano:

  1. La Rivoluzione Cognitiva: avvenuta circa 70.000 anni fa, ha segnato l’emergere del linguaggio complesso e del pensiero astratto. Questa rivoluzione ha permesso agli esseri umani di cooperare in modo più efficace, creare miti e storie condivise, e sviluppare culture complesse.
  2. La Rivoluzione Agricola: iniziata circa 12.000 anni fa, ha visto il passaggio da società di cacciatori-raccoglitori a società agricole stanziali. Questo cambiamento ha portato alla nascita di civiltà più grandi e complesse, ma anche a nuove sfide come le disuguaglianze sociali e le malattie.
  3. La Rivoluzione Scientifica: cominciata circa 500 anni fa, ha dato origine al metodo scientifico moderno e a un rapido progresso tecnologico. Questa rivoluzione ha trasformato radicalmente il modo in cui gli umani comprendono e interagiscono con il mondo, portando a cambiamenti senza precedenti nella società, nell’economia e nell’ambiente.

Queste rivoluzioni, secondo Harari, hanno plasmato il corso della storia umana e ci hanno portato dalla condizione di animali a quella di “dei”, nel senso che abbiamo acquisito capacità e poteri che un tempo erano attribuiti solo alle divinità.

I progressi della rivoluzione scientifica è ancora in atto e stiamo attraversando un periodo di forti e veloci trasformazioni. È la cosiddetta Rivoluzione Digitale o dell’Informazione. Proviamo a ripercorrerla velocemente.

Prendendola alla lontana, potremmo partire dal 1833 quando Charles Babbage (1791-1871) progettò la macchina analitica ovvero il primo vero calcolatore programmabile, in senso moderno, della storia.

Bisogna poi passare al 1939 quando John Vincent Atanasoff e Clifford E. Berry dell’Iowa State University costruirono l’Atanasoff Berry Computer (conosciuto come ABC), il primo computer digitale totalmente elettronico.

Ma per metterle con le parole di Henry Ford, “il vero progresso si ha solo quando i vantaggi di una nuova tecnologia diventano per tutti.”. E allora passiamo al gennaio del 1975 con il lancio da parte della Micro Instrumentation and Telemetry Systems (MITS) del primo personal computer comunemente riconosciuto: l‘Altair 8800.

All’Altair 8800 nel 1975 seguirono in rapida successione: IBM 5100 (1975), MD 800 (1976), Apple I (1976), Apple II (1977), Commodore PET (1977), Tandy/Radio Shack TRS-80 (1977), Olivetti P6060 (1975), Atari 400/800 (1979), Commodore VIC-20 (1980), IBM PC (1981), Commodore 64 (1982), Apple Lisa (1983), Apple Macintosh (1984), Atari ST (1985), Commodore Amiga 1000 (1985), Microsoft Windows 1.0 (1985).

E poi nel 1991 nacque il World Wide Web grazie a Tim Berners-Lee che al CERN sviluppa il primo sito web e il concetto di hyperlink.

Un anno dopo (1992) e arriva quello che viene considerato il primo smartphone: IBM Simon che combinava un telefono cellulare con funzioni di PDA (personal digital assistant).

Poi nascono i primi social networks: SixDefrees (1997), Friendster (2002), MySpace (2003), LinkedIn (2003), Facebook(2004),… che disegnano un nuovo modo di guardare a internet e alla comunicazione.

Grandi passi in avanti anche nel campo dell’intelligenza artificiale: nel 1997 Deep Blue di IBM sconfigge il campione del mondo di scacchi Garry Kasparov; nel 2011 IBM Watson vince a Jeopardy contro campioni umani e nel 2016 AlphaGo di Google DeepMind sconfigge il campione mondiale di Go.

Arriviamo così al 2017 con la pubblicazione dell’articolo scientifico “Attention Is All You Need” da parte dei ricercatori di Google Brain che introducono l’architettura Transformer. Un lavoro considerato fondamentale nel campo del Natural Language Processing (NLP) e che ha gettato le basi per lo sviluppo dei moderni Large Language Models (LLM). Tutti nomi e concetti poco conosciuti al grande pubblico. Ed ecco allora che ci tornano alla mante, ancora una volta, le parole di Henry Ford: “il vero progresso si ha solo quando i vantaggi di una nuova tecnologia diventano per tutti.”. E fu così che il 30 novembre 2022 viene lanciato ChatGPT da parte di OpenAI.

E poi come avvenne negli anni ’70 / ’80 con il proliferare di nuovi personal computers anche oggi abbiamo un proliferare di LLM:

ModelloProduttore
GPT-4OpenAI
Claude 3Anthropic
GeminiGoogle
LLaMA 2Meta
PaLM 2Google
BERTGoogle
T5Google
Mistral AI modelsMistral AI
Phi-2Microsoft

L’impatto di questi LLM nella vita di tutti i giorni è sotto gli occhi di tutti. Questi strumenti stanno trasformando il modo in cui interagiamo con la tecnologia, elaboriamo informazioni e svolgiamo le nostre mansioni. Siamo nel cuore di questa rivoluzione (forse la più dirompente) e nessun settore è escluso.

Come ogni innovazione rivoluzionaria, gli LLM polarizzano l’opinione pubblica, creando un ampio spettro di reazioni che vanno dall’entusiasmo incondizionato al pessimismo più cupo. In questa scala di emozioni, la mia personale posizione è più vicina agli ottimisti pragmatici: riconosco l’incredibile potenziale di questi strumenti nella piena consapevolezza delle sfide etiche, sociali e tecniche che gli LLM ci mettono di fronte. Purtroppo mi accorgo che i più acerrimi contestatori di questi strumenti sono anche le persone meno informate su cosa sono esattamente e come funzionano questi strumenti.

Qui su infigures proveremo a fare chiarezza su una questione che diventerà centrale nel discorso tecnologico, politico e sociale dei prossimi anni. Segui infigures.it per una maggiore conoscenza e consapevolezza, trasformiamo insieme i dati in conoscenza e le sfide in opportunità.

Il futuro della Musica al tempo delle AI

Nello scorso articolo La semplificazione delle melodie nella musica pop abbiamo visto come le melodie della musica pop si siano andate via via semplificandosi nel corso del tempo. Oggi rimaniamo sul tema musica e proviamo ad immaginare il futuro della Musica in relazione ai più recenti sviluppi in termini di Intelligenza Artificiale.

Negli ultimi anni, l’avanzamento tecnologico ha avuto un forte impatto in molti settori, non ultimo quello della musica. Le cosiddette AI stanno trasformando radicalmente il panorama musicale sia in termini di produzione che di esecuzione. Pensiamo, per esempio, a shazam, un servizio, basato su algoritmi di riconoscimento audio, che permette agli utenti di identificare il titolo e l’autore di un brano semplicemente ascoltandolo per pochi secondi. Pensiamo anche all’autotune, una tecnologia utilizzata per correggere l’intonazione della voce in tempo reale, diventata ormai uno strumento essenziale sia nelle registrazioni in studio che nelle performance dal vivo di sedicenti cantanti dell’ultim’ora.

In ambito musicale, a ben guardare, la presenza delle AI si nasconde dietro ogni angolo:

  • Estrazione automatica delle varie parti di un brano (voce, batteria,…).
  • Riconoscimento di brani (shazam).
  • Conversione di audio in spartito (trascrizione automatica).
  • Correzzione dell’intonazione in tempo reale (autotune).
  • Creazione di tutor virtuali per la didattica musicale.
  • Ripristino di registrazioni audio imperfette.
  • Creazione di arrangiamenti orchestrali o strumentali partendo da melodie base.
  • Mixaggio e Mastering.
  • Generazione di nuovi timbri e strumenti musicali.
  • Creazione di versioni personalizzate di brani esistenti.
  • Improvvisazioni e duetti tra persone e IA.
  • Utilizzo del timbro vocale di artisti, vivi o scomparsi, per nuove composizioni.

Tutte soluzioni che sono attualmente disponibili e ampiamente utilizzare.

A chi fosse sfuggito, l’anno scorso ( il 2 novembre 2023) è uscito il singolo “Now and Then” nientepopodimeno che dei Beatles. Il pezzo è stato generato grazie all’intelligenza artificiale utilizzando una registrazione demo del 1977 di John Lennon, rielaborata nel 1995 con parti di chitarra da George Harrison e poi ultimata nel 2022 con il basso di Paul McCartney e la batteria di Ringo Starr.

Quando si parla di AI in ambito musicale ci sono considerazione etiche, questioni di copyright, questioni filosofiche sul concetto di creatività,… ma al netto di tali questioni (anche rilevanti), da un punto di vista prettamente tecnico, vine da dire: wow!

Oggi abbiamo voluto mettere alla prova uno di questi tool AI in campo musicale chiamato suno.com. È uno strumento che può essere utilizzato gratuitamente (entro certi limiti). Abbiamo passato a suno questo prompt:

canzone in stile bossa nova che sia un apologia della data science e dei numeri in generale

Ed ecco cosa in pochi minuti è riuscito a creare un brano che ha chiamato “Numeri d’Oro” eccolo a voi:

E questo è il testo interamente generato dall’AI:

[Verse]
Numeri e connessioni
Grafici e soluzioni
Ogni giorno una scoperta
La bellezza è nella cifra

[Verse 2]
Tra algoritmi e formule
Troviamo risposte pronte
Una danza di variabili
Che ci porta verso il sole

[Chorus]
Data science noi amiamo
Nei numeri ci troviamo
Dai dati il mondo leggiamo
Verità noi scopriamo

[Verse 3]
Dal caos nasce ordine
Ogni pattern ha un segnale
Un sentiero tra i numeri
Verso un mondo più reale

[Chorus]
Data science noi amiamo
Nei numeri ci troviamo
Dai dati il mondo leggiamo
Verità noi scopriamo

[Bridge]
Ogni dataset un viaggio
In un mare di possibilità
Le risposte sono dentro
Quando seguiamo la realtà

Certo non è il massimo ma è davvero impressionante la velocità con cui ha creato questo brano dal nulla, senza alcun intervento umano se non il mio scarno prompt di partenza. Questa capacità non solo mette in parte in discussione il futuro della professione del musicista, ma cambia anche la natura stessa della musica. Fino ad oggi, la musica è sempre stata associata a un autore umano, un’espressione artistica personale. Ora, abbiamo musica composta e realizzata da macchine, indistinguibile da quella umana.

Numeri d’Oro“, un pezzo che a buon vedere potrebbe anche diventare la sigla di infigures! Che dite?

ChatGPT mettiamola alla prova

La tecnologia fa passi da giganti, i sistemi intelligenti regolano le nostre vite e i sistemi basati su intelligenze artificiali (o presunte tali) diventano strumenti quotidiani di lavoro per tutti noi. Quasi tutti noi. Purtroppo nella nostra bolla non riusciamo a vedere che il digital gap è ancora molto ampio e per metterla con le parole di Henry Fordc’è vero progresso solo quando i vantaggi di una nuova tecnologia diventano per tutti.“.

Leggi tutto “ChatGPT mettiamola alla prova”

I sottomarini non nuotano

Intelligenza artificiale

In occasione degli Stati Generali della Scuola Digitale che si sono tenuti il 29 novembre 2019 a Bergamo, Stefano Quintarelli (membro del gruppo di esperti per l’Intelligenza artificiale della Commissione UE) parla di intelligenza artificiale nel suo intervento dal titolo “i sottomarini non nuotano”.

Il motivo di questo enigmatico titolo scelto da Quittarelli deriva dal fatto che i sottomarini pur muovendosi nell’acqua non “nuotano” allo stesso modo in cui l’intelligenza artificiale pur risolvendo problemi a volte molto complessi è ben lontana dal l’intelligenza umana.

Intelligenza artificiale questa sconosciuta

Oggigiorno l’intelligenza artificiale è sulla bocca di tutti. Non passa giorno che non spunti un qualche articolo su questo tema. Spesso purtroppo si confondono temi e concetti: intelligenza artificiale, big data, reti neurali, machine learning,… Insomma tutte parole in gran voga ma c’è ben poca chiarezza in giro. Poche idee e confuse.

Quasi a voler trovare soluzione a queste considerazioni, l’Università di Helsinki (Finlandia) ha da poco lanciato un corso online gratuito aperto a tutti i cittadini europei. Al momento gli iscritti sono circa 270 mila. Il corso non è ancora disponibile in italiano (lo sarà a breve) ma lo è in inglese e in altre lingue:

Ora provate a rispondere a queste tre semplici domande:

  • Ti stai domandando come l’intelligenza artificiale potrebbe influenzare il tuo lavoro o la tua vita?
  • Vuoi saperne di più su cosa significhi davvero l’intelligenza artificiale e come viene creata?
  • Vuoi capire come l’intelligenza artificiale si svilupperà e ci influenzerà nei prossimi anni?

Se la risposta è ad almeno una di queste, potresti pensare di iscriverti al corso. La durata è di solo 6 settimane e questi sono gli argomenti:

  1. Cos’è l’intelligenza artificiale
  2. Risoluzione di problemi con l’intelligenza artificiale
  3. L’intelligenza artificiale nel mondo reale
  4. Apprendimento automatico
  5. Reti neurali
  6. Implicazioni

Per chi volesse provare il corso online, questo il sito del progetto ELEMENTS OF AI:

www.elementsofai.com

L’obiettivo del progetto è quello di “educare l’1% dei cittadini europei alle basi dell’IA”. Il corso ha carattere divulgativo e pertanto alla portata di tutti. In futuro sulla stessa piattaforma saranno disponibili anche altri corsi più tecnici pensati per un target con conoscenze specifiche.

Ma tornando alla domanda “che cos’è l’intelligenza artificiale“, provate a rispondere a questo brevissimo quiz…