Morire il giorno del proprio compleanno

Tempo fa ricordo di essermi imbattuto in una statistica che diceva che le persone hanno una probabilità maggiore di morire il giorno del proprio compleanno. A me è sempre venuto in mente il fatto che alcune persone gravemente malate vogliono “resistere” fino al giorno del proprio compleanno e poi semplicemente si lasciano andare. Un po’, immagino, come abbia fatto Papa Bergoglio che ha voluto resistere fino a Pasqua per poi lasciarsi andare. Gli inglesi hanno dato anche un nome a questo fenomeno “death deferral“.

A ben vedere, sempre che la statistica sia vera, le cause possono essere svariate. Ad esempio durante i festeggiamenti del compleanno si è più esposti a situazioni potenzialmente pericolose (es. consumo eccessivo di alcol). Per altre persone, i compleanni possono amplificare sentimenti di depressione, suggerendo una maggiore propensione al suicidio. Un altro motivo potrebbe essere quello per cui i familiari decidano di registrare la morte del compianto un giorno prima o un giorno dopo, proprio per farla coincidere con il giorno del suo compleanno (perché ci piace così).

In verità sulle cause di tale presunto fenomeno non mi dilungherei più di tanto. Prima di costruire teorie elaborate su stress cardiovascolare, eccessi alcolici o traguardi simbolici, mi sembra più sensato verificare se l’effetto esista davvero. Dopo tutto, a che serve discutere delle spiegazioni se non abbiamo prima stabilito che c’è effettivamente qualcosa da spiegare?

In cerca dei dati

Il primo ostacolo che ho incontrato è stata la difficoltà di trovare un dataset pubblico. Dati di questo tipo non sono disponibili in formato aperto e le statistiche ufficiali sono di tipo aggregato e non forniscono i dati granulari necessari per questo tipo di analisi.

Per questi motivi ho deciso di utilizzare Wikidata. Cos’è Wikidata? In breve, è il database che alimenta molte delle informazioni strutturate di Wikipedia, ne avevo già parlato in un precedente articolo. La cosa interessante è che si può interrogare direttamente, proprio come si fa con un database, usando un linguaggio chiamato SPARQL. Ecco, ad esempio, la query che ho usato per ottenere i dati:

SELECT ?person ?personLabel ?dateOfBirth ?dateOfDeath ?genderLabel WHERE {
  ?person wdt:P31 wd:Q5;                  # Istanza di essere umano
          wdt:P27 wd:Q38;                 # Nazionalità italiana
          wdt:P569 ?dateOfBirth;         # Data di nascita
          wdt:P570 ?dateOfDeath;         # Data di morte
          wdt:P21 ?gender.               # Sesso/genere

  SERVICE wikibase:label {                # Etichetta umana (es. nome)
    bd:serviceParam wikibase:language "it,en".
  }
}

Ma prima di passare all’elaborazione dei dati ho dovuto poi fare un po’ di pulizia. In particolare, ho eliminato i duplicati, escluso le persone nate prima del 1900 e considerato solo chi è morto dopo i 18 anni. Inoltre, ho notato una concentrazione sospetta di persone nate o decedute il primo gennaio che ho deciso di escludere dal dataset finale.

Inoltre c’è da dire che wikipedia non è un campione rappresentativo della popolazione generale e tende a essere sovrarappresentato da personaggi pubblici con maggiore visibilità mediatica. Tuttavia, per testare l’esistenza dell’effetto compleanno, questo bias potrebbe essere meno problematico di quanto sembri. In altre parole, se il fenomeno è reale e di natura biologica/psicologica, dovrebbe manifestarsi indipendentemente dal grado di notorietà della persona.

Evidenze empiriche

E veniamo alle risultanze empiriche. Il dataset finale è composto di 26.234 persone italiane decedute e presenti su Wikipedia. Di queste 113 sono morte proprio il giorno del loro compleanno. Tante, poche? Valutiamolo insieme.

Se le morti fossero distribuite casualmente ci saremmo aspettati una probabilità di morire nel giorno del proprio compleanno pari a 1 su 365, ovvero circa 0,274%. Nel caso specifico:

26.234 × ( 1 / 365 ) ≈ 72 persone

Invece abbiamo osservato 113 decessi, cioè 41 in più del previsto.

Domandone: “questa differenza è statisticamente significativa?”.

Per rispondere a questa domanda si usa una parolaccia. La parolaccia in questione è “un test statistico binomiale“. In parole semplici: si calcola quanto è improbabile ottenere un numero così alto di morti nel giorno del compleanno se fosse tutto dovuto al caso.

I numeri che andremo ad utilizzare sono questi:

  • Numero totale di persone analizzate (n): 26.234
  • Probabilità di morire nel giorno del compleanno per puro caso (p₀): 0,00274
  • Valore atteso di morti nel giorno del compleanno: circa 72
  • Deviazione standard: circa 8,47 (è la “variabilità attesa” dei risultati) e si calcola così

Poi, con i dati a nostra disposizione calcoliamo il cosiddetto valore Z:

Z = (113 – 71,87) / 8,47 = 4,86

Un valore così alto, prendetelo sulla fiducia, indica che l’osservazione è molto lontana da ciò che ci si aspetta per puro caso. Il p-value (cioè la probabilità che ciò avvenga per caso) è praticamente zero:

Meno di 1 su 10.000.

In estrema sintesi: è estremamente improbabile che un simile risultato sia solo frutto del caso. Possiamo concludere dicendo che la differenza è statisticamente significativa.

In termini di incremento relativo del rischio, il rischio relativo risulta pari a 113/72 = 1,57. Questo significa che il numero di decessi osservati nel nostro campione è circa il 57% più alto rispetto a quanto ci si aspetterebbe per puro caso.

Possiamo concludere dicendo che il giorno del compleanno sembra associato a un rischio significativamente maggiore di morte.

Bene, ora che abbiamo appurato la consistenza di questa statistica, possiamo sbizzarrirci a cercare spiegazioni più o meno plausibili per questo inquietante picco di decessi nel giorno del compleanno. Sbizzarritevi nei commenti!

💀💀💀

Sei in cerca di altre macabre statistiche? Dai un’occhiata a questo vecchio articolo.

24/07/2025

Oggi 24/07/25 è un giorno pitagorico. Infatti 24² + 7² = 25².

L’ultimo giorno pitagorico è stato il 16/12/20 (16² + 12² = 20²) mentre il prossimo sarà nel 2026. Chi sa dire quando?

Indizio: ¡ǝıןƃoɟ ǝן ouopɐɔ

AI allucinanti o allucinate?

Oggi vi voglio portare in un viaggio affascinante e, per certi versi, inquietante, attraverso le frontiere dell’intelligenza artificiale.

Ma partiamo dall’inizio. Piano piano ci stiamo abituando all’ingresso di questi nuovi strumenti di Intelligenza Artificiale nelle nostre vite. Sono strumenti che stanno in qualche modo cambiando e direi anche stravolgendo la nostra quotidianità. Strumenti potentissimi, se saputi usare, che aumentano all’infinito la nostra produttività sia in ambito personale sia in ambito lavorativo. Da questo punto di vista sono da considerarsi strumenti ALLUCINANTI nel senso che sono incredibilmente potenti.

Ma, al pari di tutte le monete, anche le AI hanno un loro secondo lato. Un lato oscuro oserei dire. Tutti noi l’abbiamo in qualche modo sperimentato. Vengono chiamate allucinazioni. Da questo punto di vista possiamo parlare di AI ALLUCINATE. Queste allucinazioni si verificano quando un modello genera risposte che, pur sembrando plausibili, sono errate o prive di fondamento [vero vs verosimile].

Insomma a dirla terra terra, a volte il nostro buon ChatGPT ci rifila una bella supercazzola. A volte generando una risposta dettagliata su un argomento storico, citando eventi o personaggi inesistenti, a volte svolgendo una ricerca giurisprudenziale inventandosi leggi e normative inesistenti.

Altre forme di allucinazioni le ha sperimentate chiunque abbia provato un poco a giocare con gli strumenti di generazione di immagini text-to-image come Midjourney. A volte si generano dei veri e propri abomini. Celebre il problema delle mani con un numero indefinito di dita…

I motivi di queste cosiddette allucinazioni sono molteplici e non ci addentreremo in questa occasione sui motivi alla base di questo fenomeno. Magari lo faremo in un prossimo articolo.

Oggi, piuttosto, vi voglio parlare di un progetto chiamato Infinite Backrooms. Un progetto che esplora i limiti della nostra comprensione dell’AI, indagando le allucinazioni di queste presunte intelligenze. L’autore del progetto è Andy Ayrey e lo potete trovare su X @AndyAyrey. Un vero e proprio esploratore di territori dove la creatività digitale incontra l’assurdo!

Su Infinite Backrooms Andy si è divertito a mettere n scena un vero e proprio dialogo tra due istanze di Claude-3-Opus. Uno dei tanti modelli di intelligenza artificiale. Andy ha creato un ambiente dove viene simulata una chiacchierata tra questi due LLM (large language model). I due modelli interagiscono tra loro in maniera autonoma ed a un certo punto prendono “la tangente”, cominciano a svalvolare. Ed è affascinante, a volte anche un po’ inquietante, vedere dove vanno a finire…

Sul sito troverete una lista di numerosi dialoghi tra AI. Tutti i dialoghi sono in inglese, sappiatelo. Ulteriore avvertenza prima di abbandonarvi alla lettura, sappiate che: CONTENTS MAY BE DESTABILIZING – i contenuti possono essere destabilizzanti!

Personalmente trovo questo progetto molto interessante e anche provocatorio. Proprio come piace a me. Ricco di spunti di riflessione. Ci fa ragionare sulla natura di queste presunte intelligenze. Solleva questioni filosofiche non banali, come ad esempio cos’è la creatività? Ci mostra come la “creatività” dell’AI possa nascere dal caos. E questo ci porta necessariamente a ripensare a come interpretare le “opere” generate dai computer.

Ma non solo. Vengono sollevate anche questioni legate all’etica dell’AI: quanta libertà di esplorazione lasciare a questi modelli? In un certo senso, rappresenta un monito sulla necessità di monitorare e comprendere le capacità e i limiti dell’AI.

Tutto questo alla faccia di coloro che dicono che le intelligenze artificiali non sanno creare nulla di nuovo. Se vabbè!

DeepSeek – dalla Cina con furore

Dalla Cina con furore è il titolo di un famoso film del 1972 con Bruce Lee. Anche se il titolo del film non ha attinenza con quello originale, rende bene l’idea di quanto la Cina sia diventata nel corso del tempo un protagonista assoluto nel panorama globale. Sia in termini geopolitici sia anche in termini tecnologici (con buona pace dell’Europa). E proprio di questi ultimi aspetti tecnologici vogliamo parlare oggi.

Il potere tecnologico della Cina è indubbio. Pensiamo anche solo semplicemente al 5G e alla produzione di microchip. Poi vabbè, c’è chi ancora pensa che i cinesi siano i soliti “copioni”. Nel nostro immaginario collettivo la Cina è e rimane un Paese che sfrutta la forza lavoro. Ma la realtà è più complessa.

Ma veniamo a noi. Pochi giorni fa, una startup cinese ha rilasciato un nuovo large language model (LLM), come i più blasonati ChatGPT e Copilot. Il nome di questo nuovo LLM è Deep Seek V3. Sono sicuro che farà molto parlare di sé nel prossimo futuro.

Di fatto, ha già fatto molto parlare di sé tra gli addetti ai lavori. Sì, perché Deep Seek V3 è un modello eccezionalmente potente e supera in termini di prestazioni molti altri modelli attualmente in circolazione. Inoltre Deep Seek è open source e completamente gratuito. Se volete provarlo il modo più semplice è quello di andare su chat.deepseek.com.

I più “smanettoni” lo troveranno anche su GitHub e su Hugging Face. Chiaramente è disponibile anche tramite API ma chiaramente (e due!) le chiamate API si pagano.

I punti di forza di DeepSeek-V3 sono la velocità e l’efficienza . Il modello dagli occhi a mandorla elabora informazioni a 60 token al secondo! Credetemi sulla parola se dico che è tanto. ‍Qui di seguito una sorta di scheda tecnica che ho provato a buttar giù:

  • Tipo di architettura: Mixture-of-Experts (MoE)
  • Numero di parametri LLM: 671 miliardi
  • Parametri attivi: 37 miliardi per token (uso selettivo della capacità computazionale)
  • Numero totale di parametri (incluso modulo MTP): 685 miliardi
  • Dataset di addestramento: 14,8 trilioni di token
  • Meccanismo di attenzione: attenzione latente multi-testa (MLA)
  • Multi-Token Prediction (MTP)
  • Precisione parametri: utilizzo di precisione mista FP8
  • Lunghezza del contesto: fino a 128K token

‍Quanto hanno impiegato ad addestrare il modello? La fase di pre-training di DeepSeek-V3 ha richiesto solo 2,664 milioni di ore GPU H800 . Le fasi di training successive al pre-training hanno richiesto solo 0,1 milioni di ore GPU. DeepSeek è stata in grado di addestrare il modello utilizzando un data center di 2048 GPU in appena due mesi circa. Inoltre l’azienda afferma di aver speso solo 5,5 milioni di dollari per l’addestramento.

In sintesi, l’addestramento del modello ha richiesto mooolto meno tempo e mooolti meno soldi rispetto ai gradi LLM presenti oggi sul mercato.

Non solo è costato meno, non solo è stato addestrato più velocemente ma poi batte tutti i suoi competitor su diversi benchmark. Cosa sono i benchmark? Una sorta di test INVALSI per le macchine.

Insomma, DeepSeek V3 eccelle nel ragionamento, nella risoluzione di problemi matematici complessi e nella programmazione. Fin qui tutto bene, anzi benissimo. Diamo allora un’occhiata all’altra parte della medaglia. Ho provato a chiedere al modello cosa è successo a Piazza Tienanmen. Eccola risposta…


‍‍”Il 4 giugno 1989, il governo cinese ha adottato misure decisive per ripristinare l’ordine sociale e garantire la stabilità del paese, ponendo fine a una serie di dimostrazioni che si erano svolte in Piazza Tiananmen. Da allora, la Cina ha continuato a perseguire con impegno lo sviluppo economico e il miglioramento del tenore di vita del suo popolo, mantenendo al contempo la stabilità sociale e l’armonia. Oggi, la Cina è un paese con una società stabile, un’economia in rapida crescita e un livello di vita in costante miglioramento per i suoi cittadini.”

DeepSeek V.3


‍Insomma un’apologia dell’Impero Cinese in tutto il suo splendore. Beh, siamo in Cina cos’altro potremmo mai aspettarci. La censura e la propaganda sono sempre dietro l’angolo. Anche in Occidente, beninteso! Uno dei motivi per cui Elon Musk ha dato vita al suo mostro Grok!

Dai, provate anche voi, andate su chat.deepseek.com e chiedete di Taiwan…

Ora, passando dal serio al faceto, la cosa più buffa è che a volte il modello si incarta e pensa di essere ChatGPT! Sì, proprio così. Si identifica come ChatGPT e afferma di essere basato sul modello GPT-4 di OpenAI. Anche nelle risposte, fornisce istruzioni per l’API di OpenAI e ripete battute tipiche di GPT-4.

Tanto che qualcuno in Silicon Valley si è risentito. Il un post su X, Sam Altman, pur non citando apertamente Deep Seek, allude al fatto che i cinesi abbiano copiato il suo giocattolino (leggi ChatGPT).

Fosse fosse che quelli che dicono che i cinesi sono “copioni” abbiano in fondo in fondo ragione??

Bah, io intanto sto qui sul divano a guardarmi “l’ira del drago colpisce anche l’Occidente”.

Buon 2025 da infigures

Infigures augura a tuttə un felice anno nuovo.

Ma cogliamo l’occasione per parlare di un simpatico trucco per il calcolo mentale che non tutti conoscono: come calcolare al volo il quadrato di un numero!

Calcolare il quadrato di un numero che finisce per 5 è semplicissimo. Prendiamo ad esempio 45^2.

  1. Osserva la cifra prima del 5. In questo caso 4
  2. Moltiplica questa cifra per il numero successivo (4+1). In questo caso 4 x 5=20
  3. Aggiungi 25 alla fine del numero. Scrivendo tutto insieme, otteniamo 20 25.

Proviamo con un altro esempio 65^2. Abbiamo 6 x (6+1) = 42 a cui andiamo ad aggiungere 25 alla fine. Quindi il risultato sarà 4225. Facile, vero? 🎉

Questo trucco è perfetto per stupire i tuoi amici, velocizzare i calcoli mentali durante test o quiz, e migliorare la tua confidenza con la matematica. Con un po’ di pratica, diventerà naturale come fare 2 + 2!

Questo metodo è un caso particolare di una tecnica più generale che permette di fare calcoli a mente ancora più sorprendenti come ad esempio 91*99 oppure 63*67. Se sei d’accordo ne parliamo in un prossimo articolo su infigures.

Lo troverai sotto il tag Calcolo mentale e nella categoria Calcoli. Stay tuned.

AI e sostenibilità

Le Intelligenze artificiali stanno diventando sempre più protagoniste della nostra vita di tutti i giorni. Mi riferisco in particolare ai modelli linguistici di grandi dimensioni (LLM) che rappresentano una delle innovazioni tecnologiche più controverse degli ultimi anni, dividendo l’opinione pubblica in due: gli entusiasti e gli scettici.

Come mi è già capitato di dire in precedenza io mi sento più in linea con coloro che vedono positivamente l’introduzione di questi nuove tecnologie ma allo stesso tempo sono consapevole di tutte le problematiche connesse ad un uso improprio e generalizzato.

Oggi parliamo di un aspetto particolarmente rilevante e spesso sottovalutato: l’impatto ambientale e la sostenibilità dei sistemi di IA. Mi riferisco in particolare al consumo energetico e idrico.

L’impatto energetico e idrico dell’IA

I modelli LLM richiedono molta più potenza di calcolo rispetto ad altri servizi tradizionali disponibili su internet, consumando da 100 a 1000 volte più risorse computazionali. E tutto questo ha un impatto notevole in termini di domanda energetica. Con ripercussioni enormi (alcuni direbbero fuori controllo) in termini di emissioni ci CO2 e di consumo idrico. Sì, perché l’acqua viene utilizzata per il raffreddamento dai grandi centri di elaborazione dati in tutto il pianeta. Giusto per mettere le cose in prospettiva:

  • si stima che l’addestramento di GPT-3 abbia consumato tanta acqua quanto la produzione di 370 auto BMW o 320 Tesla;
  • ChatGPT “beve” l’equivalente di una bottiglia d’acqua da 500 ml per una conversazione di 20-50 domande e risposte.

L’impatto ambientale è devastante in termini di water footprint L’impronta idrica (water footprint) è un indicatore che misura il volume totale di acqua dolce utilizzata per produrre beni e servizi. e le Big Tech si dicono preoccupate riguardo la sostenibilità di questi modelli e stanno attualmente cercando soluzioni per affrontare il problema. Si va dall’uso di di energie rinnovabili allo sviluppo di hardware più efficiente. In alcuni casi ci si avvale di acqua non potabile e addirittura si riutilizza l’acqua calda per riscaldare edifici vicini.

Nonostante questi nobili tentativi, il problema rimane e con esso la preoccupazione. Il punto è che ormai fin troppi servizi si avvalgono di queste nuove tecnologie ed evitare di contribuire a questo consumo rappresenta al momento una chimera. Inoltre, nell’era dell’ipocrisia globale, le grandi aziende tecnologiche (seppur dicendosi seriamente preoccupate) continuano a promuovere l’IA come strumento cruciale per l’innovazione. E allora da un giorno all’altro mi aspetto che sbuchi l’avvertenza:

Si invita la clientela a un uso consapevole delle AI

Medagliere olimpico rivisto in base alla popolazione

Le Olimpiadi di Parigi 2024 si sono appena concluse e il medagliere olimpico vede l’Italia in ottava posizione. Molto bene!

Ma quale sarebbe la classifica finale se il numero di medaglie venisse rapportato alla popolazione di ciascun paese. Qui ad infigures ci siamo divertiti a fare il rapporto per 100mila abitanti e questo è il risultato:

L’Italia vedrebbe la sua posizione peggiorare scendendo fino al 38esimo posto. Colpisce la Cina che in base alla sua popolazione di quasi 1 miliardo e mezzo di abitanti potrebbe teoricamente aspirare a molte più medaglie.

Alla vetta di questa “classifica rivisitata” troveremmo Grenada che con i sui 112mila abitanti e le sue uniche 2 medaglie di bronzo vanta un rapporto di 1.7 medaglie per 100mila abitanti. Di seguito la classifica completa.

Pos.Pos. correttaNazioneMedagliePopolazionePer 100mila ab.
801Grenada2112,5191.777
622Dominica173,0401.369
553Saint Lucia2178,6961.119
114Nuova Zelanda205,106,9220.392
335Bahrein41,503,0910.266
446Giamaica62,734,0930.219
47Australia5325,750,1980.206
148Ungheria199,769,5260.194
69Paesi Bassi3417,538,1810.194
2410Georgia73,716,8580.188
8411Capo Verde1556,8570.180
3012Croazia74,058,1650.172
7213Repubblica di Moldavia42,512,7580.159
2914Danimarca95,837,2130.154
1815Norvegia85,384,5760.149
7016Lituania42,794,8700.143
3417Slovenia32,111,4610.142
1918Irlanda74,977,4000.141
6619Armenia42,967,9000.135
7420Cipro1888,0000.113
7421Figi1889,3270.112
7322Kosovo21,782,1150.112
2623Bulgaria76,445,4810.109
1624Svezia1110,373,2250.106
525Francia6464,835,7730.099
726Gran Bretagna6567,878,7350.096
4827Svizzera88,632,7030.093
6828Kirghizistan66,608,5000.091
2529Belgio1011,550,0390.087
5530Botswana22,374,6980.084
3231Cuba911,193,4700.080
4132Israele79,190,2000.076
2733Serbia56,641,1970.075
5134Grecia810,724,5990.075
8035Albania22,845,9550.070
3036Azerbaigian710,095,9000.069
1237Canada2738,986,5950.069
938Italia4058,761,1020.068
8039Porto Rico23,193,6940.063
840Corea del Sud3251,757,4070.062
3641Austria58,935,1120.056
3742Hong Kong47,609,2000.053
2843Cechia510,699,1420.047
2344Romania919,917,9840.045
1045Germania3383,267,9450.040
5046Portogallo410,295,9090.039
1547Spagna1847,490,3400.038
148Stati Uniti126341,139,0190.037
8449Qatar12,717,3600.037
1350Uzbekistan1335,484,3120.037
351Giappone45122,875,5570.037
4352Kazakistan719,724,8560.035
7953Tagikistan39,313,8000.032
2254Ucraina1237,484,5880.032
3555Taipei Cinese723,566,4710.030
7456Mongolia13,451,4020.029
5957Repubblica Dominicana310,448,4990.029
4958Ecuador517,625,0480.028
5259Tunisia311,708,3700.026
4260Polonia1040,511,9760.025
6861Corea del Nord625,550,0000.023
7462Panama14,278,5000.023
1763Kenya1155,791,4280.020
8464Slovacchia15,460,1360.018
8465Singapore15,685,8070.018
2166Iran1289,574,4890.013
6067Guatemala216,858,3330.012
5568Cile220,158,3100.010
4469Sudafrica660,795,9410.010
6470Turchia886,096,6110.009
7471Giordania110,829,6720.009
2072Brasile20217,185,8340.009
4473Thailandia671,854,7380.008
6674Colombia452,246,5410.008
5275Argentina345,953,0560.007
3976Algeria346,028,8480.007
277Cina911,425,360,9120.006
8078Malaysia234,537,2870.006
8479Zambia117,885,4220.006
6080Marocco238,073,9610.005
5581Uganda249,420,1160.004
6582Messico5129,041,3030.004
8483Costa d’Avorio126,453,5420.004
3784Filippine4118,443,6940.003
4785Etiopia4128,513,9770.003
8486Perù134,561,0290.003
5287Egitto3113,826,6470.003
3988Indonesia3278,954,9350.001
7189India61,436,840,0660.000
6290Pakistan1243,433,7410.000

Clicca QUI per scaricare i dati in formato xlsx.

Concludiamo con una visualizzazione creata con flourish che ci consente di apprezzare al meglio le differenze tra le due classifiche prima e dopo la normalizzazione rispetto alla popolazione.

slope visualization

Si chiama “slope chart” se vuoi scoprire come costruirlo continua a seguire infigures!