A Pasquetta è sempre brutto tempo?

Ogni anno, quando ci avviciniamo a Pasqua sorge sempre la stessa domanda: “che tempo farà a Pasquetta?” E via giù di meme, che la risposta la sappiamo tutti: a pasquetta piove. Sempre. Il lunedì di Pasquetta è la giornata consacrata al maltempo, punto. Fa parte integrante della tradizione pasquale.

Ma qui su infigures siamo abituati ad affrontare le cose in maniera diversa. Cosa dicono davvero i dati? Quello di oggi è un post diverso dal solito. Più da nerd. Ho scritto un codice in R per verificare se davvero a Pasquetta piove sempre. Facciamo un po’ di web scraping sul sito ilmeteo.it. Per chi non lo sapesse, il web scraping è il processo di estrazione automatica di dati da pagine web. Bene, iniziamo.

Anzitutto le librerie necessarie per questo esercizio:

Mi creo un dataframe (lo chiamo per brevità df) con una colonna Anno contenente gli anni cui sono interessato (dal 2006 al 2023), una colonna Pasquetta contenente la data della pasqua +1. Easter è la funzione della libreria timeDate per il calcolo della pasqua a partire dall’anno.

Creo poi una colonna Mese con il nome del mese della pasquetta (mi servirà per poi fare lo scraping su ilmeteo.it, il Giorno del mese e una colonna Meteo inizializzata a NA e che in seguito conterrà la condizione meteo di quel giorno.

Viene ora la parte di web scraping. Di fatto un ciclo for e per ogni riga del dataframe

Ora che abbiamo il nostro bel df facciamo un minimo di pulizia sul testo (togliamo gli spazi in eccesso e mettiamo tutto in minuscolo).

Et voilà, questo è il risultato:

AnnoMeteo lunedì di Pasquetta- RM
2006pioggia debole
2007poco nuvoloso
2008temporale
2009pioggia e schiarite
2010nubi sparse
2011coperto
2012sereno
2013coperto
2014poco nuvoloso
2015poco nuvoloso
2016nubi sparse
2017poco nuvoloso
2018poco nuvoloso
2019pioggia e schiarite
2020nebbia al mattino
2021poco nuvoloso
2022sereno
2023poco nuvoloso

Oppure possiamo sintetizzare l’informazione con questa linea di codice:

Meteo n
poco nuvoloso 7
coperto 2
nubi sparse 2
pioggia e schiarite 2
sereno 2
nebbia al mattino 1
pioggia debole 1
temporale 1

Ohibò, solo due giornate con tempo sereno…

Dubbi, perplessità? Fatemi sapere. Ma questo è solo l’inizio per delle persone curiose. Ad esempio si può modificare il codice per vedere il meteo di Milano o di Napoli. Si può controllare il meteo una settimana prima e una settimana dopo la pasquetta per verificare se ci siano differenze significative. Oppure ancora si potrebbero calcolare altri indicatori come ad esempio la temperatura media.

Provate voi stessi, ho messo a disposizione il codice qui su COLAB.

La questione dell’ovetto Kinder

Sei un appassionato collezionista di ovetti Kinder? Ti sei mai chiesto quanti ovetti potresti dover acquistare prima di completare la collezione delle sorprese? In questo articolo, esploreremo la questione dal punto di vista probabilistico in modo da calcolare il numero medio di ovetti necessari per finire la collezione.

Le sorprese Kinder sono divise in collezioni, ognuna con il suo tema, si va dai Minions a Frozen. Ogni periodo dell’anno è caratterizzato dalla sua particolare collezione. Tuttavia, come tutti i bambini hanno imparato a scoprire a proprie spese, non tutti gli ovetti contengono una sorpresa della collezione: solo uno ogni tre! Bene, ora facciamo qualche conto supponendo di essere alla disperata ricerca di finire la collezione di Frozen.

La collezione di Frozen è composta da 8 personaggi. Anzitutto ci domandiamo: quanti ovetti mi aspetto di dover comprare per ottenere tutte e 8 le soprese della collezione di Frozen? Questo è il classico esempio del problema del collezionista. Tralasciando questioni troppo tecniche legate al calcolo delle probabilità, il numero medio di ovetti che ci si aspetta di dover comprare è calcolabile tramite questa semplice formula:


    \[  N = 3 * 8  * ( \frac{1}{1} + \frac{1}{2} + \frac{1}{3} + ... + \frac{1}{8} ) \approxeq 65\]

Chiaramente questo rappresenta solamente un numero medio, una sintesi estrema. In altre parole, non ho alcuna certezza di finire la collezione con 65 ovetti. Di fatto, ci saranno persone che finiscono la collezione con una decina di ovetti (non è il mio caso!) e altri che pur avendone comprati 100 non l’hanno ancora finita.

A ben vedere dunque, ogni persona finisce la collezione entro un certo numero di ovetti in base alla propria fortuna o sfortuna (agli statistici piace chiamarlo caso ma non sappiamo essere semplicemente questione di sfiga!).

Da un punto di vista probabilistico, ad ogni numero di ovetti comprati è possibile associare una probabilità di aver finito la collezione. Ad esempio è possibile calcolare la probabilità di finire la collezione avendo comprato esattamente 50 ovetti, oppure la probabilità di averne comprati esattamente 90. Calcolare la probabilità per ciascuno di questi valori vuol dire aver costruito quella che viene chiamata la curva di distribuzione della nostra variabile aleatoria. Per studiare questa distribuzione, abbiamo condotto una simulazione di 100mila casi e questi sono i risultati:

Clicca qui per allargare il grafico.

Ogni barra blu rappresenta la probabilità di finire la collezione avendo comprato un determinato numero di ovetti. La curva in arancione invece rappresenta la probabilità di completare la collezione entro un certo numero di ovetti (viene chiamata cumulata). Ad esempio la probabilità di finire la collezione entro 100 ovetti è di circa il 90%. In altre parole comprare 100 ovetti non mi mette al riparo da quel 10% di sfiga sempre lì pronto ad attendermi.

Per i più appassionati:
Se sei un appassionato collezionista di ovetti Kinder, condividi la tua esperienza nei commenti! Quanti ovetti hai dovuto acquistare per completare la tua collezione?

Per i più nerd:
Il grafico è stato costruito in R utilizzando le librerie ggplot2 e plotly. Se sei interessato ai dettagli tecnici e vuoi esplorare il codice dietro questa visualizzazione, non esitare a chiedere!