Numeri da piazza

Nuova manifestazione in piazza e nuovo giro di numeri. Sabato 14 dicembre 2019 si è svolta a piazza San Giovanni a Roma la manifestazione delle sardine. Oltre 100mila per gli organizzatori e 35mila per la questura. Siamo alle solite.

Proviamo ad attenerci ai fatti. La piazza di San Giovanni e zone limitrofe è di circa 39mila metri quadri. Fonte Google Maps (vedi foto).

Ora il punto dolente è: quante persone possono stazionare in un metro quadro? La figura qui sotto può aiutare a capire come stimare il numero.

Chiaramente le piazze non vengono mai riempite in maniera uniforme: ci saranno zone con un paio di persone al metro quadro e zone con una concentrazione maggiore. Il valore di 5 persone al metro quadro non rappresenta il limite massimo ma è comunque vicino alla soglia oltre la quale non è possibile andare. Detto questo, possiamo procedere con la “media del pollo”, lasciando al lettore il piacere di fare la propria valutazione:

Persone
al m2
Stima per una sup. di 39mila m2
139.000
278.000
3117.000
4156.000
5195.000
6234.000

Numeri alla mano e occhio alle immagini della piazza, la stima degli organizzatori (oltre 100mila persone) -tutto sommato- pare più verosimile di quella della questura (35mila).

Detto questo, oggigiorno per stabilire quante persone partecipano ad un determinato evento esistono sicuramente tecniche più sofisticate e accurate. Ad esempio modelli matematici (o se preferite di intelligenza artificiale) applicati su immagini da droni o telecamere posizionate nei punti di accesso. In alternativa, anche il conteggio degli accessi ai BTS (ripetitore di segnali radio) dei gestori telefonici o il numero di transiti presso le stazioni metro potrebbero dare indicazioni preziose riguardo al livello di partecipazione di un evento. Tutto questo però minerebbe alla base l’esilarante gioco tra questura e organizzatori a chi la spara più grossa. #laguerradeinumeri

Italia un paese di litigiosi

Gli italiani hanno una innata propensione a risolvere le controversie in sede legale. La dura realtà è messa in luce -ad esempio- dal rapporto 2012-2014 della CEPEJ (vedi tabella oppure scarica il report completo). A poco contribuiscono le norme tese a promuovere i metodi alternativi di risoluzione delle controversie (in inglese ADR – Alternative Dispute Resolution).

I motivi della elevata litigiosità italiana sono di varia natura, in primis aspetti socio-culturali, la scarsa fiducia nella possibilità di affrontare pacificamente la controversia. A questo si aggiunga la complessità del tessuto normativo responsabile inoltre del proliferare di un numero spropositato di studi legali lungo tutto lo stivale.

Qui di seguito viene riportata la cartografia tratta da Indice di Litigiosità in Italia 2001-2014.  L’indice di litigiosità è il rapporto tra il numero di cause civili di primo grado sopravvenute nell’anno presso i Giudici di Pace e i Tribunali Ordinari e la popolazione media residente per 1.000. In conformità con l’ultima pubblicazione de “L’italia in cifre – 2015” da parte dell’ISTAT (vedi estratto) per il calcolo dell’indice è stato considerato il totale delle cause civili di primo grado, sia contenzioso sia non contenzioso (volontaria giurisdizione). Pertanto questo indice non è da considerarsi un vero e proprio indice di litigiosità. Nonostante questo limite, l’indicatore consente di effettuare confronti sia a livello geografico sia temporale.

Indice di litigiosità in Italia 2014

Indice di Litigiosità in Italia 2001-2014

Giornata mondiale della statistica e 3 note fuori luogo

World Statistics Day 2015

20 Ottobre 2015. Mentre nel resto del mondo si festeggia la Seconda Giornata mondiale della statistica, in Italia siamo impegnati nella Quinta Giornata italiana della statistica! [N.f.L. Insomma a giudicare dalla numerazione siamo avanti!]

E mentre nel resto del mondo il tema di riferimento è  “Better data, Better lives“, in Italia il tema è stato declinato in “La buona statistica migliora la vita“. [N.f.L. Magari la potesse anche allungare ma per quello c’è sempre la birra.]

Data scientists in tutto il mondo dibattono sulla necessità di produrre statistiche e indicatori affidabili e tempestivi per misurare il progresso di un paese. Concordo. E concordo anche sul fatto che la statistica (in senso lato) sia uno strumento indispensabile per supportare le decisioni di governo e guidare lo sviluppo del paese. [N.f.L. Purtroppo siamo anni luce lontani da questi orizzonti, laddove la classe dirigente italiana relega la statistica a meri numeri da considerare solamente in fase elettorale.]

#statsday15

Approssimando si fa centro

Oggi molto più di ieri siamo letteralmente bombardati da informazioni e dati. Come fare per districarsi fra tutti questi numeri? Purtroppo abbiamo perso la capacità di fare di calcolo e anche quella di cogliere al volo un dato verosimile da un dato palesemente fasullo. Il più delle volte ci fidiamo incondizionatamente della fonte della notizia, nel resto dei casi ci affidiamo al nostro intuito (che come abbiamo visto in un precedente post non immune dal commettere errori).

La nostra reazione ad una notizia del tipo “in Italia 13 mld di euro di cibo finiscono nella spazzatura”  sarebbe equivalente alla reazione a fronte di “in Italia 5 mld di euro di cibo finiscono nella spazzatura”. La notizia viene percepita ed elaborata dal nostro cervello (che ha la tendenza a semplificare le cose) come “in Italia c’è tanto tanto spreco di cibo”  i dati numerici rappresentano informazioni accessorie poco rilevanti. Insomma che siano 13 miliardi o 5 miliardi poco o nulla importa.

Troppi numeri

Per interpretare questi numeri, spesso confusi e a volte contraddittori, bastano due semplici abilità:

  • comprendere il significato dei grandi numeri
  • saper fare stime approssimate e sensate basandosi soltanto su pochi fatti essenziali.

Acquisire tali abilità è alla portata di tutti e può aiutare anche in ambito lavorativo. Molte importanti multinazionali in fase di colloquio di lavoro pongono ai candidati domande del tipo “qual è il valore del mercato dei pannolini usa e getta in Italia?”. La domanda a primo acchito può sembrare ridicola ma in realtà serve a valutare sia l’intelligenza sia l’elasticità mentale del candidato.

Questo tipo di domande vengono spesso identificate come “problemi di Fermi”. Sembra infatti che il celebre fisico Enrico Fermi si divertisse a creare e risolvere quesiti di questo tipo. Cosa serve per sviluppare la capacità di saper trattare i quesiti di Fermi? Di fatto non molto: una buona dose di curiosità, saper maneggiare grandi numeri, e la conoscenza del sistema di misura di quel particolare problema (es sistema metrico decimale,…). Gli argomenti che vorrei trattare nei prossimi post sono:

  • Stima diretta vs stima indiretta (media geometrica)
  • La notazione scientifica
  • Operazioni sui grandi numeri
  • Unità di misura e conversione delle unità

Nei prossimi post cercherò di affrontare tutti questi aspetti in maniera chiara e semplice, rimanete sintonizzati.

 

 

 

Il “paradosso” del compleanno

Ho sempre avuto un debole per i paradossi della logica ma quello di cui vorrei parlare oggi, il celebre “paradosso” dei compleanni, in verità non è un vero paradosso in senso stretto. È piuttosto un verità matematica che contraddice l’intuizione comune. Ma vediamo meglio di cosa stiamo parlando. Provate a chiedere ad un vostro amico questa semplice domanda:

“Qual è la probabilità che in una classe di 23 studenti almeno due festeggino il compleanno lo stesso giorno?”

Sia chiaro, non cerchiamo una risposta esatta quanto piuttosto un valore indicativo:

  • molto molto improbabile (<1%)
  • molto improbabile (<5%)
  • poco probabile (meno del 10%)
  • così così (circa 50%)
  • abbastanza probabile (circa 75%)
  • molto probabile (>90%)

Ebbene, statene pur certi, la stragrande maggioranza dei vostri amici vi risponderà che la probabilità è molto bassa. In verità, calcoli alla mano, la reale percentuale è pari al 51%. Non ci credete? Provate allora a considerare dei casi pratici tra i colleghi del vostro ufficio, tra la cerchia delle vostre amicizie, tra i compagni di scuola di vostro figlio. Vi accorgerete che le cose stanno proprio così. La probabilità che due persone in un gruppo compiano gli anni nello stesso giorno è molto superiore a quanto il nostro intuito ci porterebbe a considerare. Qui di seguito il grafico che illustra l’andamento della probabilità al crescere del numero di persone nel gruppo.

Paradosso del compleanno

Per chi fosse interessato alla matematica dietro a questo problema si inizia calcolando la probabilità che tutti gli studenti siano nati in giorni diversi e poi si calcola il suo complemento, in formule:

P(p) = 1-\frac{364!}{365^{p-1}(365-p)!}

La bellezza del “paradosso del compleanno” sta nel mettere a nudo i limiti della nostra intuizione. Intuizione che spesso ci aiuta a vedere le cose con un “terzo occhio” ma che a volte incorre in questi clamorosi errori di valutazione!

Bambine più intelligenti dei maschietti?

Sempre alle prese con il rapporto del MIUR “Esiti dell’esame di Stato e degli scrutini nella scuola secondaria di I grado” (scarica pdf) mi sono imbattuto in una cosa interessante e una cosa buffa.

La cosa interessante è un grafico, la cosa buffa è una nomenclatura che viene utilizzata nel rapporto. Ma andiamo con ordine. Il grafico che mi ha dato da pensare e che ha dato il titolo al post è il seguente:

Graf. 7 - Voto medio riportato nelle singole prove d'esame per genere - A.S.2013/2014

il quale mostra in maniera lampante lo schiacciante predominio femminile quando si parla di risultati scolastici (in particolare l’esame di terza media… eh volevo dire scuola secondaria di secondo grado!).

La prima considerazione è che la scala dell’asse verticale va probabilmente dal sei all’otto e dunque la differenza risulta ancora più marcata e impietosa. Proviamo dunque ad utilizzare una scala dall’1 al 10 per vedere come cambierebbe visivamente. Nel rifare il grafico, pur con una certa ritrosia, ho utilizzato gli stessi colori del MIUR (fucsia compreso). Ecco il risultato:

Graf. 7 - Voto medio riportato nelle singole prove d'esame per genere - A.S.2013/2014

La sostanza non cambia ma il paragone è meno impietoso. Quello di cambiare la scala in grafici simili è una delle tecniche base di chi voglia mentire con le statistiche (particolarmente famoso a questo proposito il libro “How to lie with statistics” di Darrell Huff del 1954). In ogni caso, come dicevo, la sostanza non cambia: si evince facilmente che le bambine… sono più intelligenti dei maschietti? Certo che no! Un ricercatore serio non cadrebbe mai in questo errore. Il grafico ci dice esclusivamente che in termini di risultati all’esame di terza media le bambine “performano” meglio dei bambini. Non ci dice nulla riguardo ai MOTIVI di tali differenze. Purtroppo molto spesso mi capita di leggere articoli di giornalisti  che commettono questo tipo di errori (buona o cattiva fede che sia). Più raro ma decisamente più inquietante quando a sbagliare non sono gli articolisti ma i ricercatori stessi. Quello che mi preme è che il lettore abbia gli strumenti giusti per smascherare queste corbellerie.

Ma allora come si spiegano queste differenze? Sono dovute al caso? Io direi che sono dovute piuttosto a motivi di carattere sociale. Un recente studio dell’OCSE spiega che la la differenza tra maschi e femmine in termini di performance scolastica non ha alcun motivo di ordine genetico. Semplicemente i ragazzi dedicano in media un’ora in meno a settimana agli studi rispetto alle loro coetanee.

Questo chiude il discorso attorno alla cosa interessante e veniamo alla cosa buffa del rapporto: l’uso del termine “licenziati“. In tutto il rapporto si parla di “licenziati” per definire i ragazzi che hanno superato l’esame con successo ed hanno conseguito felicemente la Licenza Media… ops scuola secondaria di secondo grado! Ho appena finito la scuola e sono già licenziato.

Gli esami delle “medie”

Oggi mi sono imbattuto in un articolo dal titolo “Terza media, un esame che può decidere la vita” (leggi articolo) che mi ha fatto pensare un poco al modo in cui i dati vengono letti e interpretati. L’articolo prende spunto da un documento pubblicato sul sito del MIUR dal titolo “Esiti dell’esame di Stato e degli  scrutini nella scuola secondaria di I grado” (scarica pdf).

In particolare nell’articolo viene riportato il seguente grafico a barre:

 

L’articolista commenta il grafico dicendo che il voto riportato all’esame di terza media (o più propriamente “Scuola secondaria di I grado”) è fondamentale per determinare le sorti del futuro di tanti ragazzi. In soldoni chi prende nove o più finisce al liceo gli altri sono destinati a marcire tra lacrime e sudore negli istituti tecnici o peggio ancora professionali.

Quello su cui non mi trovo affatto d’accordo è il nesso di causa-effetto tra votazione d’esame e futuro che viene sotteso nell’articolo. Siamo di fronte ad un classico esempio di “correlazione spuria” di cui un giorno mi piacerebbe parlare più approfonditamente.  Il voto dell’esame è solamente il risultato di una certa propensione allo studio e questa stessa propensione allo studio -o voglia di studiare- influirà sulla scelta della scuola secondaria di II grado. Di fronte a questo grafico il mio commento sarebbe senz’altro diverso rispetto a quello che leggo su skuola.net

Da un punto di vista statistico sarebbe interessante leggere lo stesso grafico non più orizzontalmente ma verticalmente, ovvero: di coloro che hanno scelto il liceo, quanti hanno preso 10 e lode all’esame di terza media? quanti 10? quanti 9? ecc. ecc. Con i soli dati della tabella di cui sopra non è possibile fare questa trasformazione. La lettura in verticale è possibile solo se si conosce anche la distribuzione dei voti d’esame, in altre parole la tabella 2:

Tab. 2 - Licenziati all'esame conclusivo del I ciclo per genere e voto finale (valori percentuali) - A.S.2013/2014

Dalla combinazione delle due informazioni (Graf.12 e Tab.2) si può ottenere con un pochi calcoli il grafico che mi sono divertito a ricostruire e che riporto qui di seguito.

Grafico12

Questo grafico può raccontare una storia diversa da quella dell’articolo incriminato. Ecco la mia versione della storia: al liceo si iscrivono ragazzi che hanno preso bei voti all’esame di terza media ma anche ragazzi che non sono andati così bene. Ben il 61% dei ragazzi che si iscrivono al liceo hanno preso un voto all’esame di terza media compreso tra sei e otto.

Poi esistono anche quelli che prendono un bel voto alle medie e decidono di fare l’ITIS. Io mi ricordo di aver preso 10 all’esame di terza media e contavo di fare l’istituto tecnico indirizzo informatico. Poi per pressioni “esterne” sono finito al liceo scientifico e una laurea in statistica.

E’ vero quello che diceva Pirandello sul fatto che gli esami non finiscono mai ma è anche vero che gli esami devono essere presi per quello che sono, senza troppe ansie. Si dice che Albert Einstein venne rimandato in matematica. Non so se questo aneddoto sia vero in ogni caso mi piace credere che lo sia.

In figures

 

21 giugno solstizio d’estate: un bel giorno per iniziare un blog.

IN.FIGURES è un blog di numeri e infografica. “In figures” o “in cifre” nasce dall’idea di voler raccontare il mondo tramite numeri e grafici. Quantificare per capire. Analisi statistica e modelli matematici come strumenti per capire il mondo e i fenomeni che lo regolano.