Curiosando si impararivista di curiosità

Curiosità

La legge di Benford: perché il numero 1 domina i dati reali e svela le frodi

Da un'usura delle tavole logaritmiche nel 1881 a strumento forense per contabilità ed elezioni: la matematica nascosta nei numeri di ogni giorno.

di Andrea Bertolotti··6 min di lettura
Foglio di calcolo con colonne di numeri finanziari su schermo, matita e documento contabile sul tavolo
Foglio di calcolo con colonne di numeri finanziari su schermo, matita e documento contabile sul tavolo

Immaginate di aprire a caso un libro di logaritmi. Le pagine iniziali sono logore, sgualcite, quasi strappate dall'uso; quelle finali sembrano appena stampate. Fu questa banale osservazione a condurre, nel 1881, all'una delle leggi statistiche più sorprendenti della matematica: la legge di Benford, nota anche come legge della prima cifra. In quasi ogni raccolta di dati del mondo reale — dalle popolazioni delle città ai valori delle costanti fisiche, dai prezzi di borsa alle bollette dell'elettricità — la cifra iniziale 1 compare circa il 30,1% delle volte, mentre il 9 si affaccia meno del 5% delle volte. Lungi dall'essere una curiosità accademica, questa regolarità è oggi uno strumento forense concreto per individuare frodi contabili, anomalie nei bilanci aziendali e, con importanti cautele, irregolarità elettorali.

Simon Newcomb e le pagine consumate

L'astronomo e matematico americano Simon Newcomb fu il primo a descrivere il fenomeno in un articolo intitolato Note on the Frequency of Use of the Different Digits in Natural Numbers, pubblicato sull'American Journal of Mathematics nel 1881, al volume 4, pagine 39-40. Newcomb notò che le tavole dei logaritmi condivise con i colleghi mostravano un'usura sistematica: le prime pagine, corrispondenti ai numeri che iniziano con 1, erano molto più consunte di quelle finali. Da ciò dedusse che i numeri con prima cifra piccola venivano cercati e utilizzati con frequenza enormemente maggiore. Propose una formula: la probabilità che la prima cifra significativa di un numero sia d è uguale a log₁₀(d+1) − log₁₀(d), ovvero P(d) = log₁₀(1 + 1/d). La scoperta cadde però nell'oblio per oltre mezzo secolo.

Fu il fisico Frank Benford, dipendente dei Laboratori General Electric, a riscoprirla in modo indipendente e a darle solide basi empiriche. Nel 1938 pubblicò The Law of Anomalous Numbers nei Proceedings of the American Philosophical Society (vol. 78, pp. 551-572), raccogliendo ben 20.229 osservazioni tratte da venti insiemi di dati eterogenei: superfici dei fiumi, numeri apparsi sui giornali, costanti fisiche, popolazioni di città, lunghezze di strade. In tutti questi dataset la distribuzione delle prime cifre seguiva la medesima curva logaritmica decrescente. La legge prese il nome di Benford — un classico esempio della cosiddetta «legge di Stigler», per cui le scoperte raramente vengono attribuite al loro vero autore.

Calcolatrice, documenti finanziari e penna su scrivania durante una revisione contabile
L'analisi forense dei dati contabili basata sulla legge di Benford consente di individuare anomalie nella distribuzione delle prime cifre in fatture e rimborsi spese. — Foto: RDNE Stock project / Pexels

La formula e la distribuzione cifra per cifra

La formula di Newcomb-Benford è elegante nella sua semplicità. Applicando P(d) = log₁₀(1 + 1/d) si ottiene la seguente distribuzione attesa per le prime cifre in un insieme di dati «naturale»:

  • 1 → 30,1%
  • 2 → 17,6%
  • 3 → 12,5%
  • 4 → 9,7%
  • 5 → 7,9%
  • 6 → 6,7%
  • 7 → 5,8%
  • 8 → 5,1%
  • 9 → 4,6%

Quasi un terzo di tutti i numeri in natura inizia con 1; meno di uno su venti inizia con 9. La legge si applica a insiemi di dati che soddisfano alcune condizioni: devono abbracciare diversi ordini di grandezza, non avere limiti artificiali superiori o inferiori, e non essere costruiti su strutture prefissate (numeri di telefono, codici fiscali o prezzi fissi come «2,99 euro» ne sono esclusi). La matematica sottostante si basa sull'invarianza di scala: è l'unica distribuzione delle prime cifre che rimane identica cambiando l'unità di misura — da metri a piedi, da dollari a yen. Il matematico Theodore Hill fornì la dimostrazione formale di questa proprietà nel 1996, pubblicandola su Statistical Science.

La legge di Benford va tenuta chiaramente distinta dalla legge di Zipf, che è un'altra legge empirica ma descrive un fenomeno del tutto diverso: la frequenza delle parole in un testo (la parola più comune compare circa il doppio della seconda, il triplo della terza, e così via). Benford riguarda la distribuzione delle prime cifre nei dati numerici; Zipf riguarda la distribuzione di frequenza delle parole nel linguaggio. Confonderle è un errore comune nella divulgazione scientifica.

Lo strumento del revisore dei conti: Mark Nigrini e l'analisi forense

L'applicazione più concreta e rivoluzionaria della legge di Benford in campo moderno si deve a Mark Nigrini, professore associato di contabilità alla West Virginia University. Nigrini dimostrò, già nella sua tesi di dottorato conseguita all'Università di Cincinnati e poi in un fondamentale articolo apparso nel Journal of Accountancy nel 1999, che chi commette frodi contabili tende a inventare numeri anziché falsificare dati reali — e i numeri inventati dagli esseri umani non rispettano la distribuzione di Benford. Un contabile disonesto che gonfia le note spese con rimborsi da 180, 190 o 195 euro produrrà una concentrazione anomala di cifre iniziali 1 e 9, immediatamente visibile all'analisi. Nel suo libro Benford's Law: Applications for Forensic Accounting, Auditing, and Fraud Detection (Wiley, 2012), Nigrini illustra casi reali di frodi aziendali — incluso lo scandalo Enron — dove le anomalie nella distribuzione delle prime cifre avrebbero potuto essere rilevate con anticipo. La legge è stata persino ammessa come prova nei tribunali americani.

«Chi vuole manipolare dei dati ha una preferenza inconscia per certi numeri che non riproduce la casualità naturale.» — principio alla base dell'analisi forense di Benford
Urna elettorale con schede e cabina di voto durante elezioni democratiche
L'uso della legge di Benford per rilevare brogli elettorali è controverso: i dati per seggio raramente coprono gli ordini di grandezza necessari per l'applicabilità della formula. — Foto: Fatima Yusuf / Pexels

Elezioni, frodi e i limiti di uno strumento potente

L'applicazione della legge di Benford alle elezioni è diventata un tema ricorrente ogni volta che emergono sospetti di brogli. L'idea è intuitiva: se i risultati elettorale sono stati manipolati, la distribuzione delle prime cifre dei voti per seggio potrebbe deviare dalla norma logaritmica. Nel 2009, il ricercatore Walter Mebane dell'Università del Michigan propose un test basato sulla seconda cifra significativa per identificare irregolarità in dati elettorali. Tuttavia, la comunità scientifica ha espresso forti riserve sull'utilizzo di questo strumento come prova di frode.

Uno studio influente pubblicato su Political Analysis (Cambridge University Press) da Joseph Deckert, Mikhail Myagkov e Peter C. Ordeshook ha concluso che la conformità o la deviazione dalla legge di Benford «non segue alcuno schema» né nelle elezioni oneste né in quelle fraudolente, rendendo il test «essenzialmente equivalente al lancio di una moneta». Il problema fondamentale è strutturale: i dati elettorali per seggio raramente coprono diversi ordini di grandezza (i voti per candidato oscillano solitamente tra poche decine e qualche migliaio), violando una condizione necessaria per l'applicabilità della legge. Come precisa anche la rivista Significance, pubblicazione della Royal Statistical Society, «la legge di Benford non è di per sé un test di ipotesi, e non ne fonda uno senza notevoli qualificazioni».

Questo non significa che la legge sia inutile in campo forense — al contrario, in contabilità aziendale, analisi fiscale e dati finanziari dove i numeri spaziano su molti ordini di grandezza, rimane uno dei più efficaci strumenti di prima scansione per individuare anomalie che meritano indagine approfondita. Significa piuttosto che una deviazione dalla legge di Benford è un indizio, non una prova: deve essere sempre accompagnata da ulteriori verifiche e da una valutazione del contesto. Usarla come prova definitiva di brogli elettorali — come è accaduto in diversi dibattiti pubblici recenti — è un errore metodologico grave.

Dove la troviamo ogni giorno

Al di là del mondo forense, la legge di Benford è onnipresente. Le costanti fisiche fondamentali — dalla velocità della luce alla costante di Planck, dalla carica dell'elettrone alla costante gravitazionale — seguono la distribuzione prevista dalla formula logaritmica. Lo stesso accade per le superfici dei laghi, le altezze delle montagne, i prezzi delle azioni nei mercati finanziari, le dimensioni dei file digitali e persino i numeri presenti negli articoli scientifici. Ogni qualvolta un fenomeno cresce o decresce in modo moltiplicativo — quindi quasi ovunque in natura e in economia — la legge di Benford emerge spontaneamente come conseguenza matematica dell'invarianza di scala. La prossima volta che controllate una fattura o sfogliate un bilancio, ricordate: quasi un terzo delle voci dovrebbe iniziare con la cifra 1. Se così non fosse, potrebbe valere la pena approfondire.

Una buona curiosità ogni mattina

Iscriviti gratuitamente: niente spam, solo articoli scelti.

Iscrivendoti accetti la privacy policy. Puoi disiscriverti in ogni momento.


Da scoprire

Continua a leggere

Altre storie che ti potrebbero piacere, scelte per te