Categorie
Marketing

La legge di Benford: un modello matematico per smascherare i profili fake sui social

Avete mai sentito parlare della Legge di Benford? questa legge descrive la distribuzione di probabilità con cui compare la prima cifra dei numeri in molti esempi di raccolte di dati (come la popolazione dei comuni, alcune costanti fisiche o matematiche, la superficie dei vulcani, il numero di strade esistenti nelle località, ecc).

In sostanza, prendendo in considerazione diverse raccolte di dati, che siano queste rappresentative di distanze in km, valori economici o altre unità di misura, la probabilità che un numero contenuto in questa raccolta inizi con una certa cifra tra 1 e 9 è sempre la stessa (30,1% per la cifra 1, 17,6% per la cifra 2, 4,6% per la cifra 9).

Anche se un po bizzarra, la legge di Benford si dimostra estremamente utile per rilevare frodi finanziarie, infatti, ogni volta che c’è un’influenza esterna sul comportamento delle persone, sorge la possibilità di una deviazione dalla legge di Benford. Naturalmente, un set di dati che si discosta dalla legge di Benford non è una prova di frode, ma solo l’indicazione che sono necessarie ulteriori verifiche.

Questa Legge ha avuto la sua applicazione anche nel mondo dei social network grazie a Jennifer Golbeck, professoressa di Informatica presso l’università del Maryland. Attraverso la ricerca di Golbeck si è dimostrato che analizzando alcuni set di dati, le deviazioni sulla legge di Benford che ne derivano, sono correlate ad attività sospette online.

Golbeck è partita dai dati sugli utenti dei cinque principali social network: Facebook (18.000 utenti), Twitter (78.000 utenti), Google Plus (20.000 utenti), Pinterest (40 milioni di utenti) e LiveJournal (45.000 utenti). Il metodo utilizzato è semplice, si è preso in esame il numero di amici e follower associati a ciascun utente in quel set di dati e si è sviluppata la distribuzione delle prime cifre. I risultati sono molto interessanti, in ogni set, tranne uno, la distribuzione statistica delle prime cifre segue da vicino la legge di Benford.

Tra i 5 social network presi in considerazione, un set di dati non ha seguito la legge di Benford. Ciò si è verificato nel numero di follower su Pinterest. Golbeck non ha impiegato molto a identificarne la causa, si è infatti scoperto che quando le persone si iscrivono su Pinterest, devono seguire cinque o più “interessi” prima di poter continuare con il processo di registrazione. Questo crea almeno cinque follower iniziali per ciascun utente. “Sebbene gli utenti possano accedere e successivamente eliminare questi interessi, pochi lo fanno e questo influisce sull’intera distribuzione” ha spiegato Golbeck.

L’esempio appena visto dimostra quanto detto inizialmente, ovvero, la deviazione rispetto alla legge non è una “prova di frode” ma un motivo per investigare meglio e comprendere se esista un’influenza esterna capace di far deviare il set di dati. E’ ciò che accade nell’applicazione di questa legge in ambito contabile, dove si cercano deviazioni simili nei dati finanziari (Ad esempio, il numero 3 potrebbe aumentare più frequentemente del previsto nell’analisi dei costi di un’azienda che acquista frequentemente prodotti che costano ad esempio € 39,99).

Golbeck è andata a fondo nel suo studio, misurando, oltre che il numero di follower, la correlazione tra la struttura della rete di un individuo (Ego-centric network) e la legge di Benfordscoprendo che per la stragrande maggioranza delle persone, questa correlazione era maggiore di 0,9. Nel caso di Twitter, solo 170 persone su 21.000 esaminate avevano una correlazione inferiore a 0,5 e Golbeck ha studiato ognuno di questi, indovinate cosa ha scoperto?

“Quasi tutti i 170 account sembravano impegnati in attività sospette”, afferma Golbeck. Alcuni account erano chiaramente spam ma la maggior parte erano bot russi che pubblicavano frammenti di opere letterarie o citazioni. “Tutti gli account russi si comportavano allo stesso modo, seguendo altri account del loro tipo, pubblicando contenuti simili e retweettando i contenuti tra loro”, aggiunge la professoressa.

Il lavoro svolto da Jennifer Golbeck oltre ad essere un’interessante applicazione della legge di Benford, sembra essere uno strumento prezioso contro frodi e altre attività sospette sul web.

“L’applicabilità della legge di Benford ai social media è un nuovo strumento per analizzare il comportamento degli utenti, capire quando e perché possono verificarsi deviazioni naturali e in definitiva rilevare quando sono in atto forze anomale”, conclude Golbeck.

Risulta chiaro come questo approccio non sia risolutivo al problema dei profili falsi, infatti, qualsiasi account che cresce allo stesso modo di uno convenzionale, rimarrebbe nascosto, ma sicuramente risulta un metodo semplice e veloce per valutare con ulteriore indagini, eventuali anomalie.

Conoscevate questa curiosa legge e le sue applicazioni?

Ecco il link alla relazione originale di Jennifer Golbeck: https://arxiv.org/pdf/1504.04387.pdf

Questo articolo ti è piaciuto? Condividilo sui social!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *