Un’introduzione senza matematica ai metodi Markov Chain Monte Carlo
Cos’è il metodo Markov Chain Monte Carlo (MCMC)? La risposta breve è:
I metodi MCMC sono usati per approssimare la distribuzione posteriore di un parametro di interesse attraverso un campionamento casuale in uno spazio probabilistico.
In questo articolo, spiegherò questa risposta breve, senza alcuna matematica.
Primo, un po’ di terminologia. Un parametro di interesse è solo un numero che riassume un fenomeno che ci interessa. In generale usiamo la statistica per stimare i parametri. Per esempio, se vogliamo conoscere l’altezza degli adulti umani, il nostro parametro di interesse potrebbe essere l’altezza media in pollici. Una distribuzione è una rappresentazione matematica di ogni possibile valore del nostro parametro e la probabilità di osservare ciascuno di essi. L’esempio più famoso è una curva a campana:
Nel modo bayesiano di fare statistica, le distribuzioni hanno un’ulteriore interpretazione. Invece di rappresentare semplicemente i valori di un parametro e la probabilità che ognuno di essi sia il valore vero, un bayesiano pensa a una distribuzione come a una descrizione delle nostre credenze su un parametro. Quindi, la curva a campana qui sopra mostra che siamo abbastanza sicuri che il valore del parametro sia abbastanza vicino allo zero, ma pensiamo che ci sia un’uguale probabilità che il vero valore sia sopra o sotto quel valore, fino a un certo punto.
Come succede, le altezze umane seguono una curva normale, quindi diciamo che crediamo che il vero valore dell’altezza media umana segua una curva a campana come questa: