O introducere fără matematică în metodele Markov Chain Monte Carlo
Ce sunt metodele Markov Chain Monte Carlo (MCMC)? Răspunsul scurt este:
Metodele MCMC sunt folosite pentru a aproxima distribuția posterioară a unui parametru de interes prin eșantionare aleatorie într-un spațiu probabilistic.
În acest articol, voi explica acest răspuns scurt, fără nicio matematică.
În primul rând, puțină terminologie. Un parametru de interes este doar un număr care sintetizează un fenomen care ne interesează. În general, folosim statisticile pentru a estima parametrii. De exemplu, dacă vrem să aflăm despre înălțimea adulților umani, parametrul nostru de interes ar putea fi înălțimea medie în centimetri. O distribuție este o reprezentare matematică a fiecărei valori posibile a parametrului nostru și a probabilității pe care o avem de a o observa pe fiecare dintre ele. Cel mai cunoscut exemplu este o curbă în clopot:
În modul bayesian de a face statistică, distribuțiile au o interpretare suplimentară. În loc să reprezinte doar valorile unui parametru și cât de probabil este ca fiecare dintre ele să fie adevărata valoare, un bayesian se gândește la o distribuție ca la o descriere a convingerilor noastre cu privire la un parametru. Prin urmare, curba în clopot de mai sus arată că suntem destul de siguri că valoarea parametrului este destul de aproape de zero, dar credem că există o probabilitate egală ca adevărata valoare să fie peste sau sub această valoare, până la un anumit punct.
Cum se întâmplă, înălțimile umane urmează o curbă normală, deci să spunem că noi credem că adevărata valoare a înălțimii medii umane urmează o curbă în clopot ca aceasta: