Statistiques et probabilités


Introduction

Les statistiques sont d'un usage fondamental pour la mesure et le traitement du signal en Astronomie. Cette section illustre quelques notions de base :


Probabilités

Auteur: Stéphane Erard

Loi de Poisson

De nombreux processus physiques correspondent à une situation où l'on compte des événements aléatoires indépendants. C'est par exemple le cas des désintégrations radioactives ou de l'émission de lumière par une source, de façon générale toute situation où l'événement se produit avec une probabilité constante par unité de temps. On veut connaître précisément la loi du phénomène pour calculer les fluctuations associées et les minimiser.

La loi de Poisson est ainsi utilisée pour rendre compte de phénomènes aléatoires qui vérifient les deux propriétés suivantes :

Un événement se produisant en moyenne avec une fréquence \lambda, on note P(k) la densité de probabilité pour qu'il se produise k fois durant le temps t (avec k ≥ 0). La loi de Poisson de paramètre \lambda t donne :

P_{t,\lambda}(k)=  \frac{(\lambda t)^k}{k!} e^{-\lambda t}

où k! est la factorielle.

L'appliquette ci-dessous illustre la loi de Poisson : elle trace les valeurs obtenues au cours d'un certain nombre de tirages, pour une valeur de \mu = \lambda t donnée.

Loi de Poisson application.png


Ex: loi de Poisson

exerciceDérivation de la loi de Poisson

Difficulté : ☆☆   Temps : 40 min

Question 1)

Retrouver la forme générale de la loi de Poisson à partir d'un raisonnement discret.

Question 2)

Déterminer la moyenne et l'écart-type de la loi de Poisson.

Question 3)

On observe une source lumineuse faible pendant un temps t. Quel est le nombre de photons détectés en moyenne, de quoi dépend-il ? Que représente l'écart-type de cette distribution ? Quel paramètre permet de quantifier la précision de la mesure, et comment améliorer la mesure de cette source ?

remarqueRemarque

L'applet ci-dessous illustre ce dernier résultat : on améliore le rapport signal sur bruit en posant plus longtemps, mais cette amélioration est lente. Elle est spectaculaire au début (en permettant la reconnaissance de l'objet), mais ralentit de plus en plus (les détails sont de plus en plus longs à se préciser).

Loi de Poisson application.png


Loi normale

La loi de distribution gaussienne est sans doute la plus employée, en physique comme ailleurs, à tel point qu'on l'appelle généralement loi normale.

La densité de probabilité gaussienne est :

P(x) = \frac{1}{\sigma \sqrt{2 \pi}}e^{-\frac{(x-\mu)^2}{2 \sigma ^2}}

Dans cette formulation, \mu représente la moyenne, et \sigma l'écart-type. Le coefficient numérique sert à normaliser l'intégrale à 1.

On remarque la symétrie de la fonction autour du pic central, et son aspect caractéristique ("en cloche"). On note habituellement N(\mu , \sigma) la loi normale. N(0,1) est appelée loi normale centrée-réduite (moyenne nulle, variance normalisée à 1).

L'importance de la loi normale est liée au théorème de la limite centrale, qui montre que la superposition de lois de distribution différentes tend vers une loi normale. Ceci est en particulier important pour estimer les erreurs de mesure : si elles sont de provenance différentes, et de statistique mal connue, on peut généralement faire l'approximation que leur somme est distribuée de manière gaussienne. C'est le théorème de la limite centrale qui explique l'omniprésence de la loi normale.

gaussiennes
exgauss.png
Exemples de gaussiennes de moyenne et largeur à mi-hauteur variables. La surface sous la courbe est normalisée à 1.
Crédit : Astrophysique sur Mesure / Erard

Ex: Loi normale

exerciceLimite de détection d'un objet ponctuel

Difficulté :    Temps : 20 min

remarqueRemarque

Le calcul des moments de la loi normale est donné ici en exercice.

Question 1)

Calculer la largeur à mi-hauteur de la gaussienne

Question 2)

Déterminer graphiquement l'aire délimitée par une gaussienne entre ± 1, 2 et 3 écart-types de la valeur moyenne. Quel est l'intérêt de cette question ?

Question 3)

On observe un astéroïde de la ceinture principale avec un télescope de 2 m depuis le sol. Le fond de ciel produit un signal de 100 pas-codeurs à la sortie de la caméra. A quel niveau de signal peut-on penser avoir détecté l'objet ?

exerciceLimite de la loi de Poisson

remarqueRemarque

On peut montrer en utilisant la formule de Stirling que pour les grandes valeurs de l'argument, la loi de Poisson tend vers une loi normale. La loi de Poisson décrit correctement les situations où l'intervalle de valeurs possibles est borné d'un côté, donc pour les petits nombres. Dans les autres cas elle se confond pratiquement avec une loi normale (dès que n > 30 et \mu > 5).

remarqueRemarque

L'applet ci-dessous illustre ce résultat : la distribution de Poisson est comparée à la loi normale correspondante (appuyer sur le bouton "moyenne").

Loi de Poisson application.png


Chemin optique d'un photon dans le Soleil

On se propose d'estimer le temps nécessaire pour qu'un photon produit dans le Soleil soit émis à sa surface.

Le processus correspond à une suite d'émissions et absorptions successives par les atomes rencontrés en chemin. On l'assimile à une marche au hasard en trois dimensions (bien que l'identité du photon ne soit pas conservée au cours de ces événements, et que la longueur d'onde puisse changer au cours des diffusions successives).


ex: Chemin optique d'un photon dans le Soleil

Auteur: Stéphane Erard

exerciceChemin optique d'un photon dans le Soleil

Difficulté :    Temps : 45 min

Question 1)

On considère une particule se déplaçant en trois dimensions de façon aléatoire par pas de longueur d. Ecrire sa position en coordonnées sphériques après le premier pas. La distance d est appelée libre parcours moyen.

Question 2)

Ecrire les coordonnées après N pas en fonction des directions successives. Quelle est la distance au point de départ ?

Question 3)

Simplifier cette expression, sachant que les directions successives sont aléatoires et indépendantes.

Question 4)

On donne la densité \rho = 1410\; kg/m^3 et le coefficient d'absorption massique \kappa = 10\; m^2 /kg, qu'on suppose uniformes au premier ordre. Calculer le libre parcours moyen.

Question 5)

Connaissant le rayon du Soleil r_\odot \approx 7.10^8 m, combien de diffusions un photon produit au centre du Soleil subit-il en moyenne avant d'arriver en surface ? Quelle est la longueur du trajet réellement parcouru dans le Soleil ? Combien de temps faut-il au photon pour effectuer le trajet ?


Statistiques élémentaires

Auteur: Stéphane Erard

Moyennes et estimations

Mesurer une quantité physique, c'est faire une estimation de la valeur de cette quantité. Cette estimation peut être entachée de deux types d'erreurs : erreur systématique, et erreur aléatoire. La première est liée à l'instrument de mesure ou au type d'observation (si on mesure plusieurs phénomènes simultanément sans s'en rendre compte), elle peut être additive (niveau de base ou offset, par exemple le courant d'obscurité d'une caméra) ou multiplicative (réglage de gain défectueux). Les erreurs aléatoires sont liées au processus de mesure lui-même (bruit de lecture) ou à la nature du phénomène mesuré (bruit de photon d'une source lumineuse faible, lié au processus d'émission). Une bonne mesure est telle que les erreurs aléatoires sont minimisées, et que les erreurs systématiques sont beaucoup plus petites que celles-ci.

L'exercice consiste à dériver la meilleure estimation de l'éclairement d'un corps céleste, dans l'hypothèse où l'erreur systématique est faible.


Ex: moyennes et estimations

Auteur: Stéphane Erard

exerciceEstimation d'une moyenne

Difficulté :    Temps : 30 min

On mesure l'éclairement d'une étoile. La valeur "réelle" est notée \mu (celle que mesurerait un instrument parfait).

Pour obtenir une bonne estimation de cette quantité, une méthode usuelle est de pratiquer N mesures successives X_i. On s'attend à ce que celles-ci se répartissent de façon gaussienne autour de la valeur \mu (théorème de la limite centrale).

Question 1)

A partir de ces N estimations indépendantes de l'éclairement, dériver le résultat de la mesure : valeur estimée de la moyenne \mu, et incertitude sur cette estimation.

Question 2)

Plusieurs équipes ayant publié leurs résultats (maintenant notés X_i), on veut en tirer la meilleure évaluation possible. Ce problème est équivalent à celui de mesures successives entachées d'incertitudes indépendantes \sigma_i.

Application numérique : on a deux mesures indépendantes 100±5 et 94±20. Quelle est l'estimation résultante ?


Propagation d'erreurs

On s'intéresse souvent à une fonction des quantités mesurées. Le problème est alors de dériver l'incertitude associée à cette estimation.

C'est par exemple le cas en spectroscopie, où on mesure une intensité I à diverses longueurs d'onde \lambda (variable indépendante). Les quantités physiquement importantes sont liées aux variations spectrales ; elles s'expriment comme des différences ou des rapports d'intensités à différentes longueurs d'onde, ou comme des fonctions plus complexes de ces intensités. Une incertitude individuelle est associée à chaque mesure spectrale I(\lambda). En principe, les incertitudes sur les mesures individuelles sont indépendantes les unes des autres. Si ce n'est pas le cas, il y a un problème avec l'étalonnage de l'instrument et il faut ajouter un terme de covariance dans les formules ci-dessous (on parle improprement de « bruit corrélé », parce qu'un signal inconnu se superpose à celui qu'on mesure).


Ex: propagation d'erreurs

exerciceErreurs sur une fonction

Difficulté : ☆☆   Temps : 30 min

introductionIntroduction

L'exercice consiste à dériver la précision des estimations de différentes fonctions spectrales.

Question 1)

La fonction est une combinaison additive de variables : f = ax + y + b

où a et b sont des constantes, et x et y sont affectées des incertitudes \sigma_x et \sigma_y.

Quelle est l'incertitude associée \sigma_f ?

Question 2)

On utilise maintenant une fonction multiplicative :

f = cx^a . y^b où a, b et c sont des constantes.

Quelle est l'incertitude associée \sigma_f ?

Question 3)

Pour les cas plus compliqués où l'on connaît la forme analytique de la fonction, écrire la formulation générale.

Question 4)

On applique ces résultats à la situation suivante :

On mesure les intensités a, b et c aux longueurs d'onde \lambda_1, \lambda_2 et \lambda_3 situées autour d'une bande d'absorption, avec les incertitudes \sigma_1, \sigma_2 et \sigma_3.

spec.png
Exemple de spectre infrarouge et définition des paramètres mesurés
Crédit : Astrophysique sur Mesure / Erard

On estime le continuum (pente spectrale) autour de la bande d'absorption comme Ct = \frac{(a+b)}2

et la profondeur de cette bande comme Pr = \frac c{\sqrt{ab}}

Écrire les incertitudes sur ces quantités en fonction de celles des mesures.

Question 5)

On utilise maintenant la mesure d'éclairement a pour estimer la magnitude à la longueur d'onde \lambda_1.

Ecrire cette magnitude en fonction de a et d'une constante d'échelle.

Question 6)

Ecrire l'incertitude sur cette magnitude en fonction de celle sur l'éclairement.


Distribution gaussienne

Auteur: Jérôme Thiébaut

Moindres carrés

Auteur: Jérôme Thiébaut

On a très souvent accès en astrophysique à des données d (par exemple des spectres lumineux, des images CCD...) dont on veut extraire une quantité physique inconnue X (magnitude, masse, champ magnétique...). Si le problème est linéaire et si on connait les lois physiques sous jacentes, on peut modéliser le problème sous la forme accent(d;->)=A*accent(X;->), où accent(d;->) est un vecteur contenant les données, accent(X;->) est le vecteur des paramètres recherchés et A est une matrice. Connaissant accent(d;->) on veut accent(X;->) , c'est ce qu'on appelle un problème inverse. Pour résoudre ce genre de problème on utilise très souvent la méthode des moindres carrés c'est à dire qu'on cherche le vecteur accent(X_0;->) qui minimise la quantité |A*accent(X;->) - accent(d;->)*|^2.C'est ce qu'on appelle un ajustement. On se propose ici de montrer que faire des à priori gaussiens sur les distributions de probabilité de accent(X;->) et accent(d;->) revient à utiliser la méthode des moindres carrés.


Ex: Moindres carrés

Auteur: Jérôme Thiébaut

exerciceMoindres carrés

Difficulté : ☆☆   Temps : 20 min

On a le problème suivant accent(d;->)=A*accent(X;->) et on va chercher à déterminer la probabilité conditionnelle P(accent(X;->)*|*accent(d;->)).

.

Question 1)

Exprimer cette probabilité en fonction de P(accent(X;->)), P(accent(d;->)) et P(accent(d;->)*|*accent(X;->)) en utilisant le théorème de Bayes.

Question 2)

On suppose que P(accent(d;->)*|*accent(X;->)) suit une loi gaussienne multivariée de matrice de variance covariance C_d. Ecrire cette loi.

Question 3)

On suppose que le vecteur accent(X;->) suit lui aussi une loi gaussienne de matrice de variance covariance C_p et de moyenne accent(X_p;->) (a priori sur la solution, sur son spectre de puissance...) et que P(accent(d;->))=1 . Exprimer P(accent(X;->)*|*accent(d;->)).

Question 4)

Montrer que chercher les paramètres physiques les plus probables revient à résoudre la méthode des moindres carrés généralisés soit à trouver accent(X_0;->)=argmin_(accent(X;->))*(((accent(d;->)-A*accent(X;->))^T*C_d^(-1)*(accent(d;->)-A*accent(X;->))+(accent(X;->)-accent(X_p;->))^T*C_p^(-1)*(accent(X;->)-accent(X_p;->)))).

Question 5)

Dans les cas simples, on n'a pas d'a priori sur accent(X;->) et on considère que les covariances sont nulles et les variances égales entre elles donc C_d=sigma*II est la matrice identité. Que devient accent(X_0;->) ?


Réponses aux exercices

pages_proba/poisson.html

Exercice 'Dérivation de la loi de Poisson'


pages_proba/gauss.html

Exercice 'Limite de détection d'un objet ponctuel'


pages_proba/exo-soleil.html

Exercice 'Chemin optique d'un photon dans le Soleil'


pages_stat/se.html

Exercice 'Estimation d'une moyenne'


pages_stat/err.html

Exercice 'Erreurs sur une fonction'


pages_dist-gauss/ex-m-carre.html

Exercice 'Moindres carrés'