L'instrumentation astrophysique conduit souvent à des observations à la pointe de ce qui est faisable. Les signaux, obtenus après des heures d'observations chèrement acquises, doivent exprimer toute leur substantifique moelle. Une étape très importante est donc l'analyse du signal.
Cette section expose diverses pistes pour :
Quelques-unes des sources de bruit physique sont répertoriées à la page bruits de détection.
La détection d'un phénomène, comme par exemple une raie spectrale, nécessite de pouvoir distinguer le signal par rapport à ce qui n'est pas du signal, appelé bruit s'il présente un caractère aléatoire. On exprime ceci par un rapport, le rapport signal à bruit, d'autant plus important que le signal est fort par rapport au bruit.
Il ne faut pas confondre un signal parasite, ou biais observationnel, avec un bruit. Le biais qui affecte le signal possède des propriétés qui le distinguent tout à fait d'un bruit.
Un biais très commun est un offset, càd un décalage du signal dû au fait que le niveau zéro du signal physique et le niveau zéro de sa traduction en signal électrique ne coïncident pas.
L'astronomie regorge d'exemple de bruits devenus des signaux célèbres à partir du moment où leurs caractéristiques ont été identifiées.
Distinguer signaux et bruits.
Le bruit de la circulation qui vous empêche d'entendre ce que dit votre ami(e) dans la rue, c'est du bruit... et ce que vous dit votre ami(e) a priori du signal. Mais une voiture qui accélère, est-ce vraiment un bruit, ou un signal parasite ? Par analogie, la lumière du ciel diurne qui empêche de voir les étoiles de jour est-elle un bruit, un signal parasite ?
Tout observation va comporter, en plus du signal, des perturbations à ce signal. Ces dernières résultent principalement de deux causes, intrinsèques et extrinsèques :
Exemple de biais : le niveau de biais d'une image numérique prise avec une caméra CCD peut provenir du signal généré par la tension d'alimentation appliquée au détecteur.
Un bruit est un phénomène aléatoire.
On découvre par la suite deux types de bruit plus spécialement importants, obéissant à des statistiques poissonniennes ou gaussiennes.
La distinction entre bruit et signal parasite est parfois complexe. On peut prendre l'exemple du courant d'obscurité d'un détecteur, qui se superpose au flux observé.
Sa valeur moyenne est parfaitement quantifiable (tant de photoélectrons par pixel et par seconde), ce qui montre qu'il s'agit là d'un signal, parasite certes mais avec les propriétés d'un signal.
La vraie composante de bruit concerne les fluctuations de ce courant d'obscurité.
A l'aide de l'appliquette, estimer l'offset affectant cette image de Jupiter dans l'infrarouge thermique.
Solution
Les figures ci-jointes illustrent quelques lois de probabilités :
Une loi de probabilité est déterministe. Mais ses réalisations sont ... aléatoires. C'est seulement avec un nombre élevé de réalisations que l'ensemble de ces réalisations retrace fidèlement la loi de probabilité. Si le nombre de réalisations est petit, on n'observe rien d'identifiable.
Estimation de la moyenne et de l'écart type d'une loi. La moyenne peut être estimée de diverses façons, et la meilleure façon d'estimer une moyenne dépend de la loi de probabilité.
Notions élémentaires de statistiques
La définition d'un bruit repose sur ses propriétés statistiques. Cette page rappelle des notions simples de statistiques, en distinguant les lois de probabilité, leurs réalisations, et l'estimation de paramètres statistiques.
La loi de probabilité d'une variable aléatoire va être donnée par sa densité de probabilité, ou bien sa fonction de répartition .
Parmi les moments centrés associés, la moyenne et l'écart-type sont respectivement définis par :
et :
( est la variance).
Une loi statistique possède des propriétés particulières, qui caractérisent tel ou tel phénomène : une loi poissonnienne (discrète) rend compte de l'arrivée d'événements indépendants, une loi gaussienne est souvent issue de l'addition d'un grand nombre de phénomènes indépendants...
La réalisation d'une loi de probabilité est aléatoire : un tirage de dés, réalisé 6 fois, ne conduira pas nécessaire à l'obtention une fois et une seule de chaque chiffre de 1 à 6. Plus le nombre de réalisations est grand, meilleur est l'accord entre l'observation de ces réalisations et la loi de probabilité.
En pratique, il faut distinguer d'une part la valeur moyenne de la densité de probabilité de sa mesure . Avec les réalisations d'une variable aléatoire, on a accès seulement à :
Et il n'y a aucune raison que . En fait, c'est de mieux en mieux réalisé lorsque devient très grand.
La variance est mesurable par :
avec au dénominateur car a déjà été obtenu à l'aide des mesures, et il ne reste plus que valeurs indépendantes pour estimer .
L'écart entre et vaut typiquement .
L'animation ci-joint montre comment est réalisée en pratique une distribution normale. Ce n'est qu'avec un très grand nombre de tirages que l'histogramme des réalisations ressemble vraiment à la distribution statistique.
Les appliquettes ci-jointes dévoilent des signaux temporels bruités, affectés ou non d'une lente dérive. On se propose d'en mesurer le bruit et le rapport signal à bruit.
Se servir des appliquettes pour :
Le rapport signal à bruit conditionne toute observation. S'il est faible, on ne voit que du ... bruit.
La détection d'un phénomène, comme par exemple une raie spectrale, nécessite un rapport signal à bruit typiquement supérieur à 3.
Notions de probabilités et statistiques
On définit le rapport signal à bruit d'un signal comme le rapport des énergies du signal et du bruit. L'énergie du signal est représentée par sa valeur moyenne , et celle du bruit par l'écart-type . Le rapport signal à bruit est donc :
Si le signal est affecté d'un biais systématique , il faut en tenir compte dans l'estimation de ce rapport, et retirer au préalable sa contribution :
La composante de biais peut être p.ex., pour un signal évoluant dans le temps, un signal parasite apparaissant à plus basse fréquence.
Si les différents bruits contribuant à un signal sont indépendants les uns des autres, leurs écarts-types s'ajoutent quadratiquement pour construire l'écart-type total :
Il s'ensuit le rapport signal à bruit :
Identifier un spectre est d'autant plus aisé que le rapport signal à bruit est bon. En pratique, une raie a priori inconnue devient détectable pour un rapport signal à bruit supérieur à 5.
Si le bruit est dominé par le bruit de photons, le rapport signal à bruit augmente avec la durée d'observation, comme le montre cette simulation.
Difficulté : ☆☆ Temps : 30 min
On recueille le signal d'une cible stellaire. Le rapport signal à bruit s'écrit :
avec le nombre de photoélectrons reçus, relié à un signal de fond, la taille angulaire de la cible, et le bruit de lecture
Identifier précisément les différents termes de bruit contribuant au rapport signal à bruit, en précisant leur écart-type.
Simplifier l'expression du rapport signal à bruit pour le cas d'un objet très brillant, puis pour un objet très peu lumineux. Identifier l'exposant qui caractérise la dépendance en du rapport signal à bruit.
Déterminer comment le rapport signal à bruit varie avec le diamètre du collecteur ou le temps de pose .
La superposition de plusieurs variables aléatoires indépendantes les unes des autres conduit à une loi normale. C'est l'une des conséquences du théorème de la limite centrale. L'animation ci-jointe en montre un exemple.
Exemples de distributions gaussiennes.
Si un bruit est gaussien, la probabilité qu'il s'écarte de plus ou moins de la valeur moyenne est très faible. Cette propriété est mise à profit pour identifier le signal du bruit, mais ne marche que si le bruit est vraiment gaussien.
Loi de probabilité ; éléments de statistique
Le théorème de la limite central implique qu'un bruit résultant de l'action indépendante de différents facteurs physiquesobéit à la loi de probabilité, dite loi normale :
avec la moyenne et l'écart-type. Un tel bruit est dit gaussien.
Pour une loi gaussienne, la probabilité d'observer un signal s'écartant de par rapport à la valeur moyenne décroît rapidement avec ; 99.7 % des réalisations du signal s'écartent de moins de de la moyenne.
n | 1 | 2 | 3 | 4 |
% | 69.2 | 95.4 | 99.7 | 99.99 |
Probabilité d'avoir une valeur dans l'intervalle pour un bruit gaussien.
De ce qui précède, peut-on dire qu'un événement qui s'écarte de plus de de la moyenne est sûrement dû à un signal et non à un bruit, et l'identifier comme tel ?
On considère une détection sûre lorsqu'elle dépasse un seuil de 4 ou 5 fois l'écart-type. Mais, la difficulté réside souvent dans le fait que la nature d'un bruit n'est pas exactement gaussienne, ou que des signaux parasites non identifiés compliquent l'interprétation d'un signal.
L'analyse fréquentielle d'un bruit gaussien ne montre aucune composante privilégiée. Pour cette raison, on parle d'un bruit blanc.
L'ivrogne et son lampadaire sont des acolytes précieux du physicien statisticien. L'ivrogne est supposé partir du lampadaire et accomplir un certain nombre de pas par unité de temps, mais dans n'importe quelle direction.
Au bout de pas, il se sera éloigné du lampadaire d'une distance moyenne de .
A l'aide de l'appliquette, estimer le niveau de bruit affectant cette image de Jupiter dans l'infrarouge thermique. L'exprimer en fonction du niveau maximal du signal (conseil : faire une coupe non sur la planète mais sur le fond de ciel).
Lorsqu'une moyenne de quanta par unité de temps est attendue, un détecteur idéal (rendement unité) en comptera un nombre plus ou moins voisin de . La distribution des valeurs dépend du nombre N : 10, 100, 1000. Plus est grand, plus la distribution apparaît piquée en valeur relative, quand bien même elle est plus étalée en valeur absolue.
La statistique de Poisson concerne un phénomène régulier quantifié.
La détection d'un rayonnement électromagnétique en est un exemple concret, l'arrivée d'énergie étant quantifiée en photons.
Plus le nombre de photons attendus est grand, mieux on pourra préciser la valeur moyenne observée.
La statistique de Poisson va être abordée via un cas concret. L'analyse de l'arrivée de photons d'une signal lumineux de moyenne constante.
Un rayonnement monochromatique de fréquence de luminosité , observé pendant une durée , apporte une énergie . Ce rayonnement est véhiculé par un nombre moyen de photons obéissant à :
La discrétisation du flux en quanta d'énergie implique que le nombre de photons arrivant par intervalle de temps fluctue autour de cette valeur moyenne.
La probabilité de détecter photons lorsque sont attendus en moyenne s'écrit :
C'est la loi de Poisson de moyenne . Il faut retenir que :
En découpant l'intervalle de temps en parties, suffisamment petites pour assurer qu'un seul photon peut arriver pendant l'intervalle de temps , on peut estimer la probabilité de voir arriver photons, en les rangeant dans les cases.
La probabilité d'avoir un photon par case temporelle est , et la probabilité opposée . Comme il y a façons de ranger photons dans les cases, on obtient finalement en développant le coefficient de combinaison :
Avec un très grand nombre d'intervalles, on retrouve la loi énoncée :
vu les approximations pour grand et :
Pour les grandes valeurs de , on peut montrer que cette loi se confond très rapidement avec la gaussienne :
On en conclut alors, en se basant sur la statistique gaussienne, que pour une valeur moyenne , l'écart-type vaut .
Il en résulte un point important : lorsque croît, l'écart-type croît, mais le rapport écart-type/moyenne du signal décroît.
A l'aide de l'appliquette : tracer une distribution de Poisson, et identifier les variations majeures lorsque la moyenne varie.
Une bonne détection, par exemple l'identification d'une raie spectrale, nécessite l'enregistrement d'un nombre suffisant de photoélectrons, afin que la statistique d'arrivée des photons, de type poissonnien, n'empêche pas la détection.
Le bruit de photons est en fait un bruit... de photoélectrons. L'arrivée dispersée des photons, conjuguée à la conversion aléatoire d'un photon en photoélectron, construisent la statistique de création de photoélectrons, qui dépend bien sûr du nombre de photons.
Statistique de Poisson : le bruit de photons obéit à la statistique de Poisson.
Evaluer le bruit et le rapport signal à bruit du bruit de photons.
La statistique d'arrivée des photons est poissonnienne, vu que les photons sont par définition des quanta d'énergie. Lorsque l'on attend photons par intervalle de temps, la valeur moyenne observée est ... et sa fluctuation autour de cette valeur moyenne vaut .
Le bruit de photons, sur une mesure de photons, est .
Il s'ensuit un rapport signal à bruit déterminé par le flux de photons égal à :
Ce rapport signal à bruit croît avec la racine carrée du nombre de photons collectés.
Les photons que l'on observe sont le plus souvent traduits par le détecteurs en photoélectrons, qui suivent la même statistique que les photons, à un facteur de rendement près inférieur à l'unité.
Avec le rendement, le nombre de photoélectrons détectés vaut en fonction du nombre de photons incidents sur le détecteur :
Le bruit de photoélectrons et le rapport signal à bruit résultant valent en pratique .
Difficulté : ☆ Temps : 20 min
En supposant que le rendement de la chaîne de détection vaut l'unité, combien de photons doivent être enregistrés pour que le bruit de photons permette une détection à 1 ppm
Le rendement de la chaîne de détection est de 25% seulement. Par quel facteur doit on corriger le nombre de photons à collecter.
Le nombre de photons requis est collecté en 5 jours. En déduire le nombre de photons accumulés en une pose élémentaire de 1 minute, et la performance atteinte sur une pose élémentaire.
Difficulté : ☆ Temps : 20 min
La figure ci-jointe représente la courbe de lumière de l'étoile HD 49933, l'une des cibles principales du satellite CoRoT. Le signal stellaire est composé de multiples signaux (activité, oscillations...) et bien sûr du bruit de photons. On admet que celui-ci domine à haute fréquence.
Estimer l'amplitude totale du bruit du signal stellaire.
[1 points]
Estimer l'écart-type du bruit
[1 points]
Montrer que le bruit mesuré est du même ordre de grandeur que le bruit de photons.
[1 points]
Les bruits instrumentaux sont souvent dus à des dérives thermiques. L'exemple ci-joint montre la dérive enregistrée par un astérosismomètre, observant de jour une source de laboratoire délivrant un signal de référence absolument fixe, mais dont la température de travail n'est pas fixée.
L'effet de mémoire occasionne un bruit instrumental dit en 1/f. Son évolution temporelle se distingue d'un bruit blanc par une sensible dérive. Comme le montre l'analyse de Fourier, son spectre de puissance se caractérise alors par une forte contribution aux basses fréquences, qui apparaît clairement pour un spectre tracé en échelle logarithmique.
Le bruit instrumental est un bruit qui "a de la mémoire". Sa signature spectrale est intense à basse fréquence.
Le bruit dit en 1/f, avec une dépendance spectrale variant en raison inverse de la fréquence, est typiquement d'origine instrumentale. Il apparaît lorsque les fluctuations induites sur le signal ne sont pas indépendantes, mais corrélées. C'est typiquement le cas des fluctuations thermiques : une perturbation en température à l'instant aura des conséquences à tout instant suivant.
La transformée de Fourier de l'évolution temporelle d'un tel bruit montre un spectre en , l'exposant dépendant, phénoménologiquement, de la nature des corrélations au cours du temps.
L'analyse de Fourier d'un bruit en 1/f se caractérise, comme son l'indique, par une forte contribution aux basses fréquences. Ceci apparaît clairement pour un spectre tracé en échelle logarithmique.
Un signal continu n'existe pas : décrire le continu nécessite une infinité de valeurs. Tout signal est échantillonné, càd décrit sur un nombre discret de valeurs.
Un détecteur ayant une résolution limite (spatiale ou temporelle), un signal physique est nécessairement échantillonné. Même si une observation avec ce détecteur semble prendre des valeurs continues, elle peut être traduite par une série finie de valeurs, correspondant à un échantillonnage discret.
Une bonne observation nécessite de ne pas dégrader la résolution du signal par ce phénomène d'échantillonnage, ce qu'exprime la condition d'échantillonnage de Shannon, qui s'applique aussi pour un signal 2-D.
Le pas d'échantillonnage détermine la résolution maximale en fréquence. Au delà de la fréquence de coupure, échantillonnée sur 2 points par période, l'information est perdue. Autrement dit, la fréquence de coupure définie selon Fourier et le théorème de Shannon rendent compte du même phénomène.
Tout signal, spatial ou temporel, est limité en fréquence, à cause du processus d'observation. Il peut être codé sur une distribution discrète de valeurs. Ce processus de discrétisation est nommé échantillonnage.
Le critère de Shannon énonce qu'un signal doit avoir sa fréquence maximale échantillonnée sur au-moins 2 pixels afin de ne subir aucune dégradation. En pratique, il faut :
La justification de ce critère est liée à l'analyse fréquentielle, par transformée de Fourier : en appliquant le critère de Nyquist, les fréquences sont restituées convenablement jusqu'à la fréquence de coupure.
Difficulté : ☆ Temps : 10 min
Un télescope de la classe 4-m, dans une configuration ouverte à f/2, est installé dans un site dont le meilleur seeing est aux alentours de 0.5" en lumière visible. Une caméra CCD installée pour des programmes d'imagerie est spécifiée pour imager sans perdre d'éléments d'information.
Quel paramètre de la caméra est crucial pour satisfaire la spécification donnée ?
Sur catalogue, on trouve des caméras avec des pixels de 9, 15 ou 25 microns. Quel choix effectuer ?
Un système d'optique adaptative permet d'atteindre la limite théorique de diffraction dans l'IR à 2 microns. Sachant qu'il n'existe pas de caméra avec des pixels plus petits que 9 micromètres, quel paramètre de la chaîne de collecte du signal doit évoluer ?
Difficulté : ☆ Temps : 10 min
On cherche à caractériser un spectre d'oscillations stellaires. La période minimale des oscillations stellaires est de 4 minutes, et on souhaite distinguer des fréquences avec une résolution de .
Estimer la durée totale nécessaire pour ce programme.
[1 points]
Déterminer l'échantillonnage temporel optimal, qui permette de ne pas filtrer les hautes fréquences et minimise le nombre final de données.
[1 points]
Les séquences d'observation du satellite COROT (projet CNES) sont-elles en accord, avec un point de mesure toutes les 32 s et 150 jours d'observation continue sur une cible stellaire ?
[1 points]
pages_rapport-signal-bruit/rapport-signal-bruit-sexercer.html
pages_bruit-gaussien/bruit-gaussien-sexercer.html
pages_bruit-photons/bruit-photons-sexercer.html
pages_shannon/shannon-sexercer.html
pages_analyser/rapport-signal-bruit-sexercer.html
Au numérateur, on a tout simplement le signal, au dénominateur les bruits.
Il reste à identifier le terme et à interpréter la somme du dénominateur.
Les 3 termes du dénominateur sont :
- le bruit de photons ,
- le bruit de fond, , avec le nombre de photoélectrons par unité d'angle solide dus au fond,
- le bruit de lecture.
Déterminer l'importance relative des différents bruits.
Pour un objet très brillant, le bruit de photons de la source va dominer devant les autres bruits :
Dans le cas d'un objet peu lumineux, le bruit de photons de la source est négligeable. En l'absence d'autres données, il n'est pas possible de discriminer parmi les 2 autres sources de bruit.
Dans un cas, , dans l'autre .
Comment le nombre de photoélectrons collectés varie-t-il avec le diamètre du collecteur ou le temps de pose ?
Si l'on note le diamètre du collecteur et le temps de pose, il est immédiat que varie comme la surface collectrice et comme .
On en déduit les dépendances respectives :
diamètre collecteur | temps de pose | |
source lumineuse | ||
source faible |
Dépendance envers ou du rapport signal à bruit.
pages_analyser/bruit-photons-sexercer.html
Avec photons, le rapport signal à bruit du bruit de photons vaut .
Le rapport signal à bruit et la performance requise sont tous deux exprimés dans le même système d'unité relative. Le nombre de photons doit donc vérifier :
COROT doit collecter au-moins photons pour atteindre la sensibilité requise.
Avec photons, on obtient seulement photoélectrons.
Avec photons, on obtient seulement photoélectrons. L'égalité précédente doit donc être vérifiée par et non par . Il faut donc collecter photons.
1 jour = 86400 s = 1440 min
Le nombre de photons en 1 min, par rapport à celui détecté en 5 jours, vaut :
Avec un nombre de photo-électrons en accord, tenant compte du rendement de 25% (soit photo-électrons), la performance devient .
pages_analyser/bruit-photons-sevaluer.html
Repérer un intervalle de temps où le signal n'évolue pas à basse fréquence, et mesurer l'amplitude crête à crête.
Revoir les propriétés du bruit poissonnien.
pages_analyser/shannon-sexercer.html
L'ouverture du faisceau est déterminée, ainsi que la résolution angulaire. Ceci permet de déterminer la résolution spatiale dans le plan focal.
L'ouverture du faisceau étant déterminée, la focale du télescope est connue (8 m) ainsi que la résolution angulaire, limité par le seeing , la taille linéaire dans le plan focal est fixée :
La taille des pixels doit être au moins moitié moindre que la tache de seeing, il faut donc des pixels de .
Déterminer la tache de diffraction à 2 micromètres.
Identifier les paramètres fixes, de ceux qui le sont moins...
La tache de diffraction vaut . Le gain en résolution linéaire dans le plan focal est donc d'un facteur 5.
Comme le diamètre du télescope est fixée, de même que la taille minimale des pixels, la seule variable d'ajustement est l'ouverture du faisceau. Elle doit être diminuée d'un facteur au-moins 5, passant de f/4 à f/20.