Calcul de Galton

 

 

 

 

 

 

 

Calculs de Galton en 1892:

 Comment Galton « démontre » qu’il y a une chance sur 64 milliards que deux individus aient les mêmes empreintes?     On attribue à Galton les premiers calculs de probabilité dans son ouvrage « Finger Prints » paru en 1892.

 Comment Galton prouve que la seule observation des formes d’empreintes ne suffit pas. Combien existe-t-il d’empreintes digitales différentes ?

             *Première évidence : si deux empreintes ne sont pas du même modèle, à savoir spire, arche ou boucle alors les empreintes proviennent de doigts différents.

 Qu’en est-il lorsque deux empreintes ont la même apparence ?

 Après différentes observations d’empreintes, Galton affirme que :

  •  2/3 des empreintes sont des boucles.
  •  Les empreintes peuvent-être classées en 100 groupes à partir de leur forme.
  •  12 ou 15 de ces groupes appartiennent à la famille « boucles »

Utilisation du langage probabiliste pour clarifier les calculs de Galton.

Modélisons : On choisit une empreinte au hasard

  • B l’événement « l’empreinte est de la forme boucle »
  • i G l’événement « l’empreinte appartient au groupe (qui est un groupe de boucle) numéro i »

           ( 1 £ i £ 12 ou 1 £ i £ 15 ).

          P(B) = 2/3 Galton considère PB (Gi)=1/12 ou PB(Gi)=1/15 (il suppose implicitement une équiprobabilité).

   On a donc P(BÇ Gi)= P(B) * P(Gi)= 2/3*1/12= 2/32

                                                   ou

                    P(BÇGi)= P(B)*PB(Gi)=2/3*1/15=2/45

                                             Les approximations de Galton :

 

                2/36 » 2/40; 2/45 » 2/40; 2/40= 1/20

 

     On a donc P(BÇGi)= 1/20

 

   *Cette probabilité étant trop grande, Galton conclut que si deux empreintes ont une même ressemblance générale, cela ne suffit pas à prouver qu’elles proviennent d’un même doigt.

 Il faut donc faire des comparaisons plus approfondies et considérer les minuties.

                                                           Le modèle proposé

Comment Galton modélise une empreinte par 24 carrés indépendants?

 Le problème de la dimension de ces carrés et de leur indépendance.

  L’idée générale est de quadriller une empreinte.

Galton cherche à trouver le côté c d’un carré, tel que si on cache un carré de cette dimension sur une empreinte, la probabilité de reconstituer correctement la partie cachée soit égale à.

 

     

 

 

Galton remarque que sur des photos de 8 parties d’empreintes (deux sont montrées ci-contre), le rapport longueur/largeur est égal à 2/3

Il propose donc de partager chaque image en six carrés. Il estime que chaque carré a en moyenne une

largeur égale à 6 intervalles de crête.

Il découpe un carré de papier de cette taille, il le place au hasard sur un des carrés des 8 empreintes qui se trouve ainsi caché. Il essaie alors de reconstituer la partie manquante par trois méthodes différentes.

Au total, sur 75 reconstitutions tentées par l’une ou l’autre de ces méthodes, 27 sont bonnes et 48 sont mauvaises.

27/75» 1/3  

Galton conclut que la probabilité (appelée chance par lui) de reconstitution d’un carré de côté 6 intervalles de crête est égale à 1/3

Au départ, il voulait que cette probabilité soit égale à 1/2

Il estime alors qu’un carré de côté 5 intervalles de crête conviendrait davantage, en choisir un de côté 4 intervalles serait trop petit. Un carré de côté 5 intervalles de crête est donc celui recherché. Pour des raisons de calculs plus simples, il travaillera cependant dans un premier temps avec comme hypothèse un carré de côté 6 intervalles de crête et avec 1/2 plutôt qu’avec 1/3( 1/3<1/2, les probabilités calculées avec 1/2 sont supérieures aux probabilités obtenues avec 1/3, s’il obtient une probabilité qui convient avec 1/2, elle conviendra  avec 1/3)

Comment Galton prouve l’indépendance de tels carrés?

Les tracés des crêtes dans chaque carré sont incertains et présentent de très petits « incidents locaux » pour lesquels les conditions hors carré ne donnent pas d’indication certaine. Ces incidents sont déterminés par la disposition particulière d’environ 50 « glandes de sueur ».

2 cas sont possibles :

  •  autant de lignes de crêtes au départ qu’à la sortie du carré mais les lignes ne sont alors pas nécessairement parallèles, elles peuvent par exemple s’interrompre, bifurquer...
  •  pas le même nombre de lignes de crête à l’entrée qu’à la sortie, la difficulté de reconstitution augmente.

Si on connaît l’entourage d’un carré, quel qu’il soit, on a une chance sur 2 de le reconstituer.

Galton affirme donc que ces carrés peuvent être considérés comme des variables indépendantes. La probabilité de correspondance de deux carrés est 1/2.

Conséquence de cette indépendance:

Une empreinte digitale est constituée de 24 carrés de côtés 6 intervalles de crête (il considère sans doute qu’une empreinte a pour longueur environ 36 intervalles et pour largeur 24 intervalles et le rapport longueur / largeur=3/2 est conservé)

La probabilité de reconstituer correctement une configuration spécifique d’empreinte est a=(1/2)^24 (sans tenir compte de

l’entourage de chaque carré).

2^10 »1000

2^24 »16´10^6 ( la valeur exacte est 16 777 216).

Galton estime que la « chance » de correspondance est 1 sur 10 millions.Cette probabilité diminuerait avec un carré de côté 5 intervalles de crête.

Le problème de l’entourage:

Galton va maintenant prendre en compte l’entourage de chaque carré.

Rappel :  1/20 est la probabilité que deux empreintes aient la même forme de boucle.

Il généralise aux autres formes :

Galton va considérer que 1/20 est la probabilité que deux empreintes aient la même forme.

1/20» 1/2^4  On pose b=1/2^4 (probabilité d’un type de forme spécifique).

Combien de lignes de crête à l’entrée et à la sortie d’un carré ?

D’après des observations, 5 à 7 lignes arrivent sur chaque côté, Galton affirme que la probabilité que deux empreintes aient le même nombre de crêtes à l’entrée et à la sortie est 1/250

On pose c =1/2^8 ( »1/250) (probabilité de reconstituer le bon nombre de ligne crête entrant et sortant d’un carré)

Probabilité d’une configuration d’empreinte:

p(C)=a*b*c

=1/2^24*1/2^4*1/2^8

=1/2^36

=1.45*10^-11 

Après:

2^10 » 1000 donc 236 » 64´10^9 .

p »1/(64*10^9)

Conséquence :

Il y a une chance sur 64 milliards que deux doigts distincts aient les mêmes empreintes

digitales.

 

Néanmoins:

 Il y a des modèle proche :

  •  Pearson (1930)
  •  Balthazard (1911)

Galton s’appuie sur des hypothèses non vérifiées :

Il suppose que :

     · Les reconstitutions d’un carré caché sont des représentations possibles de la réalité.

     · Les carrés sont indépendants.

Ses calculs manquent de précision et ses approximations sont souvent très grossières, il semble vouloir à tout prix obtenir des puissances de 2.

 

© 2009 TPE