La table de distribution normale, expliquée

Savoir lire la table de la loi normale centrée réduite N(0;1) (Octobre 2024)

Savoir lire la table de la loi normale centrée réduite N(0;1) (Octobre 2024)
La table de distribution normale, expliquée
Anonim

La formule de distribution normale est basée sur deux paramètres simples - moyenne et écart type - qui quantifient caractéristiques d'un ensemble de données donné. Alors que la moyenne indique la valeur «centrale» ou moyenne de l'ensemble de données, l'écart-type indique la «propagation» ou la variation des points de données autour de cette valeur moyenne.

Considérez les 2 ensembles de données suivants:

Dataset 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}

Jeu de données 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Pour Dataset1, moyenne = 10 et écart-type (stddev) = 0

Pour Dataset2, mean = 10 et écart type (stddev) = 2. 83

Représentons ces valeurs pour DataSet1:

De même pour DataSet2:

La ligne horizontale rouge dans les deux graphiques ci-dessus indique la "moyenne" ou la valeur moyenne de chaque jeu de données (10 dans les deux cas). Les flèches roses dans le second graphique indiquent l'étalement ou la variation des valeurs de données à partir de la valeur moyenne. Ceci est représenté par la valeur d'écart-type de 2.83 dans le cas de DataSet2. Puisque DataSet1 a toutes les mêmes valeurs (10 chacune) et aucune variation, la valeur stddev est zéro, et donc aucune flèche rose n'est applicable.

La valeur stddev possède quelques caractéristiques significatives et utiles qui sont extrêmement utiles dans l'analyse des données. Pour une distribution normale, les valeurs de données sont réparties symétriquement de chaque côté de la moyenne. Pour tout ensemble de données normalement distribué, tracer un graphe avec stddev sur l'axe horizontal et non. des valeurs de données sur l'axe vertical, le graphique suivant est obtenu.

Propriétés d'une distribution normale

  1. La courbe normale est symétrique par rapport à la moyenne;
  2. La moyenne est au milieu et divise la région en deux moitiés;
  3. L'aire totale sous la courbe est égale à 1 pour la moyenne = 0 et stdev = 1;
  4. La distribution est complètement décrite par sa moyenne et stddev

Comme le montre le graphique ci-dessus, stddev représente ce qui suit:

  • 68. 3% des valeurs de données sont 1 écart type de la moyenne (-1 à +1)
  • 95. 4% des valeurs de données sont 2 écarts-types de la moyenne (-2 à +2)
  • 99. 7% des valeurs de données sont 3 écarts-types de la moyenne (-3 à +3)

L'aire sous la courbe en cloche, lorsqu'elle est mesurée, indique la probabilité désirée d'une donnée donnée intervalle:

  • inférieur à X: - e. g. probabilité que les valeurs des données soient inférieures à 70
  • supérieures à X - e. g. probabilité que les valeurs des données soient supérieures à 95
  • entre X 1 et X 2 - e. g. probabilité de valeurs de données entre 65 et 85

où X est une valeur d'intérêt (exemples ci-dessous).

Tracer et calculer la zone n'est pas toujours pratique, car les différents ensembles de données auront des valeurs moyennes et stddev différentes.Pour faciliter une méthode standard uniforme pour faciliter les calculs et l'applicabilité aux problèmes du monde réel, la conversion standard en valeurs Z a été introduite, qui fait partie de la Table de distribution normale .

Z = (X - mean) / stddev, où X est la variable aléatoire.

Cette conversion force la moyenne et stddev à être normalisées respectivement à 0 et 1, ce qui permet d'utiliser un ensemble standard de valeurs Z (à partir du Tableau de distribution normal ) pour faciliter les calculs . Un instantané de la table de valeurs z standard contenant les valeurs de probabilité est le suivant:

z

0. 00

0. 01

0. 02

0. 03

0. 04

0. 05

0. 06

0. 0

0. 00000

0. 00399

0. 00798

0. 01197

0. 01595

0. 01994

0. 1

0. 0398

0. 04380

0. 04776

0. 05172

0. 05567

0. 05966

0. 2

0. 0793

0. 08317

0. 08706

0. 09095

0. 09483

0. 09871

0. 3

0. 11791

0. 12172

0. 12552

0. 12930

0. 13307

0. 13683

0. 4

0. 15542

0. 15910

0. 16276

0. 16640

0. 17003

0. 17364

0. 5

0. 19146

0. 19497

0. 19847

0. 20194

0. 20540

0. 20884

0. 6

0. 22575

0. 22907

0. 23237

0. 23565

0. 23891

0. 24215

0. 7

0. 25804

0. 26115

0. 26424

0. 26730

0. 27035

0. 27337

Pour trouver la probabilité liée à la valeur z de 0. 239865 , arrondissez d'abord à 2 décimales (c.-à-d. 0. 24). Ensuite, vérifiez les 2 premiers chiffres significatifs (0, 2) dans les lignes et pour le chiffre le moins significatif (0. 04 restant) dans la colonne. Cela conduira à la valeur de 0. 09483.

La table de distribution normale complète, avec une précision jusqu'à 5 décimales pour les valeurs de probabilité (y compris celles pour les valeurs négatives), peut être trouvée ici.

Voyons quelques exemples concrets. La taille des individus dans un grand groupe suit un schéma de distribution normal. Supposons que nous avons un ensemble de 100 individus dont les hauteurs sont enregistrées et la moyenne et stddev sont calculées à 66 et 6 pouces respectivement.

Voici quelques exemples de questions auxquelles il est possible de répondre facilement en utilisant la table z-value:

  • Quelle est la probabilité qu'une personne du groupe ait 70 pouces ou moins?

La question est de trouver la valeur cumulative de P (X <= 70) i. e. dans l'ensemble de données entier de 100, combien de valeurs seront comprises entre 0 et 70.

Commençons par convertir la valeur X de 70 en valeur Z équivalente.

Z = (X - moyenne) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (arrondi à 2 décimales)

Nous devons maintenant trouver P (Z <= 0. 67) = 0. 24857 (à partir du tableau z ci-dessus)

i. e. il y a une probabilité de 24. 857% qu'un individu dans le groupe soit inférieur ou égal à 70 pouces.

Mais attendez - ce qui précède est incomplet.Rappelez-vous, nous recherchons la probabilité de toutes les hauteurs possibles jusqu'à 70 i. e. De 0 à 70. Ce qui précède vous donne juste la partie de la valeur moyenne à la valeur désirée (c'est-à-dire 66 à 70). Nous devons inclure l'autre moitié - de 0 à 66 - pour arriver à la bonne réponse.

Puisque 0 à 66 représente la demi-portion (moyenne extrême à mi-chemin), sa probabilité est simplement 0. 5.

D'où la probabilité correcte qu'une personne ait 70 pouces ou moins = 0. 24857 + 0. 5 = 0. 74857 = 74. 857%

Graphiquement (en calculant la surface), voici les deux régions sommées représentant la solution:

  • Quelle est la probabilité qu'une personne ait 75 pouces ou plus?

i. e. Trouver Complémentaire cumulatif P (X> = 75).

Z = (X - moyenne) / stddev = (75-66) / 6 = 9/6 = 1. 5

P (Z> = 1,5) = 1 - P (Z <= 1. 5) = 1 - (0. 5 + 0. 43319) = 0. 06681 = 6. 681%

  • Quelle est la probabilité qu'une personne se situe entre 52 pouces et 67 pouces?

Trouvez P (52 <= x <= 67).

P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2,33 <= z <= 0. 17)

= P (Z <= 0. 17) -p (Z <= -0 233) = (0. 5 + 0. 56749) - (.40905) =

Cette normale La table de distribution (et les valeurs z) trouve couramment son utilité pour tout calcul de probabilité sur les mouvements de prix attendus sur le marché boursier pour les actions et les indices. Ils sont utilisés dans le trading basé sur les fourchettes, identifiant les tendances à la hausse ou à la baisse, les niveaux de support ou de résistance, et d'autres indicateurs techniques basés sur les concepts de distribution normaux de l'écart moyen et standard.