Hypothèses Tests en finance: concept et exemples

Règle de décision par test d'hypothèse (Avril 2025)

Règle de décision par test d'hypothèse (Avril 2025)
AD:
Hypothèses Tests en finance: concept et exemples
Anonim

Votre conseiller en placement vous propose un régime d'investissement à revenu mensuel qui promet un rendement variable chaque mois. Vous y investirez uniquement si vous êtes assuré d'un revenu mensuel moyen de 180 $. Votre conseiller vous dit également que, au cours des 300 derniers mois, le régime avait des rendements d'une valeur moyenne de 190 $ et un écart-type de 75 $. Devriez-vous investir dans ce régime?

Les tests d'hypothèses aident à prendre de telles décisions.

AD:

Cet article suppose que les lecteurs sont familiers avec les concepts d'une table de distribution normale, d'une formule, d'une valeur p et des bases de statistiques associées.

Les tests d'hypothèse

(ou tests de signification) sont un modèle mathématique pour tester une revendication, une idée ou une hypothèse. sur un paramètre d'intérêt dans un ensemble de population donné, en utilisant des données mesurées dans un ensemble d'échantillons. Les calculs sont effectués sur des échantillons sélectionnés afin de recueillir des informations plus décisives sur les caractéristiques de la population entière, ce qui permet de tester systématiquement des revendications ou des idées sur l'ensemble de données.

AD:

Voici un exemple simple: (A) Un directeur d'école rapporte que les élèves de son école obtiennent en moyenne 7 examens sur 10. Pour tester cette "hypothèse", nous enregistrons des notes de disons 30 étudiants (échantillon) de l'ensemble de la population étudiante de l'école (disons 300) et calculons la moyenne de cet échantillon. Nous pouvons ensuite comparer la moyenne de l'échantillon (calculée) à la moyenne de la population (déclarée) et tenter de confirmer l'hypothèse.

AD:

Autre exemple: (B) Le rendement annuel d'un fonds commun de placement particulier est de 8%. Supposons que le fonds commun de placement existe depuis 20 ans. Nous prenons un échantillon aléatoire des rendements annuels de l'OPC, par exemple, pour cinq ans (échantillon) et calculons sa moyenne. Nous comparons ensuite la moyenne de l'échantillon (calculée) à la moyenne de la population (revendiquée) pour vérifier l'hypothèse.

Différentes méthodologies existent pour tester les hypothèses. Les quatre étapes de base suivantes sont impliquées:

Étape 1: Définir l'hypothèse:

Habituellement, la valeur déclarée (ou les statistiques de réclamation) est indiquée comme hypothèse et présumée être vraie. Pour les exemples ci-dessus, l'hypothèse sera:

Exemple A: Les élèves de l'école obtiennent en moyenne 7 sur 10 aux examens

  • Exemple B: Le rendement annuel de l'OPC est de 8% par an
  • La description constitue l'hypothèse "

nulle (H 0 ) " et est supposée comme étant vraie. Comme un procès devant un jury commence par assumer l'innocence du suspect suivie par la détermination si l'hypothèse est fausse. De même, les tests d'hypothèse commencent par énoncer et supposer «l'hypothèse nulle», puis le processus détermine si l'hypothèse est susceptible d'être vraie ou fausse. Le point important à noter est que nous testons l'hypothèse nulle parce qu'il y a un élément de doute sur sa validité. Quelles que soient les informations contre l'hypothèse nulle énoncée, elles sont capturées dans l'hypothèse alternative

(H 1 ). Pour les exemples ci-dessus, l'hypothèse alternative sera: Les étudiants obtiennent une moyenne qui est

  • pas égale à 7 Le rendement annuel de l'OPC est
  • pas égal à 8% par an En résumé, l'hypothèse alternative est une contradiction directe de l'hypothèse nulle.

Comme dans un procès, le jury présume l'innocence du suspect (hypothèse nulle). Le procureur doit prouver le contraire (alternative). De même, le chercheur doit prouver que l'hypothèse nulle est vraie ou fausse. Si le procureur ne parvient pas à prouver l'hypothèse alternative, le jury doit laisser aller le «suspect» (en basant la décision sur l'hypothèse nulle). De même, si le chercheur ne parvient pas à prouver une hypothèse alternative (ou simplement ne fait rien), alors l'hypothèse nulle est supposée être vraie.

Étape 2: Définir les critères de décision

Les critères de décision doivent être basés sur certains paramètres des ensembles de données et c'est là que la connexion à la distribution normale entre dans l'image.

Selon le postulat standard sur la distribution d'échantillonnage, «Pour toute taille d'échantillon n, la distribution d'échantillonnage de X̅ est normale si la population X à partir de laquelle l'échantillon est prélevé est normalement distribuée. "Par conséquent, les probabilités de

tous les autres moyens d'échantillonnage possibles que l'on pourrait sélectionner sont normalement distribués. Pour e. g. , déterminez si le rendement quotidien moyen de tout titre coté sur le marché boursier XYZ autour de la nouvelle année est supérieur à 2%.

H

0 : Hypothèse nulle: moyenne = 2% H

1 : Hypothèse alternative: moyenne> 2% (C'est ce que nous voulons prouver) Prendre l'échantillon (disons de 50 stocks sur un total de 500) et calculer la moyenne de l'échantillon.

Pour une distribution normale, 95% des valeurs se situent à moins de 2 écarts-types de la moyenne de la population. Par conséquent, cette distribution normale et cette hypothèse de limite centrale pour l'ensemble de données échantillon nous permettent d'établir 5% comme niveau de signification. Il est logique que, sous cette hypothèse, il y ait moins de 5% de probabilités (100 à 95) d'obtenir des valeurs aberrantes supérieures à 2 écarts-types par rapport à la moyenne de la population. Selon la nature des ensembles de données, d'autres niveaux de signification peuvent être pris à 1%, 5% ou 10%. Pour les calculs financiers (y compris le financement comportemental), 5% est la limite généralement acceptée.

Si nous trouvons des calculs qui vont au-delà des 2 écarts-types habituels, alors nous avons un cas fort de valeurs aberrantes pour rejeter l'hypothèse nulle. Les écarts-types sont extrêmement importants pour la compréhension des données statistiques. Apprenez-en plus sur eux en regardant la vidéo d'Investopedia sur les écarts-types. Graphiquement, il est représenté comme suit:

Dans l'exemple ci-dessus, si la moyenne de l'échantillon est beaucoup plus grande que 2% (disons 3,5%), alors nous rejetons l'hypothèse nulle.L'hypothèse alternative (moyenne> 2%) est acceptée, ce qui confirme que le rendement journalier moyen des stocks est en effet supérieur à 2%.

Cependant, si la moyenne de l'échantillon n'est pas susceptible d'être significativement supérieure à 2% (et reste autour de 2,2%), alors nous ne pouvons pas rejeter l'hypothèse nulle. Le défi vient sur la façon de décider sur des cas si proches. Pour tirer une conclusion à partir d'échantillons et de résultats sélectionnés, il faut déterminer un

niveau de signification , ce qui permet de conclure sur l'hypothèse nulle. L'hypothèse alternative permet d'établir le niveau de signification ou le concept de «valeur critique» pour décider de tels cas, selon la définition standard: «Une valeur critique est une valeur seuil qui définit les limites au-delà desquelles moins de 5% de l'échantillon des moyennes peuvent être obtenues si l'hypothèse nulle est vraie.Les moyennes d'échantillon obtenues au-delà d'une valeur critique entraîneront la décision de rejeter l'hypothèse nulle. "Dans l'exemple ci-dessus, si nous avons défini la valeur critique comme 2,1%, La moyenne calculée est de 2. 2%, alors nous rejetons l'hypothèse nulle Une valeur critique établit une démarcation claire à propos de l'acceptation ou du rejet. D'autres exemples à suivre - Tout d'abord, examinons d'autres étapes et concepts clés.

Étape 3: Calculer la statistique de test:

Cette étape consiste à calculer la ou les figures requises, connues sous le nom de statistiques de test (moyenne, z-score, p-value, etc.) pour l'échantillon sélectionné. Les différentes valeurs à calculer sont couvertes dans une section ultérieure avec des exemples.

Étape 4: Faire des conclusions sur l'hypothèse

Avec la ou les valeurs calculées, décider de l'hypothèse nulle. Si la probabilité d'obtenir une moyenne d'échantillon est inférieure à 5%, alors la conclusion est de

rejeter l'hypothèse nulle. Sinon, accepte et conserve l'hypothèse nulle. Types d'erreurs dans la prise de décision:

La prise de décision par échantillon peut avoir quatre résultats possibles en ce qui concerne l'applicabilité correcte à toute la population:

Décision de conserver

Décision de rejet > S'applique à la population entière

Correct

Incorrect

(Erreur TYPE 1 - a)

Ne s'applique pas à la population entière

Incorrect

(Erreur TYPE 2 - b)

Correct

Les cas «corrects» sont ceux où les décisions prises sur les échantillons sont réellement applicables à l'ensemble de la population. Les cas d'erreurs surviennent lorsque l'on décide de conserver (ou de rejeter) l'hypothèse nulle sur la base de calculs d'échantillons, mais cette décision ne s'applique pas vraiment à l'ensemble de la population. Ces cas constituent des erreurs de type 1 (alpha) et de type 2 (bêta), comme indiqué dans le tableau ci-dessus.

La sélection de la valeur critique correcte permet d'éliminer les erreurs alpha de type 1 ou de les limiter à une plage acceptable.

Alpha indique l'erreur sur le niveau de signification et est déterminée par le chercheur. Pour maintenir l'importance ou le niveau de confiance standard de 5% pour les calculs de probabilité, il est conservé à 5%.

Selon les repères décisionnels applicables et les définitions:

"Ce (alpha) critère est habituellement fixé à 0.05 (a = 0, 05), et nous comparons le niveau alpha à la valeur p. Lorsque la probabilité d'une erreur de type I est inférieure à 5% (p <0,05), nous décidons de rejeter l'hypothèse nulle; sinon, nous retenons l'hypothèse nulle. "

Le terme technique utilisé pour cette probabilité est

  • p-value
  • . Il est défini comme "la probabilité d'obtenir un résultat d'échantillon, étant donné que la valeur indiquée dans l'hypothèse nulle est vraie. La valeur de p pour obtenir un résultat d'échantillon est comparée au niveau de signification ". Une erreur de type II, ou erreur bêta, est définie comme "la probabilité de retenir incorrectement l'hypothèse nulle, alors qu'en fait elle ne s'applique pas à l'ensemble de la population. " Quelques exemples supplémentaires démontreront ceci et d'autres calculs.
  • Exemple 1. Il existe un programme d'investissement mensuel qui promet des rendements mensuels variables. Un investisseur n'investira dans celui-ci que s'il est assuré d'un revenu mensuel moyen de 180 $. Il a un échantillon de 300 mois de rendements qui a une moyenne de 190 $ et un écart-type de 75 $. Devrait-il investir dans ce système?

Réglons le problème. L'investisseur investira dans le régime s'il est assuré de son rendement moyen souhaité de 180 $. Ici,

H

0

: Hypothèse nulle: moyenne = 180 H 1

: Hypothèse alternative: moyenne> 180 Méthode 1 - Approche par valeur critique :

Identifie une valeur critique X L

pour la moyenne de l'échantillon, qui est assez grande pour rejeter l'hypothèse nulle - i. e. rejeter l'hypothèse nulle si échantillon signifie> = valeur critique X L P (identifier une erreur alpha de type I) = P (rejeter H 0

étant donné que H 0 est vrai), qui serait atteint lorsque la moyenne de l'échantillon dépasse les limites critiques i. e. = P (étant donné que H

0

est vrai) = alpha graphiquement, prenant alpha = 0. 05 (niveau de signification de 5%), Z

0. 05

= 1. 645 (à partir de la table Z ou de la table de distribution normale) => X L

= 180 +1. 645 * (75 / sqrt (300)) = 187. 12 Puisque la moyenne de l'échantillon (190) est supérieure à la valeur critique (187. 12), l'hypothèse nulle est rejetée, et la conclusion est que le rendement mensuel moyen est En effet, plus de 180 $, l'investisseur peut envisager d'investir dans ce régime. Méthode 2 - Utilisation de statistiques de test normalisées

:

On peut également utiliser la valeur normalisée z. Statistique du test, Z = (moyenne de l'échantillon - moyenne de la population) / (std-dev / sqrt (nombre d'échantillons) ie

Ensuite, la région de rejet devient

Z = (190 - 180) / ( 75 / sqrt (300)) = 2. 309

Notre région de rejet au niveau de signification de 5% est Z> Z

0. 05

= 1. 645 Puisque Z = 2. 309 est plus grand que 1. 645, l'hypothèse nulle peut être rejetée avec la conclusion similaire mentionnée ci-dessus Méthode 3 - Calcul de la valeur P:

Nous visons à identifier P (échantillon moyen> = 190, quand la moyenne = 180) < = P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2. 309) = 0. 0084 = 0. 84%

Le tableau suivant pour déduire les calculs de valeur p conclut qu'il y a des preuves confirmées que les rendements mensuels moyens sont supérieurs à 180.

p-value

inférence

moins de 1%

évidence confirmée

hypothèse alternative

entre 1% et 5%

preuve forte hypothèse alternative de rechange > entre 5% et 10%

Faible preuve

hypothèse alternative de soutien supérieure à 10%

Aucune évidence

hypothèse alternative de soutien Exemple 2: Une nouvelle action de courtier en valeurs mobilières (XYZ) que ses taux de courtage sont inférieurs à ceux de votre courtier en valeurs mobilières actuel (ABC). Les données disponibles auprès d'un cabinet de recherche indépendant indiquent que la moyenne et la std-dev de tous les clients des courtiers ABC sont respectivement de 18 $ et de 6 $.

Un échantillon de 100 clients d'ABC est prélevé et les frais de courtage sont calculés avec les nouveaux tarifs du courtier XYZ. Si la moyenne de l'échantillon est de 18 $. 75 et std-dev est le même (6 $), peut-on faire une inférence sur la différence dans la facture de courtage moyenne entre ABC et XYZ courtier?

H 0

: Hypothèse nulle: moyenne = 18

H

1 : Hypothèse alternative: moyenne 18 (C'est ce que nous voulons prouver) Région de rejet: Z <= - z

2. 5 et Z> = Z 2. 5

(en supposant un niveau de signification de 5%, diviser 2. 5 chacun de chaque côté) Z = (moyenne de l'échantillon) / (std-dev / sqrt (nombre d'échantillons) = (18 75 - 18) / (6 / (sqrt (100)) = 1. 25 Cette valeur Z calculée se situe entre les deux limites définies par - Z

2. 5

= -1 96 et Z

2 5

= 1. 96. Ceci conclut qu'il n'y a pas suffisamment de preuves pour déduire qu'il y a une différence entre les taux de votre courtier actuel et de votre nouveau courtier. La valeur p = P (Z1,25) = 2 * 0. 1056 = 0. 2112 = 21. 12% qui est supérieure à 0,05 ou 5%, conduisant à la même conclusion. Graphiquement , il est représenté par ce qui suit: Points de critique pour la méthode de test hypothétique:

-

Méthode statistique basée sur des hypothèses

- Erreur sujette à des erreurs alpha et bêta

- Interprétation de la valeur p peut être ambiguë, ce qui conduit à des résultats confus

Le test d'hypothèse

permet à un modèle mathématique de valider une revendication ou une idée avec certain niveau de confiance. Cependant, comme la majorité des outils et des modèles statistiques, cela est également limité par quelques limitations. L'utilisation de ce modèle pour prendre des décisions financières doit être considérée avec criticité, en gardant à l'esprit toutes les dépendances. Des méthodes alternatives comme l'inférence bayésienne méritent également d'être explorées pour une analyse similaire.