Geekflare est soutenu par notre public. Nous pouvons gagner des commissions d'affiliation en achetant des liens sur ce site.
Partager sur:

Test d'hypothèse : quoi, comment et pourquoi [+ 5 ressources d'apprentissage]

Tests d'hypothèses
Scanner de sécurité des applications Web Invicti – la seule solution qui offre une vérification automatique des vulnérabilités avec Proof-Based Scanning™.

Le test d'hypothèse est une méthode utilisée par de nombreux analystes des secteurs privé et gouvernemental pour faire des déclarations ou des hypothèses probables sur les données démographiques.

Si vous avez traité ou étudié des données démographiques, vous devez avoir rencontré cet outil essentiel de test d'hypothèse.

De nombreuses méthodes peuvent être utilisées pour faire des hypothèses, mais toutes ne fournissent pas une plus grande précision. 

Et si vous n'êtes pas sûr de vos données mais que vous souhaitez quand même les utiliser, cela pourrait être risqué pour votre organisation. 

Le test d'hypothèse est une bonne stratégie pour atteindre un niveau de précision plus élevé. Il a joué un rôle déterminant dans l'analyse de la population. 

Dans cet article, je vais discuter de ce qu'est le test d'hypothèse, de son fonctionnement, de ses avantages et de ses cas d'utilisation.

Alors, sans plus tarder, commençons!

What is Hypothesis Testing?

Le test d'hypothèse est une méthode d'inférence statistique que les analystes utilisent pour tester si les données disponibles sur la population appuient suffisamment une hypothèse donnée et en faire des hypothèses. 

Grâce à cette méthode, les analystes peuvent facilement évaluer une hypothèse et déterminer la précision de l'hypothèse en fonction des données disponibles.

YouTube vidéo

En termes simples, il s'agit d'un processus de test basé sur des statistiques inférentielles qui vous permet de rendre un verdict sur les données de population sur la base de données d'échantillon collectées.

En général, il est presque impossible pour les analystes de trouver des propriétés ou un paramètre particulier de l'ensemble de la population. Mais grâce aux tests d'hypothèse, vous pouvez faire une prédiction et une décision éclairées en fonction des données de l'échantillon et de leur exactitude. 

Types of Hypothesis Testing

Les différents types de tests d'hypothèses sont :

  • Hypothèse nulle: Les statistiques montrent que les données de l'échantillon sont abruptes et qu'il n'y a pas de corrélation entre les deux variables dans les données de l'échantillon donné. 
  • Hypothèse alternative: Il démontre la thèse principale et s'oppose à l'hypothèse nulle. C'est la principale force motrice du processus de test car elle montre une corrélation entre deux variables dans les données d'échantillon.
  • Hypothèse non directionnelle : Ce type de test d'hypothèse sert d'hypothèse bilatérale. Il montre qu'il n'y a pas de direction entre deux variables dans les données d'échantillon et que la vraie valeur n'est pas la même que la valeur prédite.  
  • Hypothèse directionnelle : L'hypothèse directionnelle décrit une relation entre deux variables. Ici, une variable dans un échantillon de données peut influencer les autres variables. 
  • Hypothèse statistique : Il aide les analystes à évaluer si les données et la valeur satisfont à une certaine hypothèse. Il est très utile pour faire des déclarations et des hypothèses concernant le résultat d'un paramètre de population échantillon.

Ensuite, discutons des méthodes de test d'hypothèse.

Methods of Hypothesis Testing

methodsoftesting

Afin d'évaluer si une hypothèse spécifique est vraie ou non, en tant qu'analyste, vous aurez besoin de beaucoup de preuves plausibles pour conclure. Dans ce processus de test, une hypothèse nulle et alternative est établie avant de commencer l'évaluation.

Le test d'hypothèse n'implique pas une seule méthode, mais plusieurs pour évaluer si les données de l'échantillon sont favorables. En tant qu'analyste, vous devez tenir compte des données et de la taille de l'échantillon et choisir la méthode de test d'hypothèse qui vous convient.

Test de normalité

Il s'agit d'une méthode de test d'hypothèse standard pour analyser la distribution régulière dans les données d'échantillon. Au cours du processus de test, il est vérifié si les points de données groupés autour de la moyenne sont inférieurs ou supérieurs à la moyenne.

Dans ce test statistique, la probabilité que des points passent au-dessus ou au-dessous de la moyenne est également probable. Une courbe en cloche est formée et elle est également répartie des deux côtés de la moyenne.

Test Z

Il s'agit d'un autre type de test d'hypothèse utilisé lorsque les données de population sont normalement distribuées. Il teste que la moyenne de deux paramètres de population distincts est différente lorsque vous connaissez la variance des données.

Lors de l'analyse des données démographiques, il est fort probable que vous utiliserez ce type lorsque la taille de l'échantillon de données est supérieure à trente. De plus, le théorème central limite est une autre raison qui rend Z-Test approprié, car le théorème indique que lorsque la taille des échantillons augmente, les échantillons sont normalement distribués. 

Test T

Le test d'hypothèse T-Test sera utilisé par vous lorsque la taille de l'échantillon est limitée et généralement distribuée. En général, lorsque la taille de l'échantillon est inférieure à 30 et que l'écart type du paramètre vous est inconnu, il est principalement appliqué.

Lorsque vous effectuez un test T, vous le faites pour calculer les intervalles de confiance de données de population spécifiques.

Test du chi carré

Le test du chi carré est un processus de test d'hypothèse populaire qui est souvent utilisé pour évaluer l'adéquation et l'intégrité d'une distribution de données.

image 227
La source: wikipedia.org

Cependant, la principale raison pour laquelle vous utiliserez ce type d'hypothèse est lorsque vous souhaitez tester la variance de la population par rapport à une variance de la population d'une valeur supposée ou connue. Différents tests de Chi-Square sont effectués, mais le type le plus courant est le Chi-Carré test de variance et d'indépendance.

Test ANOVA

test anova

Abrégé en analyse de la variance, il s'agit d'une méthode de test statistique qui permet de comparer les ensembles de données de deux échantillons. Cependant, cela vous permet de comparer plus de deux moyennes à la fois.

Il explique également une variable dépendante et une variable indépendante de données d'échantillon. L'utilisation de l'ANOVA est assez similaire à l'utilisation du Z-Test et du T-Test, mais les deux derniers sont limités à seulement deux moyens.

How Does Hypothesis Testing Work?

Chaque analyste qui utilise des tests d'hypothèse utilise des données d'échantillons aléatoires pour l'analyse et la mesure. Pendant le test, les données de l'échantillon aléatoire sont utilisées pour tester l'hypothèse nulle et l'hypothèse alternative.

Comme nous l'avons vu précédemment, l'hypothèse nulle et l'hypothèse alternative sont entièrement mutuellement exclusives, et pendant le résultat du test, une seule peut être vraie.

Cependant, il existe certains cas où l'hypothèse nulle est rejetée; l'hypothèse alternative n'est pas toujours vraie. 

travail de test d'hypothèse
La source: Étapes d'analyse

valeur p : Lorsque le processus de test commence, la valeur p ou la valeur de probabilité est impliquée et indique si le résultat est significatif ou non. Non seulement cela, mais la valeur p montre également la probabilité d'occurrence d'erreur en rejetant ou en ne rejetant pas une hypothèse nulle pendant le test. La valeur p résultante est 0 ou 1, qui est ensuite comparée au niveau de signification ou au niveau alpha.

Le niveau de signification définit ici le risque acceptable tout en rejetant une hypothèse nulle lors du test. Il est important de se rappeler que le résultat du test d'hypothèse peut conduire à deux types d'erreurs :

  • Erreur de type 1 se produit lorsque le résultat du test rejette l'hypothèse nulle même si elle est vraie. 
  • Erreur de type 2 apparaît lorsque l'hypothèse nulle est acceptée par le résultat de l'échantillon bien qu'elle soit fausse.

Toutes les valeurs qui provoquent le rejet de l'hypothèse nulle sont stockées dans la région critique. Et c'est la valeur critique qui sépare les régions critiques des autres.

Steps to Perform Hypothesis Testing  

les étapes de l'hypothèse
La source: Medium

Le test d'hypothèse implique principalement quatre étapes :

  • Définir les hypothèses : Dans un premier temps, votre travail en tant qu'analyste consiste à définir les deux hypothèses afin qu'une seule soit vraie. L'hypothèse nulle indiquera qu'il n'y a pas de différence d'IMC moyen, tandis que l'hypothèse alternative indiquera qu'il existe une différence significative d'IMC moyen. 
  • Plan: Dans l'étape suivante, vous devrez concevoir un plan d'analyse sur la façon dont vous pouvez analyser les données de l'échantillon. Il est essentiel que vous procédiez à un échantillonnage et que vous collectiez les données de l'échantillon pour vous assurer qu'il est conçu pour tester votre hypothèse. 
  • Analyser des exemples de données : Après avoir décidé comment vous allez évaluer les données, il est temps de commencer le processus. Vous devrez analyser physiquement les données de l'échantillon afin qu'il n'y ait pas de redondance. Lors de l'analyse des données, vous devez vérifier que les échantillons sont indépendants les uns des autres et que les deux tailles d'échantillon sont suffisamment grandes. 
  • Calculer les statistiques de test : Dans cette étape, vous devrez calculer les statistiques du test et trouver la valeur p. La valeur p sera déterminée en supposant que l'hypothèse nulle est vraie. 
  • Évaluez le résultat : Dans la dernière étape, vous devrez évaluer le résultat du test d'hypothèse. Ici, vous déciderez de rejeter l'hypothèse nulle ou de déclarer sa plausibilité sur la base des données de l'échantillon.

Nous allons maintenant explorer les avantages des tests d'hypothèses.

Benefits of Hypothesis Testing

avantages-1

Les avantages des tests d'hypothèses sont les suivants :

  • Il vous aide à analyser la force de votre réclamation sur une décision de données.
  • En tant qu'analyste, cela vous permet de créer un environnement fiable pour décider des exemples de données.
  • Il vous permet de déterminer si les données d'échantillon impliquées dans le test d'hypothèse sont statistiquement significatives.
  • Il est utile pour évaluer la fiabilité et la validité des résultats des tests dans tout processus de test systématique.

Il vous aide à extrapoler les données d'une étape d'échantillonnage à une population plus large en fonction des besoins. 

Use Cases of Hypothesis Testing

Les tests d'hypothèses sont utilisés dans divers secteurs pour deviner de manière appropriée l'exactitude des données d'échantillon. Voici quelques exemples concrets de tests d'hypothèses :

# 1. Essais cliniques

Les tests d'hypothèses sont largement utilisés lors des essais cliniques car ils aident les professionnels de la santé à décider si un nouveau médicament, traitement ou procédure sera efficace ou non sur la base de données d'échantillon.

Un médecin peut penser qu'un traitement peut atténuer les taux de potassium chez certains patients. Le médecin peut mesurer le taux de potassium d'un groupe de patients avant de commencer le traitement et vérifier à nouveau le taux.

Essais-cliniques-1

Ensuite, le médecin effectue des tests d'hypothèse où H0 : Uafter = Ubefore, et cela indique que le taux de potassium est le même qu'avant après l'application du traitement. Une autre hypothèse indique Ha : Uaprès < Uavant, ce qui signifie que le taux de potassium a diminué après l'application du traitement.

Donc, si la valeur p est inférieure au seuil de signification, le médecin peut conclure que le traitement peut réduire le taux de potassium.

# 2. Fabrication

Les tests d'hypothèses sont utilisés dans les usines de fabrication pour aider les superviseurs à décider si la nouvelle méthode ou technique est efficace ou non.

Par exemple, certaines unités de fabrication peuvent utiliser des tests d'hypothèse pour déterminer si la nouvelle méthode les aide à réduire le nombre de produits défectueux par lot. Supposons que le nombre de produits défectueux soit de 300 par lot.

usines-de-fabrication-

Le fabricant doit déterminer la moyenne du nombre total de produits défectueux fabriqués avant et après l'utilisation de la méthode. Ils peuvent effectuer des tests d'hypothèses et utiliser les hypothèses H0 : Uafter = Ubefore, où la moyenne des produits défectueux fabriqués après l'application d'une nouvelle méthode est la même qu'avant.

Une autre hypothèse montre que HA : Uafter n'est pas égal à Ubefore, ce qui signifie que le nombre total de produits défectueux fabriqués après l'application de la nouvelle méthode n'est pas le même.

Après le test, lorsque la valeur p est inférieure au seuil de signification, l'unité de fabrication peut conclure que le nombre de produits défectueux fabriqués a changé.

# 3. Agriculture

Les tests d'hypothèse sont souvent utilisés pour déterminer si un engrais ou un pesticide provoque la croissance et l'immunité des plantes. Les biologistes peuvent utiliser les tests pour prouver qu'une certaine plante peut pousser plus de 15 pouces après l'application du nouvel engrais.

Agriculture

Le biologiste peut appliquer l'engrais pendant un mois pour recueillir des données d'échantillonnage. Lorsque le biologiste effectue un test, une hypothèse est H0 U = 15 pouces, ce qui indique que l'engrais n'entraîne aucune amélioration de la croissance moyenne de la plante.

Une autre hypothèse montre HA : U> 15 pouces, ce qui signifie que les engrais provoquent une amélioration de la croissance moyenne de la plante. Après avoir testé lorsque la valeur p est inférieure au seuil de signification, le biologiste peut maintenant prouver que les engrais provoquent plus de croissance qu'auparavant.

Learning Resources

# 1. Statistiques : une introduction étape par étape par Udemy

image 228

Udemy propose un cours sur les statistiques dans lequel vous apprendrez une introduction étape par étape aux statistiques, couvrant les tests d'hypothèses. Ce cours contient des exemples et des leçons d'un ancien data scientist de Google pour vous aider à maîtriser les intervalles de confiance, les tests d'hypothèses, etc. 

# 2. Statistiques essentielles pour l'analyse des données par Udemy

image 229

Ce cours Udemy sur les statistiques essentielles pour l'analyse des données vous aidera à apprendre les statistiques avec des projets du monde réel, des activités amusantes, des tests d'hypothèses, des distributions de probabilités, des analyses de régression, etc. 

# 3. Statistiques pour la science des données et l'analyse commerciale

image 230

Ce cours sur les statistiques pour la science des données et l'analyse commerciale est proposé par Udemy et vous aidera à apprendre les tests d'hypothèses. Il couvre différents sujets statistiques, permettant aux scientifiques des données et aux analystes commerciaux de les apprendre et de les maîtriser. Il couvre les statistiques inférentielles et descriptives ainsi que l'analyse de régression. 

# 4. Test d'hypothèse par Jim Frost

Ce livre est disponible sur Amazon et est un guide intuitif pour aider les analystes à prendre des décisions basées sur les données.

Il couvre le fonctionnement des tests d'hypothèse, pourquoi vous en avez besoin, comment utiliser efficacement les intervalles de confiance, les valeurs p, les niveaux de signification et bien d'autres sujets. 

# 5. Test d'hypothèse par Scott Hartshorn

Ce livre est unique avec ses exemples visuels et est idéal pour les débutants à la recherche d'un guide rapide sur les tests d'hypothèses.

Aperçu Produit Note Prix
Test d'hypothèse : une introduction visuelle à la signification statistique Test d'hypothèse : une introduction visuelle à la signification statistique Aucune évaluation pour le moment $9.75

Il vous présentera l'importance des statistiques, des types et de leur fonctionnement. Il n'est pas nécessaire que vous ayez une connaissance approfondie des statistiques, mais explique tout de manière intuitive. 

Mot de la fin

Les tests d'hypothèse permettent de vérifier une hypothèse, puis de développer des données statistiques basées sur l'évaluation. Il est utilisé dans de nombreux secteurs, de la fabrication et de l'agriculture aux essais cliniques et à l'informatique. Cette méthode est non seulement précise, mais vous aide également à prendre des décisions basées sur les données pour votre organisation.  

Ensuite, consultez le ressources d'apprentissage pour devenir analyste d'affaires.

Merci à nos commanditaires
Plus de bonnes lectures sur la gestion des tests
Alimentez votre entreprise
Certains des outils et services pour aider votre entreprise à se développer.
  • Invicti utilise Proof-Based Scanning™ pour vérifier automatiquement les vulnérabilités identifiées et générer des résultats exploitables en quelques heures seulement.
    Essayez Invicti
  • Web scraping, proxy résidentiel, proxy manager, web unlocker, moteur de recherche et tout ce dont vous avez besoin pour collecter des données Web.
    Essayez Brightdata
  • Semrush est une solution de marketing numérique tout-en-un avec plus de 50 outils de référencement, de médias sociaux et de marketing de contenu.
    Essayez Semrush
  • Intruder est un scanner de vulnérabilités en ligne qui détecte les failles de cybersécurité de votre infrastructure, afin d'éviter des violations de données coûteuses.
    Essayez Intruder