Quand utiliser le test Shapiro-Wilk ?

Interrogée par: Aimé Roger  |  Dernière mise à jour: 2. Mai 2024
Notation: 4.8 sur 5 (31 évaluations)

Un des tests permettant de vérifier la normalité de la variable x est le test de Shapiro-Wilk. Il est appliquable pour des échantillons allant jusqu'à 50 valeurs. Il utilise le rapport de deux estimations de la variance.

Comment savoir si une population suit une loi normale ?

Par examen des paramètres descriptifs. La première méthode consiste à comparer les paramètres descriptifs calculés dans l'échantillon. Si par exemple la Moyenne = Médiane = Mode, nous pouvons considérer que la distribution des données de l'échantillon suit une loi normale.

Quel graphique Peut-on utiliser pour vérifier la normalité d'une distribution ?

Test graphique de la distribution normale

Si la distribution normale est testée graphiquement, on examine soit l'histogramme, soit, mieux encore, le graphique QQ.

Comment vérifier la normalité des résidus ?

Il existe différentes méthodes pour vérifier la distribution normale des résidus, comme par exemple l'examen de tracés Q-Q, le calcul de l'asymétrie et du kurtosis ou l'exécution de tests de normalité comme le test de Shapiro-Wilk.

Comment lire la table de Shapiro-Wilk ?

Si W calculé est inférieur au Wcritique de la table, la normalité est rejetée Dans le cas de l'exemple, W = 0.9739 > 0.842 l'hypothèse de normalité est acceptée. (Si W < 0.842, il y aurait refus avec un risque de 5% de rejeter une distribution normale.)

Le test de Shapiro Wilk en 2 minutes - Statistique

Trouvé 37 questions connexes

Pourquoi faire un test de normalité ?

En statistiques, les tests de normalité permettent de vérifier si des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas particuliers des tests d'adéquation (ou tests d'ajustement, tests permettant de comparer des distributions), appliqués à une loi normale.

Comment vérifier la normalité ?

La normalité est une condition indispensable à vérifier pour la réalisation des tests paramétriques en statistiques. Deux méthodes sont à retenir : La méthode graphique : examen visuel de la représentation graphique (l'histogramme, QQ-plot ou la boîte à moustache). Facile mais subjective.

Comment interpréter les résidus ?

Cette distance entre l'ordonnée du point du nuage et celle du point de la droite s'appelle le résidu. Pour les points situés au-dessus de la droite, le résidu est positif, et pour les points situés au-dessous de la droite, le résidu est négatif. Un nuage de points est représenté dans un plan repéré.

Comment savoir si test paramétrique ou non paramétrique ?

Définitions. Un test paramétrique est un test pour lequel on fait une hypothèse paramétrique sur la loi des données sous H0 (loi normale, loi de Poisson...); Les hypothèses du test concernent alors les paramètres de cette loi. Un test non paramétrique est un test ne nécessitant pas d'hypothèse sur la loi des données.

Comment faire un test de Kolmogorov-smirnov ?

Déroulement du test :
  1. On calcule FX et FY comme ci-dessus.
  2. On calcule K=sup|FX(x)−FY(x)|. ...
  3. On compare avec la valeur critique de la loi du Δ de Kolmogorov-Smirnov : si b est tel que P(Δ>b)=a P ( Δ > b ) = a et si K<√p+qpqb, K < p + q p q b , alors on accepte l'hypothèse, sinon on la rejette.

Quand utiliser le test de Bartlett ?

Le test de Bartlett peut être utilisé pour comparer deux variances ou plus. Ce test est sensible à la normalité des données. Autrement dit, si l'hypothèse de normalité des données semble fragile, on utilisera plutôt le test de Levene ou de Fisher.

Qu'est-ce que la normalité des résidus ?

L'hypothèse de normalité est l'une des hypothèses les plus importantes dans l'analyse de régression linéaire multiple (MLR). Il indique que la distribution des résidus (les différences entre les valeurs prédites et réelles de la variable dépendante) doit être normalement distribuée.

Quand Dit-on qu'une distribution est normal ?

Définition : la distribution normale est la distribution statistique de valeurs suivant une loi normale. C'est à dire des valeurs reposant sur un grand nombre de facteurs aléatoires.

Quand Dit-on qu'une variable suit une loi normale ?

On dit qu'une variable aléatoire X suit la loi normale centrée réduite, ce que l'on note X↪N(0,1) X ↪ N ( 0 , 1 ) si elle est continue et admet pour densité : f(x)=1√2πexp(−x22). f ( x ) = 1 2 π exp ⁡ Une telle variable aléatoire X admet alors une espérance et une variance : E(X)=0 et V(X)=1.

Quand utiliser un test paramétrique ?

Test statistique utilisé lorsque la ou les variables utilisées suivent une distribution prédéterminée. À l'exception du cas où la ou les variables suivent une loi normale, les tests paramétriques requièrent des échantillons de taille importante (> 30 observations).

Comment savoir quel test statistique utilisé ?

Pour les données qui suivent une loi normale, nous privilégions toujours les tests paramétriques. C'est à dire le test T de Student et l'ANOVA. Si cette condition n'est pas remplie, nous devons utiliser des tests non paramètriques tel que le test de Wilcoxon, test de Mann Whitney ou un Kruskal Wallis.

Quand faire le test de Mann-whitney ?

Le test U de Mann-Whitney est donc le pendant non paramétrique du test t pour échantillons indépendants ; il est soumis à des hypothèses moins strictes que le test t. Par conséquent, le test U de Mann-Whitney est toujours utilisé lorsque la condition de distribution normale du test t n'est pas remplie.

C'est quoi le test d Hétéroscédasticité ?

Il s'agit d'un test de diagnostic couramment utilisé pour détecter l'hétéroscédasticité dans les modèles de régression. Le test examine essentiellement si les résidus du modèle présentent des modèles d'hétéroscédasticité en régressant les carrés des résidus sur les variables indépendantes incluses dans le modèle.

C'est quoi la droite de régression ?

La droite de régression fournit une idée schématique, mais souvent très utile, de la relation entre les deux variables. En particulier, elle permet facilement d'apprécier comment évolue l'une des variables (le critère9 en fonction de l'autre (le prédicteur).

Comment savoir si un ajustement linéaire est pertinent ?

r est un nombre compris entre –1 et 1. Plus il est proche de ces deux valeurs, plus l'ajustement affine est pertinent. En revanche, plus il est proche de 0, moins il l'est. De plus, si r est très proche de 1, la droite d'ajustement affine est croissante et si r est très proche de –1, elle est décroissante.

Quels sont les tests non paramétriques ?

Un test non paramétrique est un test d'hypothèse qui n'exige pas que la distribution de la population soit caractérisée par certains paramètres. Par exemple, de nombreux tests d'hypothèse supposent que la population obéit à une loi normale pour les paramètres µ et σ.

Quand faire un test de Kruskal-wallis ?

Le test de Kruskal-Wallis est un test non paramétrique à utiliser lorsque vous êtes en présence de k échantillons indépendants, afin de déterminer si les échantillons proviennent d'une même population ou si au moins un échantillon provient d'une population différente des autres.

Qui définit la normalité ?

La normalité est ce qui est conforme à ce dont on a l'habitude, ce qui ne surprend, ne dérange ni n'attire la curiosité car moyen (norme) et considéré de ce fait comme règle à suivre.

Comment savoir si un test est significatif ?

Un test est dit statistiquement significatif lorsque le risque quantifié de se tromper, nommé p-valeur, est inférieur à un niveau de signification alpha. Pour être plus précis, la valeur-p est la probabilité d'obtenir une donnée aussi extrême sous l'hypothèse nulle.

Comment interpréter un test statistique ?

Comment interpréter les sorties d'un test statistique : le niveau de significativité alpha et la p-value. Lors de la mise en place d'une étude, il faut spécifier un seuil de risque au-dessus duquel H0 ne doit pas être rejetée. Ce seuil est appelé niveau de significativité alpha et doit être compris entre 0 et 1.

Article précédent
Pourquoi arrêter sa thèse ?