Le test de Shapiro-Wilk est le plus utilisé pour évaluer la distribution Normale d'un échantillon. Il est adapté aussi bien aux petits qu'aux grands échantillons. Ce test réalisable sur un logiciel de statistique donne directement la p-value.
Pour tester la normalité, il existe plusieurs tests qui permettent de valider ou non l'hypothèse selon laquelle la répartition des pièces suit une loi normale. Les tests habituellement utilisés sont : Le test de Khi2. Le test d'Anderson-Darling.
Les deux tests de normalité les plus connus, à savoir le test de Kolmogorov-Smirnov et le test de Shapiro-Wilk, sont les méthodes les plus couramment utilisées pour vérifier la normalité des données. Ces tests peuvent être effectués à l'aide du logiciel statistique SPSS (Analyse → Statistiques descriptives → Explorer → Graphiques → Graphiques de normalité avec tests).
La méthode la plus courante pour tester la normalité. Il calcule une statistique basée sur la corrélation entre les données et les valeurs attendues sous une distribution normale. Cela produit une p-value qui indique la probabilité d'observer une telle corrélation si les données étaient normalement distribuées.
Si la population suit une loi normale initiale, la moyenne de l'échantillon suit également une loi normale, quelle que soit la taille de l'échantillon. Pour des échantillons de toute taille prélevés dans une population suivant une loi normale, la moyenne de l'échantillon suit une loi normale, de moyenne μ<sub>X</sub> = μ et d'écart-type σ .
Théorème central limite : Le théorème central limite stipule que si la taille des échantillons est supérieure ou égale à 30, ou si la population est normalement distribuée , alors la distribution d'échantillonnage des moyennes d'échantillon est approximativement normalement distribuée avec une moyenne égale à la moyenne de la population.
Caractéristiques de la distribution normale
Les distributions normales sont symétriques, unimodales et asymptotiques ; leur moyenne, leur médiane et leur mode sont égaux. Une distribution normale est parfaitement symétrique par rapport à son centre.
Méthodes visuelles
La distribution de fréquence (histogramme), le diagramme en tiges et feuilles, le diagramme en boîte, le diagramme PP (diagramme de probabilité-probabilité) et le diagramme QQ (diagramme quantile-quantile) sont utilisés pour vérifier visuellement la normalité (2).
Examinons les options ci-dessus : l’ANOVA à un facteur est considérée comme un test robuste face à l’hypothèse de normalité . Cela signifie qu’elle tolère assez bien les violations de cette hypothèse.
Le test de t s'applique seulement quand on a une seule variable explicative catégorique, qui comprend 2 niveaux. Pour tous les autres modèles linéaires avec des variables explicatives catégoriques avec > 2 niveaux, on utilise une ANOVA.
Test de Shapiro-Wilk : Ce test compare les quantiles des données de l’échantillon à ceux d’une distribution normale. Il est particulièrement fiable pour les petits échantillons (< 50). Test de Kolmogorov-Smirnov : Ce test compare la fonction de répartition des données de l’échantillon à la fonction de répartition attendue d’une loi normale.
Le test de Shapiro-Wilk est le plus utilisé pour évaluer la distribution Normale d'un échantillon. Il est adapté aussi bien aux petits qu'aux grands échantillons. Ce test réalisable sur un logiciel de statistique donne directement la p-value.
En statistiques, les tests de normalité permettent de vérifier si des données réelles suivent une loi normale ou non.
En statistiques, le test de Kolmogorov-Smirnov est un test d'hypothèse utilisé pour déterminer si un échantillon suit bien une loi donnée connue par sa fonction de répartition continue, ou bien si deux échantillons suivent la même loi.
Effectuer un test de normalité
Sélectionnez Stat > Statistiques élémentaires > Test de normalité. Les résultats du test indiquent si vous devez rejeter ou accepter l'hypothèse nulle qui suppose que les données proviennent d'une population normalement distribuée.
La compréhension et le respect de ces hypothèses sont essentiels à la validité de l'analyse. Voici une explication simplifiée et détaillée de ces hypothèses : (1) données d'intervalle de la variable dépendante, (2) normalité, (3) homoscédasticité et (4) absence de multicolinéarité .
Le test de Kruskal-Wallis peut être utilisé pour déterminer si au moins deux groupes diffèrent l'un de l'autre. Le test de Kruskal-Wallis n'apporte pas de réponse à la question de savoir lequel des groupes diffère ; un test post-hoc est nécessaire à cet effet.
Méthodes graphiques
Une méthode informelle pour tester la normalité consiste à comparer l'histogramme des données de l'échantillon à une courbe de probabilité normale . La distribution empirique des données (l'histogramme) devrait avoir une forme de cloche et ressembler à la distribution normale.
Test de Shapiro-Wilk : La taille d'échantillon recommandée pour ce test varie de 7 à 2 000. Origin accepte des échantillons de 3 à 5 000. Cependant, lorsque la taille de l'échantillon est relativement importante, les tests de D'Agostino K² ou de Lilliefors sont généralement préférés au test de Shapiro-Wilk.
Un test d'hypothèse (ou test statistique) est une démarche qui a pour but de fournir une règle de décision permettant, sur la base de résultats d'échantillon, de faire un choix entre deux hypothèses statistiques.
Si X < 5% : la loi de distribution des variables n'est pas considérée comme suivant une loi normale. Si X >= 5% : l'hypothèse de normalité est acceptée, on peut considérer que la loi de distribution suit une loi normale.
Une distribution normale possède deux paramètres : la moyenne μ et la variance σ² . La moyenne peut prendre n’importe quelle valeur réelle et la variance peut prendre n’importe quelle valeur positive ou nulle. Notation : « X ∼ N(μ, σ²) » indique que la variable aléatoire X suit une loi normale de moyenne μ et de variance σ².
APPLICATIONS DE LA COURBE DE PROBABILITÉ NORMALE
Pour généraliser à partir de la population dont sont issus les échantillons, en calculant l'erreur standard de la moyenne et d'autres statistiques . Pour comparer deux distributions. Le NPC est utilisé pour comparer deux distributions. Pour déterminer les valeurs de difficulté.