Lorsque l'on cherche à déterminer si deux variables numériques sont liées, on parle de corrélation. Les trois tests de corrélation les plus utilisés sont ceux de Spearman, Kendall et Pearson. Les deux premiers sont des tests non-paramétriques que l'on peut également appliquer sur des variables qualitatives ordinales.
Un test statistique (ou test d'hypothèse) consiste à détecter une différence significative : Entre une population étudiée et une valeur cible (Test de comparaison à une valeur théorique ou test de -conformité). Entre deux populations (Test de comparaison de population ou test d'homogénéité)
Test unilatéral : test statistique pour lequel on prend comme hypothèse alternative l'existence d'une différence dont le sens est connu. Test bilatérale : test statistique pour lequel on prend, comme hypothèse alternative, l'existence d'une différence, dans un sens ou l'autre.
Lorsque l'un des effectifs théoriques est inférieur à 5 ou lorsque les sommes marginales du jeu de données réel sont très déséquilibrées, il est préférable de se fier au test exact de Fisher.
Le test U de Mann-Whitney est donc le pendant non paramétrique du test t pour échantillons indépendants ; il est soumis à des hypothèses moins strictes que le test t. Par conséquent, le test U de Mann-Whitney est toujours utilisé lorsque la condition de distribution normale du test t n'est pas remplie.
Le test de McNemar permet de déterminer si des proportions appariées sont différentes. Vous pouvez par exemple l'utiliser pour déterminer si un programme de formation à un effet sur la proportion de participants qui répondent correctement à une question.
Le test t est utilisé lorsque vous devez trouver la moyenne de la population entre deux groupes, tandis que lorsqu'il y a trois groupes ou plus, vous optez pour le test ANOVA. Le test t et l'ANOVA sont tous deux des méthodes statistiques permettant de tester une hypothèse.
L'analyse de la variance (ANOVA) est très utilisée en statistique et dans le domaine des études marketing. Cette méthode analytique puissante sert à mettre en avant des différences ou des dépendances entre plusieurs groupes statistiques.
Le test de Kruskal-Wallis est un test non paramétrique à utiliser lorsque vous êtes en présence de k échantillons indépendants, afin de déterminer si les échantillons proviennent d'une même population ou si au moins un échantillon provient d'une population différente des autres.
on calcule la probabilité observée : p=kn. p = k n . on calcule l'écart du test : t=|p−p0|√p(1−p)√n.
Lorsque l'on cherche à déterminer si deux variables numériques sont liées, on parle de corrélation. Les trois tests de corrélation les plus utilisés sont ceux de Spearman, Kendall et Pearson. Les deux premiers sont des tests non-paramétriques que l'on peut également appliquer sur des variables qualitatives ordinales.
En statistiques, les tests de normalité permettent de vérifier si des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas particuliers des tests d'adéquation (ou tests d'ajustement, tests permettant de comparer des distributions), appliqués à une loi normale.
Le test de comparaison de k proportions sert à déterminer si k proportions peuvent être considérées comme étant toutes égales (hypothèse nulle H0) ou si au moins deux proportions sont différentes (hypothèse alternative Ha). XLSTAT propose trois approches différentes pour la comparaison de k proportions.
Si la statistique-t est supérieure à la valeur critique, alors la différence est significative. Si la statistique-t est inférieure, il n'est pas possible de différencier les deux nombres d'un point de vue statistique.
Le test de Bartlett peut être utilisé pour comparer deux variances ou plus. Ce test est sensible à la normalité des données. Autrement dit, si l'hypothèse de normalité des données semble fragile, on utilisera plutôt le test de Levene ou de Fisher.
L'ANOVA univariée est généralement utilisée lorsque l'on a une seule variable indépendante, ou facteur, et que l'objectif est de vérifier si des variations, ou des niveaux différents de ce facteur ont un effet mesurable sur une variable dépendante.
L'Analyse de la variance (analysis of variance) est une technique statistique simple et très utilisée afin d'examiner la relation entre deux (ou plusieurs) variables et notamment entre une variable explicative et une variable cible (ou dépendante).
On obtient une p-value que l'on compare avec 0,05 (ou tout autre seuil). Si elle est supérieure, on ne rejette pas H0. En cas de variances parfaitement égales, TEST. F donne 1 ; en revanche, plus les variances sont dissemblables, plus la p-value tend vers zéro.
Si la valeur p du test de Levene est supérieure à 0,05, alors les variances ne sont pas significativement différentes les unes des autres (c'est-à-dire que l'hypothèse d'homogénéité de la variance est satisfaite).
Il peut être utilisé dans le cadre d'une ANOVA ou bien sur des données brutes pour évaluer par exemple si des moyennes sont significativement différentes l'une de l'autre.
Conditions d'application du test de Kruskal-Wallis
 Pour calculer un test de Kruskal-Wallis, il suffit de disposer de plusieurs échantillons aléatoires indépendants présentant au moins des caractéristiques à échelle ordinale. Les variables ne doivent pas nécessairement satisfaire à une courbe de distribution.
En statistique, le test de Wilcoxon-Mann-Whitney (ou test U de Mann-Whitney ou encore test de la somme des rangs de Wilcoxon) est un test statistique non paramétrique qui permet de tester l'hypothèse selon laquelle les distributions de chacun de deux groupes de données sont proches.