Quand utiliser corrélation de Pearson ?

Interrogée par: Dorothée Louis  |  Dernière mise à jour: 14. März 2024
Notation: 4.6 sur 5 (42 évaluations)

Le coefficient de corrélation de Pearson est utilisé pour les données bivariées continues afin de déterminer l'intensité et le sens de la corrélation linéaire entre les deux ensembles de données.

Quand utiliser Pearson ou Spearman ?

La corrélation de Spearman utilise le rang des données pour mesurer la monotonie entre des variables ordinales ou continues. La corrélation de Pearson quant à elle détecte des relations linéaires entre des variables quantitatives avec des données suivant une distribution normale.

Comment interpréter la corrélation de Pearson ?

Le coefficient de corrélation linéaire, ou de Bravais-Pearson, permet de mesurer à la fois la force et le sens d'une association. Variant de -1 à +1, il vaut 0 lorsqu'il n'existe pas d'association. Plus ce coefficient est proche de -1 ou +1, plus l'association entre les deux variables est forte, jusqu'à être parfaite.

Quelles sont les conditions de validité d'un test de corrélation de Pearson ?

Pour faire court, la seule condition de validité pour le calcul d'un coefficient de corrélation de Pearson ou l'estimation d'une régression linéaire, est l'existence d'une variance non-nulle sur chacune des deux variables, sous peine de division par zéro.

Quel test de corrélation utiliser ?

Le coefficient de corrélation, mesuré par la fonction cor(), permet de savoir à quel point deux variables quantitatives sont corrélées. Il existe 3 méthodes pour tester la significativité de ce coefficient : la méthode de « Pearson », de « Kendall », et de « Spearman ».

Le test de corrélation de Pearson

Trouvé 30 questions connexes

Quel test utiliser pour comparer deux variables qualitatives ?

Pour savoir si la distribution des réponses de deux variables qualitatives est due au hasard ou si elle révèle une liaison entre elles, on utilise généralement le test du Khi2 dit «Khi-deux».

Quel coefficient de corrélation utiliser ?

Un coefficient de 0,1 indique ainsi une relation linéaire positive existante, mais faible et probablement anecdotique. À l'inverse, un coefficient de 0,9 indique une relation linéaire très forte. En pratique, on ne considère la corrélation comme significative que lorsque la valeur du coefficient dépasse 0,8.

Quelle est la différence entre la corrélation et la régression ?

La corrélation mesure l'intensité de la liaison entre des variables, tandis que la régression analyse la relation d'une variable par rapport à une ou plusieurs autres.

Comment savoir si deux variables sont corrélées ?

Le coefficient de Pearson permet de mesurer le niveau de corrélation entre les deux variables. Il renvoie une valeur entre -1 et 1. S'il est proche de 1 cela signifie que les variables sont corrélées, proche de 0 que les variables sont décorrélées et proche de -1 qu'elles sont corrélées négativement.

Comment choisir le bon test statistique ?

On choisit un test statistique selon plusieurs facteurs:
  1. Etude Comparative ou Explicative. Premièrement on choisit un test selon le type de l'étude ou d'analyse à réaliser. ...
  2. Critères à échelle Quantitative ou Qualitative. ...
  3. Normalité et égalité des variances. ...
  4. Taille des échantillons.

Comment savoir si un coefficient est significatif ?

Pour être interprété, le coefficient de corrélation doit être significatif (la valeur de p doit être plus petite que 0,05). Si le coefficient est non significatif, on considère qu'il est semblable à r = 0.

Quels sont les différents types de corrélation ?

Il existe 2 types de corrélation : la corrélation positive et la corrélation négative.

Quand les conditions de validité d'un test de corrélation de Pearson ne sont pas remplies on doit réaliser ?

Conditions de la corrélation de Pearson

La meilleure façon de vérifier si les variables ont une corrélation linéaire est d'utiliser un nuage de points. Si ces conditions ne sont pas remplies, on utilise la corrélation de Spearman.

Comment interpréter le test de Spearman ?

Une valeur de 0 de 𝑟  indique qu'il n'y a pas de relation entre les variables. Plus la valeur de 𝑟  est proche de − 1 ou 1, plus la corrélation est forte ; et plus elle est proche de 0, plus la corrélation est faible.

Comment calculer le coefficient de corrélation de Pearson ?

Formule du coefficient de corrélation de Pearson
  1. N = le nombre de paires de scores.
  2. Σxy = la somme des produits des scores appariés.
  3. Σx = la somme des scores x.

Comment savoir si une variable est quantitative ou qualitative R ?

Deux grands types sont distingués : les variables quantitatives, sur lesquelles des résumés numériques peuvent être calculés (âge pour des individus, population pour des communes) ; les variables qualitatives, qui regroupent les individus dans un nombre fini de modalités (sexe pour des individus, département d' ...

Quel test pour deux variables quantitatives ?

Le test le plus utilisé pour tester la liaison entre une variable quantitative et une variable qualitative à deux (2) modalités est le test de Student (alternative test de Man-Withney).

Quels sont les 4 types de variables ?

Ces types sont définis brièvement dans cette section.
  • Variables catégoriques. Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n'est pas quantifiable. ...
  • Variables nominales. ...
  • Variables ordinales. ...
  • Variables numériques. ...
  • Variables continues. ...
  • Variables discrètes.

Comment savoir si c'est une variable discrète ou continue ?

Une variable discontinue est dite discrète si elle ne contient que des valeurs entières (exemple : nombre d'enfants d'une famille). Par ailleurs, une variable continue accepte toutes les valeurs d'un intervalle fini ou infini (exemple : diamètre de pièces, salaires…).

Quand utiliser la régression ?

La régression linéaire va vous permettre d'en analyser la nature. Par exemple, si le prix d'un produit particulier change en permanence, vous pouvez utiliser l'analyse de régression pour déterminer si la consommation baisse à mesure que le prix augmente.

Quand on utilise la régression linéaire ?

La régression linéaire simple permet d'estimer les paramètres de la droite liant la variable réponse à la variable prédictive, mais elle permet également d'évaluer si cette relation est significative ou non. Pour cela, un test T est employé pour évaluer si la pente est significativement différente de 0 ou non.

Quand utiliser régression ?

Principes de la régression logistique

Elle est très utilisée dans le domaine médical (guérison ou non d'un patient), en sociologie, en épidémiologie, en marketing quantitatif (achat ou non de produits ou services suite à une action) et en finance pour la modélisation de risques (scoring).

Qu'est-ce qu'un bon R2 ?

Il n'y a pas de score minimum, mais un modèle simple prédisant tout le temps la valeur moyenne atteint un score R2 de 0%. Par conséquent un score R2 négatif signifie que les prédictions sont moins bonnes que si l'on prédisait systématiquement la valeur moyenne.

Quel test statistique utiliser R ?

Il s'agit d'une variable numérique. Les tests que vous pouvez utiliser sont alors le test de Student ou le test de Wilcoxon-Mann-Whitney, selon si les groupes suivent une distribution normale (en forme de cloche).