Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n'est pas quantifiable. Une variable catégorique peut être nominale ou ordinale.
Une variable qualitative est une variable dont les valeurs sont des caractéristiques ou des catégories. Ces valeurs sont exprimées à l'aide de noms plus ou moins significatifs (par exemple, essai 1, essai 2, essai 3, ...) ou de codes (par exemple, les lettres A, B, C).
Les variables qualitatives les plus simples sont les variables qualitatives binaires (ou dichotomiques) qui ne comptent que deux modalités ; c'est le cas par exemple pour le sexe, ou pour le codage de la plupart des états pathologiques (présence ou absence de la maladie).
Deux variables quantitatives sont corrélées si elles tendent à varier l'une en fonction de l'autre. On parle de corrélation positive si elles tendent à varier dans le même sens, de corrélation négative si elles tendent à varier en sens contraire.
Une variable discrète est une variable qui peut prendre uniquement certaines valeurs d'un intervalle de nombres réels. Généralement, les valeurs admissibles ne sont que les nombres entiers.
Un caractère quantitatif est discret s'il prend un nombre fini de valeurs ou continu, s'il prend toutes les valeurs entre deux limites.
La meilleure façon d'identifier les variables dépendantes et indépendantes dans la recherche est de mettre les variables dans la phrase« Les variables indépendantes provoquent un changement dans la variable dépendante ».”.
Le test le plus utilisé pour tester la liaison entre une variable quantitative et une variable qualitative à deux (2) modalités est le test de Student (alternative test de Man-Withney).
Caractère qualitatif : Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que moyenne, somme, ... , n'ont pas de sens.
La principale différence entre les variables nominales et les variables ordinales est que les variables ordinales ont un ordre de catégories alors que les variables nominales n'en ont pas.
Exemple : l'âge est théoriquement une variable quantitative continue, mais en pratique l'âge est mesuré dans le meilleur des cas au jours près.
Une variable nominale est aussi appelée qualitative. Elle désigne une variable qui ne prend qu'un nombre limité de valeurs (ou modalités) et où ces valeurs n'ont entre elles aucune relation apparente.
Il est possible de regrouper les données relatives à deux variables qualitatives sous la forme d'un tableau d'effectifs ou de fréquences. On parle de tableau de contingence. La réalisation d'un tableau de contingence sur R se fait à l'aide de la commande table() .
Mise en contexte et spécificité de la recherche qualitative
Celle-ci se caractérise par l'organisation d'entretiens approfondis, des observations ou des entretiens de groupe, permettant d'atteindre une connaissance émique et étique de la réalité étudiée. Le choix de la méthode dépend de la question de recherche.
Or selon la théorie il faut faire un test de Fisher lorsque la présence de racine unitaire n'est pas rejetée (p. value > 5%). Dans le cas contraire, le test convenable est en principe celui de student pour tester uniquement la significativité de la tendance ou de la constante.
5.3.2 Quantitatif à qualitatif
Si une variable numérique contient en réalité un petit nombre de valeurs différentes, il suffit de convertir la classe de l'objet de numeric vers factor ou ordered pour que R comprenne que la variable doit être traitée comme une variable qualitative.
ANOVA permet de déterminer si la différence entre les valeurs moyennes est statistiquement significative. ANOVA révèle aussi indirectement si une variable indépendante influence la variable dépendante.
Les variables doivent correspondre exactement à la problématique et se reporter à l'objet et son unité d'échantillonnage. Un ensemble de variables sera complet et pertinent si l'information apportée permet de décrire toutes les situations possibles pour répondre à l'objectif.
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.
Une variable discrète a une valeur finie. Il est possible de les énumérer ( » 1, 2, 3,… »). Une variable continue peut prendre, en théorie, une infinité des valeurs, formant un ensemble continu.
La déclaration d'une variable caractère doit être de la forme : char nom_de_la_variable; Les valeurs possibles pour ce type de variable correspondent aux caractères ASCII. Nous pouvons remarquer qu'une valeur caractère doit toujours être entourée par des apostrophes ' '.
On distingue deux types de variables : qualitatives et quantitatives. Les variables qualitatives sont évaluées grâce à un libellé (un mot, une étiquette). Les variables quantitatives sont quant à elles représentées par des nombres.