Comment calculer une matrice de corrélation

<article data-type="article">
Comment calculer une matrice de corrélation

La corrélation (r) est une mesure de la relation linéaire entre les deux variables. Par exemple, la longueur de la jambe et la longueur du torse sont hauteur très correlated- et le poids sont moins fortement corrélés, la hauteur et la longueur du nom (en lettres) sont décorrélées.


Une corrélation parfaite positif: r = 1. (Quand on monte l`autre monte)
Une corrélation négative parfaite: r = -1 (Quand on monte, l`autre descend)
Aucune corrélation: r = 0 (Il n`y a pas de relation linéaire)


Une matrice de corrélation est une matrice de nombreuses corrélations.

Choses que vous devez

  • Ordinateur avec R, SAS ou un autre logiciel de statistiques

Calcul d`une matrice de corrélation R




  • Obtenir les données. Si vos données sont dans Excel, la méthode la plus simple est de l`enregistrer comme un fichier .csv (Dans Excel 7, cliquez sur "Fichier", puis "Enregistrer sous," puis "d`autres formats." Puis dans "Sauvegarder comme type," faites défiler vers CSV (valeurs séparées par des virgules). Chaque ligne doit avoir des données sur un sujet, et chaque colonne doit être une variable.

  • Lire les données en utilisant R read.csv. Par exemple, si vos données sont en "c: mydisk mydir data.csv" Entrer
    mes données lt; - read.csv ("c: /mydisk/mydir/data.csv").

  • Calculer la matrice en utilisant la corrélation cor (). Par exemple: cor (mydata). Ou, vous pouvez stocker la matrice de corrélation comme un objet pour une utilisation ultérieure, en utilisant: MATCOR lt; - cor (mydata).

Calcul d`une matrice de corrélation avec SAS

  • Obtenir les données. SAS peut lire des données dans de nombreux formats. Si vous stockez vos données dans Excel, disposent d`un sujet sur chaque ligne et une variable dans chaque colonne

  • Lire les données dans SAS. Vous pouvez utiliser l`assistant d`importation pour obtenir vos données. Cliquer sur "Fichier," puis "Importer des données," puis choisissez un type de données en utilisant le menu déroulant. Cliquez "Prochain" et accédez à vos données, puis cliquez sur "Terminer."

  • Calculer la matrice de corrélation. Si vos données sont enregistrées dans SAS mydata, avec des variables VAR1, VAR2 et VAR3, puis tapez: données PROC CORR = mydata- VAR var1 var2 var3- RUN;

Conseils & Avertissements

  • Dans les deux SAS et R, il existe des options pour différents types de corrélations (e .g, Pearson, Spearman de).
  • Rappelez-vous que les corrélations ne trouvent des relations linéaires. Si la relation entre deux corrélations ne sont pas linéaires, les corrélations ne sont pas un bon choix.
  • Pour obtenir plus d`aide avec R, R commencer, puis tapez? Cor.
  • Si la deuxième référence ci-dessous (R Aide) ne fonctionne pas, puis commencer à R et tapez? Cor.

AUTRES

» » » » Comment calculer une matrice de corrélation