Corrélation de rang de Spearman dans Excel : formule et graphique

  • Partage Ça
Michael Brown

Ce tutoriel explique les bases de la corrélation de Spearman dans un langage simple et montre comment calculer le coefficient de corrélation de rang de Spearman dans Excel.

Lorsque vous effectuez une analyse de corrélation dans Excel, vous utilisez le plus souvent la corrélation de Pearson. Mais comme le coefficient de corrélation de Pearson ne mesure qu'une relation linéaire entre deux variables, il ne fonctionne pas pour tous les types de données - vos variables peuvent être fortement associées de manière non linéaire et avoir un coefficient proche de zéro. Dans ces circonstances, vous pouvez utiliser la méthode de Spearmancorrélation de rang au lieu de celle de Pearson.

    Corrélation de Spearman - les bases

    Le site corrélation de Spearman est la version non paramétrique du coefficient de corrélation de Pearson qui mesure le degré d'association entre deux variables en fonction de leur rang.

    Le site Corrélation du moment produit de Pearson teste le linéaire relation entre deux variables continues. On parle de relation linéaire lorsque deux variables évoluent dans le même sens à un rythme constant.

    Corrélation de rang de Spearman évalue le monotone Dans une relation monotone, les variables ont également tendance à changer ensemble, mais pas nécessairement à un rythme constant.

    Quand faire une corrélation de Spearman

    L'analyse de corrélation de Spearman doit être utilisée dans l'une des circonstances suivantes lorsque les hypothèses sous-jacentes de la corrélation de Pearson ne sont pas satisfaites :

    1. Si vos données montrent une non linéaire ou ne sont pas normalement distribués.
    2. Si au moins une variable est ordinal Si vos valeurs peuvent être placées dans l'ordre "premier, deuxième, troisième...", vous avez affaire à des données ordinales.
    3. S'il y a des aberrations Contrairement à la corrélation de Pearson, la corrélation de Spearman n'est pas sensible aux valeurs aberrantes car elle effectue des calculs sur les rangs, de sorte que la différence entre les valeurs réelles n'a pas de signification.

    Par exemple, vous pouvez utiliser la corrélation de Spearman pour trouver les réponses aux questions suivantes :

    • Les personnes ayant un niveau d'éducation élevé sont-elles plus préoccupées par l'environnement ?
    • Le nombre de symptômes d'un patient est-il lié à sa volonté de prendre des médicaments ?

    coefficient de corrélation de Spearman

    En matière de statistiques, le coefficient de corrélation de Spearman est représenté soit par r s ou la lettre grecque ρ ("rho"), c'est pourquoi il est souvent appelé Rho de Spearman .

    Le coefficient de corrélation des rangs de Spearman mesure à la fois la force et la direction de la relation entre les rangs des données. Il peut prendre toute valeur comprise entre -1 et 1, et plus la valeur absolue du coefficient est proche de 1, plus la relation est forte :

    • 1 est une corrélation positive parfaite
    • -1 est une corrélation négative parfaite
    • 0 signifie aucune corrélation

    Formule de corrélation de rang de Spearman

    Selon qu'il y a ou non des ex-aequo dans le classement (le même rang attribué à deux ou plusieurs observations), le coefficient de corrélation de Spearman peut être calculé avec l'une des formules suivantes.

    S'il y a pas de grades liés une formule plus simple fera l'affaire :

    Où :

    • d i est la différence entre une paire de rangs
    • n est le nombre d'observations

    Pour traiter rangs serrés il faut utiliser la version complète de la formule de corrélation de Spearman, qui est une version légèrement modifiée du r de Pearson :

    Où :

    • R(x) et R(y) sont les rangs des x et y variables
    • R(x) et R(y) sont les rangs moyens.

    Comment calculer la corrélation de Spearman dans Excel avec la fonction CORREL

    Malheureusement, Excel ne dispose pas d'une fonction intégrée pour calculer le coefficient de corrélation de Spearman. Cependant, cela ne signifie pas que vous devez vous creuser la tête avec les formules ci-dessus. En manipulant un peu Excel, nous pouvons trouver une façon beaucoup plus simple de faire la corrélation de Spearman.

    Dans la colonne B, nous avons le nombre de minutes que 10 hommes du même âge passent quotidiennement dans une salle de sport, et dans la colonne C, nous avons leur pression artérielle systolique.

    Pour trouver le coefficient de corrélation de Spearman dans Excel, procédez comme suit :

    1. Classez vos données

      Étant donné que la corrélation de Spearman évalue les associations entre deux variables en fonction de leur rang, vous devez classer vos données sources, ce que vous pouvez faire rapidement en utilisant la fonction Excel RANK.AVG.

      Pour classer la première variable (activité physique), entrez la formule ci-dessous en D2 et faites-la glisser vers le bas en D11 :

      =RANK.AVG(B2,$B$2:$B$11,0)

      Pour classer la deuxième variable (pression artérielle), mettez la formule suivante dans la cellule E2 et copiez-la dans la colonne :

      =RANK.AVG(C2,$C$2:$C$11,0)

      Pour que les formules fonctionnent correctement, veillez à verrouiller les plages avec des références de cellules absolues.

      À ce stade, vos données sources devraient ressembler à ceci :

    2. Trouver le coefficient de corrélation de Spearman

      Les rangs étant établis, nous pouvons maintenant utiliser la fonction CORREL d'Excel pour obtenir le rho de Spearman :

      =CORREL(D2:D11, E2:E11)

      La formule donne un coefficient de -0,7576 (arrondi à 4 chiffres), ce qui montre une corrélation négative assez forte et nous permet de conclure que plus une personne fait de l'exercice, plus sa tension artérielle est basse.

      Le coefficient de corrélation de Pearson pour le même échantillon (-0,7445) indique une corrélation un peu plus faible, mais toujours statistiquement significative :

    L'intérêt de cette méthode est qu'elle est rapide, facile et qu'elle fonctionne qu'il y ait ou non des ex-aequo dans le classement.

    Calculer le coefficient de corrélation de Spearman dans Excel avec la formule traditionnelle

    Si vous n'êtes pas tout à fait sûr que la fonction CORREL a bien calculé le rho de Spearman, vous pouvez vérifier le résultat à l'aide de la formule traditionnelle utilisée en statistique. Voici comment procéder :

    1. Trouvez la différence entre chaque paire de rangs ( d ) en soustrayant un rang à l'autre :

      =D2-E2

      Cette formule va dans F2 et est ensuite copiée dans la colonne.

    2. Augmenter chaque différence de rang à la puissance deux ( d2 ) :

      =F2^2

      Cette formule va dans la colonne G.

    3. Additionnez les différences au carré :

      =SUM(G2:G11)

      Cette formule peut aller dans n'importe quelle cellule vide, G12 dans notre cas.

      La capture d'écran suivante vous permettra probablement de mieux comprendre la disposition des données :

    4. Selon que votre ensemble de données comporte ou non des rangs liés, utilisez l'une de ces formules pour calculer le coefficient de corrélation de Spearman.

    Dans notre exemple, il n'y a pas d'égalité, nous pouvons donc utiliser une formule plus simple :

    Avec d2 égal à 290, et n (nombre d'observations) égale à 10, la formule subit les transformations suivantes :

    Comme résultat, vous obtenez -0,757575758, ce qui correspond parfaitement au coefficient de corrélation de Spearman calculé dans l'exemple précédent.

    Dans Microsoft Excel, les calculs ci-dessus peuvent être effectués avec l'équation suivante :

    =1-(6*G12/(10*(10^2-1)))

    Où G12 est la somme des différences de rang au carré (d2).

    Comment établir une corrélation de Spearman dans Excel à l'aide d'un graphique ?

    Les coefficients de corrélation dans Excel ne mesurent que les relations linéaires (Pearson) ou monotones (Spearman). Cependant, d'autres associations sont possibles. Ainsi, quelle que soit la corrélation que vous effectuez, il est toujours bon de représenter la relation entre les variables dans un graphique.

    Pour dessiner un graphique de corrélation pour les données classées, voici ce que vous devez faire :

    1. Calculez les rangs en utilisant la fonction RANK.AVG comme expliqué dans cet exemple.
    2. Sélectionnez deux colonnes avec les rangs.
    3. Insérez un diagramme de dispersion XY. Pour cela, cliquez sur le bouton Diffuser graphique sur l'icône Insertion dans l'onglet Chats groupe.
    4. Pour ajouter une ligne de tendance à votre graphique, le moyen le plus rapide est de cliquer sur le bouton Éléments du graphique bouton> ; Ajouter une ligne de tendance... .
    5. Affichez la valeur de R au carré sur le graphique. Double-cliquez sur la ligne de tendance pour ouvrir son volet, passez à l'écran de la ligne de tendance. Options de ligne de tendance et sélectionnez l'onglet Afficher la valeur de R-carré sur la carte boîte.
    6. Montrez plus de chiffres dans la valeur R2 pour une meilleure précision.

    En conséquence, vous obtiendrez une représentation visuelle de la relation entre les rangs. En outre, vous obtiendrez l'information suivante Coefficient de détermination (R2), dont la racine carrée est le coefficient de corrélation de Pearson (r). Mais comme vous avez tracé les données classées, ce r de Pearson n'est rien d'autre que le rho de Spearman.

    Pour ajouter le signe approprié, il suffit de regarder la ligne de votre graphique de corrélation - une pente ascendante indique une corrélation positive (signe plus) et une pente descendante indique une corrélation négative (signe moins).

    Dans notre cas, R2 est égal à 0,5739210285. Utilisez la fonction SQRT pour trouver la racine carrée :

    =SQRT(0,5739210285)

    ...et vous obtiendrez le coefficient déjà connu de 0,757575758.

    La pente descendante du graphique indique une corrélation négative, nous ajoutons donc le signe moins et obtenons le coefficient de corrélation de Spearman correct de -0,757575758.

    C'est ainsi que vous pouvez calculer le coefficient de corrélation de Spearman dans Excel. Pour examiner de plus près les exemples présentés dans ce tutoriel, nous vous invitons à télécharger notre classeur type ci-dessous. Je vous remercie de votre lecture et j'espère vous voir sur notre blog la semaine prochaine !

    Cahier d'exercices

    Corrélation des rangs de Spearman en Excel (fichier .xlsx)

    Michael Brown est un passionné de technologie passionné par la simplification de processus complexes à l'aide d'outils logiciels. Avec plus d'une décennie d'expérience dans l'industrie de la technologie, il a perfectionné ses compétences dans Microsoft Excel et Outlook, ainsi que dans Google Sheets et Docs. Le blog de Michael est dédié au partage de ses connaissances et de son expertise avec les autres, en fournissant des conseils et des tutoriels faciles à suivre pour améliorer la productivité et l'efficacité. Que vous soyez un professionnel chevronné ou un débutant, le blog de Michael offre des informations précieuses et des conseils pratiques pour tirer le meilleur parti de ces outils logiciels essentiels.