Le coefficient de détermination (R², soit le carré du coefficient de corrélation linéaire r) est un indicateur qui permet de juger la qualité d’une régression linéaire simple. Il mesure l’adéquation entre le modèle et les données observées ou encore à quel point l’équation de régression est adaptée pour décrire la distribution des points.
Si le R² est nul, cela signifie que l’équation de la droite de régression détermine 0 % de la distribution des points. Cela signifie que le modèle mathématique utilisé n’explique absolument pas la distribution des points.
Si le R² vaut 1, cela signifie que l’équation de la droite de régression est capable de déterminer 100 % de la distribution des points. Cela signifie alors que le modèle mathématique utilisé, ainsi que les paramètres a et b calculés sont ceux qui déterminent la distribution des points. En bref, plus le coefficient de détermination se rapproche de 0, plus le nuage de points se disperse autour de la droite de régression. Au contraire, plus le R² tend vers 1, plus le nuage de points se resserre autour de la droite de régression. Quand les points sont exactement alignés sur la droite de régression, alors R² = 1.
Notation
Le coefficient de détermination est noté R².
Dans le cas d’une corrélation linéaire, R² = r², où r est le coefficient de corrélation linéaire.
À noter que R² n’est le carré du coefficient de corrélation r que dans le cas particulier de la régression linéaire. Dans les autres régressions non linéaires (logarithmique, exponentielle, etc.) ce n’est pas le cas. C’est pour éviter cette confusion qu’on note habituellement en minuscule le coefficient de corrélation, et en majuscule le coefficient de détermination.