Finobuzz – Essentiel CFA: Régression simple – corrélation, hypothèses et intervalle de confiance
L’intégralité de la matière sur la régression simple liant une variable dépendante Y à une variable indépendante X est transposable aux régressions multiples. Vous avez donc tout intérêt à la maîtriser pour réussir vos examens CFA.
Le modèle de régression simple ou de transformation affine lie une variable dite dépendante, souvent appelée Y, à une variable indépendante, X.
Ce modèle s’écrit sous la forme:
Y = a + b.X
Vous le verrez aussi souvent écrit:
Y = α + β.X
avec a = α = ordonnée à l’origine [valeur de Y si X=0]
et b = β = pente de la droite de régression linéaire
Graphiquement:

Source:Wikipedia
À partir du moment que vous avez de l’information sur X, vous en avez aussi sur Y.
Notamment, si vous connaissez:
- l’espérance de X, E(X), alors vous pouvez déterminer celle de Y, E(Y).
E(Y) = a + b.E(Y)
- la variance de X, Var(X), alors vous pouvez calculer celle de Y.
Var(Y) = b2.Var(X)
La pente de la droite de régression se calcule en divisant la covariance entre X et Y, σx,y, par la variance de X, σ2x.
b = β = σx,y / σ2x
Notez que bien que la matière de la régression simple soit transposable aux régressions multiples, certains sujets sont propres à la régression simple.
Il s’agit:
- 1. du coefficient de corrélation,
- 2. des hypothèses de la régression,
- 3. de la formation d’un intervalle de confiance pour la variable dépendante (Y).
1 – Coefficient de corrélation / Correlation Coefficient
Le coefficient de corrélation, noté r pour les échantillons et ρ pour la population est une mesure de l’intensité de la relation linéaire (corrélation) entre deux variables.
La corrélation se calcule à partir de la covariance et des écart-types des variables. Elle est définie telle que la covariance divisée par le produit des écart-types des variables.
Mathématiquement:
r = ρ = σx,y / (σx.σy)
avec:
σx,y : covariance entre X et Y
σx : écart-type de X
σy: écart-type de Y
Un coefficient d’une valeur de 1 indique que les 2 variables sont parfaitement corrélées, elles bougent dans le même sens et dans la même proportion.
Un coefficient de -1 indique pour sa part que les variables sont parfaitement inversement corrélées, elles évoluent dans la même proportion mais en sens opposé.
Un coefficient de 0 traduit une absence de relation linéaire.
Afin de tester si le coefficient de corrélation est significatif, autrement dit que le coefficient de corrélation est différent de zéro (hypothèse nulle H0: ρ = 0), il convient de calculer la valeur du t de Student (avec n-2 degré de liberté), tel que:
t = (r.(n-2)0,5) / (1-r2)0,5
2 – Hypothèses de la régression / Regression Assumptions
Le modèle de régression simple est basé sur 6 grandes hypothèses:
- Il existe une relation linéaire entre la variable dépendante et la variable indépendante.
- La variable indépendante n’est pas corrélée au terme résiduel
- L’espérance du terme résiduel est nulle
- La variance du terme résiduel est constante
- Le terme résiduel est distribué indépendamment, c’est à dire que le terme résiduel pour une observation n’est pas corrélé à celui d’une autre observation (une violation de ce principe s’appelle l’auto corrélation)
- Le terme résiduel suit une distribution normale (Gauss-Jourdan)
3 – Intervalle de confiance pour la prédiction de Y / Confidence Interval for a Predicted Y-Value
L’intervalle de confiance pour la valeur prévue de Y [espérance de Y, E(Y)], dans une régression simple, s’exprime sous la forme:
borne inférieure: valeur prévue de Y – (valeur critique de t).(erreur standard de prédiction)
borne supérieure: valeur prévue de Y + (valeur critique de t).(erreur standard de prédiction)
Visitez L’Essentiel du Titre CFA
Finobuzz vous recommande aussi:
Investir: les obligations canadiennes attirent toujours les étrangers
Et bien plus encore sur Finobuzz.com, Le Site de la Nouvelle Génération d’Entrepreneurs et de Financiers !!
Suivez nous sur Facebook ou sur Twittter @Finobuzz