Sunteți pe pagina 1din 33

EXERCICES DE

MÉTHODES NUMÉRIQUES
(version 2.3 Révision 4 du 17.10.2010)
Sciences.ch Méthodes numériques

EXERCICE 1.
Niveau : Gymnase (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Régression linéaire (méthode des moindres carrés)

Énoncé:

Considérons les données suivantes:

En utilisant la méthode des moindres carrés et MS Excel déterminez l'équation de la droite


(les estimateurs de la pente et de l'ordonnée à l'origine) de cet échantillon de données ainsi
que son coefficient de corrélation.

Solution:

Nous avons:
n n

n n n n  xk  yk
n xk yk  xk  yk  xk yk  k 1 k 1
cov( X , Y ) k 1 k 1 k 1 k 1 n
ˆ1  a   2
 2
V ( x) n  n   n 
n xk2    xk    xk 
n
k 1  k 1  n xk2   k 1 
k 1 n
81  126
1256 
 9  1.22
812
829 
9

et:

Serveur d'exercices 2/33


Sciences.ch Méthodes numériques
126 81
ˆ0  b  y  ax   1.22   3.02
9 9

L'équation de la droite d'ajustement est donc:

y  1.22 x  3.02

Nous obtenons les mêmes valeurs avec MS Excel:

=PENTE(C2:C10;B2:B10)=1.22
=ORDONNEE.ORIGINE(C2:C10;B2:B10)=3.02

ou sous forme matricielle en sélectionnant deux cellules horizontales au préalable:

=DROITEREG(C2:C10;B2:B10)

Nous avons aussi sous forme graphique:

Pour déterminer un point de la droite nous avons:

=PREVISION(8;C2:C10;B2:B10)

Le coefficient de corrélation est:

Serveur d'exercices 3/33


Sciences.ch Méthodes numériques
n
1 n n

cov( X , Y )
 xk yk  n  xk  yk
k 1 k 1 k 1
RX ,Y   
 ( X ) (Y ) 2 2
n
1 n  n
1 n 
 xi2  n   xi   yi2  n   yi 
k 1  k 1  k 1  k 1
81  126 81  126
1256  1256 
 9  9
2 2 829  729 1948  1764
n
1 n  n
1 n 
 i n  i   i n  i 
x 2
 x y 2
 y
k 1  k 1  k 1  k 1 
122
  0.8994
135.64

avec MS Excel:

=COVAR(B2:B10;C2:C10)/(ECARTYPEP(B2:B10)* ECARTYPEP(C2:C10))=0.8994

ou sous forme condensée:

=COEFFICIENT.CORRELATION(B2:B10;C2:C10)=0.8994

ou encore autrement:

=PEARSON(B2:B10;C2:C10)=0.8994

avec le graphique:

Nous y voyons:

R 2  0.8089  0.89942

ce qui peut être obtenu directement avec:

Serveur d'exercices 4/33


Sciences.ch Méthodes numériques
=COEFFICIENT.DETERMINATION(B2:B10;C2:C10)=0.8089

Serveur d'exercices 5/33


Sciences.ch Méthodes numériques

EXERCICE 2.
Niveau : Gymnase (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Analyse de la variance de la régression

Énoncé:

Considérons les données suivantes:

En utilisant la méthode des moindres carrés et MS Excel faites une analyse de la régression
est détaillez tous les calculs donnés par MS Excel selon la théorie vue en cours.

Solution:

Allez dans le menu Tools/Data Analysis… et choisissez l'outil Regression avec les paramètres
suivants:

Serveur d'exercices 6/33


Sciences.ch Méthodes numériques
Nous avons alors:

Notre cahier des charges est de détailler les calculs dans les cellules:

B4;B5;B7;B8;B17;B18;C17;C18;C25:C33.

On laisse donc tomber le tableau de l'ANOVA de l'analyse de la régression qui est pour moi
une supercherie ainsi que les autres valeurs qui ont, je pense, peu d'intérêt.

Commençons par B4. Nous l'avons déjà calcul dans l'exercice précédent:

R=PEARSON(B2:B10;C2:C10)=0.8994

ainsi que B5:

R 2 =COEFFICIENT.DETERMINATION(B2:B10;C2:C10)=0.8089

la cellule B8 quant à elle est très simple à obtenir:

=NB(B2:B10)=9

La cellule B7 est un peu plus longue. Nous avons vu dans la théorique que:

Serveur d'exercices 7/33


Sciences.ch Méthodes numériques

 ei2  Y 'k  yk 
SSE     k
n2 n2

Nous utilisons alors cette partie du tableau:

où la colonne Residual C25:C33 est simplement la différence entre les valeurs mesurées de la
variables expliquée et la valeur théorique. Effectivement:

où FORECAST est la version anglophone de la fonction PREVISION.

Maintenant calculons dans une colonne les Residuals:

Ensuite mettons tous ces résidus aux carrés, et effectuons la somme et enfin divisions par le
nombre de données – 2 et on prend la racine:

Serveur d'exercices 8/33


Sciences.ch Méthodes numériques

ce qui donne:

Nous retrouvons donc bien le résultat de la cellule B7!

Le contenu des cellules B17 et B18:

est déjà connu grâce à l'exercice précédent:

=PENTE(C2:C10;B2:B10)=1.22
=ORDONNEE.ORIGINE(C2:C10;B2:B10)=3.02

Donc intéressons-nous maintenant à leur écart-type C17 et C18:

Nous avons démontré dans la théorie qu'il était donné par:

2
SEE 2   xk2
SEE
 A  V ( A)  et  B  V ( B )  k
n  V ( x) n  V ( x)
2

Serveur d'exercices 9/33


Sciences.ch Méthodes numériques

Le terme SEE et n a déjà été calcul plus haut nous n'y reviendrons pas. Le calcul de V ( x) est
lui aisé:

=VARP(B2:B10)=11.111

et donc pour l'écart-type non biaisé de la pente:

=SQRT(B7^2/(COUNT(B2:B10)*VARP(B2:B10)))=0.2241

Nous procédons de manière similaire pour l'écart-type non biaisé de l'ordonnée à l'origine
mais d'abord nous calculons la somme:

 xk2
k

à l'aide de la fonction:

SUMPRODUCT(B3:B11;B3:B11)=829

nous avons alors:

=SQRT(B7^2*
SUMPRODUCT(B3:B11;B3:B11)/(COUNT(B2:B10)^2*VARP(B2:B10)))=2.1509

Serveur d'exercices 10/33


Sciences.ch Méthodes numériques

EXERCICE 3.
Niveau : Fac (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Régression linéaire multiple

Énoncé:

Considérons les données suivantes:

qui donnent en fonction du prix net de la matière brute de trois composants d'un produit, le
prix net du produit fini observé sur le marché. Sous l'hypothèse d'une dépendance linéaire,
déterminez avec les relations étables dans le chapitre de Méthodes numériques les coefficients
de régression et ensuite avec l'Utilitaire d'analyse de MS Excel.

Solutions:

Nous avons démontré dans le chapitre de Méthodes Numériques que:



 
1 
ˆ  X T X XT y

D'abord nous allons construire la matrice X que j'aime bien représenter sous la forme suivante
dans un tableau (choix tout à fait discutable):

Serveur d'exercices 11/33


Sciences.ch Méthodes numériques

Il s'agit maintenant de transposer les cellules J14:M32 en sélectionnant ces dernières et en


faisant un collage spécial avec transposition (Edition/Collage Spécial):

Pour obtenir (collage effectué sur la cellule I36) X T :

Serveur d'exercices 12/33


Sciences.ch Méthodes numériques

Ensuite, nous nous occupons de X T  X . Pour cela on sélectionne bien évidemment dans le
cas présente une plage de cellules de 4  4 de I43 à L46 (par exemple…) après quoi nous
écrivons la formule Excel permettant de faire une multiplication matricielle dans la version
anglophone (la formule doit s'écrire dans I43!):

=MMULT(I36:AA39;J14:M32)

et nous validons par Ctrl+Shift+Enter ce qui donne:

 
1
Ensuite, nous sélectionnons pour le calcul de l'inverse X T  X une plage aussi de 4  4
de I50 à L53 (par exemple…) après quoi nous écrivons la formule Excel permettant de faire
une inversion matricielle dans la version anglophone (la formule doit s'écrire dans I50!):

=MINVERSE(I43:L46)

et nous validons par Ctrl+Shift+Enter ce qui donne:

 
1
Après, il nous faut donc calculer X T  X  X T . Pour cela, nous sélectionnons une plage de
4  19 de I57 à AA60 (par exemple…) après quoi nous écrivons la formule Excel permettant
de faire une multiplication matricielle dans la version anglophone (la formule doit s'écrire
dans I57!):

=MMULT(I50:L53;I36:AA39)

et nous validons par Ctrl+Shift+Enter ce qui donne:

Serveur d'exercices 13/33


Sciences.ch Méthodes numériques

 
1 
Dernière étape, il faut calculer X T X X T y . Pour cela, nous sélectionnons une plage de
4  1 de I64 à I67 (par exemple…) après quoi nous écrivons la formule Excel permettant de
faire une multiplication matricielle dans la version anglophone (la formule doit s'écrire dans
I64!):

=MMULT(I57:AA60;I14:I32)

et nous validons par Ctrl+Shift+Enter ce qui donne:

Nous avons donc:

y  35'102.9  2.06596   Cout A   4.17636   Cout B   4.79064   Cout C 

Calculons maintenant manuellement le coefficient de corrélation pour voir s'il correspond à ce


que nous obtiendrons avec l'Utilitaire d'Analyse de MS Excel.

  yˆk  y 
2

SCE
R2   k

  yk  y 
SCT 2

D'abord nous construisons le tableau suivant:

Serveur d'exercices 14/33


Sciences.ch Méthodes numériques

et nous l'étendons avec les relations triviales suivantes:

Serveur d'exercices 15/33


Sciences.ch Méthodes numériques

Ce qui donne:

Serveur d'exercices 16/33


Sciences.ch Méthodes numériques

Maintenant nous allons voir si nous retrouvons les mêmes coefficients de la droite de
régressions avec l'Utilitaire d'Analyse:

Nous validons par OK:

Serveur d'exercices 17/33


Sciences.ch Méthodes numériques

et nous validons par OK:

et nous y retrouvons donc les mêmes coefficients que ceux calculés manuellement (en plus de
plein d'autres déjà vus dans l'exercice précédent).

Serveur d'exercices 18/33


Sciences.ch Méthodes numériques

EXERCICE 4.
Niveau : Fac (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Régression linéaire multiple à variables qualitatives

Énoncé:

Considérons les données suivantes:

Comparez les résultats entre les régressions linéaires multiples en considérant:

E1. Les données des ventes (colonne C) et leur numéro de série (colonne A) uniquement
(comme le font beaucoup de débutants)

E2. Les données des ventes (colonne C) et en discrétisant les trimestres de la colonne B en
trois colonnes séparées (comme le font beaucoup d'amateurs éclairés).

Serveur d'exercices 19/33


Sciences.ch Méthodes numériques
E3. Les données des ventes (colonne C) et en discrétisant les trimestres de la colonne B en
trois colonnes séparées et les années de la colonne D en 8 colonnes séparées.

Solutions:

S1. Nous procédons comme dans l'exercice précédent en lançant l'utilitaire d'analyse:

Nous validons par OK et prenez les paramètres suivants:

Nous aurons alors:

Serveur d'exercices 20/33


Sciences.ch Méthodes numériques

Avec le graphique suivant (modifié un peu au préalable pour des raisons esthétiques
évidentes):

Il est important de se concentrer sur la table:

Serveur d'exercices 21/33


Sciences.ch Méthodes numériques

Afin de voir que le résultat n'est vraiment pas probant! Au niveau de:

Nous avons donc 4 chances sur 1000 que la colonne A soit inutile pour faire de la prédiction
sur les ventes.

E2. Nous créons le tableau suivant:

avec:

Serveur d'exercices 22/33


Sciences.ch Méthodes numériques

où nous avons avec les trois colonnes Q1, Q2, Q3, Q4 la description des 4 trimestres car:

Q1=1,0,0
Q2=0,1,0
Q3=0,0,1
Q4=0,0,0

Et nous faisons une analyse de la régression:

Serveur d'exercices 23/33


Sciences.ch Méthodes numériques

Nous avons alors:

il faut supprimer les graphiques créés qui ne servent à rien et en recréer un à partir de zéro en
utilisant les données qui sont à la ligne 26 pour obtenir:

Serveur d'exercices 24/33


Sciences.ch Méthodes numériques

Visuellement cela à l'air d'être déjà mieux qu'avant. Chose particulièrement intéressant: la
discrétisation d'une des variables permet de ne plus avoir une simple droite!

Il est important de se concentrer sur la table:

Mais le résultat est moins bon qu'avant mathématiquement comme nous le montre les valeurs
précédentes.

Afin de voir que le résultat n'est vraiment pas probant! Au niveau de:

Nous avons donc 4 chances sur 10 que les colonnes E, F, G soient inutiles pour faire de la
prédiction sur les ventes.

Analysons brièvement le tableau:

Serveur d'exercices 25/33


Sciences.ch Méthodes numériques

qui signifie dans le cas présent que :

- le trimestre 1 (Q1) excède le trimestre 4 par 94.39

- le trimestre 2 (Q2) excède le trimestre 4 par 305.625

- le trimestre 3 (Q3) excède le trimestre 4 par 165.475

E3. Nous créons le tableau suivant:

avec les formules suivantes:

Serveur d'exercices 26/33


Sciences.ch Méthodes numériques

Et nous faisons une analyse de la régression:

Nous avons alors:

Serveur d'exercices 27/33


Sciences.ch Méthodes numériques

il faut supprimer les graphiques créés qui ne servent à rien et en recréer un à partir de zéro en
utilisant les données qui sont à la ligne 34 pour obtenir:

Visuellement cela à l'air d'être déjà mieux qu'avant.

Il est toujours important de se concentrer sur la table:

Serveur d'exercices 28/33


Sciences.ch Méthodes numériques

Le résultat est donc nettement meilleur qu'avant!

Au niveau de:

Nous avons donc 54 chances sur 1000000 que les colonnes E, F, G, H, I, J, K, L, M, N, O


soient inutiles pour faire de la prédiction sur les ventes.

Voyons les différences sous forme résumée:

Serveur d'exercices 29/33


Sciences.ch Méthodes numériques

EXERCICE 5.
Niveau : Fac (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Analyse en composantes principales

Énoncé:

Soit les données suivantes concernant des fleurs:

Fleur n°
1 5.1 3.5 1.4
2 4.9 3.0 1.4
3 4.7 3.2 1.3
4 4.6 3.1 1.5
5 5.0 3.6 1.4
6 7.0 3.2 4.7
7 6.4 3.2 4.5
8 6.9 3.1 4.9
9 5.5 2.3 4.0
10 6.5 2.8 4.6
11 6.3 3.3 6.0
12 5.8 2.7 5.1
13 7.1 3.0 5.9
14 6.3 2.9 5.6
15 6.5 3.0 5.8

Effectuez une A.C.P. avec Minitab 15.1 (car Microsoft Excel 2003/2007 n'a aucun outil
intégré pour par défaut) afin d'identifier des regroupements possibles et déterminez avec une
approche de corrélation les valeurs propres aussi des différentes composantes

Solution:

Nous ouvrons Minitab et y mettons les données:

Serveur d'exercices 30/33


Sciences.ch Méthodes numériques

Ensuite, nous allons dans le menu Stat/Multivarié/Composantes principales…:

Ensuite nous prenons les données comme indiqué ci-dessous:

Serveur d'exercices 31/33


Sciences.ch Méthodes numériques

et en cliquant sur le bouton Graphiques…:

Nous validons le tout en cliquant 2 fois sur OK:

Serveur d'exercices 32/33


Sciences.ch Méthodes numériques

et en ce qui concerne les valeurs propres Minitab nous donne dans la fenêtre d'exécution:

Serveur d'exercices 33/33

S-ar putea să vă placă și