Sunteți pe pagina 1din 28

quipe de recherche en Ingnierie des Connaissances

Laboratoire ERIC
1
Ricco Rakotomalala
Ricco.Rakotomalala@univ-lyon2.fr
PLAN
1. Economtrie:Origine(s),dfinition(s)etobjectif(s)
2. Ladmarcheconomtrique
3. Analysedergression Lhypothsedelinarit
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
2
3. Analysedergression Lhypothsedelinarit
4. Domainesdapplication
5. Typesdedonnes
6. Bibliographie
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
3
Quelques dfinitions
Dfinition1 Dfinition1 Dfinition1 Dfinition1. .. . Etudesdesrelationsquantitatives delavieconomiquefaisantappellanalyse
statistique etlaformulationmathmatique.
Dfinition2 Dfinition2 Dfinition2 Dfinition2. . . . L'conomtrieexprimequantitativementlescorrlations pouvantexisterentredes
phnomnesconomiquesdontlathorieaffirmel'existence.Lathorieconomiquefournit
desides surlesprocessusquidterminentlesgrandeursconomiques,l'conomtrie
apporteunevrificationempirique ettablitquantitativementlescorrlationsquiapparaissent
valides.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
4
valides.
Dfinition3 Dfinition3 Dfinition3 Dfinition3. .. . Lobjectifdelconomtrieestdeconfronterunmodleconomiqueun
ensemblededonnes (donnesdepanel,srietemporelle,etc.)etainsidenvrifierlavalidit.
Dfinition4 Dfinition4 Dfinition4 Dfinition4. .. . Lconomtrieestunebranchedelconomiequitraitede lestimationpratique
desrelationsconomiques.
Carrefour de 3 disciplines
Economiste (Expertdudomaine)
Exprimeunethoriesurunphnomneconomique
Ex.Lademandedpendduprix
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
5
Mathmaticien(Modlisation)
Proposeuneformulation
algbriquedelathorie.
Ex.Demande=a*prix+b
Statisticien(Estimation)
Estimelesparamtresdu
modlepartirdedonnes.
Validationstatistique.
Ex.a=-0.5;b=10
SouslecontrledelEconomiste
ValidationdelExpertdudomaine(ex.aestforcmentngatif)
Notions cls Modle Economique
Unmodleconsisteenuneprsentationformalisedunphnomnesous
formedquationsmathmatiques.
Commetouteslesvariablesconomiquessontinterdpendantes(notion
desystme),iln'estpassuffisantdeconstruiredesquationsisoles:il
fauttablirunsystmecompletd'quations.
= p f O ) (
Exemple:
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
6
+ =
=
=
D O
p g D
p f O
) (
) (
Exemple:
Equationsdecomportement.
Identit
Thorieconomique Thorieconomique Thorieconomique Thorieconomique Thorieconomique Thorieconomique Thorieconomique Thorieconomique
Modlisation Modlisation Modlisation Modlisation Modlisation Modlisation Modlisation Modlisation
(Introductiondhypothses (Introductiondhypothses (Introductiondhypothses (Introductiondhypothses (Introductiondhypothses (Introductiondhypothses (Introductiondhypothses (Introductiondhypothses
simplificatricessurlaformedelarelation) simplificatricessurlaformedelarelation) simplificatricessurlaformedelarelation) simplificatricessurlaformedelarelation) simplificatricessurlaformedelarelation) simplificatricessurlaformedelarelation) simplificatricessurlaformedelarelation) simplificatricessurlaformedelarelation)
+ =
+ =
p D
b p a O
Estimationdea,b, et partirdesdonnesdisponibles
Notions cls Modle Economtrique
Faireintervenirlalatoire danslquationconomique.
Parcequelarelationnestpasdterministe.
Laspcificationretenueestunesimplification,ilestvidentquilnersume
pastoutelateneurdelarelation (ex.danslesquations,larelationest
vraimentlinaire ?)
Ilyadautresfacteurs dontonnetientpascompte(ex.leprixdesautresde
biensquipeuventsesubstitueraubientudi)
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
7
Leserreursdemesuresurlesgrandeurstudies,soitlorsduprocessusdercolte
desinformations,soittoutsimplementparcequeladonnercoltereprsentepeu
ouprouleconceptquelonveuttudier.
Introductiondufacteur Introductiondufacteur Introductiondufacteur Introductiondufacteur Introductiondufacteur Introductiondufacteur Introductiondufacteur Introductiondufacteur alatoire alatoire alatoire alatoire alatoire alatoire alatoire alatoire
Rsumdetoutelinformationnonprise Rsumdetoutelinformationnonprise Rsumdetoutelinformationnonprise Rsumdetoutelinformationnonprise Rsumdetoutelinformationnonprise Rsumdetoutelinformationnonprise Rsumdetoutelinformationnonprise Rsumdetoutelinformationnonprise
encomptedanslemodle encomptedanslemodle encomptedanslemodle encomptedanslemodle encomptedanslemodle encomptedanslemodle encomptedanslemodle encomptedanslemodle D
O
p D
b p a O

+ + =
+ + =
Notions cls Variable
Lesvariablesreprsententdesgrandeursconomiquesobservesoumesures.Ex.
lesquantitsvenduesdunbien,leprixdunbien,destauxdintrt,lesoldedune
balancecommerciale,letauxdechange,etc.
Lavariabledoittrereprsentativeduphnomnequelontudie,desaqualit
dpendlavaliditdesrsultatsobtenus
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
8
Problmesdinadquation(tudierlesventesdepain,etutiliser
desdonnesmesurantlesventesdebiscottes)
Erreurdemesures(problmeslorsdurecueildesdonnesou
destransmissionsdesdonnes),dunits(compterennombrede
painvendu,ouenchiffredaffaires)
Problmedereprsentativit (mesureruniquementdesventes
desboulangeries,etnepastenircomptedesventesengrande
surface)
Problmessurles Problmessurles Problmessurles Problmessurles Problmessurles Problmessurles Problmessurles Problmessurles
variables variables variables variables variables variables variables variables
Notions cls Variable alatoire
Unevariablealatoireestunegrandeurmesurabledontlesvaleurs
sontsoumisesunecertainedispersion lorsdelarptitiondun
processusdonn.
Ladispersiondunevariablealatoireestrgieparuneloideprobabilit loideprobabilit loideprobabilit loideprobabilit .
Ex.lersultatdujetdunepicedemonnaieestunevariablealatoire,il
prenddeuxvaleurspossibles pile ou face ,ilsuituneloide
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
9
prenddeuxvaleurspossibles pile ou face ,ilsuituneloide
Bernouilli deparamtrep=0.5.
Remarque :chaquephnomnetudisaloideprobabilit.
Ex.Dureentredeuxphnomnes,nombredoccurrencedun
phnomnedansunlapsdetemps,nombredessaisavantdobtenirun
rsultat,etc.
Notions cls Types de variables
Quantitative
Qualitativenominale
Qualitativeordinale
Success Wages Job Refunding
Y 0 Unemployed Slow
N 2000 Skilled Worker Slow
N 1400 Worker Slow
N 1573 Retired Slow
Y 2776 Skilled Worker Slow
N 2439 Retired Fast
N 862 Office employee Slow
Y 1400 Salesman Slow
N 1700 Skilled Worker Slow
Y 785 Employee Fast
Y 1274 Worker Slow
N 960 Employee Fast
N 1656 Worker Fast
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
10
N 1656 Worker Fast
N 0 Unemployed Slow
Lecritreleplusimportantpourdistinguerlesvariablesestde
dterminersilcartentredeuxvaleursaunsens,etquelles
sontcomparablesdeuxdeux.
Ex.Age,Salaires,Satisfaction,Typedtudessuivies,
Notions cls Population et chantillon
Lapopulation dfinitlensembledindividussurlesquelsnousvoulonstravailler :
onparlealorsdepopulationderfrenceoudepopulationparenteoupopulation
mre(ex.lesvhiculesvendusenFranceen2005,etc.).Touslesrsultats
obtenussonttoujoursrelatifs(circonscrites)unepopulation.
Lesenqutesexhaustivesconsisteobservertouslesindividusquicomposent
lapopulation.Oprationtrscoteuse.
Onprocdealorsunchantillonnage,onprlveunefractiondelapopulation
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
11
Onprocdealorsunchantillonnage,onprlveunefractiondelapopulation
enveillantcequilsoitreprsentatif delapopulationc.-.-dreflterla
compositionetlacomplexitdelapopulation.
Letauxdesondagecorrespondaurapportentrelatailledelchantillonetla
tailledelapopulation.
Attentionaumauvaischantillonnage. Attentionaumauvaischantillonnage. Attentionaumauvaischantillonnage. Attentionaumauvaischantillonnage. Attentionaumauvaischantillonnage. Attentionaumauvaischantillonnage. Attentionaumauvaischantillonnage. Attentionaumauvaischantillonnage.
Commentsassurerquelchantillonestreprsentatif? Commentsassurerquelchantillonestreprsentatif? Commentsassurerquelchantillonestreprsentatif? Commentsassurerquelchantillonestreprsentatif? Commentsassurerquelchantillonestreprsentatif? Commentsassurerquelchantillonestreprsentatif? Commentsassurerquelchantillonestreprsentatif? Commentsassurerquelchantillonestreprsentatif?
Rledesvariablesdecontrle. Rledesvariablesdecontrle. Rledesvariablesdecontrle. Rledesvariablesdecontrle. Rledesvariablesdecontrle. Rledesvariablesdecontrle. Rledesvariablesdecontrle. Rledesvariablesdecontrle.
Notions cls Infrence statistique
Infrencestatistique. .. . Elleconsistealorseffectuerdestudessur
lchantillonettransposer lesrsultatssurlapopulation.
Cettetranspositionnestpasstricte,elleattachetoujoursuneprobabilit
auxrsultatsetauxconclusionsmises.
Tirerdesconclusionssurlexistenceounondun
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
12
Tirerdesconclusionssurlexistenceounondun
phnomne(testdhypothses ex.laugmentationduprix
dutabacrduit-t-ilvraimentlaconsommationde
cigarettes ?)
Estimerlesparamtresdunphnomne(estimation de
paramtres ex.uneaugmentationde1euroduprixdu
paquetdecigaretterduitdecombienlenombredepaquets
vendus ?)
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
13
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
14
Attention:Distinguercequirelvedelasimplergularitstatistique(artefact) Attention:Distinguercequirelvedelasimplergularitstatistique(artefact) Attention:Distinguercequirelvedelasimplergularitstatistique(artefact) Attention:Distinguercequirelvedelasimplergularitstatistique(artefact) Attention:Distinguercequirelvedelasimplergularitstatistique(artefact) Attention:Distinguercequirelvedelasimplergularitstatistique(artefact) Attention:Distinguercequirelvedelasimplergularitstatistique(artefact) Attention:Distinguercequirelvedelasimplergularitstatistique(artefact)
decequireprsenteunecausalitconomique. decequireprsenteunecausalitconomique. decequireprsenteunecausalitconomique. decequireprsenteunecausalitconomique. decequireprsenteunecausalitconomique. decequireprsenteunecausalitconomique. decequireprsenteunecausalitconomique. decequireprsenteunecausalitconomique.
Lathorieconomique(laconnaissancedudomaine)estun Lathorieconomique(laconnaissancedudomaine)estun Lathorieconomique(laconnaissancedudomaine)estun Lathorieconomique(laconnaissancedudomaine)estun Lathorieconomique(laconnaissancedudomaine)estun Lathorieconomique(laconnaissancedudomaine)estun Lathorieconomique(laconnaissancedudomaine)estun Lathorieconomique(laconnaissancedudomaine)estun
garde garde garde garde garde garde garde garde- -- -- -- -fouindispensable. fouindispensable. fouindispensable. fouindispensable. fouindispensable. fouindispensable. fouindispensable. fouindispensable.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
15
Source: CRISP-DM 1.0, Step-by-step Data Mining Guide, SPSS Publication
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
16
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
17
Analyse de rgression Schma de rgression
+ = ) , , , (
2 1 p
X X X f Y K Modleunequation:
Prdiction/Explication:Prdire/expliquerlesvaleursdeYpartirdesvaleursde
X1,X2,,Xp.
Y estdite variableendogne ,cestlavariabledonconessaiedeprdireles
valeurs(variableprdire,variabledpendante,explique) ;
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
18
X1Xp sontles variablesexognes ,cesontlesvariablesquiserventprdire
lesvaleursdeY(variablesprdictives,variablesindpendantes,explicatives).
LesvaleursdesXsontdoncconnues(oumesuresrapidement,facilement),elles
serventprdirelesvaleursdesYquisontinconnues(ouconnuesavecretard).
Ex1.Prdirelesventesnationalesdepainsurlanne(connuuniquementlafindelanne)
partirdesonprix(connuinstantanment).
Ex2.Expliquerlaconsommationdespayseuropenspartirdurevenuetdutauxdechmage.
Rgression linaire multiple
Lemodleparfaitnexistepas.Onprocdetrssouventunesimplification
supplmentaireenconsidrantquelaliaisonestlinaire,ouencoreonprocde
destransformations(devariables)demanireseramenercombinaisonlinaire
desvariablesexognes.
Ilfautpouvoirestimerlesparamtres,ilfautpouvoirlesinterprter!!!
+ + + + + =
p p
X a X a X a a Y K
2 2 1 1 0
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
19
+ + + + + =
p p
X a X a X a a Y K
2 2 1 1 0
Yquantitative(forcment).
Xquantitativeouqualitative
recode(0/1).
estletermederreur.Cestune
variablealatoire.Ellersumetout
cequelemodlenexpliquepas.
Xestsupposnonalatoire.
Yestalatoirecausede.
Linarit par rapport aux paramtres
2
1 3 1 2 1 1 0
) ln( X a X a X a a Y + + + =
Cestunmodlelinaire.
Cf.Transformationdevariables.
2 1 0
1 1 0
X
X
Y


+
+
= Cenestpasunmodlelinaire.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
20
aX b Y
e b Y
aX
+ =
=
) ln( ) ln(
Linaireaprstransformation.
Evaluation de la rgression linaire
Quelestlepouvoirexplicatifdumodle ?Est-celaliaisondcouverteentreYet
lesXestsignificative ?(c.--d.transposabledanslapopulationetnonpaspropre
lchantillonobserv)
QuelestlapportmarginaldechaquevariableXdanslexplicationdesvaleursde
Y ?(c.--d.unparamtreest-ilsignificativementdiffrentde0 ?)
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
21
Quellesontlesproprits(notammentlaprcision)desparamtres a
obtenus ?(biais,variance)
Quelleseralaqualitdelaprdiction desvaleursdeYpartirdesvaleursdeX ?
(intervalledeprdiction,fourchettes)
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
22
Usage de la rgression linaire
Lexplication. .. . Comprendrelanaturedesliaisonsentrelesvariables.On
parlegalementdanalysestructurelle analysestructurelle analysestructurelle analysestructurelle.
Outilprivilgipourvaliderlesthoriesmisesparlesconomistes.
Ex.consommation=a*revenu+b :b>0,cestlaconsommationincompressible,aestpositifet
srementinfrieur1,[1-a]correspondalorsautauxdpargnedesmnages)
Laprdiction. .. . Premierusageoprationneldelargression.Pour
lanticipationetlaprisededcision.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
23
lanticipationetlaprisededcision.
Ex.Laconsommationdesmnagesvaaugmenterlanneprochaine?
Lasimulationetladfinitiondespolitiquesconomiques. .. . Secondusage
oprationneldelargression.Permetdedfinir(1)lesbonnespolitiques
conomiqueset(2)denmesurerlavancelesconsquences.
Ex.Fixerlabonnevaleurdela primelacasse .
Autres domaines dapplication
Tous les domaines o on essaie de dtecter des relations de causalit
Marketing. Evaluerlebudgetpublicitairencessaireuneaugmentation
significativedesventes.
Sociologie. .. . Prdireleniveaudesnotesdestudiantspartirdeleurgeoudu
nombrederedoublements.Expliquerleniveaudtudesatteintparlestudiants
partirdelaprofessionetdesrevenusdesparents
Economiste Economiste Economiste Economiste Economiste Economiste Economiste Economiste Expertdudomaine Expertdudomaine Expertdudomaine Expertdudomaine Expertdudomaine Expertdudomaine Expertdudomaine Expertdudomaine
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
24
Agriculture. .. . Evaluerlesrendementsdesparcellesdeterrainspartirdela
quantitdengraisutilissoudunombredejoursdepluiedanslanne.
Ecologie. .. . Estimerlamortalitdespoissonspartirdelaquantitdersidus
rejetsparlesusinesdanslescoursdeau.
Sant.Evaluerlinfluencedescomplmentsalimentairessurlafrquencedes
maladiescardio-vasculaires(cf.parexemplelesomga3etlesmaladiescardio-
vasculaires).
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
25
Recueil des donnes
Problmercurrent :lemanquededonnespertinentes.
Ex.Analysedesprocessusdeblanchimentdargent
Donnesbrutesvs.donnescorrigsnormalises
Donnesbrutes:recueilliesdirectementsurleterrain,trsbonnequalitsiprcautionsderecueilprises.
Donnescorriges(institutdesondages):+normalisationdesdfinitions;- djmanipuleset
corriges,attention.
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
26
corriges,attention.
Donnesexprimentalesvs.donnesnon-exprimentales
Donnesexprimentales:contrlesdansuneexprimentation(ex.dosesdemdicamentspourun
cobaye).
Donnesnonexprimentales:directementobserves.
Xpeuttreexprimental;Yesttoujoursobserv.
Donnes transversales, longitudinales, de panel
Parcelle
Rendement
(quintal)
Engrais
(kilo)
A 16 20
B 18 24
C 23 28
D 24 22
E 28 32
F 29 28
G 26 32
H 31 36
I 32 41
J 34 41
Coupestransversales
Ligne=individu
Ex.Personne,vhicule,client,parcellede
terrain,etc.
Donnestemporelles(longitudinales)
Ligne=date
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
27
Ligne=date
Stock ,dfiniesurunedate
Flux dfiniesurunepriode
StockFluxfacile(ex.somme,moyenne)
FluxStockpasvident(Mars=5000eurosdeCA,
commentdfinirlavaleurpourladatedu15mars?)
Mois CA (K-euros) Prospectus distribus
janv-04 1250 156
fvr-04 1456 178
mars-04 4863 293
Donnesdepanel
Fairedescoupestransversalessurplusieursdates.
Sionobservespcifiquementlesmmesindividus,on
parlede cohorte .
Ex.Recueillirlesventesdun
chantillondeconcessionnaires.
Renouvelerloprationsurplusieurs
mois.
Bibliographique
http://eric.univ-lyon2.fr/~ricco/cours/cours_econometrie.html
Rgis BOURBONNAIS, Economtrie Manuel et exercices corrigs , Dunod, 1998.
Y.Dodge, V.Rousson, Analyse de rgression applique , Dunod, 2004.
M. Tenenhaus, Statistique : Mthodes pour dcrire, expliquer et prvoir , Dunod,
quipe de recherche en Ingnierie des Connaissances
Laboratoire ERIC
28
M. Tenenhaus, Statistique : Mthodes pour dcrire, expliquer et prvoir , Dunod,
2007.
Ren GIRAUD, Nicole CHAIX, Economtrie , PUF, 1994. (il existe une version QSJ,
plus accessible)
Jack JOHNSTON, John DINARDO, Mthodes conomtriques , ECONOMICA, 1997.

S-ar putea să vă placă și