Sunteți pe pagina 1din 14

https://www.mathsisfun.com/data/standard-normal-distribution-table.

html
|xmed-miu|=Dx
Δ
μ
σ
| -μ|= Δx
|xmed-miu|/radical(sigma^2(x)/n)~N(0.1)

Variabila dummy
O variabila care are 2 variante de raspuns/ 2 valori se numeste variabila alternativa
Daca valorile se noteaza cu 0 /1 atunci variabila se numeste binara /dummy
Exemplu
0 absent 0 Nu 0 Feminin 0 Rural
1 prezent 1 Da 1 Masculin 1 Urban
Variabila binara/dummy 1) Media variabilei binare este ponderea variantei notate cu 1
Exemplu Daca intro clasa avem 90 de studenti; 40 de baieti si 50 de fete atunci
Daca notam cu 0=Fete si cu 1 Baieti
0 Feminin 50 Media variabile binare =gen/
1 Masculin 40 0.444444
2) Dispersia este sigma^2(f)=f(1-f)=0.44*(1-0.44)
0 Taxa
1 Buget
ariantei notate cu 1
e baieti si 50 de fete atunci

Media variabile binare =gen/sex= ponderea baietilor=f=40/90


Xi ni Xi=ci= Pe un esantion de 65 de locuinte s-a inregist
mijloc (Xi-
Supraf loc. (mp)
Nr. locuinte ul Fc Xi*ni
med)^2*ni
interv
25-35 4 30
alului 4 3600 120 a) Determinati acea marime a suprafetei pen
35-45 7 40 11 2800 280 b) definiti o variabila dummy in raport cu su
45-55 12 50 23 1200 600 c) calculati eroarea maxim-admisibila (limita
55-65 21 60 44 0 1260 d) Construiti un interval de incredere pentru
65-75 9 70 53 900 630 e) Daca se dubleaza volumul esantionului, ia
75-85 7 80 60 2800 560
85 si peste 5 90 65 4500 450
Total 65 15800 3900 Rezolvari
a) 25% reprezinta un sfert=> trebuie
unitatea observata este locuinta=
Vom determina acea valoare a su
Q3
P1 Determinam Lq3=3*(n+1)/4=3*(6
P2 calculam frecventa cumulata
P3 Cautam unde Fc depaseste prima
Prima Fc>Lq3 este 53. => Q3 este
P4 Q3=x0+h*(Lq3-Fc(pana la Q3))/n
x0=limita sau capatul din stanga a
h=lungimea intervalului=10
Lq3=49.5
Fc(pana la Q3)=44
nQ3=frecventa individuala a inte
nQ3=9
Q3=65+10(49.5-44)/9=
Concl: Un sfert (25%) din locuinte
b) definiti o variabila dummy in raport cu su
In primul rand calculam valoarea medie=med
xmed=sum(Xini)/sum(ni)
xmed=3900/65 60
Acum definim variabila dummy in ra
0 cu suprafata sub medie (Xi<60 m
1 cu suprafata peste medie (Xi>60
Stim de la proprietati ca media variabilei binare este po
f=nr . Loc cu supraf >60mp/nr total de locuinte
Peste 60 mp sigur sunt 9+7+5 locuinte
Aplicam regula de 3 simpla
55-65 10
60-65 5
Nr de locuinte cu supraf de peste 60mp va fi egal cu 9+7+5+10.5
f=31.5/65
48.4% din locuinte au osuprafata de peste 60 mp
Dispersia=Sigma^2(f)=f(1-f)=0.484*(1-0.484)
c) calculati eroarea maxim-admisibila (limita
Eroarea limita admisa =Dx=|xmed-miu|=z*r

Avem nevoie de dispersia lui x (si


Dispersia lui x =sigma^2(x)=15800/65
Dx=2*radical(243.07/65)
d) Construiti un interval de incredere pentru
P(xmed-Dx<=miu<xmed+Dx)=0.95
P(60-3.86<=miu<=60+3.86)=0.95
Cu o probabilitate de 95% suprafata medie a unei locuinte va fi cuprinsa int
e) Daca se dubleaza volumul esantionului, ia
Dx=|xmed-miu|=z*radical(sigma^2(x)/n)
Concluzie: Daca vol .esantionului se dubleaza eroarea scade de l
de 65 de locuinte s-a inregistrat suprafata locuibila. Pe baza acestor date raspundeti la cerinte

acea marime a suprafetei pentru care 25% din locuinte au o valoarea mai mare decat ea.
iabila dummy in raport cu suprafata medie. Calculati media si dispersia acestei variabile
area maxim-admisibila (limita admisa) in cazul in care esantionul este extras repetat .P=0.95
interval de incredere pentru suprafata medie a unei locuinte in pop generala daca acest esantion este extras repetat. P=0.95
eaza volumul esantionului, iar restul factorilor raman constanti atunci care va fi noua eroare limita?
25% 25% 25% 25%
min q1 q2=Me q3 max

reprezinta un sfert=> trebuie sa calculam quartile


atea observata este locuinta===> caracteristica/variabila este supraf. Locuibila
determina acea valoare a suprafetei (a lui X) pentru care 25% din locuinte au o valoare mai mare

erminam Lq3=3*(n+1)/4=3*(65+1)/4 49.5


ulam frecventa cumulata
am unde Fc depaseste prima data LQ3
a Fc>Lq3 este 53. => Q3 este situata in intervalul 65-75
x0+h*(Lq3-Fc(pana la Q3))/nQ3
imita sau capatul din stanga a intervalului (65-75)==X0=65
ngimea intervalului=10

ana la Q3)=44
=frecventa individuala a intervalului in care se afla Q3! ATENTIE nu FC!

65+10(49.5-44)/9= 71.11111
cl: Un sfert (25%) din locuinte au o supraf de peste 71.1 mp
iabila dummy in raport cu suprafata medie. Calculati media si dispersia acestei variabile
alculam valoarea medie=media aritmetica (xmed)
m(Xini)/sum(ni)
mp
efinim variabila dummy in raport cu xmed
uprafata sub medie (Xi<60 mp)
uprafata peste medie (Xi>60 mp)
a media variabilei binare este ponderea categoriei notate cu 1
>60mp/nr total de locuinte
ur sunt 9+7+5 locuinte Mai avem o parte din intervalul 55-65 pentru care n=21

21
y y=21*5/10 10.5
fi egal cu 9+7+5+10.5 "=31.5~32 de locuinte"
0.484615
e peste 60 mp
0.249744
area maxim-admisibila (limita admisa) in cazul in care esantionul este extras repetat .P=0.95
admisa =Dx=|xmed-miu|=z*radical(sigma^2(x)/n)
P=0.95=>z=2
m nevoie de dispersia lui x (sigma^2(x))
243.0769
3.867577
interval de incredere pentru suprafata medie a unei locuinte in pop generala daca acest esantion este extras repetat. P=0.95

nei locuinte va fi cuprinsa intre 56.14 mp si 63.86 mp


eaza volumul esantionului, iar restul factorilor raman constanti atunci care va fi noua eroare limita?
2.73479
dubleaza eroarea scade de la 3.86 la 2.73
s repetat. P=0.95
s repetat. P=0.95
Pe un esantion de 180 de persoane s-a efectuat un studiu privind corelarea venitului cu rata platita.

Coeficient
Grupe de ul de
Nr. pers
venit Valoarea variatie al
medie a ratei (CV
rate(lei) %) a) Analizati omogenitatea pe fiecare grupa si per total
<2500 lei 20 450 20 b) care este dispersia valorii ratelor pentru persoanele din categoria d
2500-4000
60
lei 600 22 c)Calculati R2 si stabiliti in ce proportie factorul de grupare explica rez
4000-6000
80
lei 850 24 d)Testati daca influenta factorului este semnificativa din punct de ved
>6000 20 1000 26
Total 180
a venitului cu rata platita.

si per total
u persoanele din categoria de venit <2500 lei?

torul de grupare explica rezultatul

mnificativa din punct de vedere statistic


O companie doreste sa lanseze produsul X pe piata. Compania va obtine profit numai daca produsul va fi cumparat de minim
Pe baza unui esantion de n =200 de persoane, compania obține că 72% din persoane ar cumpara produsul.
Daca în populația totală sunt 150 de mii de persoane carora li se adreseaza produsul, precizati daca compania va obtine profit

Rezolvare
Deoarece eu vad o pondere , f=72%=0.72==> m-ar interesa un interval de incredere pentru pondere
|f-w|=Df=eroarea limita admisa f=ponderea in esantion
w=ponderea in populatie
Deoarece f=ponderea este o medie (a var binare) construiesc la fel
eroarea limita admisa =Df=z*radical(sigma^2(x)/n)
Dar la mine var x este o var dummy (binaraDf=z*radical(sigma^2(f)/n)
sigma^2(f)=f(1-f) 0.2016
Df=2*radical(0.201/200) 0.063403
Intervalul de incredere==> La media(ponderea) din esantion adaug si scad eroarea limita
P(f-Df<=w<=f+Df)=0.95
P(0.72-0.063<=w<=0.72+0.063)=0.95
Cu o probabilitate de 95% intre 65.7% si 78.3% din potentialii clienti vor cumpara produsul
Aplicand ponderile in populatia totala aflu (estimez) cate persoane vor cumpara produsul
In concluzie vor cumpara produsul cu o P=95% intre 65.7% * 150 de mii si 78.3% *150 de mii
98550 117450
Cu o probabilitate de 95% vor compara produsul intre 98.550 si 117.450 persoane
Cum limita inferioare este mai mare decat targetul impus de companie (80 de mii) rezulta compania va o
dusul va fi cumparat de minim 80.000 de persoane.
a produsul.
aca compania va obtine profit, la o P=0.95

ncredere pentru pondere

eroarea limita

mpara produsul
mpara produsul
78.3% *150 de mii

de mii) rezulta compania va obtine profit


https://www.mathsisfun.com/data/standard-normal-distribution-table.html
|xmed-miu|=Dx
Δ
μ
σ
| -μ|= Δx

Pentru populatie masor caracteristica X=varsta


Populatie P1 P2 P3 P4 P5 P6
20 39 19 41 70 55
De obicei nu pot sa fac Recensaman, deci nu pot sa-l aflu pe
Ex: extrag un esantion E1={P4, P7,P8}
varsta medie este= (41+33+37)/3
37

Eroarea limita admisa= |xemd-miu|= | μ|


Eroarea limita admisa=Delta x=Dx= Δx
Pe baza unor proprietati matematica |x-miu|/ radical(sigma^2(x)/n)=
Datorita acestui fapt folosim proprietatile distributiei normale standar
radical (sigma^2(x)n)

|xmed-miu|"=z"

atunci diferenta |xmed-miu|=


Folosim proprietatile: Daca P=0.95===>z~2; Daca P=0.99===
Sigma^2 si n sunt caracteristici care pot fi luate/calculate di

Daca N=milioane sau zeci de milioane atun


1-n/N---->1
P7 P8 P9 P10
33 37 58 22 μ= 39.4
man, deci nu pot sa-l aflu pe miu. DE obicei fac sondaj, folosesc esantioane

medie este= (41+33+37)/3


-2.4

u|/ radical(sigma^2(x)/n)=z~N(0,1)=o repartitie normala standard (vezi graficul de la mathis fun)


istributiei normale standard

"Dx" depinde de o probabilitate

nci diferenta |xmed-miu|=Dx=> depinde de o probabilitate


95===>z~2; Daca P=0.99====> z~3
are pot fi luate/calculate din esantion

sau zeci de milioane atunci corectia nu mai conteaza

S-ar putea să vă placă și