Sunteți pe pagina 1din 32

STATISTICĂ ĨN SPSS - CURS 3

1 MARTIE2021

1
OBIECTIVULPRINCIPAL

măsuri numerice ca alternativă la rezumarea datelor

2
TIPURI DE REZUMARENUMERICĂ

• Măsuri ale locației, sau tendinței centrale adatelor

• Dispersia

• Forma distribuției

• Relațiadeasociere

3
CONCEPTE IMPORTANTE
statistici de selecție: sunt calculate pe baza datelor dintr-un
eșantion

parametrii populației: proprietati numerice ce sunt calculate


pentru întreaga populație

estimator: o funcţie ce depinde de rezultatele obţinute pe un


eşantion extras aleatoriu

estimatorpunctual: valoarea dată de funcţia ataşată estimatorului


4
EXEMPLU

Populatia: studenți, anulI

Eșantion: 5 studenți, selectați aleatoriu

Caracteristică: nota finală la Microeconomie

Datele: 6, 7, 8, 5, 10

5
EXEMPLU
estimator: media (adunăm toate datele și împărțim
rezultatul la numărul de date)

statistica de selecție: media de selecție, 36/5 = 7.2

parametrul populației: de obicei necunoscut

estimator punctual: 7.2 este un estimator punctual pentru


adevărata valoare a parametrului populației.
6
I. MĂSURI ALE LOCAȚIEI

Media

Mediana

Modul

Procentila
7
MEDIA

Media - probabil cea mai importantă, familiară și larg utilizată


măsură a tendinței centrale adatelor

media =sum(x)/n,unde

x: x1,x2,x3,… xn suntdatele

n: numărul deobservații

8
NOTE -MICROECONOMIE
Student Nota Student Nota

1 10 6 6

2 5 7 10

3 5 8 7

4 7 9 6

5 8 10 5
9
CUM FACEMCALCULUL?

(10+5+5+7+8+6+10+7+6+5)/10 =6.9

10
DOUĂ NOTAȚIIDIFERITE

media de selecție: 𝒙ҧ

media populației:μ

DAR

aceeași regulă decalcul

11
MEDIA DE SELECȚIE ȘIMEDIA
POPULAȚIEI

media de selecție:6.9

media populației: de obiceinecunoscută

Media de selecție 6.9 este un (alt) estimatorpunctual al mediei


necunoscute, μ, apopulației

12
LIMITELE MEDIEI?

1655,2280, 2396,2444,2597,2602,2704, 2882,


3180,3765

media =2650.5

1655,2280, 2396,2444,2597,2602,2704, 2882,


3180,13765

media =3650.5
13
MEDIANA
valoarea din mijloc într-un șir de date, atunci când datele sunt aranjate
în ordine crescătoare (de la cea mai mică la cea mai mare)

număr impar de observații: valoarea din mijloc

1,5,6,8,13,15, 22 ; Me = 8

număr par de observații: media celor două valori din mijloc

1,5,6,8,13,15, 22, 31

Me = (8+13)/2 = 10.5
14
APLICAȚII?

salariul mediu versus salariul median

Ori de câte ori setul de date conține valori extreme,


mediana este o măsură mai bună pentru a descrie
tendința centrală a datelor

15
MEDIE VERSUSMEDIANĂ
media - sensibilă la valori extreme

mediana - calculată pe baza a cel mult două valori din setul de


date

“trimmed mean”

1655,2280,2396,2444,2597,2602,2704,2882,3180,
13765

trimmed mean =2635.625


16
MODUL

valoarea care apare cu cea mai mare frecvență

17
EXEMPLU

 notele la Microeconomie -uneșantion dedimensiune 10

 notele:10,5,5,7,8,6,10,7,6,5

18
10, 5, 5, 7, 8, 6, 10, 7, 6, 5 - mulțime
unimodală
valoarea de frecvență maximă

Nota
5 6 7 8 10

19
10, 5, 5, 7, 8, 6, 7, 7, 6, 5 -
mulțime bimodală

două valori de frecvență maximă

Nota
5 6 7 8 10

20
PROCENTILA

oferă informații despre modul în care sunt repartizate datele


în intervalul care are ca și capete cea mai mică și cea mai
mare valoare din mulțimea de date

21
DEFINIȚIE FORMALĂ
 Procentila de ordin p este valoarea pentru care cel puțin p%
dintre observații sunt mai mici decât aceasta și cel puțin (1-p)%
dintre observații sunt mai mari sau egale decât aceasta

22
Utilitate (exemplu)

Un student obține 54 de puncte la un examen de


admitere

Cum s-a descurcat acest student în raport cu ceilalți care au


dat același test?

23
CALCULUL PROCENTILEI P
Pasul 1. Aranjăm datele în ordine crescătoare

Pasul 2. Calculăm un indice,i

i = (p/100) * n

p este procentila de interes

n este numărul de observații.

Pasul 3. (a) Dacă i nu ia o valoare întreagă, rotunjim. Următorul întreg mai


mare decât i este procentila de ordin p. (b) Dacă i este întreg, procentila de
ordin p este media valorilor de pe pozițiile i și i+1.
24
EXEMPLU

Procentila 85 pentru eșantionul celor 10 note la Microeconomie

10,5,5,7,8,6,10,7,6,5

Pasul 1 Aranjarea datelor în ordine crescătoare.


5, 5, 5, 6, 6, 7, 7, 8, 10, 10

25
EXEMPLU

5,5,5,6,6,7,7,8,10,10

Pasul 2: calculul indicelui,i i = (p/100)*n

i = (85/100)*10

i = 8,5

26
EXEMPLU

Pasul 3 Pentru că i nu este întreg, rotunjim valoarea la 9.


Poziția procentilei 85 va fi, deci, poziția 9.

În setul de date, aceasta corespunde valorii 10.

27
QUARTILELE

procentile particulare:

Q 1 - prima quartilă, sau procentila 25

Q 2 - a doua quartilă, sau procentila 50 (mediana)

Q 3 - a treia quartilă, sau procentila 75

28
Aplicație

 Se consideră datele privind numărul de pagini citite de 10 studenţi


pentru pregătirea testului de seminar la una din disciplinele
studiate:
 5, 6, 7, 10, 12, 12, 13, 20, 25, 300.
 Calculaţi:
 Media
 Mediana
 Modul
 Quartilele
 Procentila 60
Formule – pentru date
grupate
 Media:
σ 𝑥𝑖 𝑛𝑖
𝑥ҧ = σ 𝑛𝑖

 Mediana:
𝑛+1
−𝐹𝑐𝑀𝑒−1
Me = 𝑥𝑖𝑛𝑓𝑀𝑒 + ℎ𝑀𝑒 2
𝑛𝑀𝑒
𝑥𝑖𝑛𝑓𝑀𝑒 - limita inferioara a intervalului in care se situeaza mediana

ℎ𝑀𝑒 - marimea intervalului in care se situeaza mediana

𝐹𝑐𝑀𝑒−1 - frecventa cumulate a intervalului anterior celui median

𝑛�𝑀𝑒 – frecventa absoluta a intervalului in care se situeaza mediana

 Modul:
∆1
Mo = 𝑥𝑖𝑛𝑓𝑀𝑜 + ℎ𝑀𝑜
∆1 +∆2
𝑥𝑖𝑛𝑓𝑀𝑜 - limita inferior a intervalului in care se situeaza modul

ℎ𝑀𝑜 - marimea intervalului modal

∆1 = 𝑛𝑀𝑜 − 𝑛𝑀𝑜−1 - frecventa intervalului modal minus frecventa intervalului anterior celui modal

∆2 = 𝑛𝑀𝑜 − 𝑛𝑀𝑜+1 - frecventa intervalului modal minus frecventa intervalului urmator celui modal
Aplicație

 Procentul din profit cheltuit de 70 firme pentru reclama


si publicitate in anul 2018 a avut urmatoarea distributie:

% pt reclama si publicitate Nr. firme cu % pt reclama


0.6 - 1 14
1 – 1.4 18
1.4 – 1.8 24
1.8 – 2.2 8
2.2 – 2.6 4
2.6 - 3 2
Total 70
 Nota: limita inferioara inclusa in interval
Aplicație

Se cere:
 Sa se reprezinte grafic distributia de frecvente absolute
 Sa se determine procentul mediu cheltuit pentru
reclama si publicitate si sa se studieze daca valoarea
obtinuta este reprezentativa
 Care este procentul din profit cheltuit pentru reclama si
publicitate peste care se situeaza:
 Trei sferturi dintre firme?
 50% dintre firme?
 O patrime dintre firme?

S-ar putea să vă placă și