Documente Academic
Documente Profesional
Documente Cultură
Pentru calcularea parametrilor statisticii descriptive Excel oferă mai multe moduri: prin
calcularea funcţiilor, un mod simplu şi mai rapid: pachetul de calcule statistice Data
Analysis Tool oferit de Excel – opţiunea Descriptive Statistics, tabelul pivot-Pivot
Table, pentru calculul statisticilor descriptive pe subgrupuri de date. Se pot calcula
următorii parametrii: sumă, medie aritmetică, modul, minim, maxim, deviaţie standard,
variaţie, eroare standard, kurtosis, skewness, interval de confidenţă, al k-lea element mai
mic sau mai mare, talia, şi intervalul. Toţi aceşti parametrii se pot calcula pentru una sau
mai multe variabile.
Problema 1
Tipul Scor
Nr.id Sex nasterii Apgar Greutate Inaltime Nationalitate
1 F normala 10 3,1 60 romana
2 M normala 10 2,5 55 maghiara
3 M normala 9 4,1 52 romana
4 F normala 8 3,7 56 germana
5 F cezariana 10 3,2 53 romana
6 F normala 9 4,2 61 romana
7 M normala 6 2,8 50 maghiara
8 F normala 9 3,3 55 italiana
9 M cezariana 9 4,2 60 romana
10 M cezariana 8 2,9 51 germana
11 M normala 8 3,4 56 maghiara
12 F normala 10 2,4 52 romana
13 M normala 10 3,6 55 romana
14 F normala 9 3,1 54 romana
15 F normala 10 3,2 56 romana
Să se calculeze statistica descriptivă pentru variabila Greutate din tabelul de mai sus.
Instrucţiuni
Vom rezolva această problemă cu ajutorul componentei Data Analysis – Descriptive
Statistics:
1. Pentru a folosi pachetul Data Analysis el trebuie instalat. Pentru aceasta verificaţi
dacă nu a fost instalat deja: deschideţi meniul Tools. Dacă opţiunea Data Analysis
este prezentă, atunci se trece la pasul următor. Dacă opţiunea Data Analysis nu este
prezentă, atunci din meniul Tools se alege opţiunea Add-Ins. Va apărea o fereastră
asemănătoare celei de mai jos în care se va bifa prima opţiune Analysis ToolPak.
Apăsaţi butonul Ok.
2. Alegeţi opţiunea Data Analysis din meniul Tools. Din fereastra de dialog care
apare selectăm Descriptive Statistics. Clic pe OK.
Interpretarea rezultatelor
• Mean – Media aritmetică a greutăţii este 3,31.
S
ES =
• Standard Error – Eroarea standard calculată după formula: n , unde
S este deviaţia standard şi n numărul de observaţii.
• Median – Mediana este o valoare a seriei astfel încât jumătate dintre observaţii
au valori mai mici (sau egale) şi cealaltă jumătate au valori mai mari (sau egale).
Dacă n este impar, atunci mediana este dată prin formula:
X n +1
Me = 2 .
Xn + Xn
+1
2 2
Me = 2 .
• Mode – Modulul este valoarea care are cea mai mare frecvenţă din serie. In
cazul modulului o situaţie care apare este cea în care seria nu are modul, adică
toate valorile apar o singură dată. Atunci va fi afişată valoarea #N/A. O altă
situaţie posibilă este ca seria să fie bimodală sau trimodală. Atunci va fi
afişată numai prima valoare în ordinea apariţiei lor în cadrul seriei. In acest
caz pentru determinarea tuturor valorilor modulului se poate face un tabel de
frecvenţă.
(X i − X )2
s2 = i =1
• Kurtosis – Excesul sau Boltirea măsoară înălţimea aplatizării sau boltirii unei
distribuţii în comparaţie cu o distribuţie normală. Această măsură este definită
prin:
1 n
(X i − X )4
n i =1
−3
4 = S4 .
Excesul 4 este zero pentru o serie de date având o distribuţie normală, este
pozitiv pentru o serie de date având trena mai înaltă decât cea a unei distribuţii
normale (cu media X şi variaţia S2) şi este negativ pentru o serie de date a cărei
trenă este mai coborâtă decât cea a unei distribuţii normale. In cazul nostru
valoarea -0,669 a boltirii indică o curbă puţin mai aplatizată decât curba
normală.
[( X i − X ) / S ]3
3 = i =1
Asimetria este 0 pentru o serie de date având o distribuţie normală, este pozitivă
pentru o serie de date asimetrică spre stânga (seria are mai multe valori mai
mici), este negativă pentru o serie de date asimetrică spre dreapta (seria are mai
multe valori mai mari). In cazul nostru asimetria este 0,198, deci este puţin
deplasată la dreapta faţă de curba normală.
• Range – Intervalul este Maximul-Minimul. Maximul este 4,2, iar minmul este
2,4. Range=4,2-2,4
X i
X i , i = 1, n
• Sum – Suma sau Totalul valorilor seriei: i =1 , unde seria de
date.
• Largest(2) - Numărul al k-lea mai mic decât numărul cel mai mare.
• Smallest(2) - Numărul al k-lea mai mare decât numărul cel mai mic.
e. Sǎ se calculeze media IMC pentru pacienţii care consumǎ grasimi, sunt de sex
feminin şi sunt obezi, pentru pacienţii…. – folosiţi Pivot Table.
Sex Consuma grasimi Nu consuma grasimi
Obezi Feminin Media IMC Media IMC
Masculin Media IMC Media IMC
Neobezi Feminin Media IMC Media IMC
Masculin Media IMC Media IMC
Instrucţiuni
Punctul a:
1. Alegeţi opţiunea Data Analysis din meniul Tools. Din fereastra de dialog care
apare selectăm Descriptive Statistics. Clic pe OK.
11. Click OK. Rezultatul va apărea într-o foaie nouă cu numele Sheet4
asemănător cu cel de mai jos:
Punctul b:
7. Veţi vedea în zona datelor un buton pentru funcţia SUM, care este funcţia
implicită pentru o variabilă cantitativă. Deoarece noi dorim să efectueze media
aritmeticǎ vom schimba funcţia Sum cu funcţia Average. Pentru aceasta vom
executa dublu clic pe butonul SUM.
8. Va apărea fereastra de dialog Pivot Table Field ca mai jos. Selectaţi funcţia
AVERAGE din lista Summarize by. Clic pe butonul OK.
9. Click pe butonul OK din fereastra Pivot Table Layout apoi clic pe butonul
Finish din fereastra Step 3 of 3. Tabelul cu rezultatele va fi afişat pe Sheet5:
In acest tabel pivot 85,47 este Media Glicemiei pacienţilor neobezi, 98,3 este media
Glicemiei pacienţilor obezi, Grand Total este Media Aritmeticǎ pentru toţi pacienţii
luaţi în evidenţă.
Punctul c:
7. Veţi vedea în zona datelor un buton pentru funcţia SUM, care este funcţia implicită
pentru o variabilă cantitativă. Deoarece noi dorim să efectueze media aritmeticǎ
vom schimba funcţia Sum cu funcţia Average. Pentru aceasta vom executa dublu
clic pe butonul SUM.
8. Va apărea fereastra de dialog Pivot Table Field ca mai jos. Selectaţi funcţia
AVERAGE din lista Summarize by. Clic pe butonul OK.
9. Prin operaţia drag and drop se trage din nou butonul Greutate peste Data. Un nou
buton cu Sum of Greutate va apărea sub cel cu Average of Greutate. Executaţi
dublu clic pe el. Alegeţi funcţia Stdev procedând în acelaşi mod ca mai sus la
alegerea funcţiei Average.
Punctul d:
6. Diagrama pentru efectuarea unui tabel pivot este afişată în figura de mai jos. Prin
operaţia drag and drop se trage butonul Obez peste Row, apoi se trage butonul
Diabet peste Column, iar apoi se trage butonul Varsta peste Data.
7. Veţi vedea în zona datelor un buton pentru funcţia SUM, care este funcţia implicită
pentru o variabilă cantitativă. Deoarece noi dorim să efectueze media aritmeticǎ
vom schimba funcţia Sum cu funcţia Average. Pentru aceasta vom executa dublu
clic pe butonul SUM. Va apărea fereastra de dialog Pivot Table Field ca mai jos.
Selectaţi funcţia AVERAGE din lista Summarize by. Clic pe butonul OK.
8. Click pe butonul OK din fereastra Pivot Table Layout apoi clic pe butonul Finish
din fereastra Step 3 of 3. Tabelul cu rezultatele va fi afişat pe Sheet7:
In acest tabel pivot 47 este Media Varstei pacienţilor neobezi şi nediabetici, 26 este
media Varstei pacienţilor neobezi dar diabetici, 43 este Media Varstei pacienţilor
obezi şi nediabetici, 54 este media Varstei pacienţilor obezi şi diabetici, Grand
Total este Media Aritmeticǎ pentru toţi pacienţii luaţi în evidenţă per total şi pe
subgrupe.
9. Dacă dorim să inversăm categoriile ca să apară True mai întâi şi apoi False, atunci
facem dublu clic pe Diabet. Va apărea o ferestră ca şi cea de mai jos. Clic pe
butonul Advanced.
10. Va apărea o nouă cutie de dialog Pivot Table Advanced Field Options în care veţi
selecta butonul Descending. Clic OK. Apoi click OK pe butonul ferestrei
PivotTable Field.
6. Diagrama pentru efectuarea unui tabel pivot este afişată în figura de mai jos. Prin
operaţia drag and drop se trage butonul Obez peste Row, apoi se trage butonul
Sex peste Row, apoi se trage butonul Grăsimi peste Column, iar apoi se trage
butonul IMC peste Data.
7. Veţi vedea în zona datelor un buton pentru funcţia SUM. Deoarece noi dorim să
efectueze media aritmeticǎ vom schimba funcţia Sum cu funcţia Average. Pentru
aceasta vom executa dublu clic pe butonul SUM. Va apărea fereastra de dialog
Pivot Table Field ca mai jos. Selectaţi funcţia AVERAGE din lista Summarize
by. Clic pe butonul OK.
8. Click pe butonul OK din fereastra Pivot Table Layout apoi clic pe butonul Finish
din fereastra Step 3 of 3. Tabelul cu rezultatele va fi afişat pe Sheet8:
In acest tabel pivot sunt calculate mediile IMC ale pacienţilor împărţiţi pe diferite
categorii.