Statistica Descriptiva Problema 2

Problema 2.
Introduceţi în Excel următorul tabel cu datele a 30 de pacienţi aflaţi în

atenţia centrului de diabet şi boli de nutriţie.
SEX VARSTA OBEZ DIABET GRASIMI DULCIURI GREUTATE IMC GLICEMIE

M 59 FALSE FALSE TRUE TRUE 95 33 100
F 68 TRUE TRUE TRUE TRUE 85 35 103
F 70 FALSE FALSE FALSE FALSE 54 22 99
M 29 FALSE FALSE FALSE TRUE 74 26 84
F 29 FALSE FALSE FALSE TRUE 61 24 82
M 52 FALSE FALSE TRUE FALSE 82 23 72
F 43 FALSE FALSE FALSE TRUE 67 25 89
M 47 FALSE FALSE FALSE FALSE 86 29 80
F 30 TRUE FALSE FALSE TRUE 69 28 76
M 47 TRUE FALSE TRUE FALSE 107 33 108
M 41 TRUE TRUE FALSE FALSE 84 25 85
M 41 TRUE FALSE FALSE TRUE 104 34 122
F 49 TRUE FALSE FALSE FALSE 109 38 89
F 50 TRUE FALSE TRUE TRUE 88 32 123
F 48 FALSE FALSE TRUE TRUE 78 26 93
M 44 TRUE FALSE TRUE TRUE 108 37 89
M 26 FALSE TRUE FALSE TRUE 96 31 81
M 41 TRUE FALSE FALSE FALSE 81 29 90
a. Să se calculeze statisticile descriptive pentru variabilele: Greutate, IMC, Glicemie folosiţi

pachetul Data Analysis – Descriptive Statistics.
b. Sǎ se calculeze media Glicemiei pentru pacienţii care sunt obezi şi pentru cei neobezi –
folosiţi Pivot Table.
Obezi Neobezi
Media Glicemiei Media Glicemiei

c. Sǎ se calculeze media Varstei pentru pacienţii obezi şi diabetici, pentru cei neobezi şi
diabetici, pentru cei obezi şi nediabetici, pentru cei neobezi şi nediabetici – folosiţi Pivot
Table.
Diabetici Nediabetici
Obezi Media Varstei Media Varstei
Neobezi Media Varstei Media Varstei
Punctul a.
1. Alegeţi opţiunea Data Analysis din meniul Data fig. a1. Din fereastra de dialog care
apare selectăm Descriptive Statistics. Clic pe OK.
Fig.a1
2. După apăsarea butonului OK pe ecran va apărea fereastra de dialog Descriptive

Statistics, fig a2. Completaţi ca mai jos:
3. Input Range: Introduceţi referinţele domeniului unde se găsesc variabilele pentru
care dorim sǎ se calculeze Statisticile Descriptive. În cazul nostru Greutate, IMC,
Glicemie: G1:I31. Pentru introducere executaţi click în câmpul Input Range, apoi
click în celula G1 şi executaţi o selecţie până în celula G31.
4. Grouped by: se va selecta Columns deoarece variabilele sunt introduse pe coloane.
5. Labels in first row. Bifǎm Label in first row deoarece antetul de coloană este
selectat.
6. Opţiunile Output se referă la locul amplasării tabelului de frecvenţă. Vom selecta
opţiunea New Worksheet Ply.
7. Summary statistics se bifează pentru ca să se calculeze parametrii statistici

principali.
8. Confidence Level for Mean se bifează pentru a se calcula şi intervalul de confidenă
pentru media aritmetică. Nivelul de confidenţă implicit este 95%, se poate schimba cu
un alt număr de la 1 la 99,9.
9. Kth Largest nu se bifeazǎ.
10. Kth Smallest nu se bifeazǎ.
Fig.a2
11. Click OK. Rezultatul va apărea într-o foaie nouă cu numele Sheet4 asemănător cu
cel de mai jos, fig a3:
Fig.a3
Interpretarea rezultatelor
 Mean – Media aritmetică a greutăţii , a IMC si a Glicemiei
S
ES 
 Standard Error – Eroarea standard calculată după formula: n , unde S este
deviaţia standard şi n numărul de observaţii.
 Median – Mediana este o valoare a seriei astfel încât jumătate dintre observaţii au
valori mai mici (sau egale) şi cealaltă jumătate au valori mai mari (sau egale). Dacă n
este impar, atunci mediana este dată prin formula:
X n1
Me = 2 .
Dacă n este par, atunci mediana este dată prin formula:
Xn  Xn
1
2 2
Me = 2 .
 Mode – Modulul este valoarea care are cea mai mare frecvenţă din serie. In cazul
modulului o situaţie care apare este cea în care seria nu are modul, adică toate valorile
apar o singură dată. Atunci va fi afişată valoarea #N/A. O altă situaţie posibilă este ca
seria să fie bimodală sau trimodală. Etunci va fi afişată numai prima valoare în
ordinea apariţiei lor în cadrul seriei. In acest caz pentru determinarea tuturor valorilor
modulului se poate face un tabel de frecvenţă.
 Standard Deviation – Deviaţia standard sau Abaterea standard S = s 2 . Unde s2
este variatia.
(X i  X )2
s2  i 1
 Sample Variance – Variaţia este calculată după formula: n , unde n

X , i  1, n
este talia seriei, i seria de date, în cazul nostru Greutatea şi X este media
aritmetică a seriei.
 Kurtosis – Excesul sau Boltirea măsoară înălţimea aplatizării sau boltirii unei
distribuţii în comparaţie cu o distribuţie normală. Această măsură este definită prin:
1 n
  (X i  X )4
n i 1
3
4 = S4 .
Excesul 4 este zero pentru o serie de date având o distribuţie normală, este pozitiv
pentru o serie de date având trena mai înaltă decât cea a unei distribuţii normale (cu
media X şi variaţia S2) şi este negativ pentru o serie de date a cărei trenă este mai
coborâtă decât cea a unei distribuţii normale. In cazul nostru valoarea -0,669 a boltirii
indică o curbă puţin mai aplatizată decât curba normală.
 Skewness – Asimetria măsoară abaterea de la aspectul simetric şi direcţia asimetriei

(pozitivă sau negativă) faţă de curba normală. Este calculată cu formula:
n
 [( X i  X ) / S ]3
3  i 1
Asimetria este 0 pentru o serie de date având o distribuţie normală, este pozitivă
pentru o serie de date asimetrică spre stânga (seria are mai multe valori mai mici),
este negativă pentru o serie de date asimetrică spre dreapta (seria are mai multe valori
mai mari). In cazul nostru asimetria este 0,198, deci este puţin deplasată la dreapta
faţă de curba normală.
 Range – Intervalul este Maximul-Minimul. Maximul este 4,2, iar minmul este 2,4.
Range=4,2-2,4
 Minimum – Minimul valoarea cea mai mică din serie.
 Maximum – Maximul valoarea cea mai mare din serie.

n
X i
X i , i  1, n
 Sum – Suma sau Totalul valorilor seriei: i 1 , unde seria de date.
 Count – Numărul de observaţii n=15.
 Largest(2) - Numărul al k-lea mai mic decât numărul cel mai mare.
 Smallest(2) - Numărul al k-lea mai mare decât numărul cel mai mic.
 Confidence Level (95,0%) – întoarce o valoare cu ajutorul căreia se poate construi
intervalul de confidenţă de 95% pentru medie. Această valoare este 10,97, intervalul
este [ X  0,31, X  0,31] =[3,31-0,31, 3,31+0,31] = [3;3,62], unde X este media
aritmetică. Fie m media populaţiei situată în acest interval. Media oricărui eşantion al
acestei populaţii este mai departe de m ca X cu o probabilitate mai mare decât alpha.
Alpha în cazul nostru este 95,5%. Presupunem că utilizăm X , deviaţia standard
standard şi talia pentru a construi un test cu un prag de semnificaţie alpha în ipoteza
că media populaţiei este m. Nu vom respinge ipoteza dacă m este în intervalul de
confidenţă şi vom respinge ipoteza dacă m nu este în intervalul de confidenţă. Dacă
alpha este 0,95 trebuie să calculăm aria de sub curba normală. Această valoare este
[ X  tcrit ES , X  tcrit ES ]
1,96. Intervalul de confidenţă este: , unde X este media
aritmetică, iar ES este eroarea standard, iar t critic este 1,96. Valoarea întoarsă de
program este tcrit ES . Se poate calcula şi cu funcţia CONFIDENCE.
Punctul b:
Sǎ se calculeze media Glicemiei pentru pacienţii care sunt obezi şi pentru cei neobezi –
folosiţi Pivot Table.
Obezi Neobezi
Media Glicemiei Media Glicemiei
1. Se aduce tabelul cu datele pe foaia Sheet1
2. Din Insert se alege opţiunea PivotTable
3. Se va deschide fereastra Create Pivot Table
4. Se selectează din tabelul de date domeniul variabilelor Obez şi Glicemie C1:I31.

Click pe butonul OK vezi fig. b1
Fig.b1
5. Apare fereastra Pivot Table Field List, fig b2 prin operaţia drag and drop se trage
butonul Obez peste Column, iar apoi se trage butonul Glicemie peste ∑ Value.
Fig. b2
Fig. b3
6. Apare rezultatul conform fig.b3 vedea în zona datelor un buton pentru funcţia
SUM, care este funcţia implicită pentru o variabilă cantitativă. Deoarece noi dorim să
efectueze media aritmeticǎ vom schimba funcţia Sum cu funcţia Average. Pentru
aceasta vom executa dublu clic pe butonul SUM.
7. Va apărea fereastra de dialog Value Field Settings ca mai jos. Selectaţi funcţia
AVERAGE din lista Summarize by. Clic pe butonul OK.
Fig.b4
8. Va apare rezultatul conform fig.b5
Fig.b5
In acest tabel pivot 85,47 este Media Glicemiei pacienţilor neobezi, 98,33
este media Glicemiei pacienţilor obezi, Grand Total este Media Aritmeticǎ pentru toţi
pacienţii luaţi în evidenţă.
Punctul c
Sǎ se calculeze media Varstei pentru pacienţii obezi şi diabetici, pentru cei neobezi şi
diabetici, pentru cei obezi şi nediabetici, pentru cei neobezi şi nediabetici – folosiţi Pivot
Table.
Diabetici Nediabetici
Obezi Media Varstei Media Varstei
Neobezi Media Varstei Media Varstei
1. Se aduce tabelul cu datele in foaia Sheet1
2. Din Insert se alege opţiunea PivotTable
3. Se va deschide fereastra Create Pivot Table
4. Se selectează din tabelul de date domeniul variabilelor Varsta, Obezi si Diabetici

B1:D31. Click pe butonul OK vezi fig. c1
Fig,c1
5. Diagrama pentru efectuarea unui tabel pivot este afişată în figura de mai jos. Prin operaţia
drag and drop se trage butonul Obez peste Row, apoi se trage butonul Diabet peste
Column, iar apoi se trage butonul Varsta peste Data vezi fig.c2.
Fig.c2
6. Veţi vedea în zona datelor un buton pentru funcţia SUM, care este funcţia implicită
pentru o variabilă cantitativă. Deoarece noi dorim să efectueze media aritmeticǎ vom
schimba funcţia Sum cu funcţia Average. Pentru aceasta vom executa dublu clic pe
butonul SUM. Va apărea fereastra de dialog Pivot Table Field ca mai jos. Selectaţi
funcţia AVERAGE din lista Summarize by. Clic pe butonul OK si rezultatul apare in
fig.c3
Fig.c3
In acest tabel pivot 47,65 este Media Varstei pacienţilor neobezi şi nediabetici, 26 este
media Varstei pacienţilor neobezi dar diabetici, 43,14 este Media Varstei pacienţilor
obezi şi nediabetici, 54,5 este media Varstei pacienţilor obezi şi diabetici, Grand Total
este Media Aritmeticǎ pentru toţi pacienţii luaţi în evidenţă per total şi pe subgrupe.

Statistica Descriptiva Problema 2

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Statistica Descriptiva Problema 2

Încărcat de

Drepturi de autor:

Formate disponibile

Problema 2.

Introduceţi în Excel următorul tabel cu datele a 30 de pacienţi aflaţi în

SEX VARSTA OBEZ DIABET GRASIMI DULCIURI GREUTATE IMC GLICEMIE

a. Să se calculeze statisticile descriptive pentru variabilele: Greutate, IMC, Glicemie folosiţi

2. După apăsarea butonului OK pe ecran va apărea fereastra de dialog Descriptive

7. Summary statistics se bifează pentru ca să se calculeze parametrii statistici

9. Kth Largest nu se bifeazǎ.

10. Kth Smallest nu se bifeazǎ.

 Mean – Media aritmetică a greutăţii , a IMC si a Glicemiei

Dacă n este par, atunci mediana este dată prin formula:

 Sample Variance – Variaţia este calculată după formula: n , unde n

 Skewness – Asimetria măsoară abaterea de la aspectul simetric şi direcţia asimetriei

 Minimum – Minimul valoarea cea mai mică din serie.

 Maximum – Maximul valoarea cea mai mare din serie.

 Count – Numărul de observaţii n=15.

1. Se aduce tabelul cu datele pe foaia Sheet1

2. Din Insert se alege opţiunea PivotTable

3. Se va deschide fereastra Create Pivot Table

4. Se selectează din tabelul de date domeniul variabilelor Obez şi Glicemie C1:I31.

8. Va apare rezultatul conform fig.b5

1. Se aduce tabelul cu datele in foaia Sheet1

2. Din Insert se alege opţiunea PivotTable

3. Se va deschide fereastra Create Pivot Table

4. Se selectează din tabelul de date domeniul variabilelor Varsta, Obezi si Diabetici

S-ar putea să vă placă și