Sunteți pe pagina 1din 13

LP 7 MICROSOFT EXCEL

EXERCIȚII PROPUSE:

DATA ANALYSIS: CALCULUL DISTRIBUȚIEI DE FRECVENȚE:

1. Calculați distribuția de frecvențe și realizați histograma corespunzătoare pentru variabila MEDIU


din tabelul anterior.

Comanda „Histogram” din pachetul de funcții statistice „Data Analysis” calculează


distribuția de frecvențe pentru valorile numerice ale unui parametru dintr-un tabel și realizează, dacă
este cazul, reprezentarea grafică corespunzătoare de tip histogramă.

OBSERVAŢIE: Comanda necesită în mod obligatoriu folosirea de valori numerice – prin urmare,
dacă valorile unui parametru într-un tabel sunt codificate prin șiruri de caractere, va fi necesară
recodificarea lor cu numere.

Pentru a se calcula o distribuție de frecvențe, vor trebui specificate în mod obligatoriu două
informații:
- Șirul de celule care conține valorile efective ale variabilei pentru care dorim să realizăm distribuția
(„Input Range”);
- O coloană auxiliară de valori („Bin Range”) ce conține valorile distincte din șirul de valori inițial,
așezate în ordine crescătoare, pentru care se realizează distribuția de frecvențe (acestea vor fi căutate
în coloana inițială de valori și pentru fiecare dintre ele va fi identificat numărul de apariții).

SOLUȚIE: Parcurgeți pașii de mai jos:


- Inserați în tabel, după coloana MEDIU, o coloană suplimentară cu același nume și
recodificați cele două valori introduse cu cifre; se va folosi: u = 1 (mediu urban),
r = 2 (mediu rural)
(folosiți comanda de filtrare a datelor – Home / Sort&Filter / Filter – pentru a realiza ușor
această operație).
- Adăugați un tabel auxiliar în foaia de calcul curentă, intitulat ”Bin Range”, și inserați acolo
valorile distincte ale variabilei pentru care urmează să calculați distribuția de frecvențe
(MEDIU).

MEDIU
BIN RANGE
1
2
- Selectați butonul Data / Data Analysis și comanda Histogram din fereastra « Analysis
Tools »:

Fereastra de dialog activată se va personaliza cu următoarele informații:

Se introduce șirul de celule


pentru care dorim să calculăm
distribuția de frecvențe (în
cazul nostru, valorile din
coloana MEDIU).

Se introduc valorile distincte,


ordonate crescător, pentru care
se calculează distribuția de
frecvențe (în cazul nostru,
valorile 1 și 2 înscrise în tabelul
auxiliar).

Se bifează numai atunci când


prima celulă din coloanele de
valori selectate conține numele
Se indică poziția în care dorim să afișăm rezultatele comenzii, variabilei pentru care se
prin alegerea uneia dintre următoarele opțiuni: realizează analiza (de regulă se
vor selecta doar valorile, fără
- Output Range: rezultatele se vor afișa în foaia de lucru numele coloanelor aferente,
curentă, într-o regiune începând cu celula a cărei etichetă este astfel încât această opțiune
specificată aici; rămâne nebifată).
- New Worksheet Ply: rezultatele se vor afișa pe o foaie de
lucru separată, cu nume implicit (Sheet 5) sau specificat de
noi, în același registru de calcul;
- New Workbook: rezultatele se vor afișa într-un registru de
calcul separat care se creează la lansarea comenzii.

Se indică tipul de distribuție de frecvențe pe care dorim să îl calculăm:

- Dacă nu se bifează nimic: se realizează distribuția de frecvențe ce conține frecvențele absolute


pentru categoriile specificate;
- Pareto: tabelul distribuției de frecvențe se afișează în ordinea descrescătoare a frecvențelor
calculate, și nu în cea a categoriilor specificate în „Bin Range”;
- Cumulative Percentage: tabelul va conține și frecvențele procentuale cumulate;
- Chart Output: se realizează și graficul de tip Histogramă corespunzător.
Rezultatul comenzii Histogram fără nici Rezultatul comenzii Histogram cu opțiunea „Pareto” bifată:
o opțiune de calcul bifată: sunt afișate sunt afișate frecvențele absolute ale categoriilor urmărite, atât
doar frecvențele absolute ale în ordinea categoriilor, cât și în ordinea frecvențelor (în cazul
categoriilor urmărite. nostru, din întâmplare cele două ordini coincid).

Rezultatul comenzii Histogram cu opțiunea Rezultatul comenzii Histogram cu opțiunea


„Cumulative Percentage” bifată: sunt afișate „Chart Output” bifată: sunt afișate frecvențele
frecvențele absolute și cele procentuale ale absolute ale categoriilor urmărite și reprezentarea
categoriilor urmărite. corespunzătoare de tip histogramă.

- Încărcați informațiile necesare în fereastra « Histogram » :


MEDIU
BIN RANGE
1
2

REZULTATUL AȘTEPTAT :

(folosind opțiunile
Pareto
Chart Output)

Rezultatul obținut poate fi formatat ulterior ca orice grafic obișnuit:


2. Calculați distribuția de frecvențe și realizați histograma corespunzătoare pentru variabila VARSTA
din tabelul anterior.

Când se dorește realizarea histogramei pentru o variabilă numerică având o plajă de variație
continuă, este necesară gruparea valorilor vecine în intervale de clasă.
În acest caz, tabelul « Bin Range » va conține limita inferioară a fiecărui interval de clasă ; se
vor folosi intervale de clasă de câte 10 ani.

SOLUȚIE: Parcurgeți pașii de mai jos:

- Coloana VARSTA conține valori numerice; prin urmare nu este necesară recodificarea
acestora;
- Adăugați un tabel auxiliar în foaia de calcul curentă, intitulat ”Bin Range”, și indicați acolo
limitele inferioare ale intervalelor de clasă care vor fi utilizate.
Limitele inferioare ale intervalelor de clasă vor fi definite conform modelului de mai jos:
20 <= 20
30 > 20 și <= 30
40 > 30 și <= 40
50 > 40 și <= 50
60 > 50 și <= 60
more > 60
VARSTA
BIN RANGE
10
20
30
40
50
60

- Selectați butonul Data / Data Analysis și comanda Histogram din fereastra « Analysis
Tools »:

- Încărcați informațiile necesare în fereastra « Histogram » :


VARSTA
BIN RANGE
10
20
30
40
50
60

REZULTATUL AȘTEPTAT :

(utilizând opțiunile
Cumulative Percentage
Chart Output)
Rezultatul obținut poate fi formatat ulterior ca orice grafic obișnuit:

3. Calculați distribuția de frecvențe și realizați histograma corespunzătoare pentru variabila SCOR


DE DURERE din tabelul anterior.

4. Calculați distribuția de frecvențe și realizați histograma corespunzătoare pentru variabila


GREUTATE din tabelul anterior, folosind intervale de variație de 10 kg, cu limitele 50, 60, 70, 80,
90.

5. Calculați distribuția de frecvențe și realizați histograma corespunzătoare pentru variabila


INALTIME din tabelul anterior, separat pe genuri (bărbați și femei), folosind intervale de variație
de câte 5 centimetri, cu limitele 1.60, 1.65, 1.70, 1.75, 1.80, 1.85, 1.90.

INDICAȚIE : Este necesară mai întâi separarea valorilor din coloana ÎNĂLȚIME după genul
pacienților; pentru a se rezolva această problemă, parcurgeți pașii următori:
- Sortați sau filtrați tabelul după valorile din coloana GEN;
- Copiați valorile înălțimii pentru bărbați în afara tabelului inițial de date, într-o coloană auxiliară;
- Repetați procedura pentru valorile înălțimii la femei;
- Realizați două histograme, câte una pentru fiecare dintre cele două coloane auxiliare (valorile
înălțimii la bărbați și valorile înălțimii la femei).

6. Calculați distribuția de frecvențe și realizați histograma corespunzătoare pentru variabila GRUPA


DE SANGE din tabelul anterior.
CALCULUL PARAMETRILOR DE STATISTICĂ DESCRIPTIVĂ:

7. Calculați parametrii de statistică descriptivă pentru variabila GLICEMIE din tabelul anterior.

Comanda „Descriptive Statistics” din pachetul de funcții statistice „Data Analysis” calculează
simultan toți parametrii de statistică descriptivă pentru valorile numerice ale unei variabile dintr-un
tabel.
Comanda utilizează în mod obligatoriu doar valori numerice și necesită introducerea unei
singure informații, respectiv șirul de celule care conține valorile efective ale variabilei pentru care
dorim să calculăm parametrii de statistică descriptivă („Input Range”).
Rezultatele comenzii sunt afișate sub formă tabelară și prezintă avantajul că toți parametrii de
statistică descriptivă sunt calculați simultan și prezentați într-un format centralizat, economisindu-se
timpul care ar fi fost necesar pentru calcularea individuală a lor.

Pentru a obține rezultatul indicat mai sus, fereastra de dialog activată prin comanda Data /
Data Analysis / Descriptive Statistics se personalizează cu următoarele informații:
Se introduce șirul de celule
pentru care dorim să calculăm
parametrii de statistică
descriptivă (în cazul nostru,
valorile din coloana
GLICEMIE).

Se bifează atunci când prima


celulă din coloanele de valori
selectate conține numele
variabilei pentru care se
realizează analiza (de regulă se
bifează această opțiune tocmai
pentru a defini în clar numele
variabilei ai cărei indicatori
statistici s-au calculat).

Se indică poziția în care dorim să afișăm rezultatele comenzii, prin alegerea uneia dintre următoarele
opțiuni:
- Output Range: rezultatele se vor afișa în foaia de lucru curentă, într-o regiune începând cu celula
a cărei etichetă este specificată aici;
- New Worksheet Ply: rezultatele se vor afișa pe o foaie de lucru separată, cu nume implicit (Sheet
4) sau specificat de noi, în același registru de calcul;
- New Workbook: rezultatele se vor afișa într-un registru de calcul separat care se creează la
lansarea comenzii.

Se bifează calculele pe care dorim să le realizăm:

- Summary statistics: se bifează obligatoriu; vor fi calculați parametrii standard de statistică


descriptivă;
- Confidence Level for Mean: atunci când este bifat va fi calculat în plus și intervalul de
confidență al mediei cu precizia dorită (valoarea standard a preciziei este de 95%, dar se pot
folosi și valori de 99% sau de 90%);
- Kth Largest: se afișează a k-a valoare din șirul de valori individuale ordonate descrescător;
- Kth Smallest: se afișează a k-a valoare din șirul de valori individuale ordonate crescător.

OBSERVAŢIE: În mod obișnuit, la calcularea parametrilor de statistică descriptivă este suficientă


doar bifarea opțiunilor „Summary statistics” și „Confidence Level for Mean”.

SOLUȚIE: Parcurgeți pașii de mai jos:

- Alegeți din meniul superior succesiunea de comenzi:


Data / Data Analysis / Descriptive Statistics:
- Definiți parametrii funcției, respectiv:
o Input Range: se încarcă șirul de celule pentru care dorim să calculăm statisticile,
respectiv coloana F din tabel;
o New Worksheet Ply: se bifează pentru a afișa rezultatele într-o nouă foaie de calcul
care se va adăuga în registrul de calcul curent;
o Summary statistics: se bifează pentru a stabili mărimile statistice care urmează a fi
calculate.
REZULTATUL AȘTEPTAT:

8. Calculați parametrii de statistică descriptivă pentru variabila COLESTEROL din tabelul anterior.

9. Calculați parametrii de statistică descriptivă pentru variabila HGB (hemoglobină) din tabelul
anterior global și separat pentru pacienții cu și fără hipertensiune.

INDICAȚIE : Este necesară mai întâi separarea valorilor din coloana HGB în două grupe,
pentru pacienții cu și fără hipertensiune; pentru a se rezolva această problemă, parcurgeți
pașii următori:
- Sortați sau filtrați tabelul după valorile din coloana HIPERTENSIUNE;
- Copiați valorile HGB pentru pacienții cu hipertensiune în afara tabelului inițial de date, într-o
coloană auxiliară;
- Repetați procedura pentru valorile HGB la pacienții fără hipertensiune;
- Folosiți comanda ”Descriptive statistics” de trei ori, o dată pentru întreaga coloană HGB din
tabelul inițial de date, apoi pentru prima coloană auxiliară, care conține valorile HGB la
pacienții cu hipertensiune și apoi pentru a doua coloană auxiliară, care conține valorile HGB
la pacienții fără hipertensiune.

10. Calculați parametrii de statistică descriptivă pentru variabila WBC la pacienții cu grupa de sânge
AB din tabelul anterior.

INDICAȚIE: Este necesară mai întâi separarea pacienților cu grupa de sânge AB. Pentru a se
rezolva această problemă, parcurgeți pașii următori:
- Sortați sau filtrați tabelul după valorile din coloana GRUPA DE SANGE;
- Copiați valorile WBC pentru pacienții cu grupa de sânge AB în afara tabelului inițial de date,
într-o coloană auxiliară – eventual, pentru o claritate mai bună, într-o foaie de calcul nouă din
același fișier;
- Folosiți comanda ”Descriptive statistics” pentru coloana auxiliară, care conține pacienții cu
grupa de sânge AB.

11. Calculați parametrii de statistică descriptivă pentru variabila HCT (hematocrit) la bărbați, separat
pe grupe de sânge.

12. Calculați parametrii de statistică descriptivă pentru variabila HCT (hematocrit) la femei cu vârsta
>35 ani și VSH > 20.

13. Reprezentați pe un grafic (de tip Column) valorile VSH comparativ la pacienții cu RH + și separat,
cu RH -.

14. Reprezentați pe un grafic (de tip Column) valorile HGB comparativ pe grupe de sânge.

S-ar putea să vă placă și