Sunteți pe pagina 1din 11

Definirea și utilizarea funcțiilor de prelucrare a datelor în Excel

Pentru a defini și aplica funcții ce au rolul de a oferi informații despre un anumit eșantion de persoane,
să alegem un exemplu din mediul didactic:

Într-o clasă cu 27 de elevi de clasa a VII-a se dă un test la Matematică. Notele obținute sunt
reprezentate în figura 1:
2,15 5,00 7,00 7,90 8,85
2,85 5,45 7,15 8,00 9,00
3,30 5,85 7,35 8,00 9,80
3,90 6,10 7,45 8,15 10
4,15 6,40 7,85 8,30
4,80 7,85 8,45
Figura 1

Ordonarea crescătoare a notelor din Figura 1 are scopul de a încadra notele obținute în diferite
categorii, după cum se observă în Figura 2:
Note sub 5 Note între 5-6,99 Note între 7,00-8,49 Note peste 8,50
2,15 5,00 7,00 7,90 8,85
2,85 5,45 7,15 8,00 9,00
3,30 5,85 7,35 8,00 9,80
3,90 6,10 7,45 8,15 10
4,15 6,40 7,85 8,30
4,80 7,85 8,45
Figura 2

Ne interesează acest criteriu de clasificare întrucât ne dorim să obținem diferite informații de natura
statistică despre respectivul eșantion din enunț: media, abaterea media pătratică, cuartilele (de tipul 1, 2 și 3)
și câteva dintre formulele de corelare între date.
Primul pas în prelucrării datelor statistice din enunț, este întocmirea graficului ce va sta la baza
analizei tuturor funcțiilor sus-menționate. Am catalogat conform criteriilor dorite toate datele primite,
încadrând notele obținute de elevi în 4 clase: elevii cu note sub 5, elevi cu note cuprinse între 5 și 6,99, elevi
cu note cuprinse între 7 și 8,49 și elevi care au obținut peste 8,50.
Observăm că există 6 elevi în prima categorie, 5 elevi în cea de-a doua, 12 elevi în cea de-a treia și 4
elevi în ultima categorie. Pe baza acestei cuantificări a rezultatelor obținute la test, vom forma tabelul de mai
jos:

1
Note Nr elevi
<5 6
5-6,99 5
7-8,49 12
8,50-10 4

Un prim aspect pe care trebuie să îl avem în vedere este reprezentarea procentuală a acestor rezultate.
Deci, calculăm procentul pe care îl reprezintă elevii din una din cele 4 categorii din totalul elevilor, folosind
funcția: =ROUND(Bi/SUM($B2:B5),2), unde B reprezintă faptul că datele noastre se află pe coloana B a foii
Excel, iar i reprezintă un numărul liniei pe care se află datele. În cazul exemplului nostru, i este un număr
între 2 și 5, și conform imaginii de mai jos obținem:

Pentru a obține procentele de mai sus pe reprezentarea grafică, vom crea următorul tabel:

<5 5-6,99 7-8,49 8,50-10


0 6 0 0 0
22 6 0 0 0
22 0 0 0 0
22 0 5 0 0
41 0 5 0 0
41 0 0 0 0
41 0 0 12 0
85 0 0 12 0
85 0 0 0 0
85 0 0 0 4
100 0 0 0 4

începând de la 0(%) până la primul procent (22%*100), după care aplicăm funcția =SUM(C2,C3)*100
(adunăm toate datele selectate și le înmulțim cu 100), =SUM(C2,C3,C4)*100 și continuăm până ajungem la
suma tuturor procentelor care, în cazul nostru, este =SUM(C2:C5)*100, și va reprezenta maximul de 100%.
Selectăm datele transpuse în tabel. acționăm butonul ”inserare” și alegem din categoria ”Diagrame”
modul în care dorim să reprezentăm aceste date (eu am ales reprezentarea sub forma ”Arie Stivuită”):

2
Reprezentare grafica
14

12

10

<5 5-6,99 7-8,49 8,50-10

Am obținut astfel o reprezentare a datelor bazată atât pe numărul de elevi dintr-o clasă (axa Oy), cât
și pe procentul categoriei în care se află (axa Ox).
Pentru a calcula media notelor obținute de elevi, trebuie să apelăm funcția =AVERAGE. Această
funcție calculează media aritmetică a datelor selectate.
Pentru a ne asigura că datele nu vor fi distorsionate, vom apela de asemenea la blocarea elementelor
din funcția de medie, prin folosirea simbolului $ înainte de fiecare caracter al mediei, astfel:

Selectăm datele obținute, inclusiv noua coloană formată cu media, și obținem tabelul și reprezentarea
(în același mod ca și pentru reprezentarea grafică) de mai jos:

3
<5 5-6,99 7-8,49 8,50-10 AVG
0 6 0 0 0 6,75
22 6 0 0 0 6,75
22 6,75
22 0 5 0 0 6,75
41 0 5 0 0 6,75
41 6,75
41 0 0 12 0 6,75
100 0 0 12 0 6,75
100 6,75
100 0 0 0 4 6,75
100 0 0 0 4 6,75

În continuare, vom determina abaterea medie pătratică (ce reprezintă o măsură a dispersiei valorilor
acesteia în jurul uneia considerate mijlocii, calculată după formula: ), apelând la funcția
Excel: =STDEVP. În cazul exemplului prezentat, obținem abaterea de 3,11.

4
Cuartilele:
 prima quartilă (Q1) delimitează cele mai mici 25% din date.
 a doua quartilă (Q2) delimitează cele mai mici 50% din date / împarte setul în două. Este egală cu
mediana.
 a treia quartilă (Q3) delimitează cele mai mari 25% din date.

Q1
<5 5-6,99 7-8,49 8,50-10 =QUARTILE.EXC($B$2:$B$5,1)
0 6 0 0 0 4.25
22 6 0 0 0 4.25
22 4.25
22 0 5 0 0 4.25
41 0 5 0 0 4.25
41 4.25
41 0 0 12 0 4.25
100 0 0 12 0 4.25
100 4.25
100 0 0 0 4 4.25
100 0 0 0 4 4.25

5
Q2
<5 5-6,99 7-8,49 8,50-10 =QUARTILE.EXC($B$2:$B$5,2)
0 6 0 0 0 5.50
22 6 0 0 0 5.50
22 5.50
22 0 5 0 0 5.50
41 0 5 0 0 5.50
41 5.50
41 0 0 12 0 5.50
100 0 0 12 0 5.50
100 5.50
100 0 0 0 4 5.50
100 0 0 0 4 5.50

6
Q3
<5 5-6,99 7-8,49 8,50-10 =QUARTILE.EXC($B$2:$B$5,3)
0 6 0 0 0 10.50
22 6 0 0 0 10.50
22 10.50
22 0 5 0 0 10.50
41 0 5 0 0 10.50
41 10.50
41 0 0 12 0 10.50
100 0 0 12 0 10.50
100 10.50
100 0 0 0 4 10.50
100 0 0 0 4 10.50

Cuartila 3 (Q3)
14

12

10

0
0 22 22 22 41 41 41 100 100 100 100

<5 5-6,99 7-8,49 8,50-10 Q3

7
Formule de corelare

Considerând exemplul de mai sus, în care datele erau reprezentate de notele a 27 de elevi din aceeași
clasă la un test la Matematică, vom adăuga un set suplimentar de date:

Mai cunoaștem despre acești elevi următoarele:


- 10 elevi au lipsit cel puțin la o oră de Matematică în ultimele 3 săptămâni
- 4 elevi nu au lucrat temele pentru acasă la Matematică în ultimele 3 săptămâni
- 10 elevi au lucrat doar temele pentru acasă la Matematică în ultimele 3 săptămâni
- 3 elevi au lucrat minimum 1 oră pe zi în plus față de tema pentru acasă în ultimele 3 săptămâni.
Obținem, deci, un nou tabel:

Note Nr elevi Informatii noi


<5 6 10
5-6,99 5 4
7-8,49 12 10
8,50-10 4 3

Pentru a calcula legătura dintre notele de la test și studiul individual, folosim formula:
=PEARSON(set 1 date (nr elevi),set 2 date (noi info.)
Coeficientul Pearson este r = 0,7309, ceea ce semnifică faptul că putem extinde studiul efectuat pe
cei 27 de elevi afirmând faptul că prezența la cursuri și studiul individual al elevilor de clasa a VII-a
reprezintă un avantaj în obținerea notelor mari la teste.

Diagrama de calcul coeficient Pearson


14

12

10

Elevi Informatii

8
Folosind aceeași problemă de la începutul referatului, cunoaștem notele a 27 de elevi de clasa a VIIa
un test la matematică. Media clasei este 6,75.
Ne punem întrebarea: Este media tuturor celor 81 de elevi de clasa a VIIa din școala X să fie mai
mare decât 6 (media populației școlare)?
Pentru a răspunde acestei întrebări, vom folosi One-sample Test.
H0: media să fie mai mică sau egală decât 6
HA: media să fie mai mare strict decât 6
Considerăm un tabel cu două coloane: pe prima coloana (A) vom adăuga toate notele din pagina 1,
iar în coloana B vom adăuga minimum 2 zerouri (deoarece în programul Excel nu există funcție directă
pentru One-Sample Test). După introducerea datelor, apelăm butonul Date- Analize Date- t-Test: Two
Sample assuming unequal variances și introducem informațiile necesare:

Rezultatul acestui test este:

t-Test: Two-Sample Assuming Unequal Variances


Variable 1 Variable 2
Mean 6.703703704 0
Variance 4.516524217 0
Observations 27 2
Hypothesized Mean 6
df 26
t Stat 1.720558911
P(T<=t) one-tail 0.048606485
t Critical one-tail 1.70561792
P(T<=t) two-tail 0.097212971
t Critical two-tail 2.055529439

9
Avem, deci, ipoteza: 6. Vrem să aflăm dacă media populației școlare de clasa a VIIa este mai mică
sau mai mare decât 6.
Dacă 𝑡 > 1.70 (valoarea Critical One-tail), atunci putem anula ipoteza nulă.
Avem 𝑡𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐 = 1,72, deci putem anula ipoteza nulă.
Putem face încă o verificare pentru validarea rezultatului:
𝛼 = 0,05 (valoare stabilită la introducerea datelor). Dacă 𝑝 < 𝛼, atunci putem anula ipoteza nulă.
Avem p = 0,048, deci putem anula ipoteza nulă.

Eliminând ipoteza nulă (prin două metode), putem afirma că:

Avem suficiente date statistice pentru a conchide că media celor 81 de elevi de clasa a VIIa la un
test similar cu cel pe care l-au susținut cei 27 de elevi este mai mare decât 6.

10
Siteografie

1.http://webcache.googleusercontent.com/search?q=cache:f76vIqcafGkJ:www.policy.hu/badescu/p5.ppt+&cd=4&
hl=ro&ct=clnk&gl=ro

2. https://www.youtube.com/watch?v=v-ZcqrdTcIQ

11

S-ar putea să vă placă și