Sunteți pe pagina 1din 11

Programul Operațional Capital Uman (POCU) 2014-2020

Obiectiv Tematic 9. Promovarea incluziunii sociale, combaterea sărăciei și a oricărei forme de discriminare
Axa Prioritară 6. Educaţie şi competenţe
Prioritatea de investiții: 10.ii. ”Îmbunătățirea calității și eficienței și accesul la învățământul terțiar și a celui echivalent în vederea
creșterii participării și a nivelului de educație, în special pentru grupurile defavorizate”
Obiective specifice: (O.S.) 6.7, 6.9, 6.10.
Numărul de identificare al Contractului: POCU/379/6/21/124388
Titlul proiectului: “MĂSURI ACTIVE PENTRU CREȘTEREA PARTICIPĂRII LA ÎNVĂȚĂMÂNTUL TERȚIAR
ANTREPRENORIAL A STUDENȚILOR DIN MEDII DEFAVORIZATE Antre_S”
Beneficiar: Universitatea de Științe Agricole și Medicină Veterinară ”Ion Ionescu de la Brad” Iași
Parteneri: P1 - Universitatea de Ştiinţe Agricole şi Medicină Veterinară a Banatului „Regele Mihai I al României” din
Timişoara; P2 – Universitatea „Dunărea de Jos” Galaţi

Activitatea tematică 1 ”Competențele TIC – atuurile tale în vederea creșterii


angajabilității” (S.A. 2.6.) - Concepte de baza în Tehnologia Informației şi a
Comunicaţiilor (TIC): Comparații medii în Excel – algebric și statistic”, desfășurată în
cadrul acțiunilor de inovare socială destinate grupului țintă de studenți din cadrul
proiectului “MĂSURI ACTIVE PENTRU CREȘTEREA PARTICIPĂRII LA ÎNVĂȚĂMÂNTUL
TERȚIAR ANTREPRENORIAL A STUDENȚILOR DIN MEDII DEFAVORIZATE Antre_S”

August 2020

Comparația algebrică și statistică a mediilor performanțelor productive


din fermă/unitate de procesare a alimentelor/companie

Așa cum începeam în luna iulie, vă reamintesc că în activitatea voastră de viitori manageri de
fermă, antreprenori sau angajați, veți întâlni la un moment dat nevoia de a efectua o apreciere
individuală și de ansamblu a unor parametri productivi ce pot fi măsurați (caractere cantitative) și
care pot fi sau necesită a fi îmbunătățiți prin modificarea unor anumiți factori productivi în tehnologia
de creștere sau de cultivare a speciei cu care lucrați în fermă.
Atunci dădeam exemplul unei microferme familiale cu 30 capete vaci, din care:
 10 vaci de lapte rasa Bălțată cu Negru Românească (la bază fiind genetica Holstein-Friză)
 10 vaci de lapte rasa Bălțată Românească (la bază fiind genetica Fleckvieh - Siemental)
 10 vaci de lapte metise, achiziționate în timp de la crescători din zonă, care nu au origine
genetică de calitate sau cunoscută.
Am învățat împreună cum să introducem în șiruri de valori performanțele individuale din
fiecare grup și cum să obținem principalii descriptori statistici în Excel, din care cel mai mult ne
interesează Media, Eroarea standard a mediei și Coeficientul de variație.
Având valorile medii, ne interesează să comparăm cele obținute de fiecare grup în parte,
exprimând diferențele în valori absolute și procentuale (relative) (cu cât % este mai mare producția
de lapte în BNR față de BR și VM sau invers) și apoi ne interesează să vedem dacă aceste diferențe

Page 1 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
chiar sunt relevante sau semnificative.
De exemplu, dacă între producția vacilor BNR și a celor BR vom identifica diferențe relevante,
poate am dori să schimbăm în timp tot efectivul de vaci de lapte și să îl migrăm spre BNR. Cu alte
cuvinte, prin modulul de calcul statistic denumit ANOVA sau analiză a varianței, putem identifica,
pornind de la datele individuale din fiecare lot și de la mediile obținute, un procent de probabilitate
ca diferențele dintre mediile loturilor să aibă de fiecare dată cel puțin aceleași diferențe când vacile
sunt crescute în același mediu, cu aceleași condiții tehnologice oferite în ferma mea.
Sau, un alte exemplu, propus în ocazia precedentă, dar neparcurs încă… Dacă la un moment
dat mă decid să îmbunătățesc alimentația vacilor de lapte, spre exemplu, să înlocuiesc în rație fânul
de deal (fâneață predominant alcătuită din graminee perene și mai puține leguminoase) cu un fân
de leguminoase, aș dori să văd:
1. Dacă producția de lapte se va modifica, în ce direcție (±)și cu ce %?
2. Dacă diferențele între rația inițială și cea modificată experimental sunt într-adevăr
relevante și dacă există probabilitatea ca de fiecare dată când voi înlocui fânul de deal cu
fân de lucernă să obțin aceeași modificare în % a producției de lapte sau este doar o
modificare pasageră, întâmplătoare?
Programul Excel mă ajută pentru ambele situații și mă scutește de ore întregi de calcul manual
al acestor probabilități.

Bun, la modul concret, să plecăm de unde rămăsesem luna trecută:

Observăm următoarele performanțe, în funcție de rasă:


 BNR are 42,2±0,71 litri lapte/zi, cu un coeficient de variație de 5,33% (omogenitate
bună)
 BR are 35,5±0,65 litri lapte/zi, cu un coeficient de variație de 5,83% (omogenitate
bună)
 VM are 22,5±2,58 litri lapte/zi, cu un coeficient de variație imens, de 36,24%
(omogenitate absentă, heterogenitate accentuată
În continuare vom trece la comparațiile algebrice între loturi. Considerăm BNR ca lot de
Page 2 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
referință (lot de control), acesta având performanța cea mai bună.
Vom trece lângă tabelul cu date brute un tabel de comparații, după cum urmează și vom
prelua mediile realizate inserând comanda ”=”, urmată de celula de unde vrem să culegem
valoarea, în acest caz, de exemplu, pentru BNR vom introduce în celula G2 comanda =B12.

Procedăm la fel și pentru BR, VM, indicând culegerea valorii din C12, D12.
Lucrând astfel, chiar dacă vom modifica valorile individuale din intervalele B2:B11, C2:C11, D2:D11,
se vor transpune în tabelul de comparații noile valori calculate automat.
Apoi, vom afla valorile absolute ale diferențelor (abaterile în litri, în minus, între BR și BNR,
între VM și BNR). De exemplu, la diferențe absolute BR față de BNR, în celula H3, vom introduce
formula =H2-G2. Procedăm asemănător și pentru VM.

În următoarea etapă, vom afla diferențele procentuale dintre cele BR și VM față de BNR,
considerând deci BNR 100%. În celula H4 programăm ”=H3*100/G2”, cu alte cuvinte, cât % din
G2 (valoarea lui BNR) o constituie abaterea negativă de 6,7 litri de la BR? Vom obține -15,9%,
adică vacile BR produc cu 15,9% lapte mai puțin decât vacile BNR.

Page 3 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
Procedăm la fel și pentru VM și obținem o abatere mult mai mare, de -46,7%, valoare
dictată de formula din spatele numărului rezultat, dar pe care o găsim în bara de formule:

Cum vi se par diferențele? Putem spune și invers, că vacile BNR au o producție cu circa 16%
mai mare față de cele BR și cu circa 47% mai mare față de cele metise. Deci, deja ne putem gândi
să renunțăm cu timpul la cele metise (cel puțin) și să populăm cu vaci BNR sau să reținem în efectivul
matcă vițele BNR de la cele mai performante vaci de lapte care vor ajunge la maturitate reproductivă
și vor avea performanțe comparative cu mamele lor, pe care le testăm acum.
În aparență, lucrurile sunt simple, dar, de fapt, trebuie să testăm și statistic aceste
diferențe, pentru a afla cât de semnificative sunt aceste diferențe și dacă există
probabilitatea ca de fiecare dată să obținem aceleași diferențe procentuale între
grupurile comparate.
Pentru aceasta vom folosi tot din Excel funcțiile și testele incluse în pachetul Data analysis.
În mod curent, Data analysis este o extensie (Add-in) pe care o activează la cerere doar anumiți
utilizatori (mai chisați  , pardon… mai pasionați  ), deci e foarte probabil ca să nu fie disponibilă
în orice Excel. Iată cum verificați dacă este disponibilă: mergeți pe fila de Meniu (panelul) Data și în
dreapta panelului ar trebui să vă apară Data analysis, ca în imaginea de mai jos. Dacă nu apare,
trebuie activată.

Cum activăm?

Page 4 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
Intrăm în meniul File (stânga sus), coborâm și apăsăm Options.
Din Options coborâm și apăsăm Add-Ins,
Apoi coborâm la Manage: Excel Add-ins și GO
Se deschide un alt meniu, în care alegem Analysis ToolPak și Analysis ToolPak – VBA + OK

Acum ar trebui să se instaleze și să vă apară în panelul Data pachetul Data Analysis, pe care
apăsăm pentru a continua.
Alegem din listă ANOVA – single factor și OK (analiza varianței unifactorială – un singur factor
experimental ne afectează nouă producția de lapte, respectiv rasa animalelor în acest caz).
Va apare un meniu de unde alegem parametrii de reglaj ai testului:

Page 5 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
Parametrii sunt:
Input range – zona din care testul ANOVA culege datele de comparat, vom alege aici cu
mouse-ul, de pe butonul cu pătrățele și săgețică, apoi selectare în tabelul Excel coloanele B și C,
doar capul de tabel și datele individuale (fără medie și ceilalți parametri statistici deja calculați mai
jos).

Grouped By: Columns sau Rows (bifăm columns penttru că datel noastre brute sunt în
coloane)
Labels in first row: bifăm, deoarece am selectat și capul tabelului, respectiv etichetele
(labels) celor două coloane cu date individuale (BNR și BR)
Alpha: pragul de semnificație statistică. Din oficiu, este de 0,05 dar dacă testul dă depășire
pentru acest prag se repetă testul cu Alpha 0,01 și apoi, dacă din nou se depășește, cu Alpha 0,001.
Valorile Alpha se introduc manual (0,01 sau 0,001). Vom vedea mai târziu la rezultate cum
funcționează testarea succesivă.
Output options: Excel ne dă posibilitatea să alegem dacă rezultatul să apară în:
 Output Range: în aceeași filă cu datele (cum am ales eu, dar începând cu o celula goală,
de ex. A21 aici) – Mare atenție, când alegeți Output Range, să fiți sigur că aveți spațiu gol
și în dreapta și în jos față de celula de pornire. Excel va scrie rezultatele pornind de acolo
spre dreapta și în jos, suprascriind orice alte date, rezultate etc. ce ar putea fi acolo. !!!NU
FUNCȚIONEAZĂ UNDO, odată suprascrise acele celule cu rezultatele de la
ANOVA!!!! Puteți pierde date prețioase din neatenție)
 New workseet ply – în altă filă, în același fișier
 New workbook – în alt fișier Excel
După ce am făcut aceste setări, apăsăm OK.

Excel ne dă rezultatul testului începând cu celula A21 în jos și la dreapta:

Page 6 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
Testul calculează și o serie de descriptori statistici, cum ar fi numărul de probe pe grup,
(Count, n), Suma valorilor individuale (Sum), Media (average) și Varianța (Variance), după care
afișează rezultatele testului, din care ne interesează:
 df (degrees of freedom, gradele de libertate), în acest caz se notează cu df=1;18
 valoarea F, denumit și F calculat sau Fisher, notat și 𝐹̂ = 48,03 în acest calcul
 Valoarea F crit (F critic, F tabelar, pentru Alpha testat, în acest caz pentru Alpha 0,05,
cu care am început testul, adică un prag de probabilitate de 95%) = 4,41 în acest
exemplu
 Valoarea lui P (P-value), care este, în acest exemplu, de 1,77334E-06, ceea ce se
scrie de fapt ca 1,77334 x 10-6 și s-ar traduce ca 0,00000177334.

Cum se interpretează testul?


A) În funcție de valoarea lui F calculat, în comparație cu valorile F tabelar
B) În funcție de valoarea lui P, în comparație cu 0,05; 0,01 sau 0,001

A) Să luăm primul mod de interpretare (în funcție de valoarea lui F calculat).


A.1. Se urmărește dacă valoarea lui F calculat o depășește pe cea a lui F crit pentru alpha
0,05. În exemplul nostru, F=48,03 > F de alpha 0.05 = 4.41. Putem spune că, deocamdată,
în acord cu acest rezultat diferențele dintre mediile BNR și BR (diferența de 6,7 litri lapte
sau cea de 15,9%) sunt semnificative statistic, deci există cel puțin 95% probabilitatea
ca de fiecare dată când vacile BNR sunt comparate cu cele BR, crescute în aceleași condiții
pe care le-am asigurat eu în ferma mea, să obțină o producție de lapte cu 15,9% mai mare.
Se continuă testarea pentru pragul alpha = 0,01, reluăm testul cu Data Anlysis,
ANOVA Single Factor, intervalul de date rămâne același, scriem manual 0,01 în loc de 0,05
la alpha și se alege o altă celulă pentru rezultatele ANOVA (A37 în exemplul nostru).

Page 7 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
Rezultatele sunt acestea:

A.2. Se urmărește dacă valoarea lui F calculat o depășește pe cea a lui F crit pentru alpha
0,01. În exemplul nostru, F=48,03 > F de alpha 0.01 = 8.28. Putem spune că, deocamdată,
în acord cu acest rezultat diferențele dintre mediile BNR și BR (diferența de 6,7 litri lapte
sau cea de 15,9%) sunt distinct semnificative statistic, deci există cel puțin 99%
probabilitatea ca de fiecare dată când vacile BNR sunt comparate cu cele BR, crescute în
aceleași condiții pe care le-am asigurat eu în ferma mea, să obțină o producție de lapte cu
15,9% mai mare.
Se continuă testarea pentru pragul alpha = 0,001, reluăm testul cu Data Anlysis,
ANOVA Single Factor, intervalul de date rămâne același, scriem manual 0,001 în loc de 0,01
la alpha și se alege o altă celulă pentru rezultatele ANOVA (A53 în exemplul nostru).

Page 8 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
A.3. Se urmărește dacă valoarea lui F calculat o depășește pe cea a lui F crit pentru alpha
0,001. În exemplul nostru, F=48,03 > F de alpha 0.001 = 15.37. Putem spune că, în cele
din urmă, în acord cu acest rezultat diferențele dintre mediile BNR și BR (diferența de 6,7
litri lapte sau cea de 15,9%) sunt foarte semnificative statistic, deci există cel puțin
99,9% probabilitatea ca de fiecare dată când vacile BNR sunt comparate cu cele BR,
crescute în aceleași condiții pe care le-am asigurat eu în ferma mea, să obțină o producție
de lapte cu 15,9% mai mare.
Testarea se oprește aici. Datele sunt concludente și ne determină să înclinăm
spre schimbarea rasei BR cu BNR pentru că avem o probabilitate de 99,9% să
obținem pe viitor, dacă vom folosi vaci BNR, o producție de lapte cu 15,9% mai
mare.
Dacă ne uităm la diferența dintre medile VM și BNR, de 46.7%, e mult mai clar că vom depăsi
pragul de alpha 0,001, de unde probabilitatea de 99% ca înlocuind vacile metise cu vaci BNR
să obținem o producție de lapte cu circa 47% mai mare decât a acestora.
De regulă, dacă utilizăm un lot de control (cum ar fi BNR) și obținem diferențe foarte
semnificative pentru un lot care are o diferență mai mică (15,9% în cazul BR), atunci când ar
trebui să comparăm pentru diferența dintre control (BNR) și un lot cu diferență mult mai
mare, sau, în orice caz, peste cea a primului lot comparat (-46,7% VM față de -15,9% BR) ,
este clar că același prag de semnificație pentru alpha 0,001 va fi depășit. Totuși, trebuie
efectuate teste și pentru acele comparații.
Pe scurt:
 dacă F crit alpha 0,05 > F calculat = dif. nesemnificative (notate cu ns) (probabilitate <
95% ca aceeași situație să se repete în condiții identice). De regulă, în această situație se
consideră că există și alți factori care interferează cu factorul experimental (rasa, în cazul
exemplului nostru) și că rezultatele nu sunt destule de consistente, concludente, relevante
pentru a induce o schimbare sau o decizie de schimbare.
 dacă F crit alpha 0,01 > F calculat > F crit. alpha 0.05 = dif. semnificative (notate cu s
sau cu *) (probabilitate > 95% ca aceeași situație să se repete în condiții identice)
 dacă F crit alpha 0,001 > F calculat > F crit alpha 0.01 = dif. distinct semnificative
(notate cu ds sau cu **) (probabilitate > 99% ca aceeași situație să se repete în condiții
identice)
 dacă F calculat > F crit alpha 0,001 = dif. foarte semnificative (notate cu fs sau cu ***)
(probabilitate > 99,9% ca aceeași situație să se repete în condiții identice)

B) Să luăm al doilea mod de interpretare (în funcție de valoarea lui P).


Este un mod de interpretare mult mai rapid, chiar de la primul prag testat și se

Page 9 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
folosește din ce în ce mai mult în ultimii 10-15 ani în literatura de specialitate.
Se urmărește dacă valoarea lui P din test este mai mică decât valorile prag de 0,05; 0,01
sau 0,001.
În exemplul nostru, P=1,77 x 10-6 , valoare mai mică decât ultimul prag alpha, de 0,001.
Observăm că, spre deosebire de valoarea lui F, valoarea lui P rămâne neschimbată,
indiferent de pragul de testare, alpha 0,05 sau 0,01 sau 0,001.

Testarea se oprește aici. Datele sunt concludente și ne determină să înclinăm


spre schimbarea rasei BR cu BNR pentru că avem o probabilitate de 99,9% să
obținem pe viitor, dacă vom folosi vaci BNR, o producție de lapte cu 15,9% mai
mare.
Pe scurt:
 dacă P calculat > 0,05 = dif. nesemnificative (notate cu ns) (probabilitate < 95% ca

Page 10 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020
aceeași situație să se repete în condiții identice).
 dacă 0,01 < P calculat < 0.05 = dif. semnificative (notate cu s sau cu *) (probabilitate
> 95% ca aceeași situație să se repete în condiții identice)
 dacă 0,001 < P calculat < 0.01 = dif. distinct semnificative (notate cu ds sau cu **)
(probabilitate > 99% ca aceeași situație să se repete în condiții identice)
 dacă P calculat < 0,001 = dif. foarte semnificative (notate cu fs sau cu ***) (probabilitate
> 99,9% ca aceeași situație să se repete în condiții identice)

Bineînțeles, acesta este doar un model didactic, de a învăța cum să folosim instrumentul Data
Analysis din Excel pentru o comparație foarte simplă, în regim 1:1 (câte 2 loturi, pe rând). În
realitatea, analiza statistică este mult mai complexă, există o multitudine de alte teste de comparare
a mediilor sau a șirurilor de date, adevărata artă constând în capacitatea de alegere a celui mai
potrivit test pentru datele de analizat.
De asemenea, e foarte important și numărul de subiecți (sau de probe) de la care se
recoltează datele. Cele 10 vaci din fiecare lot sunt infime ca număr pentru a avea reprezentativitate
de comparație pentru întreaga rasă, bineînțeles, dar ca model de exercițiu sunt suficiente, pentru a
înțelege cum lucrează softul și testul statistic.
Ca regulă generală, cu cât mai multe surse de date la un șir, cu atât mai mult crește
consistența datelor și gradul de încredere, pentru că, de exemplu, mult mai mulți indivizi sunt mai
reprezentativi pentru o populație extinsă. De exemplu, dacă am lua media celor 10 vaci din fiecare
rasă din exemplul nostru și o medie obținută de la câte 2000 vaci din regiunea de nord-est a țării,
din fiecare rasă, care din ele ar fi mai reprezentativă???
Posibil ca cea de la cele 2000 vaci, deși… cele 2000 vaci cresc în ferme diferite, cu condiții cu
totul deosebite de cazare, hrănire, climat zonal etc… dar asta e cu totul altă poveste… deja am intra
în analiză multifactorială și asta veți studia la masterat.

Pe Moodle aveți, de asemenea, Excelul cu 2 file – Exemplul discutat aici și foaia de exercițiu,
pe care vă rog să o umpleți cu valorile individuale lucrate în luna iulie și apoi să rulați comparațiile
algebrice (absolute și procentuale), dar și comparațiile statistice ANOVA Single Factor.
Pe viitor vom încerca și un exercițiu de analiză a varianței prin introducerea unui
factor experimental (de exemplu, modificarea rației de hrană), pentru a testa, de
exemplu, modul de reacție al fiecărei rase/populații din exemplul nostru la acest
element de noutate.

SPOR LA JOACĂ!

Page 11 of 11

Proiect cofinanţat din Fondul Social European prin Programul Operaţional Capital Uman 2014-2020

S-ar putea să vă placă și