Documente Academic
Documente Profesional
Documente Cultură
rezumat
Curs introductiv n
STATISTIC i PROBABILITI
Capitolul 2:
Analiza descriptiva si prezentarea grafica a datelor
Textul original:
Elementary Statistics, Johnson/Kuby ITP Publishers ISBN 0534356761
B. Burt Gerstman, StatPrimer: Statistics for Public Health Practice.
www.sjsu.edu/faculty/gerstman/StatPrimer
Traducere si adaptare: dr. Camelia F. Voinea
Versiune-rezumat 1.5, 2009-2010
Grafica de prezentare bazata pe cercuri si bare:Grafica utilizata pentru rezumate date de tip atribut.
Grafica bazata pe cercuri sectionate in felii (pie diagrams) arata cantitatea de date care apartine unei
anumite categorii de date ca o „felie“ proportionala a cercului
Barele grafice arata cantitatea de date care apartin fiecarei categorii ca niste zone dreptunghiulare
verticale cu marimi proportionale
Diagrama Pareto: Un grafic cu bare care are barele aranjate de la categoria cea mai numeroasa la cea
mai putin numeroasa. Mai include si o linie grafica pentru afisarea procentelor cumulative si a
contoarelor de numarare pentru fiecare bara.
Date cantitative (quantitative data): un motiv pentru constructia raficelor pentru date cantitative este
de a aexamina distributia datelor: daca sunt dispuse compact, imprastiate, simetric, etc.
Distributie (distribution): reprezinta modelul de variabilitatea (i.c.: felul in care variaza datele) pe
care il pun in evidenta datele atribuite unei variabile. Distributia prezinta (grafic) frecventa de aparitie
a fiecarei valori luate de acea variabila.
Afisare prin puncte (dotplot display): afiseaza adtele dintr-un esantion reprezentand fiecare element
de date cu ajutorul unui punct grafic pozitionat de-a lungul unei scale. Aceasta scala poate fi verticala
sau orizonatala. Frecventa valorilor este reprezentata de-a lungul scalei.
Pagina 1
Introducere in STATISTICA si PROBABILITATI
rezumat
Localizare
Locatia unei distributii este de obicei descrisa in termenii centrului sau. Cea mai comuna masura a
centrului locatiei este media. Alte masuri sunt mediana si modul.
Media, mediana si modul sunt aceleasi cand distributia este simetrica si unimodala.
Dispersia (Spread)
Dispersia unei distributii inseamna variabilitatea valorilor (cat de multe valori sunt dispersate in
populatie). Masurile obisnuite ale dispersiei includ: variana, abaterea (deviaia) standard si
domeniul intercuartil (inter-quartile range). Curbele din Figura 7 reprezinta doua distributii cu
aceeasi locatie centrala, dar cu dispersii diferite.
Distributii de frecventa
Pagina 2
Introducere in STATISTICA si PROBABILITATI
rezumat
Distributiile de frecvente si histogramele sunt utilizate pentru rezumarea unor seturi largi de date.
Distributie de frecvente: o lista care imperecheaza (adesea sub forma grafica) fiecare valoare cu
frecventa sa. Grupate si negrupate.
Distributie de frecvente negrupata: fiecare clasa contine o singura valoare din distributie.
Distributie de frecvente grupata: valorile sunt grupate intr-un set de clase.
Histograma: un grafic cu bare care reprezinta distributia de frecvente a unei variabile cantitative.
Histograma este compusa din urmatoarele componente:
1. Un titlu care identifica populatia de interes
2. O scara verticala care identifica frecventele din diferitele clase
3. O scara orizontala care identifica variabila x. Valorile pentru limitele claselor sau marcajele de
clase pot fi etichetate pe axa-x.
Termeni cel mai frecvent utilizati pentru a descrie histogramele:
Simetrica: ambele parti ale distributiei sunt identice. Exista o linie de simetrie.
Uniforma (rectangulara): Fiecare valoare apare cu o frecventa egala.
Alungita (Skewed): una dintre cozi este mai alungita decat cealalta.
Normala: o distributie simetrica este „inghesuita“ in zona mediei si incepe sa se „rareasca“ spre
margini.
Pagina 3