Sunteți pe pagina 1din 13

10/28/2010

Informatic Medical i Biostatistic Informatic Conf. dr. Lucian V. Boiculese

1-Tabele Pivot Acestea reprezint un rezumat al datelor de tip tabelar tabelar. . Se creeaz astfel un nou tabel (pivot) n care informaia dintrdintr-o celul este condiionat de criteriile prezentate n primul rnd respectiv n prima coloan a tabelului pivot. pivot. Se pot determina astfel caracteristicile descriptive coninnd numrul de cazuri, medii, dispersii, valori minime, maxime, etc. etc. pentru grupele definite pe rnduri i coloane coloane. . Presupunem c avem setul de date: date
JUD IS IS IS IS IS IS SV SV SV SV VS VS VS MEDIU U U U U R R U U R R U R R CAZURI 4 5 2 7 6 6 6 8 4 4 3 2 4

Suntem interesai n a determina cte persoane din fiecare jude provin din mediul urban sau rural. rural. Putem evident folosi comanda countif() sau mai bine countifs() deoarece avem mai multe condiii. ii. Putem s ne folosim i de ordonarea datelor pentru a avea o imagine clar asupra contorizrilor ce le avem de calculat. calculat . Dar cte calcule avem de fcut ? Avem 3 judee i 2 medii de reziden deci n total 6 contorizri (fr totalizri rnd,col rnd,col. .). Puine ....multe ....multe ?! Dar dac am avea 15 categorii pe o ax respectiv 10 pe cealalt !

10/28/2010

Pentru Excel 2007: 2007: 1. Se selecteaz datele 2. Insert + Pivot Table i se definesc variabilele de interes. interes. Trebuie definite 3 variabile ce prezint criteriilul de grupare pe linii, apoi pe coloane i evident pentru celulele din interiorul tabelului ce funcie se aplic. 2 -Insert 3 Pivot table 1 Selectarea datelor

4 Definirea elementelor de creare

Obinerea tebelului pivot prin rezumarea datelor dup criteriile dorite. Tabel final obinut. Valorile calculate dorite.

Selectarea celor 3 variabile de interes !!!

10/28/2010

Product of CAZURI Column Labels Row Labels R U Grand Total IS 36 280 10080 SV 16 48 768 VS 8 3 24 Grand Total 4608 40320 185794560

Produsul valorilor n IS sunt n mediul R 2 cazuri. Produsul lor este 6*6=36 Suma cazurilor n IS sunt n mediul R 2 cazuri. Suma lor este 6+6=12 Media cazurilor n IS sunt n mediul R 2 cazuri. Suma lor este (6+6)/2=6

Sum of CAZURI Column Labels Row Labels R U Grand Total IS 12 18 30 SV 8 14 22 VS 6 3 9 Grand Total 26 35 61

Average of CAZURI Column Labels Row Labels R U Grand Total IS 6 4.5 5 SV 4 7 5.5 VS 3 3 3 Grand Total 4.333333333 5 4.692307692

StdDev of CAZURI Column Labels Row Labels R U Grand Total IS 0 2.081665999 1.788854382 SV 0 1.414213562 1.914854216 VS 1.414213562 #DIV/0! 1 Grand Total 1.505545305 2.160246899 1.84321347

Deviaia standard Cazurile fiind egale dev. std. este 0

2 - Filtre Se folosesc pentru a impune condiii asupra coloanelor de interes. interes. Dac de exemplu dorim s afim din coloana Jude doar pe cei din NT atunci prin filtru vom impune selectarea acestora. acestora. Excel 2007 : 1 Selectarea datelor 2 DATA + FILTER Crearea filtrelor Activarea filtrului pe jude=SV

Noul tabel creat prin filtrare poate fi copiat i folosit n alte aplicaii.

10/28/2010

3 Totaliz Totalizri Datele se pot grupa dup crit criteriile dorite i se pot calcula anumite valori valori. . Este asemntor tabelelor pivotante av avnd nd doar un singur criteriu criteriu. . Excel 2007 2007: : 1 selecia datelor 2 DATA + SUBTOTAL

4 Exemple (EXEMPLE FINALE. FINALE.xls) S se transfeorme coloana TA din forma text n dou coloane numerice reprezentnd TAS respectiv TAD

10/28/2010

Calculul indicatorilor statistici descriptivi descriptivi. .

METODA: METODA: DATA + DATA ANALYSIS + DESCRIPTIVE STATISTICS

CREAREA HISTOGRAMEI

Vom folosi countifs() deoarece avem mai mult de o conditie pentru calculul valorilor valorilor. . Numr de pacieni pe grupele de vrst

Grupele de vrst Grupele de vrst

10/28/2010

PIVOT TABLE NUMRUL DE CAZURI DUP AFECIUNE SPECIAL - DZ NE INTERESEAZ N

REGRESIE LINIAR

Panta este pozitiv (coef. lui x este >0) => dependen de tip direct proporional

Coeficientul de determinare R2 arat n procente ct % din variaia IMCului depinde de variaia vrstei. n cazul studiat avem 5.22%.

10/28/2010

Ms Excel EXEMPLE II
1. Importul une baze de date de tip DBF. 2. Calculul mediei, medianei, min, max, deviaiei standard pentru coloana nota Bacalaureat. 3. Conversia notei de la Bacalaureat in calificative : 9-10 A; 7-8 B; 6 C; 5 D; <5 E. Atenie: dac nota este de tip continuu se va face trecerea la 0,50 deci : >= 8,50 A; [6,50-8,50) B; [5,50-6,50) C; [4,50-5,50) D; <4,50 E. 4. Calculul valorilor de A, B, C, D i E (countif(), Histogram, Subtotals). 5. Reprezentarea grafic a frecvenelor absolute Histograma. 6. Regresie Corelaie, se va verifica existena relaiei ntre media BAC i media celor 4 ani de liceu. Grafic i interpretare. 7. S se aleag in forma aleatoare un lot format din 30 de concureni din totalul candidailor. Se va folosi funcia RAND() RAND(). . 8. S se calculeze media , mediana , dispersia, min, max pentru acest lot i s se compare cu valorile ntregului set de date. 9. Utilizarea Pivot Table pentru determinarea nr. de cazuri pe judetdomiciliu.

1 Importul une baze de date de tip DBF Office Button + open. Daca nu se gaseste formatul sau exista incompatibiliteta se exporta baza DBF din Fox intr-un alt format !!!

10/28/2010

2 Calculul mediei, medianei, min, max, deviatiei standard a coloanei nota Bacalaureat.

3 Conversia notei de la Bacalaureat in calificative : 9-10 A; 7-8 B; 6 C; 5 D; <5 E. Atentie daca nota este de tip continuu se va face trecerea la 0,50 deci : >= 8,50 A; [6,50-8,50) B; [5,50-6,50) C; [4,50-5,50) D; <4,50 E.

10/28/2010

4 Calculul valorilor de A, B, C, D si E (countif(), Histogram, Subtotals). Histograma se poate aplica numai pe valori numerice.

4 Calculul valorilor de A, B, C, D i E - Histogram

10/28/2010

4 Calculul valorilor de A, B, C, D i E - Subtotals

Pasul 1

Rezultat final

Pasul 2

5 Reprezentarea grafic a frecvenelor absolute Histograma.

10

10/28/2010

6 Regresie Corelaie, se va verifica existenta unei relaii ntre media BAC i media celor 4 ani de liceu. Grafic i interpretare.

Pentru creterea variabilei MED_BAC cu 1 punct , variabila MED_LIC va crete n medie cu 0.72 puncte.

7 - Sa se aleaga in form aleatoare un lot format din 30 de concureni din totalul candidailor. Se va folosi funcia RAND().

Pasul 1 Generm aleator numere Pasul 2 Ordonm dup coloana aleatoare

11

10/28/2010

8 Sa se calculeze media , mediana , dispersia, min, max pentru acest lot si sa se compare cu valorile intregului set de date.

9 S se aplice Pivot Table pentru determinarea nr. de cazuri pe jude domiciliu i sex.

12

10/28/2010

Pivot Table Excel 2003 DATA + PIVOT TABLE AND PIVOT CHART REPORT

13