Sunteți pe pagina 1din 6

Intrebri teoretice

1) Ce este un eantion? Un subset reprezentativ al populatiei. Entitatile din esantion tre sa fie aleatoare. 2) Ce sunt datele cantitative? Date cu valori numerice. 3) Ce sunt datele calitative (categoriale)? Date ale caror valori nu-s numerice. 4) Ce sunt datele ordinale? Datele ale caror trasaturi se evalueaza pe scale ordinale-indivizii se distribuie in clase desemnate prin nume sau numere ce indica ordinea claselor: ex:cat de bn vb engl?-> deloc putin satisfacator fluent. 5) Ce este frecvena absolut? Care sunt funciile Excel folosite pentru a calcula frecvena absolut. Nr de aparitii a unei valori intr-un set de date. COUNTIF sau FREQUENCY. 6) Ce este frecvena relativ? Raportul dintre frecventa absoluta si nr de date luate in calcul. Poate fi si sub forma de %. 7) Ce este o histogram? Grafic sub for a de bare sau coloane folosit pt a reprezenta frecventele. Fiecare coloana e proportionala cu fr a valorii pe care o reprezinta. 8) Ce sunt quartilele unei repartiii? Care sunt funciile Excel 2010 folosite pentru a determina quartilele? 3 valori care impart un set de date in 4 subgrupe de cate 25% din date. QUARTILE 9) Care sunt tipurile de parametri statistici? De centralitate, de imprastiere(dispersie), de normalitate. 10) Enumerai parametrii statistici care msoar tendina de centralitate. Valoarea centrala, media aritmetica, mediana, valoarea modala(modulul), media geometrica, media armonica, media trunchiata, media interquartilica. 11) Ce este valoarea central? (max+min)/2 12) Ce este media interquartilic? Care este funcia Excel folosit pentru a determina media interquartilic?

Media calculata pe baza a 50% din date, elminand primele 25% si ultimele 25% din valori. Adica media valorilor de la Q1 la Q3. TRIMMEAN(d, 0.5) 13) Ce este valoarea modal? Care sunt funciile Excel 2010 folosite pentru a determina valoarile modale? Valoarea care apare cel mai frecvent ntr-un set de valori, adica valoarea cea mai probabila. MODE 14) Ce este o repartiie unimodal? Care are o singura valoare modala cu frecventa cea mai mare. MODE.SNGL() 15) Ce este o repartiie multimodal? Care are 2 sau mai multe valori modale cu frecventa cea mai mare. MOD.MULT() fct matriceala. 16) Ce este mediana? Care este funcia Excel folosit pentru a determina mediana? Valoarea de la mijloc. MEDIAN() 17) Enumerai parametrii statistici care msoar tendina de dispersie (mprtiere). Amplitudinea variatiei(mx-min), intervalul interrquartilic(IQR=Q3-Q1),dispersia,abaterea standard, coef de variatie. 18) Care sunt funciile Excel 2010 pentru calculul dispersiei? VAR.S VAR.P sau VAR 19) Care sunt funciile Excel 2010 pentru calculul abaterii standard? STDEV() STDEV.S() STDEV.P() 20) Care este relatia dintre dispersie si abaterea standard? DISPERSIA=(ABATEREA)2 21) Ce este coeficientul de variaie? Interpretai mprtierea datelor n funcie de valoarea coeficientului de variaie. Cv = abatere/medie daca Cv<=0.1 date omogene,dispersie mica, daca 0.1<=Cv<=0.2 dispersie medie, daca Cv>=0.2 date neomogene, dispersie mare. 22) Ce este amplitudinea variaiei? A=max-min 23) Ce este intervalul intercuartilic? Intervalul de la Q1 la Q3 cu dimensiunea IQR=Q3-Q1 24) Ce este proporia variaiei? Complementul valorii modale, adica tot ce nu-i valoare modala, e proportia variatiei. 25) Ce este coeficientul de asimetrie? Care este funcia Excel folosit pentru a determina coeficientul de asimetrie? Skewness SKEW().

26) Ce este coeficientul de exces (sau aplatizare)? Care este funcia Excel folosit pentru a determina coeficientul de exces? Kurtosis KURT(). 27) Definii entropia unei variabile calitative. Determina gradul de incertitudine purtata de datele unei variabile aleatoare calitative de studiu, si cantitatea de informatie continuta in aceasta variabila aleatoare. 28) Care sunt parametrii de centralitate pentru date cantitative? Valoarea centrala, media aritmetica, mediana, valoarea modala(modulul), media geometrica, media armonica, media trunchiata, media interquartilica.

29) Care sunt parametrii de variaie pentru date cantitative? ?! 30) Care sunt parametrii de variaie pentru date calitative nominale?
Nu exista ordine. Entropia si proportia variatiei?!

31) Care sunt parametrii de variaie pentru date calitative ordinale?


Exista ordine. Min si max?!

32) Care sunt datele calitative pentru care exist quartile? Cele ordinale pt ca daca exista ordine se pot calcula quartilele. 33) Care sunt parametrii de centralitate pentru date calitative nominale? Doar valoarea modala. 34) Care sunt parametrii de centralitate pentru date calitative ordinale? Valoarea modala si mediana. 35) Care sunt parametrii care determin o repartiie normal? media si abaterea standard.

36) Care sunt parametrii care determin o repartiie binomial? D=domeniu, N=nr de incercari, P=probabilitatea (repartitia Bernoulli: esec sau succes, ex: moneda) 37) Care sunt proprietaile repartiiei normale? Este simetrica, este unimodala, are domeniul de la infinit la + infinit, aria de sub curba=1(evenimentul sigur) 38) Cum realizai i cum interpretai o diagram Q-Q plot? Se reprez quartilele pe care le avem in fct de quartilele normale pe grafic. Cu cat punctele diagramei sunt mai apropiate de prima bisectoare, cu atat distributia este mai apropiata de distributia normala.

39) Care sunt testele statistice pe care le cunoatei? Testul t(Student), testul z, testul ANOVA. 40) Care sunt indicatorii folosii pentru a verifica normalitatea datelor? SKEWNESS si KURTOSIS. 41) Cum aplicai testul 2 pentru a verifica normalitatea datelor? Care sunt funciile Excel 2010 pentru aplicarea testului 2? Se calculeaza Fr si fct binomiala(BINOM.DIST) si apoi =CHITEST(coloana cu Fr,coloana cu fct. bin.) sau cu fct pt excel 2010 =CHISQ.TEST() de la chi square (x2) 42) Cum interpretai rezultatul testului 2 pentru verificarea normalitii datelor? Daca rezultatul testului e mai aproape de zero => repartitia nu-i normala si daca rezultatul testului e mai aproape de 1 => datele-s normal distribuite. 43) Care sunt cele dou ipoteze statistice? H0=ipoteza nula si H1=ipoteza alternativa. 44) Definii erorile statistice de tipul I. Acceptarea H1 desi ea e falsa (respingerea H0 desi e adevarata). 45) Definii erorile statistice de tipul II. Acceptarea H0 desi ea e falsa(mai grav). 46) Cte tipuri de teste t (Student) cunoatei? Doua categorii: 1.testul t pt 2 esantioane perechi(pt variabile dependente) si 2.testul t pt 2 esantioane neperechi(pt variabile independente) care poate fi cu variatii egale sau inegale. 47) Care teste t se aplic pentru a compara tendintele de centralitate pentru variabile independente? Testul t-student pt 2 esantioane neperechi cu variatii egale si Testul t-student pt 2 esantioane neperechi cu variatii inegale 48) Care test t se aplic a compara tendintele de centralitate pentru variabile dependente? testul t pt 2 esantioane perechi(pt variabile dependente) de ex: cate ore dormi/noapte in mod normal si in sesiune. 49) Cnd se aplic testul z ? Daca esantionul>30 50) Ce este repartiia t (Student)? Cand gradele de libertate(df=degrees of freedom) tind la infinit z devine t, adica repartitia z=normala si t=cvasinormala 51) Definii intervalul de ncredere pentru medie folosind repartiia normal. Care sunt funciile Excel2010 pe care le folosii?

Intervalul de la medie-abatere pana la medie+abatere are 68% incredere, sau media-2abateri pana la media+2abateri are 95% incredere. Se calc in excel cu CONFIDENCE.NORM(). 52) Definii intervalul de ncredere pentru medie folosind repartiia t. Care sunt funciile Excel 2010 pe care le folosii? Extragem un esantion pt care calculam media si abaterea standard, iar intervalul de la medie-abatere pana la medie+abatere are 68% incredere, sau media-2abateri pana la media+2abateri are 95% incredere. Se calc in excel cu CONFIDENCE.T(). 53) Dac se extrag n eantioane din aceeai populaie care are media teoretic , care este media mediilor eantioanelor? Media mediilor este egala cu media teoretica. 54) Dac se extrag n eantioane din aceeai populaie care are dispersia 2, care este dispersia mediilor eantioanelor? Dispersia mediilor= 2/n 55) Care este Teorema limitei centrale? TLC=cea mai importanta teorema din statistica: daca extragem n esantioane din aceeasi populatie, cu repartitie nu neaparat normala, mediile repartitiilor au repartitie normala. Repartiia Normal apare
ca repartiie limit pentru medii, chiar dac eantioanele au o repartiie care nu este normal.(n>30)

56) Care este numrul de grade de libertate n cazul unui eantion de dimensiune n? Este n-1 57) Cnd se foloseste testul ANOVA? Cand comparam mai mult de 2 esantioane. 58) Ce nseamn H0 (ipoteza nul)? Ce nseamn H1 (ipoteza alternativ)? H0=ipoteza nula=nu exista diferente semnificative intre ceea ce comparam si H1=ipoteza alternativa=exista diferente semnificative intre ceea ce comparam. 59) Care este condiia de acceptare a ipotezei nule(H0)? Probailitatea>riscul(alpha) adica P>0.05 60) Care este condiia de respingere a ipotezei nule (H0)? Probailitatea<riscul(alpha) adica P<0.05 61) Ce este un BoxPlot pentru intervale de ncredere i la ce se folosete? Este reprezentarea grafica a intervalelor de incredere si se foloseste pt a le compara. 62) Cum se creaz un BoxPlot pentru intervale de ncredere? Se calc abaterea standard,dimensiunea simedia pt fiecare esantion, facem confidence.norm pt amandoua, si apoi pt mediile celor 2 esantioane facem grafic XY scatter si apoi: Layout->error bars ->analysis-> more error bars options->Both si la error amount->custom->specify value->custom

error value->si la positive error bars si la negative error value trecem adresele celulelor in care am calc confidence.norm 63) Ce este covariana? Este variatia impreuna a 2 variabile aleatoare. 64) Care sunt posibilitile pentru calculul covarianei n Excel 2010? COVARIANCE.S(X,Y) COVARIANCE.P() sau COVAR() 65) Interpretarea covarianei. Daca cov>0 atunci X si Y variaza in acelasi sens, daca cov<0 atunci X si Y variaza in sensuri opuse si daca cov=o atunci nu exista relatie liniara intre X si Y. 66) Ce este coeficientul de corelaie (Pearson)? Se obtine din raportul covarianta/(abaterea standard a lui X)*(abaterea standard a lui Y) 67) Care sunt posibilitile pentru calculul coeficientului de corelaie n Excel 2010? CORREL.S(X,Y) CORREL.P(X,Y) sau CORREL(X,Y) 68) Proprietile i interpretarea coeficientului de corelaie (regula lui Colton). Coef<=0.25 corelare slaba Coef intre 0.25 si 0.5 corelare slaba Coef intre 0.5 si 0.75 corelare medie Coef intre 0.75 si 1 corelare buna si f buna Coef >0 corelare pozitiva Coef <0 corelare negativa 69) Ce este o regresie? O metoda de modelare a legaturilor dintre variabile. 70) Cum determinai regresiile n Excel? Cum alegei regresia cea mai bun? De pe grafic cand selectam display equation on chart bifam si R-squared value on chart. Alegem regresia care are R2 cel mai mare.