Sunteți pe pagina 1din 5

Ce este un eantion? Este un subset al populatiei, care trebuie sa fie reprezentativ pentru intreaga populatiei. Ce sunt datele cantitative?

Sunt caracteristici, care iau valori numerice. Datele cantitative pot fi discrete sau continue. Ce sunt datele calitative (categoriale)? Sunt trasaturi care evalueaza pe scare nominale. Indivizii se distribuie intr-o multime de clase ale caracteristicii. Ex: Culoarea ochii, cetatenie, nationalitate. Ce sunt datele ordinale? Sunt trasaturi care evalueza pe scare ordinale. Indivizii se distribuie in clase ale caracteristicii. Clasele au o anumita ordine. Ex: Insuficient, Suficient, Bine, Foarte bine. Ce este frecvena absolut? Care sunt funciile Excel folosite pentru a calcula frecvena absolut. Reprezinta numarul de aparitii a unei valori intr-un set de date. Functii: COUNTIF, FREQUENCY. Ce este frecvena relativ? Este raportul intre frecvanta absoluta si numarul de date luate in calcul. Ce este o histogram? Este un tip de grafic pe coloane, folosit pentru reprezentarea frecventelor. Ce sunt quartilele unei repartiii? Care sunt funciile Excel 2010 folosite pentru a determina quartilele? Quartilele sunt 3 valori, care impart un set de date in patru subgrupe egale, fiecare cuprinzand cate 25% din date. Formula: QUARTILE. Care sunt tipurile de parametri statistici? (de localizare, de imprastiere) Paremetri pentru masurarea tendintei de centralitate, pentru masurarea tendintei de veriatie si indicatori de normalitate. Enumerai parametrii statistici care msoar tendina de centralitate. Valoarea centrala, media, mediana, valoarea modala, media geometrica, media armonica, media interquartilica, media trunchiata. Ce este valoarea central? Este un indicator de localizare si reprezinta media aritmetica pentru minimul si maximul din valori. Ce este media interquartilic? Care este funcia Excel folosit pentru a determina media interquartilic? Este media calculata pe baza a 50% din date, eliminand primele 25% si ultimele 25% din valori, dupa ordonarea crescatoare. Formula: TRIMMEAN(domeniu, 0.5) Ce este valoarea modal? Care sunt funciile Excel 2010 folosite pentru a determina valoarile modale? Este valoarea care apare cel mai frecvent intr-un set de valori. Formula: MODE. Ce este o repartiie unimodal? Daca repartitie experimentala are un singur maxim. O distributie unimodala exprima omogenitatea datelor. Ce este o repartiie multimodal? Daca repartitia experimentala are mai multe maxime si exprima neomogenitatea datelor. Ce este mediana? Care este funcia Excel folosit pentru a determina mediana? Reprezinta valoarea din mijlocul setului de date. Formula: MEDIAN. Enumerai parametrii statistici care msoar tendina de dispersie (mprtiere). amplitudinea variatiei, intervalul interquartilic, dispersia, abaterea standard, coeficient de variatie Care sunt funciile Excel 2010 pentru calculul dispersiei? VAR.P-pentru intreaga populatie, VAR.Spentru un esantion Care sunt funciile Excel 2010 pentru calculul abaterii standard? STDEV.P- petru intreaga populatie, STDEV.S- pentru un esantion Care este relatia dintre dispersie si abaterea standard? Abaterea standard este radacina patrata din dispersie.(abaterea standrad este dispersi la puterea a doua)

Ce este coeficientul de variaie? Interpretai mprtierea datelor n funcie de valoarea coeficientului de variaie. Este raportul dintre abaterea standard si media unui set de valori. Daca c<=0,1 dispersia este mica, datele sunt omogene. Daca c este intre 0,1 si 0,2 dispersia este medie. Daca c>=0,2 dispersia este mare, datele sunt neomogene. Ce este amplitudinea variaiei? Este diferenta intre valoarea maxima si valoarea minima a sirului si are rolul de a masura dimensiunea intervalului de imprastiere. Ce este intervalul intercuartilic? Este intervalul cuprins intre quartilele 1 si 3. Ce este proporia variaiei? Este procentul de date, care nu sunt egala cu valoarea modala. Ce este coeficientul de asimetrie? Care este funcia Excel folosit pentru a determina coeficientul de asimetrie? Evalueaza gradul in care o distributie de valori este deviata stanga-dreapta fata de o distributie normala(gaussiana). Caracterizeaza asimetria distributiei fata de media aritmetica. Daca e pozitiv valorile sunt deplasate spre stanga, daca e negativ, invers. Formula: SKEW. Ce este coeficientul de exces (sau aplatizare)? Care este funcia Excel folosit pentru a determina coeficientul de exces? Evalueaza gradul in care o distributie de valori este mai aplatizata sau ma amplificata, fata de o distributie normala(gaussiana). Caracterizaeza inaltimea relativa a distributiei datelor, fata de o distributie normala. Daca e pozitiv distributia e ascutita, daca e negativ distributie este plana. Formula: KURT. Definii entropia unei variabile calitative. Determina gradul de incertitudine purtate de datele unei variabile aleatoare calitative de studiu, precum si cantitatea de date continuta in aceasta variabila aleatoare. ( Sumproduct(fr. frel, log pe baza 4 a frecventelor relative)) Care sunt parametrii de centralitate pentru date cantitative? Valoarea central, media, media trunchiat, media interquartilic, mediana, modul, media geometrica, media armonica Care sunt parametrii de variaie pentru date cantitative? Amplitudinea, intervalul interquartilic, dispersia, abaterea standard Care sunt parametrii de variaie pentru date calitative nominale? Proportia variatiei, entropia unei variabile calitative Care sunt parametrii de variaie pentru date calitative ordinale? Amplitudinea variatiei, intervalul interquartilic, proportia variatiei, entropia unei variabile calitative. Care sunt datele calitative pentru care exist quartile? Datele ordinale Care sunt parametrii de centralitate pentru date calitative nominale? Valoarea modala Care sunt parametrii de centralitate pentru date calitative ordinale? Valoarea modala, mediana sau quartilele. Care sunt parametrii care determin o repartiie normal? Parametrii de centralitatea (media, mediana, abaterea standard, valoarea modala) si de dispersie, frecventele absolute, testele de normalitate Care sunt parametrii care determin o repartiie binomial? Parametrii de centralitatea (media, mediana, abaterea standard, valoarea modala) si de dispersie, frecventele absolute, testele de normalitate Care sunt proprietaile repartiiei normale? Media=Mediana=Modul, Media>Abaterea standard. Se compar graficul frecvenelor absolute cu graficul curbei lui Gauss. 68% din valori sunt n intervalul [m - s, m+s], 95% din valori sunt n intervalul [m - 2s, m + 2s] si 99.7% din valori sunt n intervalul [m - 3s, m + 3s], unde m este media calculat, iar s este abaterea standard calculat. Indicatori descriptivi de normalitate

Teste de normalitate Skewness (asimetrie), Kurtosis (exces). Metoda interquartilic: gartilele calculate experimental sa fie aproape de quartilele teoretice Q-Q plot: qaurtilele sa fie aflate pe prima bisectoare

Cum realizai i cum interpretai o diagram Q-Q plot? Reprezentam cuartilele calculate din distribuia esantionului in funcie de cuartilele teoretice (ideale) ale unei distribuii normale (Gaussiene). Interpretare: Cu ct punctele diagramei sunt mai apropiate de prima bisectoare cu atat distributia de selectie a esantionului este mai aprpiata de o distributie normala.

Care sunt testele statistice pe care le cunoatei? Testul Fisher, Testul t, Testul z, Testul Anova, Testul Pearson (Chi) Care sunt indicatorii folosii pentru a verifica normalitatea datelor? Skewness (asimetrie) si Kurtosis (exces), metoda grafic, metoda interquartilic, Q-Q plot. Cum aplicai testul Chi pentru a verifica normalitatea datelor? Care sunt funciile Excel 2010 pentru aplicarea testului Chi? Calculam pasul( (max-min)/10 ), calculam frecventele relative pentru intervalele, calculam repartitia binomiala( BINOM.DIST) si aplicam testul. Formula: CHISQ.TEST, CHITEST Cum interpretai rezultatul testului Chi pentru verificarea normalitii datelor? Daca probabilitatea p este eglala cu 1, ipoteza nula, H0 este adevarata, adica datele sunt normal distribuite. Daca p este diferit de 1, este adevarata ipoteza alternativa, H1, deci datele nu sunt normal distribuite. Care sunt cele dou ipoteze statistice? Ipoteza nula, H0, care indica normalitatea datelor si ipoteza alternativa, care indica abnormalitatea distributiei datelor. Definii erorile statistice de tipul I. Respingerea ipotezei nule H0, cand aceasta este adevarata. Probabilitatea acestei erori se noteza cu alfa(nivel de risc). Definii erorile statistice de tipul II. Acceptarea ipotezei nule H0, cand aceasta este falsa. Probabilitatea acestei erori se noteaza cu beta. Cte tipuri de teste t (Student) cunoatei? 3 tipuri de teste t: pentru variabile dependente testul t perechi, pentru cele independente testul t neperechi si variatii egale sau testul t neperechi si variatii inegale. Care teste t se aplic pentru a compara tendintele de centralitate pentru variabile independente? Testul t neperechi si variabile egale sau inegale. Care test t se aplic a compara tendintele de centralitate pentru variabile dependente? Testul t perechi. Cnd se aplic testul z ? Daca dimensiunea esantionului este mai mare decat 30 sau daca se cunoaste dispersia teoretica. Ce este repartiia t (Student)? Repartiia t (Student) este de fapt o familie de repartiii continue de probabilitate, care se folosesc atunci cand dimensiunea eantionului este mic (mai mic decat 30) i nu se cunoate abaterea standard teoretic. Are o imprstiere mai mare a valorilor fa de medie, cozile lui fiind mai groase, fata de repartitia normala( clopotul lui Gauss). 51) Definii intervalul de ncredere pentru medie folosind repartiia normal. Care sunt funciile Excel 2010 pe care le folosii? Este un interval in jurul mediei de selectie in care, cu un anumit grad de risc, se va gasi orice medie a unui esantion similar din populatia de tinta. In acest interval se va gasi

media teoretica. Funtie: CONFIDENCE.NORM, returneaz valoarea expresiei Zc

, unde ZC este z

critic corespunztor valoarei alese pentru probabilitatea alfa (numit risc), s este abaterea standard, iar n este dimensiunea eantionului. Definii intervalul de ncredere pentru medie folosind repartiia t. Care sunt funciile Excel 2010 pe care le folosii? Functie: CONFIDENCE.T. Funcia CONFIDENCE.T returneaz valoarea expresiei , unde tc este t critic corespunztor valorii alese pentru risc (alfa), s este abaterea standard, iar n este dimensiunea eantionului. Dac se extrag n eantioane din aceeai populaie care are media teoretic , care este media mediilor eantioanelor? Dac X1, X2, ... Xn este o succesiune de eantioane extrase din aceeai populaie care are media teoretic , iar X=(x1,x2,x3,.xn ) (x barat!!!) este variabila aleatoare a mediilor acestor eantioane, atunci media acestei variabile aleatoare este . Dac se extrag n eantioane din aceeai populaie care are dispersia 2, care este dispersia mediilor eantioanelor? Dac X1, X2, ... Xn este o succesiune de eantioane extrase din aceeai populaie care are media teoretic i dispersia teoretic 2, iar X=(x1,x2,x3,.xn ) (x barat!!!) este variabila aleatoare a mediilor acestor eantioane, atunci dispersiia acestei variabile aleatoare este 2/n. Care este Teorema limitei centrale? Afirma ca repartitia normala apare, ca o repartitie limita pentru medii, daca dimensiunea esantionului este mare mare decat 30, chiar daca esantioanele au o dimensiune care nu este normala. Care este numrul de grade de libertate n cazul unui eantion de dimensiune n? n-1 Cnd se foloseste testul ANOVA? Este un test cu ajutorul caruia se compara mai mult de 2 grupuri. Ce nseamn H0 (ipoteza nul)? Ce nseamn H1 (ipoteza alternativ)? Ipoteza nula inseamna, ca mediile esantioanelor sunt egale, iar ipoteza alternativa inseamna, ca cel putin doua dintre mediile esantioanelor nu sunt egale. Care este condiia de acceptare a ipotezei nule(H0)? p trebuie sa fie mai mare, decat nivelul de risc(alfa=0,05). Care este condiia de respingere a ipotezei nule (H0)? p sa fie mai mic sau egal cu nivelul de risc(alfa=0,05). Ce este un BoxPlot pentru intervale de ncredere i la ce se folosete? Este o grafica de tip XY scatter in care sunt reprezentate toate mediile. Se foloseste pentru identificarea diferentelor semnificative dintre esantioane. Diferentele apar acolo, unde intervalele de incredere sunt disjuncte. Cum se creaz un BoxPlot pentru intervale de ncredere? Aranjez intr-un tabel mediile si valorile corespunzatoare pentru intervalele de incredere. Creez un grafic de tip XY scatter pentru medii. In fereastra de dialog Format Error Bars activez Vertical Error Bars si activez Both. In chenarul Error Amount selectez Custom si introduc atat in campul Pozitiv Error Bars cat si in campul Negtiv Error Value domeniul care contine valorile intervalelor de incredere. Sterg barele orizontale. Fac click dreapta pe un punct si selectez Add Data Labels. Ce este covariana? Media produilor termenilor omologi a dou variabile corelate. Este corelatia intre doua serii de date. Care sunt posibilitile pentru calculul covarianei n Excel 2010? 1) Funcia COVARIANCE.S esantion 2) Funcia COVARIANCE.P populaie 3) Funcia COVAR compatib. Excel 2007

4) Data Analysis|Covariance Interpretarea covarianei. 1) COV(X, Y) > 0 X si Y variaz n acelasi sens. 2) COV(X, Y) < 0 X si Y variaz n sensuri opuse. 3) COV(X, Y) = 0 nu exist relaie liniar ntre X si Y. Ce este coeficientul de corelaie (Pearson)? rxy= Sy,Sx - abaterile standard pt X si Y Care sunt posibilitile pentru calculul coeficientului de corelaie n Excel 2010? 1) Funcia CORREL.S(dX, dY) esantion 2) Funcia CORREL.P(dX, dY) populaie Proprietile i interpretarea coeficientului de corelaie (regula lui Colton). 1) |rXY| 0.25 nu exist corelare liniar. 2) 0.25 XY|0.5 exist o corelare slab. |r 3) 0.5 |rxy|0.75 corelare medie. 4) 0.75 |rXY|1 corelare bun si foarte bun. 5) 0 rXY 1 corelare pozitiv. 6) -1 rXY 0 corelare negativ. Ce este o regresie? Regresia este o metoda de modelare a legaturilor dinre variabile. Cum determinai regresiile n Excel? Cum alegei regresia cea mai bun? 1) Grafic tip XY (nor de puncte) 2) Clic-dreapta pe un punct si aleg Add Trendline 3) Aleg tipul Linear. 4) Marchez opiuni: - Display Equation on chart - Display R-squared value 5) nchid cu Close. 6) Fac alte tipuri de regresii si o aleg pe cea care are Coeficientul de determinare (R2) mai mare.

S-ar putea să vă placă și