Sunteți pe pagina 1din 9

Universitatea tehnică a Moldovei

Tehnologii informaționale

Statistica Computațională

Lucrare de laborator Nr.2

Tema: Analiza statistică a datelor cu ajutorul


funcțiilor grafice hist(), boxplot(), qqnorm(), qqplot()
din limbajul R.

Elaborat: masterandul gr. TI-211 Maftei Alexandru


Coordonant: conf. univ. dr. Marusic Galina

Chișinău, 2021
Grupa: TI-211M
Student: Maftei Alexandru
Numarul in listă: 19

Sarcina

Generați un set de 100 de date aleatorii conform următoarelor repartiții:


1. Repartiția binomială (n=20, p=0.5).
2. Repartiția Poisson (𝜆 = 3).
3. Repartiția uniformă pe intervalul [-10,10].
4. Repartiția normală (mean = 2, sd=3).

1. Reprezentați datele obținute cu ajutorul diferitor tipuri de histograme (cel


puțin 4), folosind funcția hist(). Explicați rezultatele obținute.
2. Reprezentați datele obținute cu ajutorul funcției boxplot(). Explicați
rezultatele obținute.
3. Verificați cu ajutorul funcției qqnorm() dacă setul de date generat este
aproape de repartiția normală.
4. Efectuați analiza datelor obținute cu ajutorul funcției qqplot(). Explicați
rezultatele obținute.

Generarea seturilor de date:

1. set1 = rbinom(100,20,0.5)
2. set2 = rpois(100,3)
3. set3 = runif(100,-10,10)
4. set4 = rnorm(100,2,3)

Reprezantarea grafică hist():


Histogramele obținute în urma reprezentării grafice, arată repartiția
numerelor pe intervalele respective. La primul, al treilea și al patrulea set de
date am folosit mai multe blocuri pentru o vizualizare mai detaliată a
repartițiilor. Pentru a doua figură această manevră nu are sens pentru că
valorile repartiție au o diversitate de valori mai mică.
În histograma mulțimii repartizate normal (a patra) se poate observa
conturul clopotului Gaussian. Acest efect este mult mai evident la generarea
unei mulțimi mai mari, folosind repartiția Gaussiană:
Reprezentare grafică boxplot():

Reprezentarea cu ajutorul funcției grafice boxplot, ne ajută să vedem toate


seturile de date într-un singur grafic. Fiecare figura din imagine reprezintă
distribuirea valorilor pe intervalele respective. Valorea maximă este in setul
Nr1 (distribuit binomial), iar cea minimă în repartiția uniformă (Nr3).
În figura repartiției Gaussiene (nr4), observăm un punct, ce reprezintă o
valoare care se abate cu mult de media și limitele mulțimilor.
Repartiția poison are cel mai restrâns interval de valori și cu toate că
mediana acestei mulțimi este mai mare decît mediana mulțimilor 3 și 4,
valoarea maximă a repartiției poisson este cea mai mică dintre toate valorile
maxime ale mulțimilor.

Verificarea cu ajutorul funcției qqnorm():

Concluzie: În urma elaborării lucrării de laborator, am învățat


repartițiile binomiale, repartițiile Poisson, repartițiile uniforme, repartițiile
Gaussiene (normale) și repartițiile lognormale. Am efectuat calculele
matematice și am practicat limbajul R folosind funcțiile de calcul și de
reprezentare grafică.
Încercarea de a reprezenta seturile de date pe același grafic, nu este o idee bună pentru
că nu ne permite să facem careva deduceri, chiar și dacă folosim culori diferite pentru
fiecare mulțime. Cea mai bună soluție e să desenăm 4 grafice.

Analizând fiecare figură în parte putem spune că, cel mai apropiat de repartiția normală este
setul de date distribuit uniform (3, verde), dacă să excludem însuși repartiția normală (4,
albastră).
Analiza qqplot()

La reprezentarea cu ajutorul funcției qqplot(), vedem un grafic bidimensional. unde


prima dimensiune reprezintă primul set de date, iar a doua dimensiune, al doilea set de date.
Punctul de jos-stinga (5,0) reprezintă reprezentarea a celei dea 14 valoarea a ambelor
mulțimi. La aceste două mulțimi a cîte 100 de valori, distribuite binomial și poisson, vedem
relativ puține puncte (18), din cauza că valorile mulțimii reprezintă numere întregi, și multe
sete de date se suprapun, și avem doar 18 variante unice. Aceast nu lucru nu se va repeta
pentru reprezentarea celorlalte 2 mulțimi, unde șansa ca două valori să se repete este foarte
aproape de 0.
Concluzie: În urma elaborării lucrării de laborator, mi-am aprofundat
cunoștințele în lucrul cu limbajul R, și în analiza datelor statistice, reprezentate
grafic.