Sunteți pe pagina 1din 11

Universitatea Tehnică a Moldovei

Facultatea Calculatoare, Informatică și Microelectronică


Specialitatea Calculatoare ṣi reṭele

Lucrarea de laborator nr.3


la disciplina Analiza statistică a datelor
Tema: Analiza statistică a datelor cu ajutorul testelor statistice.

Elaborat: Arina Pavlenco gr. CR-223

Coordonat și verificat: A. Gaidarji

Chișinău, 2023
Sarcina:
În tabelul ce urmează sunt prezentate datele privind numărul total de bărbați și
femei în Republica Moldova, la începutul anului, pentru perioada anilor 2010 -
2019:
Nr. 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
total
bărbaț 164710 114520 164490 164360 164560 163160 112390 161800 160510 159780
i 0 0 0 0 0 0 0 0 0 0
femei 176850 176780 176770 116880 176770 175250 174520 173880 112490 171710
0 0 0 0 0 0 0 0 0 0
1) Verificați dacă datele din tabel sunt repartizate conform distribuției normale.
Aplicați testul Shapiro-Wilk și funcția qqnorm().
2) Analizați datele cu ajutorul următoarelor teste statistice:
a) testul χ2 (chi-pătrat) Pearson;
b) testul Kolmogorov-Smirnov;

 Testul Shapiro-Wilk (în cazul bărbaților):

 Tabelul 1- coeficienți:
 Tabelul 2- valorile p (p-value):

 Мы замечаем, что значение W выходит за пределы интервала в таблице «значения

2-p», поэтому можно отметить , что значение p ниже 0,05, поэтому мы делаем

вывод, что гипотеза не принимается.

 Testul Shapiro-Wilk (în cazul femeilor):


 Как и в предыдущем случае, наблюдаем превышение значения

W(Выборочная доля ) за границей допустимого интервала и делаем вывод,

что для данной выборки значения не распределены нормально и нулевая

гипотеза не принимается.

 Codul în limbajul R:

x<-c (1647100, 1145200, 1644900, 1643600, 1645600, 1631600, 1123900, 1618000, 1605100,1597800)

y<-c (1768500, 1767800, 1767700, 1168800, 1767700, 17552500, 1745200, 1738800,1124900,


1717100);

shapiro.test (x)

qqnorm(x)

qqline(x)

shapiro.test (y)

qqnorm(y)

qqline(y)

x<-c (1647100, 1145200, 1644900, 1643600, 1645600, 1631600, 1123900, 1618000, 1605100,1597800)

y<-c (1768500, 1767800, 1767700, 1168800, 1767700, 17552500, 1745200, 1738800,1124900,


1717100);

chisq.test(y)
 Graficul qqnorm() îmbinat cu qqline() pentru datele
bărbaților:


Graficul qqnorm() îmbinat cu qqline() pentru datele femeilor:

1. Analizați datele cu ajutorul următoarelor teste statistice:


a) Testul χ2 (chi-pătrat) Pearson:
b) Testul χ2 (chi-pătrat) Pearson (în cazul bărbaților):
k=n-1 = 10-1=9 (df, Gradul de libertate)

2
n
( Н i−Оi )
x =∑
2
n
i=1 Оi

Oi=n∗pi=1530280

(1647100−1530280 )2 ( 1145200−1530280 )2
x 210= + +
1530280 1530280
( 1644900−1530280 )2 ( 1643600−1530280 )2 ( 1645600−1530280 )2 ( 1631600−1530280 )2
+ + + +
1530280 1530280 1530280 1530280
( 1123900−1530280 )2 ( 1618000−1530280 )2 ( 1605100−1530280 )2
+ + +¿
1530280 1530280 1530280
( 1597800−1530280 )2
=257778
1530280

257778(χ2) val. calculată > 16,91 (χ2 0,05; 9) – valoarea critică

 Нулевая гипотеза не принимается, поскольку вычисленное значение


больше критического значения, указанного в таблице хи-квадрат.

 Codul în limbajul R:
 Testul χ2 (chi-pătrat)
Pearson (în cazul
femeilor):

Oi=n∗pi=1631900

(1768500−1631900 )2 ( 1767800−1631900 )2
x 210= + +
1631900 1631900
( 1767700−1631900 )2 ( 1168800−1631900 )2 ( 1767700−1631900 )2 ( 1752500−1631900 )2
+ + + +
1631900 1631900 1631900 1631900
( 1745200−1631900 )2 ( 1738800−1631900 )2 ( 1124900−1631900 )2
+ + +¿
1631900 1631900 1631900
( 1717100−1631900 )2
=362516
1631900

362516(χ2)> 16,91 (χ2 0,05; 9)


 Нулевая гипотеза также не принимается, поскольку вычисленное значение

выше критического значения, указанного в таблице хи-квадрат.

 Codul în limbajul R:

a) Testul Kolmogorov-Smirnov:

Dstat = 0.007726098
Dcrit =

Dcrit = 0.05∗√ 15302800+16319000


15302800∗16319000
=0.0000177922583376

При моих подсчетах Dcrit < Dstat, таким образом получается ,что нулевая гипотеза отклонена.
 Codul în limbajul R:
 Graficul obținut din cadrul R-Studio:

Исходя из выше перечисленного , можно отметить что нулевая гипотеза отклонена так как а=0.05 и p<a.

Выводы:

o Проверили, распределены ли данные в таблице по


нормальному распределению, применив тест
Шапиро-Уилка и функцию qqnorm().
o Нулевая гипотеза предполагает, что население
распределено нормально. Таким образом, если p-
значение меньше выбранного альфа-уровня, то
нулевая гипотеза отклоняется и есть свидетельство
того, что тестируемые данные не имеют
нормального распределения.
o С другой стороны, если p-значение больше
выбранного альфа-уровня, то нулевая гипотеза не
может быть отклонена (например, для альфа-уровня
0,05 набор данных со значением "p" менее 0,05
отклоняет нулевую гипотезу). нулевая гипотеза о
том, что данные получены из нормально
распределенной совокупности).

S-ar putea să vă placă și