Sunteți pe pagina 1din 25

Proiectul SMDM

12-14-2021

Metode statistice pentru luarea
deciziilor

Declarație problema 1:
Un distribuitor angro care operează în diferite regiuni ale Portugaliei are informații despre cheltuielile
anuale ale mai multor articole din magazinele lor din diferite regiuni și canale. Datele constau în
cheltuielile anuale ale a 440 de mari comercianți cu amănuntul pentru 6 soiuri diferite de produse în 3
regiuni diferite (Lisabona, Porto, Altele) și pe diferite canale de vânzare (Hotel, Retail).

Datele sunt furnizate în fișierul „Engros+Clienți+Date.csv”, așa cum se arată mai jos.

EDA de bază
 Datele au 440 de instanțe cu 9 atribute. 7 tip întreg și 2 tipuri de obiect (șiruri în coloană), așa cum se
vede din rezultatul de mai jos.

Proiectul SMDM PAGINĂ 2


 Nu există valori nule în nicio coloană, ceea ce este evident din rezultatul de mai jos.

 Setul de date are 9 variabile Cumpărător/Spender”, „Canal”, „Regiune”, „Proaspăt”, „Lapte”, „Băcănie”,
„Congelat”, „Hârtie_detergenți” și „Delicatessen”. Canalul și Regiunea sunt ambele coloane categorice,
în timp ce toate celelalte sunt de tip întreg.

1.1 Utilizați metode de statistică descriptivă pentru a rezuma datele. Ce


regiune și ce canal par să cheltuiască mai mult? Care regiune și care canal
par să cheltuiască mai puțin?

Următorul tabel este derivat folosind Statistica descriptivă pentru a rezuma datele.

Proiectul SMDM PAGINĂ 3


Tabelul de mai sus reprezintă distribuția în funcție de regiune a cheltuielilor totale pentru toate produsele
alimentare. Aici se poate observa că cheltuielile sunt repartizate în trei regiuni Lisabona, Porto și altă
regiune.

Graficul cu bare de mai jos reprezintă cheltuielile totale ale tuturor regiunilor.

Din graficul de mai sus se poate concluziona că regiunea Altele are cele mai mari cheltuieli, iar regiunea
Porto are cele mai mici cheltuieli.

Tabelul de mai sus reprezintă distribuția în funcție de canal a Cheltuielilor totale pentru toate produsele
alimentare. Aici se poate observa că cheltuielile sunt repartizate pe două canale Hotel și Retail ..

Graficul cu bare de mai jos reprezintă cheltuielile totale ale ambelor canale.

Proiectul SMDM PAGINĂ 4


Din graficul de mai sus se poate concluziona că Channel Hotel are cele mai mari cheltuieli, iar
Channel Retail are cele mai mici cheltuieli.

1.2 Sunt luate în considerare 6 soiuri diferite de articole. Toate soiurile


prezintă un comportament similar în regiune și canal? Oferiți o
justificare pentru răspunsul dvs.

Proiectul SMDM PAGINĂ 5


La reprezentarea coeficientului de variabilă în toate regiunile, este evident că toate produsele alimentare nu se
comportă similar în toate regiunile.

 Se poate observa că în regiunea Lisabona produsul Hârtie Detergentă are coeficient maxim de
variabilitate, deci este foarte inconsecvent în Lisabona , urmat de Produse alimentare . În cazul în
care la Oporto, produsele congelate prezintă cel mai mare comportament inconsecvent, urmate de
hârtia detergentă . Pe de altă parte, în Regiunea Other Delicatessen prezintă cea mai mare
inconsecvență, urmată de Hârtia Detergentă.

 În regiunea Lisabona , produsul Delicatessen are cel mai mic coeficient de variabilă, deci este cel
mai consistent produs din Lisabona , unde, ca și în Porto, Fresh și Delicatessan sunt cele mai
consistente. Pe de altă parte, în Altă regiune, numai proaspăt este cel mai consistent.

Proiectul SMDM PAGINĂ 6


La reprezentarea coeficientului de variabilă pe cele două canale, este evident că toate produsele alimentare nu
se comportă similar în toate regiunile.

 Se poate observa ca in canalul Hotel produsul Delicatessen are coeficient de variabil maxim deci este
foarte inconsecvent in Hotel urmat de Frozen . Pe de altă parte, în canalul Retail Detergent Paper
prezintă cea mai mare inconsecvență, urmată de Milk .

 În canalul Hotel , produsul Hârtie Detergentă are cel mai mic coeficient de variabilă, deci este cel
mai consistent produs din Canalul Hotel , unde, ca și în Retail , produsele congelate sunt cele mai
consistente.

Pe baza analizei de mai sus se poate concluziona că luând în considerare toate cele 6
varietăți de articole, toate soiurile nu prezintă un comportament similar în regiune și
canal.

1.3 Pe baza unei măsuri descriptive a variabilității, care element prezintă cel
mai inconsecvent comportament? Care elemente arată cel mai puțin
comportament inconsecvent?

Tabelul de mai sus reprezintă statisticile descriptive ale tuturor celor șase produse alimentare proaspete,
lapte, produse alimentare, congelate, detergenți_hartie și delicatese.
Aici, consistența oricărui aliment poate fi calculată folosind Coeficientul de variație (CV). Cu cât
coeficientul de variație este mai mare, cu atât este mai mare nivelul de inconsecvență și invers.

Este derivat din formula după cum urmează:

Coeficient de varianță (CV) = μ/σ

Unde:
σ = abaterea standard
μ = medie

Proiectul SMDM PAGINĂ 7


Graficul cu bare de mai sus reprezintă coeficientul de variație al tuturor alimentelor. Din diagramă este
evident că Coeficientul de variație este cel mai mare pentru Item Delicatessen și cel mai scăzut pentru Item
Fresh.
Prin urmare, se poate concluziona că elementul care arată cel mai inconsecvent comportament este
Delicatessen și articolele care arată cel mai puțin inconsecvent comportament este Fresh.

1.4 Există valori aberante în date?

Pentru a determina prezența Outlierilor în Date, cea mai bună metodă este crearea unui diagramă cu casete
pentru toate variabilele, așa cum se arată mai jos.

Proiectul SMDM PAGINĂ 8


Din diagramele cu casete ale tuturor variabilelor, ca mai sus, se poate concluziona că Da, există valori
aberante în date.
Valorile aberante sunt prezente în variabilele Proaspăt, Lapte, Băcănie, Congelat, Detergenți_Hârtie și
Delicatese.

1.5 Pe baza analizei dumneavoastră, care sunt recomandările dumneavoastră


pentru afacere? Cum poate analiza dvs. să ajute afacerea să-și rezolve
problema? Răspuns din perspectiva afacerii.

Pe baza analizei se pot face următoarele recomandări:

 Pe baza analizei, se poate observa că regiunea Altele și canalul Retail au cheltuieli mai mari decât alte
Canale și Regiuni. Prin urmare, din perspectiva afacerii, dacă urmează să fie deschisă o nouă afacere,
aceasta ar trebui să fie deschisă în Cealaltă regiune cu Channel Retail , deoarece Cealaltă regiune
absoarbe volumul maxim de vânzări și acest lucru se poate lăuda cu veniturile mai mari în comparație
cu deschiderea unei noi afaceri în Lisabona sau Porto și cu Hotelul Channel.

Proiectul SMDM PAGINĂ 9


 În toate regiunile, Foot Items Fresh are cele mai mari cheltuieli, urmată de Băcănie și Lapte. Prin
urmare, se recomandă insistent ca aceste produse alimentare să fie disponibile simultan în toate
întreprinderile, având ca prioritate disponibilitatea produsele alimentare proaspete .

 De asemenea, produsul alimentar Delicatessen prezintă un comportament cel mai puțin inconsecvent
în toate regiunile și canalele. Deci Delicatessen-ul este de asemenea recomandat să fie disponibil în
orice moment în toate Afacerile.

Problema 2:

Student News Service de la Clear Mountain State University (CMSU) a decis să culeagă date despre studenții
care participă la CMSU. CMSU creează și distribuie un sondaj de 14 întrebări și primește răspunsuri de la 62 de
studenți.
Datele sunt stocate în setul de date sondaj , după cum urmează:

2.1 Pentru aceste date, construiți următoarele tabele de contingență


(Păstrați genul ca variabilă de rând)

2.1.1 Gen și major

Proiectul SMDM PAGINĂ 10


2.1.2 Gen și intenție de grad

2.1.3 Gen și angajare

2.1.4 Gen și computer

Proiectul SMDM PAGINĂ 11


2.2 Să presupunem că eșantionul este reprezentativ pentru populația
CMSU. Pe baza datelor, răspunde la următoarea întrebare:

2.2.1. Care este probabilitatea ca un student CMSU selectat aleatoriu va fi


bărbat?

Din toate tabelele de contingență create se poate observa că.

Numărul total de studenți = 62


Numărul total de bărbați = 29
Probabilitatea ca un student selectat aleatoriu să fie bărbat = Numărul total de bărbați / Numărul total
de bărbați
Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea ca un student CMSU selectat aleatoriu să fie bărbat este de 46,77 %

2.2.2. Care este probabilitatea ca un student CMSU selectat aleatoriu să fie


femeie?

Din toate tabelele de contingență create se poate observa că.

Numărul total de studenți = 62


Nr total de Femeie = 33
Probabilitatea ca un student selectat aleatoriu să fie bărbat = Numărul total de bărbați / Numărul total
de femei

Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea ca un student CMSU selectat aleatoriu să fie femeie este de 53,23 %

2.3. Să presupunem că eșantionul este reprezentativ pentru populația


CMSU. Pe baza datelor, răspunde la următoarea întrebare:

2.3.1. Găsiți probabilitatea condiționată a diferitelor cursuri în rândul


studenților de sex masculin din CMSU.

Tabel de urgență pentru sex și major:

Proiectul SMDM PAGINĂ 12


Din toate tabelele de contingență create se poate observa că.

Probabilitatea de contabilitate în rândul studenților de sex masculin = 4/29


Probabilitatea CIS în rândul studenților de sex masculin = 1 / 29
Probabilitatea economiei/finanțelor în rândul studenților de sex masculin = 4 /29
Probabilitatea de afaceri internaționale în rândul studenților de sex masculin = 2/29
Probabilitatea de management în rândul studenților de sex masculin Management = 6/29
Probabilitatea de Altul în rândul elevilor de sex masculin Altul = 4/29
Probabilitatea de vânzare cu amănuntul/Marketing în rândul studenților de sex masculin = 5/29
Probabilitatea de nehotărât în rândul studenților de sex masculin = 3/29

Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea de contabilitate în rândul studenților de sex masculin este de 13,79%

Probabilitatea de CIS în rândul studenților de sex masculin este de 3,45%

Probabilitatea economiei/finanțelor în rândul studenților de sex masculin 13,79%

Probabilitatea afacerilor internaționale în rândul studenților de sex masculin 6,9%

Probabilitatea de management în rândul studenților de sex masculin Management este de


20,69%

Probabilitatea de altul în rândul studenților de sex masculin Altul 13,79%

Probabilitatea de retail/marketing în rândul studenților de sex masculin 17,24%

Probabilitatea de a fi nehotărât în rândul studenților de sex masculin 10,34%

2.3.2 Găsiți probabilitatea condiționată a diferitelor specializări în rândul


studenților de la CMSU.

Tabel de urgență pentru sex și major:

Proiectul SMDM PAGINĂ 13


Din toate tabelele de contingență create se poate observa că.

Probabilitatea de contabilitate în rândul studenților = 3/33


Probabilitatea CIS în rândul elevilor = 3/33
Probabilitatea economiei/finanțelor în rândul studenților = 7/33
Probabilitatea de afaceri internaționale în rândul studenților = 4/33
Probabilitatea de management în rândul elevilor Management = 4/33
Probabilitatea de Altul în rândul elevilor Alte = 3/33
Probabilitatea de vânzare cu amănuntul/Marketing în rândul studenților = 9/33
Probabilitatea de nehotărât în rândul elevilor = 0/33

Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea de contabilitate în rândul studenților este de 9,09%

Probabilitatea de CIS în rândul studenților este de 9,09%

Probabilitatea economiei/finanțelor în rândul studenților 21,21%

Probabilitatea afacerilor internaționale în rândul studenților 12,12%

Probabilitatea de management în rândul studentelor de sex feminin Management este de


12,12%

Probabilitatea de altul în rândul elevilor Altele 9,09%

Probabilitatea de retail/marketing în rândul studenților 27,27%

Probabilitatea de nehotărât în rândul elevilor 0%

2.4. Să presupunem că eșantionul este reprezentativ pentru populația


CMSU. Pe baza datelor, răspunde la următoarea întrebare:

2.4.1. Găsiți probabilitatea ca un student ales aleatoriu să fie bărbat și să


intenționeze să absolve.

Proiectul SMDM PAGINĂ 14


Tabel de urgență pentru sex și intenție de grad:

Probabilitatea ca un elev ales aleatoriu să fie bărbat = 29/62


Probabilitatea Masculului care intentioneaza sa se Gradruate = 17/29

Probabilitatea ca un student ales aleatoriu să fie bărbat și intenționează să absolve


= Probabilitatea ca un elev ales aleatoriu să fie bărbat * Probabilitatea ca un elev ales aleatoriu
să fie bărbat

Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea ca un student ales aleatoriu să fie bărbat și să intenționeze să absolve


este de 27,42 %

2.4.2 Găsiți probabilitatea ca un elev selectat aleatoriu să fie o femeie și NU


să aibă un laptop.
Tabel de urgență pentru sex și computer:

Probabilitatea ca un elev ales aleatoriu să fie Femeie = 33/62


Probabilitatea unei femei fără laptop = 1-(29/33)

Probabilitatea ca un elev selectat aleatoriu să fie o femeie și NU are laptop


= Probabilitatea ca un elev ales aleatoriu să fie o femeie * Probabilitatea ca o femeie fără laptop

Proiectul SMDM PAGINĂ 15


Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea ca un student selectat aleatoriu să fie o femeie și să NU aibă un laptop


este de 6,45 %

2.5. Să presupunem că eșantionul este reprezentativ pentru populația


CMSU. Pe baza datelor, răspunde la următoarea întrebare:

2.5.1. Găsiți probabilitatea ca un student ales aleatoriu să fie fie bărbat, fie
să aibă un loc de muncă cu normă întreagă?

Tabel de urgență pentru gen și angajare:

Probabilitatea ca un elev să fie bărbat = 29/33


Probabilitatea ca un student să aibă un loc de muncă cu normă întreagă = 10/62
Probabilitatea ca un bărbat să aibă un loc de muncă cu normă întreagă = 7/29

Probabilitatea ca un student ales aleatoriu să fie fie bărbat, fie să aibă un loc de muncă cu normă întreagă
= Probabilitatea ca un student să fie bărbat + Probabilitatea ca un student să aibă un loc de
muncă cu normă întreagă - Probabilitatea ca un bărbat să aibă un loc de muncă cu normă
întreagă

Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea ca un student ales aleatoriu să fie fie bărbat, fie să aibă un loc de muncă cu
normă întreagă 79,87 %

2.5.2. Găsiți probabilitatea condiționată ca, având în vedere că o studentă


este aleasă aleatoriu, ea este specializată în afaceri internaționale sau
management.

Tabel de urgență pentru gen și angajare:

Proiectul SMDM PAGINĂ 16


Probabilitatea de afaceri internaționale dată Femeie = 4/33
Probabilitatea managementului dat Femeie = 4/33

Deoarece afacerile internaționale și managementul sunt independente unele de altele

Probabilitatea de afaceri sau management internațional dat fiind Femeie


= Probabilitatea de afaceri internaționale dată Femeie + Probabilitatea de management dată
Femeie

Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea condiționată ca, având în vedere că o studentă este aleasă aleatoriu, ea este
specializată în afaceri internaționale sau management este de 24,242 %

2.6. Construiți un tabel de contingență de gen și intenție de absolvire la 2


niveluri (Da/Nu). Elevii nehotărâți nu sunt luați în considerare acum și
masa este o masă 2x2. Crezi că intenția absolvenților și a fi femeie sunt
evenimente independente?

2X2 Tabel de contingență de gen și intenție de absolvire fără a lua în considerare studenții
nehotărâți

Două evenimente A și B pot fi dovedite a fi evenimente independente atunci când îndeplinesc condiția:

P(A ∩ B) = P(A) * P(B)

În acest caz, dacă a fi femeie și intenția absolventă sunt independente, se poate dovedi prin verificarea
condiției:

Proiectul SMDM PAGINĂ 17


P(F ∩ Da) = P(F) * P(Da)

Unde F = Femeie
Da = Intenția de absolvire fiind Da

Prin urmare, din calculele făcute în Python concluzionăm că:

P(F ∩ Da) ≠ P(F) * P(Da)

Prin urmare, intenția de absolvent și a fi femeie nu sunt evenimente independente

2.7. Rețineți că există patru variabile numerice (continue) în setul de date,


GPA, salariu, cheltuieli și mesaje text.

Răspundeți la următoarele întrebări pe baza datelor

2.6.1. Dacă un student este ales aleatoriu, care este probabilitatea ca GPA
să fie mai mic de 3?

Deoarece GPA este o variabilă continuă, probabilitatea unui student a cărui GPA este mai mică de 3 poate fi
calculată utilizând distribuția Poisson.

Pentru a calcula probabilitatea GPA 3 sau mai mică vom adăuga probabilitatea de 0,1,2 și 3 GPA obținută în
distribuția Poisson.

Prin urmare, din calculele făcute în Python concluzionăm că:

Dacă un student este ales aleatoriu, care este probabilitatea ca GPA să fie mai mic de 3
este de 39,49%

2.6.2. Găsiți probabilitatea condiționată ca un bărbat selectat aleatoriu să


câștige 50 sau mai mult. Găsiți probabilitatea condiționată ca o femeie
aleasă aleatoriu să câștige 50 sau mai mult.

Probabilitatea condiționată ca un bărbat selectat aleatoriu să câștige 50


sau mai mult:

Proiectul SMDM PAGINĂ 18


Distplotul de mai sus reprezintă salariul tuturor bărbaților din populație.

După cum putem vedea, este distribuit în mod normal, deci probabilitatea condiționată ca un bărbat selectat
aleatoriu să câștige 50 sau mai mult poate fi calculată folosind distribuția normală.

Pentru a calcula acest lucru, vom calcula probabilitatea cumulativă pentru mai puțin de 50 folosind distribuția
normală și apoi vom scădea din 1.

Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea condiționată ca un bărbat selectat aleatoriu să câștige 50 sau mai mult


este de 83,04 %

Probabilitatea condiționată ca o femeie aleasă aleatoriu să câștige 50 sau


mai mult:

Proiectul SMDM PAGINĂ 19


Diagrama de mai sus reprezintă salariul tuturor femeilor din populație.

După cum putem vedea, este distribuit în mod normal, deci probabilitatea condiționată ca o femeie selectată
aleatoriu să câștige 50 sau mai mult poate fi calculată folosind distribuția normală.

Pentru a calcula acest lucru, vom calcula probabilitatea cumulativă pentru mai puțin de 50 folosind distribuția
normală și apoi vom scădea din 1.

Prin urmare, din calculele făcute în Python concluzionăm că:

Probabilitatea condiționată ca o femeie aleasă aleatoriu să câștige 50 sau mai mult


este de 86,09 %

2.8. Rețineți că există patru variabile numerice (continue) în setul de date,


GPA, salariu, cheltuieli și mesaje text. Pentru fiecare dintre ei comentați
dacă urmează o distribuție normală. Scrieți o notă care rezumă concluziile
dvs.

Proiectul SMDM PAGINĂ 20


Din histogramele de mai sus pentru variabilele continue GPA, salariu, cheltuieli și mesaje text putem
vedea că:
 GPA este distribuit aproape în mod normal, cu o ușoară înclinare spre stânga.
 Salariul este, de asemenea, distribuit în mod normal, cu o ușoară înclinare spre dreapta.
 Cheltuielile nu sunt distribuite în mod normal și sunt extrem de distorsionate la dreapta
 Mesajul text nu este distribuit în mod normal și este extrem de înclinat la dreapta.

Următorul tabel constă din valoarea Skewness a variabilelor.

Proiectul SMDM PAGINĂ 21


După cum sa menționat mai devreme din tabel, este evident că:
 GPA are foarte mai puțin Skewness și este negativ, deci este spre stânga.
 Salariul are, de asemenea, foarte puțină asimetrie, dar pozitivă, deci este spre dreapta.
 Cheltuielile sunt extrem de distorsionate
 Mesajul text este extrem de înclinat spre dreapta.

Problema 3
O caracteristică importantă de calitate folosită de producătorii de șindrilă de asfalt ABC este
cantitatea de umiditate pe care o conține șindrila atunci când este ambalată. Clienții pot simți că au
achiziționat un produs lipsit de calitate dacă găsesc umezeală și șindrilă umedă în interiorul
ambalajului. În unele cazuri, umiditatea excesivă poate face ca granulele atașate de șindrilă în
scopuri de textură și colorare să cadă de pe zona zoster, ceea ce duce la probleme de aspect. Pentru a
monitoriza cantitatea de umiditate prezentă, compania efectuează teste de umiditate. Se cântărește
șindrila și apoi se usucă. Șindrila este apoi cântărită din nou și, pe baza cantității de umiditate scoasă
din produs, se calculează kilogramele de umiditate pe 100 de picioare pătrate. Compania ar dori să
arate că conținutul mediu de umiditate este mai mic de 0,35 lire la 100 de metri pătrați.

Fișierul (A & B shingles.csv) include 36 de măsurători (în lire pe 100 de picioare pătrate) pentru
șindrila A și 31 pentru șindrila B.

3.1 Credeți că există dovezi care înseamnă că conținutul de umiditate în


ambele tipuri de șindrilă se află în limitele permise? Spuneți concluziile,
arătând clar toți pașii.

Pentru sindrila A, se oferă ipoteza nulă și alternativă pentru a testa dacă conținutul mediu de umiditate al
populației este mai mic de 0,35 lire la 100 de metri pătrați:

Proiectul SMDM PAGINĂ 22


H0 : conținut mediu de umiditate <=0,35
HA: conținut mediu de umiditate > 0,35

Nivel de semnificație: 0,05

Avem un eșantion și nu cunoaștem abaterea standard a populației.

Eșantionul nu este un eșantion mare. Deci utilizați distribuția t și statistica testului tSTAT

Deoarece testăm numai pentru proba A, folosim testul T cu o probă. De asemenea, ca python
implicit în Python, ttest_1samp arată rezultatul 2-sided este împărțit la 2, deoarece este un
test !_Sided.

Prin urmare, din calculele făcute în Python concluzionăm că:

Valoarea p testului t pentru un eșantion = [0,07477633]

Nu avem dovezi care să respingă ipoteza nulă, deoarece valoarea p > Nivel de
semnificație

Pentru sindrila B, se oferă ipoteza nulă și alternativă pentru a testa dacă conținutul mediu de umiditate al
populației este mai mic de 0,35 lire la 100 de metri pătrați:

H0 : conținut mediu de umiditate <=0,35


HA: conținut mediu de umiditate > 0,35

Nivel de semnificație: 0,05

Avem un eșantion și nu cunoaștem abaterea standard a populației.

Eșantionul nu este un eșantion mare. Deci utilizați distribuția t și statistica testului tSTAT

Deoarece testăm numai pentru proba A, folosim testul T cu o probă. . De asemenea, ca python
implicit în Python, ttest_1samp arată rezultatul 2-sided este împărțit la 2, deoarece este un
test !_Sided.

Prin urmare, din calculele făcute în Python concluzionăm că:

Valoarea p testului t pentru un eșantion = [0,0020904774003191826]

Avem dovezi pentru a respinge ipoteza nulă deoarece valoarea p < Nivelul de
semnificație

3.2 Considerați că media populației pentru zona zoster A și B este egală?


Formulați ipoteza și efectuați testarea ipotezei. Ce presupunere trebuie să
verificați înainte de a efectua testul pentru egalitatea de mijloace?

Ipoteze teoretice pentru testarea ipotezelor:

Proiectul SMDM PAGINĂ 23


Pentru a efectua un Test de egalitate a mediei populației din zona A și B, se dă ipoteza nulă și alternativă pentru
a testa dacă conținutul mediu de umiditate al populației este egal:

H0: conținutul mediu de umiditate al lui A = conținutul mediu de umiditate al lui B


HA: conținutul mediu de umiditate al lui A ≠ conținutul mediu de umiditate al lui B

Nivel de semnificație: 0,05

Avem două mostre A și B și nu cunoaștem abaterea standard a populației.

Probele nu sunt mostre mari. Deci utilizați distribuția t și statistica testului tSTAT

Deoarece testăm egalitatea între eșantionul A și B, folosim două probe T de testare.

Prin urmare, din calculele făcute în Python concluzionăm că:

Valoarea p testului t cu două eșantioane = 0,2017496571835306

Nu avem suficiente dovezi pentru a respinge ipoteza nulă în favoarea ipotezei alternative ,
deoarece valoarea p > Nivel de semnificație

Prin urmare, se poate concluziona că media populației pentru zona zoster A și B este egală.

Proiectul SMDM PAGINĂ 24


Mulțumesc

Proiectul SMDM PAGINĂ 25

S-ar putea să vă placă și