Sunteți pe pagina 1din 37

Lean Six Sigma Training

Modulul A1 – Statistica Inferentiala

2018

Slide 1 © 2018 Business Future Solutions


Agenda
Ziua 1 Ziua 2 Ziua 3 Ziua 4 Ziua 5
Introducere in Statistica
Harta Procesului
metodologie Inferentiala
Fundamente Statistici Six
Lean Sigma

Analiza
Fundamente
Six Sigma
Sistemului de
Masurare
Selectia
Proiectelor
FMEA

© 2018 Business Future Solutions


Introducere

Obiective
 Definirea conceptului de statistica
inferentiala (inductiva)

 Teorema Limitei Centrale

 Nivel de incredere, interval de incredere,


marja de eroare in statistica inferentiala

3 © 2018 Business Future Solutions


Natura inferenței

inferența “Actul sau procesul de a deriva concluzii logice din premise


cunoscute sau presupuse ca fiind adevărate. Raționament pornind de la
cunoștințe sau dovezi.” 1 1. Dictionary.com

Statistici inferențiale – Derivarea de inferențe cu privire la procesul sau


populația studiata prin modele de date într-un mod care sa ia in considerare
aspectul aleatoriu si incertitudinea in cadrul observațiilor. 22. Wikipedia.com

Slide 4 © 2018 Business Future Solutions


Scopul statisticilor de bază
Scopul statisticilor de bază este de a:
 Furniza un rezumat numeric al datelor care sunt analizate.
- Date (n)
- Informații factuale organizate pentru analiză
- Informații numerice sau reprezentate într-o alta formă adecvată pentru
prelucrarea pe calculator
- Valorile din experimente științifice
 Oferi baza pentru a face inferențe cu privire la viitor.
 Oferi baza pentru evaluarea capacității unui proces.
 Oferi un limbaj comun, care poate fi utilizat într-o organizație,
pentru a descrie procese.
Relaxaţi-vă….nu va fi
chiar atât de rău!
Slide 5 © 2018 Business Future Solutions
Parametri versus Statistici
Populație: Toate elementele care au “proprietatea de interes” studiata.
Eșantion: Un subset semnificativ mai redus al populației folosit pentru
realizarea unei analize.
Populatie

Eșantion

Eșantion Eșantion

Statisticile Eșantionului :
Parametri Populatiei:
– Descrierea aritmetica a esantionului
– Descrierea aritmetica a populatiei
– X-bar , s, p, s2, n
– µ,  , P, 2, N
Slide 6
6 © 2018 Business Future Solutions
Tipuri de erori la eșantionarea datelor
1. Eroare de eșantionare
Eroare datorata diferențelor dintre eșantioane extrase aleatoriu dintr-o populație
(extragere la noroc).
Aceasta este unica sursa de eroare care poate fi acceptata de statistica.
2. Eroare sistematica in eșantionare
Eroare datorata absentei independentei intre eșantioane aleatorii sau datorata unor
proceduri sistematice de eșantionare (exemplu - înălțimea jocheilor sau baschet).
3. Eroare in măsurătoare
Eroare in măsurarea eșantioanelor (MSA/GR&R).
4. Absenta validitatii masurarilor
Eroarea de măsurare nu măsoară in realitate ceea ce intenționează sa măsoare
(amplasarea unei sonde in fanta greșită - măsurarea temperaturii cu un termometru
amplasat imediat lângă un cuptor).
Slide 7 © 2018 Business Future Solutions
Curba Normală
Curba Normală este o curbă netedă, simetrică, în formă de clopot, generată
de funcția Densitate.

Deviații standard

Este cel mai util model de probabilitate continuă, de vreme ce numeroase


măsurători naturale, cum ar fi înălțimile, masele etc. sunt aproximativ Normal
Distribuite.

Slide 8 © 2018 Business Future Solutions


Regula Empirică

Regula Empirică…

Slide 9 © 2018 Business Future Solutions


Distribuția Normală
Aria acoperită de curbă între oricare două puncte reprezintă proporția
distribuției între respectivele două puncte.
Aria dintre Medie și oricare
alt punct depinde de
distanta exprimata in
Deviații Standard fata de
Medie.
m x

Convertiți orice scor brut într-un scor Z folosind formula:

Consultați un set de Tabele de Normale Standard pentru a determina proporția


dintre μ și x.
Slide 10 © 2018 Business Future Solutions
Distribuția Normală Standard

Fiecare combinație de Medie și Deviație Standard generează o Curbă normală


unică:

Distribuția Normală „standard”:

 Are un μ = 0, și σ = 1
 Datele din orice Distribuție Normală pot fi determinate să se potrivească
Normalei standard prin convertirea scorurilor brute la scoruri standard.
 Scorurile Z măsoară distanța dintre Medie și valoarea unei anume date, în
Deviații Standard.

Slide 11 © 2018 Business Future Solutions


Z Table

Slide 12 © 2018 Business Future Solutions


Dar…

Ce facem cand NU cunoastem media si deviatia standard a populatiei?

Slide 13 © 2018 Business Future Solutions


Teorema limitei centrale
Sa presupunem ca:
Prelevați un mare număr de eșantioane de la o populație care nu se
conformează cu o distribuție normala
Calculați media pentru fiecare din aceste eșantioane

Forma distribuției populației formate de aceste medii de eșantioane va semăna cu


o distribuție normala. Cu cat numărul de elemente din fiecare eșantion este mai
mare, cu atât aproximația va fi mai buna.

© 2018 Business Future Solutions


Teorema limitei centrale
1. Luam o populatie oarecare cu media µ si deviatia
standard σ. µ
2. Luam un esantion de dimensiune n si calculam media
esantionului x1
σ
3. Incepem sa trasam histograma valorilor mediilor n n n
esantioanelor
4. Luam al doilea esantion de dimensiune n, avand
-x x- x-
1 2 3
n
media x2
5. Continuam cu toate esantioanele posibile de -x m
dimensiune n
6. Media mediilor esantioanelor este media populatiei
7 Distributia mediilor esantioanelor este o distributie
normala
8 Deviatia standard a distributiei mediilor esantioanelor ,
denumita abatere standard si notata cu s, se calculeaza
cu formula: Media mediilor

Slide 15 © 2018 Business Future Solutions


Să vedem – Distributia mediilor esantioanelor

© 2018 Business Future Solutions


Teorema limitei centrale
Daca toate eșantioanele aleatorii posibile, fiecare de dimensiunea n, sunt
prelevate din orice populație cu Medie μ si deviația standard σ, distribuția
de medii eșantioane:
va avea o Medie

va avea Std Dev

si va fi distribuita normal când populația părinte este normal distribuita sau va


fi aproximativ normala pentru eșantioane de dimensiunea 30 sau mai mult
când populația părinte nu este normal distribuita.

Acest aspect se îmbunătățește cu eșantioane de dimensiuni mai mari.

Slide 17 © 2018 Business Future Solutions


Teorema limitei centrale – pentru Proporție
Dacă toate posibile eșantioane aleatorii, fiecare de dimensiune n, sunt
luate din orice populație cu o proporție P, distribuția proporțiilor eșantionului
va:
Avea a Media

Avea o Deviație Std

și va fi distribuita normal.

Slide 18 © 2018 Business Future Solutions


Teorema limitei centrale
Teorema Limitei Centrale afirma ca distribuția eșantioanelor este mai îngusta
decât distribuția populației, printr-un factor de
n
Medie eșantion =
n subiecți

Astfel, estimările
obținute din eșantioanele
 n
noastre sunt tot timpul Populația, x
subiecți individuali
relativ apropiate de
parametrul de populație µ.

m
Daca populația este normal distribuita N(µ,σ),

la fel va fi si distribuția de eșantionare N(µ,σ/√n),
Slide 19 © 2018 Business Future Solutions
Semnificație
95% din toate mediile eșantioanelor se
 n
vor încadra aproximativ in 2 deviații
standard (2*/√n) din parametrul 
populației m.
Distantele sunt simetrice ceea ce implica
faptul ca parametrul de populație m
trebuie sa se încadreze in aproximativ
2 deviații standard fata de media
a eșantioanelor, in 95% din toate
eșantioanele.
Punct roșu: valoarea medie
Acest raționament este esența inferenței statistice! a eșantionului individual
© 2018 Business Future Solutions
Implicații
Nu avem nevoie sa prelevam multe eșantioane aleatorii pentru a “reconstrui”
distribuția de mediilor esantioanelor, găsindm la mijloc.

n
Nu avem nevoie decât de un
Eșantion simplu esantion aleatoriu (SRS
n - Simple Random Sample) de
Populație dimensiunea n si ne bazam pe
proprietățile distribuției mediilor
eșantioanelor pentru a deduce
m locatia mediei populației m.

Slide 21 © 2018 Business Future Solutions


Cu alte cuvinte
Cu 95% încredere, putem afirma ca µ ar
trebui sa se încadreze in aprox. 2 deviații
standard (2*s/√n) fata de media de
eșantion
x
 In 95% din toate eșantioanele posibile
de aceasta dimensiune n, µ se va
încadra într-adevăr in intervalul
 nostru
de încredere.
 In numai 5% din eșantioane x va fi la
mai mare distanta de µ.


© 2018 Business Future Solutions
Niveluri de încredere variate
Intervalele de încredere conțin media populației m in C% din eșantioane. Diferite
suprafețe de sub curba oferă niveluri diferite de încredere C.

Utilizare practica a z: z*
•z* este înrudit cu nivelul de
încredere ales C.
•C este zona de sub curba normala
C
standard intre −z* si z*.

Intervalul de încredere este


dat de: −z* z*
Exemplu: Pentru un nivel de încredere C de 80%, 80%
din suprafața curbei normale este conținuta in interval.
Slide 23 © 2018 Business Future Solutions
Niveluri de încredere vs. Marja de eroare
Nivelul de încredere C determina valoarea z* .

Marja de eroare depinde de z*.

Un nivel de încredere mai înalt C implica o


marja mai larga de eroare m (deci mai
putina precizie in estimările noastre).

C
Un nivel de încredere mai redus C produce
m m
o marja de eroare mai redusa m (deci o
precizie mai buna in estimările noastre). −z* z*

Slide 24 © 2018 Business Future Solutions


Intervalul de încredere
Un interval de încredere poate fi exprimat ca:
• Medie ± m • Doua capete ale unui interval
m se numeste marja de eroare
m in ( − m) la ( + m)
m in x ± m
Exemplu: 120 ± 6 Exemplu: 114 la 126

Un nivel de încredere C (in %) indica


 probabilitatea ca µ sa se încadreze in
interval.

Intervalul de incredere reprezintă


zona de sub curba normala in ± m de
m m
la centrul curbei.
© 2018 Business Future Solutions
Niveluri de încredere pentru medie, mediana si Sigma

Funcția sumar grafic Minitab


oferă intervaluri de încredere
pentru medie, mediana si
deviația standard.

© 2018 Business Future Solutions


Cum găsim valorile specifice z*?

Putem folosi un tabel (Tabel Z). Pentru un nivel special de încredere, C, valoarea z*
corespunzătoare este chiar deasupra.

Exemplu: Pentru un nivel de încredere de 98%, z*=2.326

© 2018 Business Future Solutions


Diferite niveluri de încredere
O fabrica produce izolatori din ceramica. Deviatia standard a procesului pentru
rezistenta de izolatie, cunoscuta din datele istorice este, de 1 M. Au fost efectuate
trei masuratori pentru a verifica nivelul de calitate al izolatorilor si au fost obtinute
urmatoarele valori: 24, 29 si 31M, cu media 28M. Gasiti, cu un nivel de incredere
de 96%, intervalul in care se afla rezistenta de izolatie. Dar cu 70%

Pentru nivel de incredere de 96%, Pentru nivel de incredere de 70%,


z* = 2.054, deci z* = 1.036, deci
CI96%= = 28 ± 2.054(1/√3) CI70%= = 28 ± 1.036(1/√3)

= 28 ± 1.18 M = 28 ± 0.6 M

© 2018 Business Future Solutions


Impactul dimensiunii eșantionului
Dispersia in distributia mediilor esantioanelor este dependenta de dimensiunea
esantioanelor.
 Cu cat dimensiunea eșantionului este
mai mare, cu atât deviația standard a distribuției
mediilor eșantioanelor este mai redusa.
 Dar dispersia scade numai cu o rata egala cu √n.

Slide 29 © 2018 Business Future Solutions


Eroarea standard a mediei
Deviația standard pentru distribuția mediilor esantioanelor se
numește eroare standard a mediei si se definește ca :

Unde:
Se = Eroare (abatere) Standard
σ= Deviația standard a populatiei
n = Mărimea eșantionului

Slide 30 © 2018 Business Future Solutions


Eroarea standard
Rata schimbării in Eroarea Standard se apropie de zero la aprox. 30 elemente
in eșantioane.
Eroare standard

0 5 10 20 30
Dimensiune esantion

De aceea 30 de elemente in eșantioane sunt adesea recomandate când se


generează statistici sumare cum ar fi deviația standard si media.
Acesta este si punctul in care distribuțiile t si Z devin aproape echivalente.

Slide 31 © 2018 Business Future Solutions


Dimensiuni eșantion si design experimental
S-ar putea sa aveți nevoie de o anumita marja de eroare (de ex. proba unui
medicament, fabricarea de ochelari). In multe cazuri, variabilitatea populației (s)
este fixa, dar putem alege numărul de măsurători (n).

Astfel planificați dinainte ce dimensiune de eșantion veți folosi pentru a obține


respectiva margine de eroare.

Amintiți-va, totuși, ca dimensiunea eșantionului nu poate fi oricând extinsa


după voința. Exista de obicei costuri si constrângeri asociate cu eșantioane
mari. Abordarea optima este folosirea celei mai mici dimensiuni de eșantion
care va poate oferi rezultate utile.
Slide 32 © 2018 Business Future Solutions
Cresterea preciziei – marja de eroare impusa
O fabrica produce izolatori din ceramica. Deviatia standard a procesului pentru
rezistenta de izolatie, cunoscuta din datele istorice, este de 1 M. E nevoie de a
determina rezistenta electrica a izolatorilor cu o marja de eroare de cel mult 0.4M la
un nivel de incredere de 96%. Stabiliti dimensiunea esantionului si apoi determinati
intervalul de 96% incredere in care se afla rezistenta electrica, presupunand ca
media esantionului este 28M.

Pentru nivel de incredere de 96%, Pentru nivel de incredere de 96%,


z* = 2.054, deci z* = 2.054, deci
CI96%= = 28 ± 2.054(1/√27)
= = 26.37
= 28 ± 0.3952 M

© 2018 Business Future Solutions


Dimensiunea esantionului in studii sociologice

Rezultatele prezentate mai jos fac parte dintr-un studiu desfăşurat între 11-21
noiembrie 2016. Interviurile au fost aplicate prin telefon (metodologie CATI –
Computer Assisted Telephone Interviews). Eşantionul studiului este de 1003
respondenţi.
De unde rezulta?

Studiul este reprezentativ pentru populaţia României cu drept de vot (peste 18


ani), stratificat pe cote de gen, vârstă, educaţie, regiune şi mărimea localităţii
conform datelor din anexă (structura comparabilă cu datele INS).

Marja de eroare a studiului este de +/- 3.1% la un nivel de incredere de 95%.

Slide 34 © 2018 Business Future Solutions


Intervalul de încredere – Exerciţiu

Un test de kilometraj este realizat pentru un model de


mașină nouă "Turbo Duster”. Treizeci (n = 30) mașini
“Turbo Duster” sunt selectate și conduse timp de o lună,
iar kilometrajul este atent măsurat. Media eșantionului este
28,6 Km pe litru (km/l) iar deviația standard a eșantionului
este de 2,2 (km/l). Estimati, cu un interval de încredere de
95%, consumul mediu al noii mașini "Turbo Duster”.

27.81 29.39

© 2018 Business Future Solutions


Sumar
In acest moment, aveți posibilitatea sa:
Explicați termenul “Statistici inferențiale”
Explicați Teorema Limitei Centrale
Descrieți impactul dimensiunii eșantionului asupra
estimărilor realizate de dv. cu privire la parametrii
populației
Explicați eroarea standard
Calculați marjele de eroare si intervalul de
încredere
SFARSIT (THE END)

Slide 36 © 2018 Business Future Solutions


Intrebari

© 2018 Business Future Solutions

S-ar putea să vă placă și