Sunteți pe pagina 1din 42

Curso de Gesto da Informao e do Conhecimento

Mdulo 17: Anlise e Tratamento de Dados Texto 4 Teoria das Probabilidades

Nino Matos da Fonseca

Junho de 2005

INTERESSE DA TEORIA DAS P ROBABILID ADES (I)


A teoria das probabilidades a base sobre a qual assentam no s o clculo da probabilidade de acontecimentos especficos (e.g. a probabilidade de uma pea ser defeituosa) como tambm toda a anlise estatstica propriamente dita (i.e. estatstica indutiva). (i) Como exemplos do clculo da probabilidade de ocorrncia de acontecimentos especficos, temos: A probabilidade de acertar no totoloto jogando com uma nica aposta; A probabilidade de encontrar um televisor defeituoso na produo de uma dada empresa. (ii) Como exemplos de questes, no campo da estatstica indutiva, que s podem ser respondidos atravs da considerao da teoria das probabilidades (bem como das restantes teorias estatsticas), temos: Existem diferenas significativas entre as taxas de absteno nos vrios pases da Unio Europeia em eleies para o Parlamento Europeu? Existem diferenas significativas entre as alturas dos adultos do sexo feminino dos vrios pases da OCDE (Organizao para a Cooperao e Desenvolvime nto)?
2

INTERESSE DA TEORIA DAS P ROBABIL IDADES (II)


Nos exemplos apresentados em (i), relativamente fcil compreender as ligaes teoria das probabilidades. Nos exemplos apresentados em (ii), a ligao menos clara. Para j, bastar ficar com a ideia de que a resposta a qualquer uma daquelas questes pode estar errada (e.g. se a amostra no for representativa). Ou seja, subjacente a qualquer concluso existe uma probabilidade de erro. (pelo menos) a que a teoria das probabilidades vai entrar e ser aplicada. Formalmente, a teoria das probabilidades baseia-se em modelos (i.e. frmulas matemticas) que, a partir do conhecimento da natureza dos dados (quantitativos ou qualitativos) e das caractersticas fundamentais da populao (e.g. mdia e desvio-padro), permitem o clculo (i.e. previso) da ocorrncia de um determinado acontecimento: P(A ) = F(A | , 2 ) , ou seja a probabilidade de ocorrncia do acontecimento A corresponde aplicao da frmula F ao fenmeno A, sendo conhecidas a mdia e a varincia populacionais relativas ao problema em estudo: Exemplo: A = 180cm, = 175cm e s 2 = 6cm.
3

CONCEITOS FUNDAMENTAIS (I)


Parmetros: nmeros que caracterizam as distribuies de frequncias associadas a populaes so constantes. Exemplos: Mdia das alturas de todos os adultos do sexo feminino de Portugal; Percentagem de televisores defeituosos na produo total de uma dada empresa. Estatsticas: nmeros que caracterizam as distribuies de frequncias associadas a amostras variam de amostra para amostra. Exemplos: Mdia das alturas de uma amostra de adultos do sexo feminino de Portugal; Percentagem de televisores defeituosos uma amostra da produo total de uma dada empresa. Experincia aleatria: procedimento que se pode repetir um grande nmero de vezes nas mesmas condies e cujo resultado sempre imprevisvel. Exemplos: Recolha de uma amostra de adultos do sexo feminino da populao portuguesa; Recolha de uma amostra de televisores retirada da produo total de uma dada empresa.

CONCEITOS FUNDAMENTAIS (II)


Acontecimento aleatrio: acontecimento que pode ou no realizar-se durante uma experincia aleatria (idem). Exemplos: Encontrar adultos do sexo feminino com mais de 180cm na populao em estudo; Encontrar televisores defeituosos na produo da empresa. Espao amostral ou espao de resultados: conjunto de todos os resultados possveis de uma experincia aleatria (ibidem). Como exemplos, temos: Amplitude de variao das alturas dos adultos do sexo feminino na populao portuguesa. Televisores defeituosos e televisores no defeituosos.

CONCEITOS FUNDAMENTAIS (III)


Acontecimentos mutuamente exclusivos: acontecime ntos cuja intercepo nula, ou seja, que no podem ocorrer em simultneo. Exemplificando, temos: Ser homem e ser mulher; Ter uma determinada altura ou outra; Sair par ou sair mpar num lanamento de uma moeda honesta. Acontecimento complementar: acontecimento a que correspondem todos os outros acontecimentos excepto aquele em anlise. Como exemplos, temos Se o acontecimento for sair par, o acontecimento complementar ser sair mpar; Se o acontecimento for ter uma altura compreendida entre 155cm e 165cm, o acontecimento complementar ser ter uma altura inferior a 155cm ou superior a 165cm.

DEFINIES DE P ROBABILIDADE
Definio clssica: se um determinado acontecimento A tiver nA casos favorveis sua ocorrncia e N casos possveis, a probabilidade de ocorrncia do acontecimento A dada por

P( A ) =

N. de casos favorveis n A = . N. de casos possveis N

Exemplos: Sair par num lanamento de dados; Sair cara no lanamento de uma moeda; Ter 160cm de altura no contexto da populao portuguesa do sexo feminino; Ter entre 155cm e 165cm no contexto da populao portuguesa do sexo feminino. de notar a semelhana entre esta definio e o conceito de frequncia relativa. Nota: existem outras definies (geomtrica, frequencista e subjectiva Guimares e Cabral, 1998: 74-77). Pelo menos para j, a definio apresentada suficiente.

AXIOMAS E P ROPRIEDADES DA P ROBABILIDADE (I)


A probabilidade de um qualquer acontecimento aleatrio A no mnimo igual a 0 e no mximo igual a 1, ou seja, 0 P(A) 1. Se P( A) = 0 , o acontecimento diz-se impossvel; Se P( A) = 1, o acontecimento diz-se certo. A probabilidade da unio de dois acontecimentos mutuamente exclusivos igual soma das probabilidades desses acontecimentos, ou seja,

P( A B) = P (A) + P(B) .
Exemplos: Sair o 1 e sair o 3 num lanamento de dados. Ter entre 155cm e 165cm e ter mais de 175cm no contexto dos adultos do sexo feminino da populao portuguesa. A probabilidade da unio de n acontecimentos mutuamente exclusivos igual soma das probabilidades desses acontecimentos, ou seja,

P( A1 A2 A3 ... An ) = P (A1 ) + P(A2 ) + P( A3 ) + ... + P( An ) .

AXIOMAS E P ROPRIEDADES DA P ROBABILIDADE (II)


A probabilidade da unio de dois acontecimentos que no so mutuamente exclusivos igual soma das probabilidades desses acontecimentos subtrada da probabilidade da sua intercepo, ou seja,

P( A B ) = P(A) + P(B) P (A B ) .
Exemplo: A = ser do sexo masculino e B = ser fumador (nota: nem todos os fumadores so do sexo masculino). A probabilidade do acontecimento complementar de A dada por,

P(A ) = 1 P( A ) .
Exemplo: A = ser fumador.

PROBABILIDADE CONDICIONAL
A probabilidade de o acontecimento A ocorrer depois da ocorrncia do acontecimento B chama-se probabilidade condicional de A dado B, representa-se por

P( A / B ) e dada por
P( A / B ) =
Exemplo: A = ser estudante trabalhador e B = ser estudante nocturno, sendo

P( A B ) . P (B )

P( A B ) = 0,28

P(B ) = 0,79.
A generalizao da probabilidade condicional corresponde ao teorema de Bayes (que no abordaremos aqui).

10

ACONTECIMENTOS INDEPENDENTES
Os acontecimentos A e B dizem-se independentes quando a probabilidade de realizao de um deles no depende da probabilidade de realizao do outro, ou seja, quando

P( A B) = P(A)P(B ) .
Exemplos: Sair cara em dois lanamentos consecutivos de uma moeda honesta.

11

DISTRIBUIES DE P ROBABILIDADE
Uma distribuio de probabilidade uma funo (i.e. frmula matemtica) que estabelece uma correspondncia entre cada uma das realizaes de uma determinada varivel aleatria e a respectiva probabilidade de ocorrncia. No contexto do estudo das distribuies de probabilidade, usual designar a varivel aleatria por X, o acontecimento por x e a probabilidade de ocorrncia por P( X = x ) (ou, muito simplesmente, P( x ) ). Exemplo: Sendo X a face que fica voltada para cima num la namento de dados, a probabilidade de sair 1 dada por P( X = 1) . No caso da variveis discretas, possvel fazer corresponder um nico valor a P( X = x ). No caso das variveis contnuas verifica-se P( X = x ) = 0 , pelo que apenas nos possvel calcular P(a x b ). Exemplo: Sendo X a altura dos adultos portugueses do sexo masculino, a probabilidade de um adulto ter entre 175cm e 185cm dada por P(175 x 185 ) .

12

DA DISTRIBUIO DE F REQUNCIAS RELATIVAS AO POLGONO DE F REQUNCIAS RELATIVAS (I)


J vimos antes que existe uma relao entre a distribuio de frequncias relativas associada a um determinado fenmeno em estudo e a probabilidade de verificao de um acontecimento. Recordando um exemplo j apresentado (ver Texto 2):
Notas dos alunos da turma A Frequency 1 1 1 2 4 2 1 1 13 2 15 Percent 6,7 6,7 6,7 13,3 26,7 13,3 6,7 6,7 86,7 13,3 100,0 Valid Percent 7,7 7,7 7,7 15,4 30,8 15,4 7,7 7,7 100,0 Cumulative Percent 7,7 15,4 23,1 38,5 69,2 84,6 92,3 100,0

Valid

2 3 5 6 7 8 9 10 Total System

Missing Total

40

30

20

10

0 2 3 5 6 7 8 9 10

Notas dos alunos da turma A 13

DA DISTRIBUIO DE F REQUNCIAS RELATIVAS AO POLGONO DE F REQUNCIAS RELATIVAS (II)


Se a amostra for representativa (ou se ela corresponder populao), a probabilidade de um aluno ter 6 valores corresponde prpria frequncia relativa deste valor. Formalmente, fi (6) = P( x = 6 ) = 0,154 . Graficamente, dita frequncia relativa ou probabilidade corresponde rea relativa segunda coluna (sombreada). Analogamente, aquela rea idntica que fica por baixo do polgono de frequncias:

40

30

20

10

0 2 3 5 6 7 8 9 10

Notas dos alunos da turma A

14

DO POLGONO DE FREQUNCIAS CURVA DE FREQUNCIAS DE DE M OIVRE (I)


medida que o nmero de observaes aume nta e a varivel passa de discreta a contnua, o polgono de frequncias tende a aproximar-se cada vez mais de uma curva simtrica em forma de sino invertido (e, ao mesmo tempo, a probabilidade que acima se pretendia deduzir passa a ser dada por P(5,5 x 6,4 ) - porque a varivel passa a ser contnua). Graficamente (embora com outros exemplos):

Fonte: http://mathworld.wolfram.com/FrequencyCurve.html~

Fonte: http://mathworld.wolfram.com/NormalDistribution.html

15

DO POLGONO DE FREQUNCIAS CURVA DE FREQUNCIAS DE DE M OIVRE (II)


Abraham de Moivre (1667-1754), amigo pessoal de Isaac Newton (pai da Fsica clssica), foi o primeiro matemtico a constatar essa convergncia do comportamento do polgono de frequncias (nota: o teorema do limite central, apresentado mais tarde, permitiu demonstrar que essa convergncia ocorre em quase todos os fenmenos da natureza).

Fonte: http://turnbull.mcs.st-and.ac.uk/~history/PictDisplay/De_Moivre.html

16

DO POLGONO DE FREQUNCIAS CURVA DE FREQUNCIAS DE DE M OIVRE (III)


De Moivre encetou como objectivo deduzir uma expresso matemtica para essa curva, a qual foi primeiramente publicada num panfleto em latim, em 1733 e, mais tarde, na edio de 1756 da sua obra The Doctrine of Chances: A Method of Calculating the Probabilities of Events in Play.

Fonte: http://turnbull.mcs.st-and.ac.uk/~history/Bookpages/DeMoivre10.gif

17

DO POLGONO DE FREQUNCIAS CURVA DE FREQUNCIAS DE DE M OIVRE (IV)


A expresso matemtica da curva de frequncias de De Moivre a seguinte:

Sendo p igual a 3,14159 e exp o nmero de Euler (e = 2,71828). Contudo, a curva de De Moivre tem uma grande limitao: no entra em linha de conta com o facto de que as diferentes distribuies de frequncias tm diferentes localizaes (i.e. mdias) e/ou escalas (i.e. graus de disperso = varincias).

18

DA CURVA DE DE M OIVRE CURVA DE GAUSS (I)


Johann Carl Friedrich Gauss (1777-1855), considerado por muitos como o maior matemtico de todos os tempos, melhorou a curva de De Moivre de forma a ultrapassar aquelas limitaes.

1828

A nova frmula da curva de frequncias, da autoria de Gauss, a seguinte.

Aqui, e s representam, respectivamente a mdia e a varincia populacionais. A curva de frequncias deduzida por Gauss tambm costuma ser designada por curva normal ou curva gaussiana.

19

DA CURVA DE DE M OIVRE CURVA DE GAUSS (II)


A aplicao daquela frmula permite calcular a probabilidade de ocorrncia de qualquer acontecimento da varivel X, desde que sejam conhecidas a mdia e a varincia populacionais. Exemplo: supondo = 7 e s = 5 (implica s = 2,24), temos
2

( x 7) 1 P(5,5 x 6,4 ) = exp 5 , 5 2,24 10 2


6 ,4

d .

Diferentes valores de e s correspondem a diferentes curvas normais:


= 0; s 2 = 0,2

= -2; s 2 = 0,5

= 0; s 2 = 1,0

Fonte: http://en.wikipedia.org/wiki/Image:Normal_distribution_pdf.png

= 0; s 2 = 5,0

20

DA CURVA DE DE M OIVRE CURVA DE GAUSS (III)


Do ponto de vista terminolgico, a expresso de f(x) recebe a designao de funo de densidade de probabilidade (fdp); a expresso de F(x), que permite calcular probabilidades o integral da fdp designa-se funo de distribuio de probabilidade (ou funo de distribuio cumulativa - fdc). A expresso distribuio normal refere-se s fdp e fdc de Gauss. Como qualquer fenmeno em estudo tende para a distribuio normal, para se calcularem probabilidades de acontecimentos especficos, basta: Conhecer a mdia e a varincia da populao; Aplicar a frmula de Gauss relativa a F(x).

21

DA CURVA DE DE M OIVRE CURVA DE GAUSS (IV)


Contudo, Gauss fez mais do que isso. Para evitar construir uma distribuio normal para cada fenmeno, Gauss sugeriu que a varivel X fosse transformada de acordo com a frmula

Depois, torna-se possvel calcular a probabilidade de interesse aplicando sempre a mesma distribuio, dita normal reduzida (que tem = 0 e s = 1). Esta curva corresponde, nem mais nem menos curva de De Moivre! A diferena reside no facto de Gauss sugerir a transformao da varivel em estudo antes do clculo da probabilidade do acontecimento. Exemplo: supondo = 7 e s = 5 (implica s = 2,24), temos
2 2

6,4 7 5,5 7 P(5,5 x 6,4 ) = P Z 2,24 2,24 2 0 , 2362 1 z = P ( 0,6696 z 0,2362) = exp d 0 , 6696 2 2

z
22

DA CURVA DE DE M OIVRE CURVA DE GAUSS (V)


A curva normal tem as seguintes caractersticas: simtrica, unimodal e tem a forma de um sino invertido; completamente caracterizada por dois parmetros: a mdia e a varincia; Se a varivel X tiver mdia e varincia s e se a ela estiver associada uma distribuio normal, dizse que a varivel X segue/tem uma distribuio normal de mdia e varincia s e escreve-se X ~ N(, s ). 68,26% dos valores de X esto dentro do intervalo dado por X s ; 95,44% dos valores de X esto dentro do intervalo dado por X 2s ; 99,73% dos valores de X esto dentro do intervalo dado por X 3s . Dito de outra forma (Guimares e Cabral, 1997: 200), a probabilidade de X tomar valores dentro de cada um dos intervalos , respectivamente,
2 2 2

68,26%, 95,44% e 99,73%.

23

DA CURVA DE DE M OIVRE CURVA DE GAUSS (VI)


de salientar a tremenda utilidade da distribuio normal: com a mdia e a varincia populacionais conhecidas, no necessrio construir a distribuio de frequncias. Basta usar a distribuio normal. Nem sequer necessrio calcular probabilidades com base em diferentes distribuies para variveis com mdias e/ou varincias diferentes. Todas as variveis, depois de transformadas estandardizadas permitem a utilizao de uma nica distribuio normal, a distribuio normal reduzida, cujas mdia e varincia so, respectivamente, 0 e 1: Se X ~ N(, s ) ento Z =
2

X ~ N(0, 1), sempre!

Tambm no necessrio realizar clculos complexos porque existem tabelas que, a cada valor estandardizado, fazem corresponder uma nica probabilidade acumulada (Maroco e Bispo, 2003:313).

24

EXERCCIO N. 3
1. (Maroco e Bispo, 2003:68) Sabendo que o tempo de reaco a um determinado estmulo sonoro (em minutos) uma varivel normal com mdia 5.6 e desvio-padro 1.6, determine a probabilidade de o tempo de reaco ser inferior a 2 minutos. 2. (Adaptado de Murteira, 1990:110) A precipitao anual, em milmetros, no distrito de Beja uma varivel normal com mdia 572 e desvio-padro 136.8. a) Qual a probabilidade de, num determinado ano, a precipitao ser igual ou inferior a 500? b) Qual a probabilidade de, num determinado ano, a precipitao estar compreendida entre 700 e 800? 3. (Adaptado de DHainaut, 1997:124-126) Se numa populao de crianas de uma determinada idade, a mdia da estatura for de 120cm e a varincia de 10cm, entre que limites (simtricos em redor da mdia) se encontram 95% das crianas desta populao? 4. (Ibidem) O que se representa em abcissa e em ordenada numa curva de distribuio? 5. (Ibidem) Numa distribuio normal qual a percentagem de indivduos que obtm uma nota superior mdia? 6. (Adaptado de DHainaut, 1997:141) A distribuio do peso de objectos fabricados em srie tem uma mdia e um desvio-padro, respectivamente, de 988.2 e 9.3 gramas. a) Qual a probabilidade de um objecto, tirado ao acaso, ter um peso compreendido entre 988.2 e 1000 gramas? b) Qual a probabilidade de um objecto, tirado ao acaso, ter um peso compreendido entre 980 e 996 gramas?

25

O TEOREMA DO LIMITE CENTRAL (I)


Trata-se de um dos mais importantes resultados da teoria estatstica. Postula que a distribuio das mdias tende para a normal, mesmo quando a distribuio de onde as mdias foram calculadas seja claramente no normal. Normalmente, dez observaes so suficientes para garantir a obteno de uma distribuio normal (embora seja possvel faz-lo com muitas menos (veja-se o exemplo seguinte).

26

O TEOREMA DO LIMITE CENTRAL (II)


A distribuio de probabilidade da varivel aleatria X (fdp) a seguinte (nota: ni de cada realizao = 2):

A representao da fdp, claramente no normal a seguinte: o o o ------------1 2 3

Consideremos agora as somas possveis das vrias realizaes da varivel X:

A representao da fdp agora dada por o o o o o o o o o ---------------------------2 3 4 5 6

Fonte: http://en.wikipedia.org/wiki/Concrete_illustration_of_the_central_limit_theorem

27

NOTA HISTRICA
Foi De Moivre quem descobriu a expresso matemtica da curva de frequncias. O papel de Gauss consistiu em melhorar dita curva. Contudo, foi ele quem ficou com todos os louros, j que a curva (fdp) e a distribuio que lhe esto associadas (fdc) costumam ser apelidadas, respectivamente, de curva e distribuio gaussiana. A expresso distribuio normal foi cunhada indepe ndentemente por Pierce, Galton e Lexis por volta de 1875. Contudo, trata-se de uma designao algo infeliz, porque encoraja a que se cometa a falcia de que todas as distribuies so normais. De facto, existem muitas distribuies de frequncias que no so normais.

28

UM VISLUMBRE SOBRE A ESTATSTICA I NDUTIVA


Na estatstica indutiva realizam-se testes com o objectivo de comparar valores de variveis aleatrias (e.g. saber se a diferena entre as mdias de duas populaes ou no estatisticamente significativa). Para responder s questes colocadas, necessrio calcular uma estatstica (amostral) dita de teste i.e. aplicar uma frmula que compara as variveis em estudo, para depois calcular qual a probabilidade de aquela diferena assumir determinados valores. O problema que muitas vezes as variveis a que correspondem aquelas estatsticas de teste no seguem distribuies normais. neste contexto que surgem as distribuies qui-quadrado, t de Student e F de Snedecor.

29

DISTRIBUIO QUI-QUADRADO (I)


Suponhamos a varivel aleatria contnua

X = Z 12 + Z 22 + ... + Z k2
onde Z 12 , Z 22 ,..., Z k2 so variveis independentes que seguem distribuies normais reduzi das (i.e de mdia nula e varincia unitria). Esta varivel X (que s assume valores positivos) tem uma distribuio (qui-quadrado) com k graus de liberdade e escreve-se X ~ (k). Dita distribuio completamente caracterizada por um nico parme tro, uma constante inteira e positiva denominada nmero de graus de liberdade (k). Nota: o facto de a distribuio ser completamente caracterizada por k significa que a mdia, a varincia e restantes parmetros de localizao e de disperso apenas dependem de k (e.g. no caso desta distribuio, a mdia igual a k e a varincia igual a 2k).
2 2

30

DISTRIBUIO QUI-QUADRADO (II)


A fdp de uma varivel X com distribuio qui-quadrado dada por

sendo a funo Gama, neste caso, dada por

k + k2 1 t = t e dt . 2 0
Graficamente, a fdp da distribuio qui-quadrado corresponde a
k=1

k=2 k=3 k=4 k=5

Exemplo: sendo X ~ (10), qual a P( X 15,987 ) e qual o valor de X tal que P( X x ) = 0,95 ?
2

31

DISTRIBUIO T DE STUDENT (I)


Suponhamos as variveis aleatrias independentes Z e X, tal que Z ~ N(0, 1) e X ~ (k). A varivel aleatria T (que pode assumir valores negativos, nulos ou positivos), dada por
2

T =

Z . X n

tem uma distribuio t de Student com v graus de liberdade, o que se representa abreviadamente por T ~ t(v). A distribuio t de Student, tal como a distribuio quiquadrado, tambm completamente caracterizada por um nico parmetro constante, inteiro e positivo, os graus de liberdade (v) [nota: mdia igual a 0 e varincia igual a v (v 2 ), para v > 2].

32

DISTRIBUIO T DE STUDENT (II)


A fdp de uma varivel T com esta distribuio dada por

A distribuio t de Student tem a forma da distribuio normal reduzida (embora com extremos mais largos) e converge para esta medida que os graus de liberdade tendem para o infinito. Para n > 30, as curvas normal reduzida e t de Student so quase indistinguveis. Graficamente:

Exemplo: sendo T ~ t(v), qual a P(T 1345 ) e qual o , valor de t tal que P(T t ) = 0,95 ?
33

DISTRIBUIO F DE S NEDECOR (I)


Suponhamos as variveis aleatrias independentes X e Y, tal que X ~ (n) e Y ~ (d).
2 2

A varivel aleatria F (contnua, que s assume valores positivos), dada por

F=

X n , Y d

tem uma distribuio F com (n, d) graus de liberdade o que, abreviadamente, corresponde a F ~ F( n,d ) . Esta distribuio caracterizada por dois parmetros inteiros e positivos, os graus de liberdade do numerador (n) e os graus de liberdade do denominador (d) [nota: mdia igual a d (d 2) e varincia igual a

[2d (n + d 2)]
2

[n (d 2) (d 4 )] .
2

A fdp F de Snedecor dada por

(x) =

(nx ) d (nx + d )
n

d n+ d

n d xB , 2 2

sendo a funo Beta


d n d 1 n 1 1 B , = t 2 (1 t )2 dt . 2 2 0

34

DISTRIBUIO F DE S NEDECOR (II)


Graficamente, a fdp F de Snedecor, para diferentes pares de graus de liberdade, corresponde a:

Exemplo 1: seja F uma varivel com distribuio F de Snedecor com 6 e 5 graus de liberdade (no numerador e no denominador, respectivamente). Qual o valor de P(F 3,4) e qual o valor de f(x) tal que P(F f ) = 0,99 ?

Exemplo 2: seja F uma varivel com distribuio F de Snedecor com (n, d) = (7, 4) graus de liberdade. Qual o valor de F0.01(7,4 ) ?
35

RESUMO (I)
Abraham De Moivre (1867-1754) deduziu a expresso da curva de frequncias. Carl Gauss (1777-1855) deduziu as expresses das curvas normal e normal reduzida, permitindo o clculo de probabilidades sempre com base na mesma distribuio. O teorema do limite central (TLC desenvolvido por vrios autores entre os sculos XIX e XX) permitiu a aplicao da distribuio normal reduzida ao estudo da probabilidade de a mdia de qualquer fenmeno ser igual ou inferior a um dado valor de interesse. Formalmente, este teorema diz-nos que mesmo quando

X ~ i.i.d.( , 2 ) , verifica-se

X ~ N , quando n tende para o infinito, n


2

pelo que

X ~ N (0,1) . 2 n
Assim,

X c X c P(X c ) = P = P . 2 2 n n n n
36

RESUMO (II)
Student, pseudnimo de William Gosset (1876-1937), demonstrou (num trabalho intitulado The Probable Error of Mean, 1908) que em amostras pequenas, as varincias populacional e amostral so muito diferentes, pelo que no correcto aplicar a distribuio normal reduzida. Assim, verdade, de acordo com o TLC, que, em qualquer situao

X ~ N (0,1) n
mas no verdade que

X ~ N (0,1) . s n
Gosset demonstrou que a varivel em questo tem uma distribuio que, mais tarde, atravs de Fisher, passar a receber a designao de distribuio t de Student.

37

RESUMO (III)
Ronald Fisher (1890-1962), amigo pessoal de Gosset, melhorou o trabalho deste num artigo intitulado Applications of Students Distribution (1925).

Em concreto, Apresentou a estatstica t (Gosset tinha apresentado uma estatstica dada por z = x s , sendo x a diferena entre a mdia amostral e o valor de interesse); Simplificou a expresso da fdp da estatstica t; Melhorou a apresentao da tabela de valores da fdc de Gosset.

38

RESUMO (IV)
Ainda no mesmo trabalho, Fisher deu um outro contributo de valor inestimvel: generalizou a aplicao da estatstica t para alm das situaes com interesse para Gosset (essencialmente no campo da qumica, da biologia e da agricultura Gosset trabalhava na Guiness, uma cervejaria, sendo responsvel pelo controlo de qualidade da cevada). Para o efeito, demonstrou que sempre que um numerador tem uma distribuio normal reduzida e um denominador tem uma distribuio qui-quadrado (que j era conhecida), o respectivo quociente segue uma distribuio t de Student. Assim, sempre que se pretender avaliar a probabilidade de uma qualquer mdia ser igual ou inferior a um determinado valor, partindo de valores amostrais, deve-se utilizar a distribuio t de Student (e no a distribuio normal reduzida, excepto se n for grande). Exemplo: qual o valor de P(X 170) , sendo n = 15,

X = 175 e s = 10?

39

RESUMO (V)
George W. Snedecor (1881-1974), baseando-se no trabalho de Fisher, demonstrou que o quociente entre duas variveis que seguem distribuies qui-quadrado (como o caso das varincias amostrais) tem uma distribuio F (o F constitui uma homenagem a Fisher). Esta distribuio particularmente til quando se pretende comparar varincias de populaes diferentes.

40

NOTA FINAL
Existe MUITAS outras distribuies contnuas. Contudo, aquelas aqui apresentadas cobrem a grande maioria das situaes possveis de analisar no campo das cincias sociais e humanas. Igualmente, existem distribuies para variveis quantitativas discretas. Mas, na medida que elas podem ser aproximadas pelas distribuies contnuas agora estudadas, apenas as abordaremos se tal se revelar absolutamente necessrio. As excepes referem-se ao estudo das variveis qualitativas, para as quais a Estatstica No-Paramtrica est especialmente vocacionada. Estud-la-emos mais tarde.

41

REFERNCIAS
AAVV (S.D.) Wikipedia, The Free Encyclopedia. Em linha, acedido em Junho de 2005 e disponvel em http://en.wikipedia.org/wiki/ Main_Page DHAINAUT, L. (1997) Conceitos e Mtodos de Estatstica, Volume I: Uma Varivel a Uma Dimenso, 1 Edio, Fundao Calouste Gulbenkian, Portugal. GUIMARES, R. e Cabral, J. (1997) Estatstica, 1 Edio, McGrawHill, Portugal. MAROCO, J. e Bispo, R. (2003) Estatstica Aplicada s Cincias Sociais e Humanas, 1 Edio, Climepsi, Portugal. MILLER, J., org. (S.D.) Earliest Known Uses of Some of the Words of Mathematics. Em linha, acedido em Junho de 2005 e disponvel em http://members.aol.com/jeff570/mathword.html MURTEIRA, B. (1999) Probabilidades e Estatstica, Volume I, 2 Edio, McGraw-Hill, Portugal. OCONNOR, J. e ROBERTSON, E., org. (2005) The MacTutor History of Mathematics Archive, School of Mathematics and Statistics, University of St Andrews, Scotland. Em linha, acedido em Junho de 2005 e disponvel em http://www-history.mcs.st-an drews.ac.uk/history/

42

S-ar putea să vă placă și