Documente Academic
Documente Profesional
Documente Cultură
Junho de 2005
DEFINIES DE P ROBABILIDADE
Definio clssica: se um determinado acontecimento A tiver nA casos favorveis sua ocorrncia e N casos possveis, a probabilidade de ocorrncia do acontecimento A dada por
P( A ) =
Exemplos: Sair par num lanamento de dados; Sair cara no lanamento de uma moeda; Ter 160cm de altura no contexto da populao portuguesa do sexo feminino; Ter entre 155cm e 165cm no contexto da populao portuguesa do sexo feminino. de notar a semelhana entre esta definio e o conceito de frequncia relativa. Nota: existem outras definies (geomtrica, frequencista e subjectiva Guimares e Cabral, 1998: 74-77). Pelo menos para j, a definio apresentada suficiente.
P( A B) = P (A) + P(B) .
Exemplos: Sair o 1 e sair o 3 num lanamento de dados. Ter entre 155cm e 165cm e ter mais de 175cm no contexto dos adultos do sexo feminino da populao portuguesa. A probabilidade da unio de n acontecimentos mutuamente exclusivos igual soma das probabilidades desses acontecimentos, ou seja,
P( A B ) = P(A) + P(B) P (A B ) .
Exemplo: A = ser do sexo masculino e B = ser fumador (nota: nem todos os fumadores so do sexo masculino). A probabilidade do acontecimento complementar de A dada por,
P(A ) = 1 P( A ) .
Exemplo: A = ser fumador.
PROBABILIDADE CONDICIONAL
A probabilidade de o acontecimento A ocorrer depois da ocorrncia do acontecimento B chama-se probabilidade condicional de A dado B, representa-se por
P( A / B ) e dada por
P( A / B ) =
Exemplo: A = ser estudante trabalhador e B = ser estudante nocturno, sendo
P( A B ) . P (B )
P( A B ) = 0,28
P(B ) = 0,79.
A generalizao da probabilidade condicional corresponde ao teorema de Bayes (que no abordaremos aqui).
10
ACONTECIMENTOS INDEPENDENTES
Os acontecimentos A e B dizem-se independentes quando a probabilidade de realizao de um deles no depende da probabilidade de realizao do outro, ou seja, quando
P( A B) = P(A)P(B ) .
Exemplos: Sair cara em dois lanamentos consecutivos de uma moeda honesta.
11
DISTRIBUIES DE P ROBABILIDADE
Uma distribuio de probabilidade uma funo (i.e. frmula matemtica) que estabelece uma correspondncia entre cada uma das realizaes de uma determinada varivel aleatria e a respectiva probabilidade de ocorrncia. No contexto do estudo das distribuies de probabilidade, usual designar a varivel aleatria por X, o acontecimento por x e a probabilidade de ocorrncia por P( X = x ) (ou, muito simplesmente, P( x ) ). Exemplo: Sendo X a face que fica voltada para cima num la namento de dados, a probabilidade de sair 1 dada por P( X = 1) . No caso da variveis discretas, possvel fazer corresponder um nico valor a P( X = x ). No caso das variveis contnuas verifica-se P( X = x ) = 0 , pelo que apenas nos possvel calcular P(a x b ). Exemplo: Sendo X a altura dos adultos portugueses do sexo masculino, a probabilidade de um adulto ter entre 175cm e 185cm dada por P(175 x 185 ) .
12
Valid
2 3 5 6 7 8 9 10 Total System
Missing Total
40
30
20
10
0 2 3 5 6 7 8 9 10
40
30
20
10
0 2 3 5 6 7 8 9 10
14
Fonte: http://mathworld.wolfram.com/FrequencyCurve.html~
Fonte: http://mathworld.wolfram.com/NormalDistribution.html
15
Fonte: http://turnbull.mcs.st-and.ac.uk/~history/PictDisplay/De_Moivre.html
16
Fonte: http://turnbull.mcs.st-and.ac.uk/~history/Bookpages/DeMoivre10.gif
17
Sendo p igual a 3,14159 e exp o nmero de Euler (e = 2,71828). Contudo, a curva de De Moivre tem uma grande limitao: no entra em linha de conta com o facto de que as diferentes distribuies de frequncias tm diferentes localizaes (i.e. mdias) e/ou escalas (i.e. graus de disperso = varincias).
18
1828
Aqui, e s representam, respectivamente a mdia e a varincia populacionais. A curva de frequncias deduzida por Gauss tambm costuma ser designada por curva normal ou curva gaussiana.
19
d .
= -2; s 2 = 0,5
= 0; s 2 = 1,0
Fonte: http://en.wikipedia.org/wiki/Image:Normal_distribution_pdf.png
= 0; s 2 = 5,0
20
21
Depois, torna-se possvel calcular a probabilidade de interesse aplicando sempre a mesma distribuio, dita normal reduzida (que tem = 0 e s = 1). Esta curva corresponde, nem mais nem menos curva de De Moivre! A diferena reside no facto de Gauss sugerir a transformao da varivel em estudo antes do clculo da probabilidade do acontecimento. Exemplo: supondo = 7 e s = 5 (implica s = 2,24), temos
2 2
6,4 7 5,5 7 P(5,5 x 6,4 ) = P Z 2,24 2,24 2 0 , 2362 1 z = P ( 0,6696 z 0,2362) = exp d 0 , 6696 2 2
z
22
23
Tambm no necessrio realizar clculos complexos porque existem tabelas que, a cada valor estandardizado, fazem corresponder uma nica probabilidade acumulada (Maroco e Bispo, 2003:313).
24
EXERCCIO N. 3
1. (Maroco e Bispo, 2003:68) Sabendo que o tempo de reaco a um determinado estmulo sonoro (em minutos) uma varivel normal com mdia 5.6 e desvio-padro 1.6, determine a probabilidade de o tempo de reaco ser inferior a 2 minutos. 2. (Adaptado de Murteira, 1990:110) A precipitao anual, em milmetros, no distrito de Beja uma varivel normal com mdia 572 e desvio-padro 136.8. a) Qual a probabilidade de, num determinado ano, a precipitao ser igual ou inferior a 500? b) Qual a probabilidade de, num determinado ano, a precipitao estar compreendida entre 700 e 800? 3. (Adaptado de DHainaut, 1997:124-126) Se numa populao de crianas de uma determinada idade, a mdia da estatura for de 120cm e a varincia de 10cm, entre que limites (simtricos em redor da mdia) se encontram 95% das crianas desta populao? 4. (Ibidem) O que se representa em abcissa e em ordenada numa curva de distribuio? 5. (Ibidem) Numa distribuio normal qual a percentagem de indivduos que obtm uma nota superior mdia? 6. (Adaptado de DHainaut, 1997:141) A distribuio do peso de objectos fabricados em srie tem uma mdia e um desvio-padro, respectivamente, de 988.2 e 9.3 gramas. a) Qual a probabilidade de um objecto, tirado ao acaso, ter um peso compreendido entre 988.2 e 1000 gramas? b) Qual a probabilidade de um objecto, tirado ao acaso, ter um peso compreendido entre 980 e 996 gramas?
25
26
Fonte: http://en.wikipedia.org/wiki/Concrete_illustration_of_the_central_limit_theorem
27
NOTA HISTRICA
Foi De Moivre quem descobriu a expresso matemtica da curva de frequncias. O papel de Gauss consistiu em melhorar dita curva. Contudo, foi ele quem ficou com todos os louros, j que a curva (fdp) e a distribuio que lhe esto associadas (fdc) costumam ser apelidadas, respectivamente, de curva e distribuio gaussiana. A expresso distribuio normal foi cunhada indepe ndentemente por Pierce, Galton e Lexis por volta de 1875. Contudo, trata-se de uma designao algo infeliz, porque encoraja a que se cometa a falcia de que todas as distribuies so normais. De facto, existem muitas distribuies de frequncias que no so normais.
28
29
X = Z 12 + Z 22 + ... + Z k2
onde Z 12 , Z 22 ,..., Z k2 so variveis independentes que seguem distribuies normais reduzi das (i.e de mdia nula e varincia unitria). Esta varivel X (que s assume valores positivos) tem uma distribuio (qui-quadrado) com k graus de liberdade e escreve-se X ~ (k). Dita distribuio completamente caracterizada por um nico parme tro, uma constante inteira e positiva denominada nmero de graus de liberdade (k). Nota: o facto de a distribuio ser completamente caracterizada por k significa que a mdia, a varincia e restantes parmetros de localizao e de disperso apenas dependem de k (e.g. no caso desta distribuio, a mdia igual a k e a varincia igual a 2k).
2 2
30
k + k2 1 t = t e dt . 2 0
Graficamente, a fdp da distribuio qui-quadrado corresponde a
k=1
Exemplo: sendo X ~ (10), qual a P( X 15,987 ) e qual o valor de X tal que P( X x ) = 0,95 ?
2
31
T =
Z . X n
tem uma distribuio t de Student com v graus de liberdade, o que se representa abreviadamente por T ~ t(v). A distribuio t de Student, tal como a distribuio quiquadrado, tambm completamente caracterizada por um nico parmetro constante, inteiro e positivo, os graus de liberdade (v) [nota: mdia igual a 0 e varincia igual a v (v 2 ), para v > 2].
32
A distribuio t de Student tem a forma da distribuio normal reduzida (embora com extremos mais largos) e converge para esta medida que os graus de liberdade tendem para o infinito. Para n > 30, as curvas normal reduzida e t de Student so quase indistinguveis. Graficamente:
Exemplo: sendo T ~ t(v), qual a P(T 1345 ) e qual o , valor de t tal que P(T t ) = 0,95 ?
33
F=
X n , Y d
tem uma distribuio F com (n, d) graus de liberdade o que, abreviadamente, corresponde a F ~ F( n,d ) . Esta distribuio caracterizada por dois parmetros inteiros e positivos, os graus de liberdade do numerador (n) e os graus de liberdade do denominador (d) [nota: mdia igual a d (d 2) e varincia igual a
[2d (n + d 2)]
2
[n (d 2) (d 4 )] .
2
(x) =
(nx ) d (nx + d )
n
d n+ d
n d xB , 2 2
34
Exemplo 1: seja F uma varivel com distribuio F de Snedecor com 6 e 5 graus de liberdade (no numerador e no denominador, respectivamente). Qual o valor de P(F 3,4) e qual o valor de f(x) tal que P(F f ) = 0,99 ?
Exemplo 2: seja F uma varivel com distribuio F de Snedecor com (n, d) = (7, 4) graus de liberdade. Qual o valor de F0.01(7,4 ) ?
35
RESUMO (I)
Abraham De Moivre (1867-1754) deduziu a expresso da curva de frequncias. Carl Gauss (1777-1855) deduziu as expresses das curvas normal e normal reduzida, permitindo o clculo de probabilidades sempre com base na mesma distribuio. O teorema do limite central (TLC desenvolvido por vrios autores entre os sculos XIX e XX) permitiu a aplicao da distribuio normal reduzida ao estudo da probabilidade de a mdia de qualquer fenmeno ser igual ou inferior a um dado valor de interesse. Formalmente, este teorema diz-nos que mesmo quando
X ~ i.i.d.( , 2 ) , verifica-se
pelo que
X ~ N (0,1) . 2 n
Assim,
X c X c P(X c ) = P = P . 2 2 n n n n
36
RESUMO (II)
Student, pseudnimo de William Gosset (1876-1937), demonstrou (num trabalho intitulado The Probable Error of Mean, 1908) que em amostras pequenas, as varincias populacional e amostral so muito diferentes, pelo que no correcto aplicar a distribuio normal reduzida. Assim, verdade, de acordo com o TLC, que, em qualquer situao
X ~ N (0,1) n
mas no verdade que
X ~ N (0,1) . s n
Gosset demonstrou que a varivel em questo tem uma distribuio que, mais tarde, atravs de Fisher, passar a receber a designao de distribuio t de Student.
37
RESUMO (III)
Ronald Fisher (1890-1962), amigo pessoal de Gosset, melhorou o trabalho deste num artigo intitulado Applications of Students Distribution (1925).
Em concreto, Apresentou a estatstica t (Gosset tinha apresentado uma estatstica dada por z = x s , sendo x a diferena entre a mdia amostral e o valor de interesse); Simplificou a expresso da fdp da estatstica t; Melhorou a apresentao da tabela de valores da fdc de Gosset.
38
RESUMO (IV)
Ainda no mesmo trabalho, Fisher deu um outro contributo de valor inestimvel: generalizou a aplicao da estatstica t para alm das situaes com interesse para Gosset (essencialmente no campo da qumica, da biologia e da agricultura Gosset trabalhava na Guiness, uma cervejaria, sendo responsvel pelo controlo de qualidade da cevada). Para o efeito, demonstrou que sempre que um numerador tem uma distribuio normal reduzida e um denominador tem uma distribuio qui-quadrado (que j era conhecida), o respectivo quociente segue uma distribuio t de Student. Assim, sempre que se pretender avaliar a probabilidade de uma qualquer mdia ser igual ou inferior a um determinado valor, partindo de valores amostrais, deve-se utilizar a distribuio t de Student (e no a distribuio normal reduzida, excepto se n for grande). Exemplo: qual o valor de P(X 170) , sendo n = 15,
X = 175 e s = 10?
39
RESUMO (V)
George W. Snedecor (1881-1974), baseando-se no trabalho de Fisher, demonstrou que o quociente entre duas variveis que seguem distribuies qui-quadrado (como o caso das varincias amostrais) tem uma distribuio F (o F constitui uma homenagem a Fisher). Esta distribuio particularmente til quando se pretende comparar varincias de populaes diferentes.
40
NOTA FINAL
Existe MUITAS outras distribuies contnuas. Contudo, aquelas aqui apresentadas cobrem a grande maioria das situaes possveis de analisar no campo das cincias sociais e humanas. Igualmente, existem distribuies para variveis quantitativas discretas. Mas, na medida que elas podem ser aproximadas pelas distribuies contnuas agora estudadas, apenas as abordaremos se tal se revelar absolutamente necessrio. As excepes referem-se ao estudo das variveis qualitativas, para as quais a Estatstica No-Paramtrica est especialmente vocacionada. Estud-la-emos mais tarde.
41
REFERNCIAS
AAVV (S.D.) Wikipedia, The Free Encyclopedia. Em linha, acedido em Junho de 2005 e disponvel em http://en.wikipedia.org/wiki/ Main_Page DHAINAUT, L. (1997) Conceitos e Mtodos de Estatstica, Volume I: Uma Varivel a Uma Dimenso, 1 Edio, Fundao Calouste Gulbenkian, Portugal. GUIMARES, R. e Cabral, J. (1997) Estatstica, 1 Edio, McGrawHill, Portugal. MAROCO, J. e Bispo, R. (2003) Estatstica Aplicada s Cincias Sociais e Humanas, 1 Edio, Climepsi, Portugal. MILLER, J., org. (S.D.) Earliest Known Uses of Some of the Words of Mathematics. Em linha, acedido em Junho de 2005 e disponvel em http://members.aol.com/jeff570/mathword.html MURTEIRA, B. (1999) Probabilidades e Estatstica, Volume I, 2 Edio, McGraw-Hill, Portugal. OCONNOR, J. e ROBERTSON, E., org. (2005) The MacTutor History of Mathematics Archive, School of Mathematics and Statistics, University of St Andrews, Scotland. Em linha, acedido em Junho de 2005 e disponvel em http://www-history.mcs.st-an drews.ac.uk/history/
42