Sunteți pe pagina 1din 10

Gua de estudio Materia: Probabilidad y Estadstica Unidad I. Introduccin a la estadstica.

CONCEPTOS BSICOS DE ESTADSTICA Estadstica Descriptiva: Se dedica a los mtodos de recoleccin, descripcin, visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos pueden ser resumidos numrica o grficamente. Estadstica Inferencial: Se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin de estudio. Poblacin: Coleccin de unidades individuales de las cuales algunas caractersticas son de inters. El objetivo es establecer conclusiones acerca de esa coleccin de unidades o poblacin. (Estatura de los alumnos de la secundaria federal 1 del Estado de Quertaro: 1200 alumnos). Muestra: Porcin de la poblacin que es estudiada con el objetivo de aprender de ella. (Se selecciona aleatoriamente 100 alumnos de la secundaria federal 1 y se registra su estatura). Muestra Aleatoria: Es una muestra al azar. Este tipo de muestra es representativa de la poblacin.

Unidad II. Estadstica descriptiva


MEDIDAS DE TENDENCIA CENTRAL Media: Valor promedio representado por (poblacin) o x barra o testada (muestra). La media se calcula al sumar los valores de un conjunto y al dividir el valor de su suma entre el nmero de valores del mismo. Mediana: Valor medio de lista de datos. La mediana representada por Md o P50, es el valor central de una serie cuando los valores se ordenan segn su magnitud:

X (1/ 2)( n1)


Moda: Valor que ms se repite en la muestra. En ocasiones no es muy til porque puede ocurrir que una distribucin tenga dos o ms valores que se repitan con la misma frecuencia, en tal caso se tienen dos o ms modas, tambin puede ocurrir que no exista ningn valor que se repita y entonces no habr moda. MEDIDAS DE DISPERSIN Rango: Es la diferencia entre el valor mayor y menor del conjunto de datos. Desviacin Estndar: Medida de dispersin de datos con respecto a la media. Es el promedio del valor absoluto de las desviaciones de los datos con respecto a la media. Varianza: El cuadrado de la desviacin estndar. La desviacin estndar presenta grandes ventajas sobre la varianza, pues sus unidades fsicas son las mismas que las de las observaciones, mientras que las de la varianza son unidades fsicas cuadradas.

Coeficiente de Variacin (CV): Es una medida relativa de dispersin. Relaciona la desviacin estndar y la media al expresar la primera como un porcentaje de la segunda.

Poblacin

Muestra

MEDIDAS DE POSICIN Cuartiles. Divide los datos en cuatro partes iguales. Q1, Q2, Q3 y Q4

Deciles. Divide los datos en diez partes iguales. D1, D2,D3.,D10

Percentiles. Divide los datos en cien partes iguales. P1, P2, P3,P100

Ejercicio:

De acuerdo a los siguientes datos calcule: Media, mediana, desviacin estndar, coeficiente de variacin, Q3 y D1.
13.3 14.5 15.3 15.3 14.3 14.8 15.2 14.5 14.6 14.1 14.3 16.1 13.1 15.5 12.6

Media14.5 Mediana14.5 Desviacin Estndar0.91942 CV6.34 Q315.275 D113.1

Diagrama de Caja

Presenta Informacin respecto: Tendencia Central Dispersin Simetra

Lmite Superior Q3+1.5(Q3-Q1)

Media

Lmite Inferior Q3-1.5(Q3-Q1)

Ejercicio

De acuerdo a los siguientes datos construya el diagrama de Caja.


LS= 16.962 Q3=15.275

Media=Mediana=14.5 Q1= 14.15

LI= 13.587

Unidad III. Fundamentos de la teora de la probabilidad


Evento: Es un subconjunto del espacio muestral de un experimento aleatorio. Ejemplo: Sea A el evento definido como la suma de 2 dados sea 10 Sea B el evento de que una pieza salga defectuosa

Unin de 2 eventos. Es el evento que consta de todos los resultados que estn contenidos en cualquiera de los 2 eventos. Se denota como:

Interseccin de 2 eventos. Es el evento que consta de todos los resultados que estn contenidos en los 2 eventos. Se denota como: A B

Complemento de un evento. Es el conjunto de resultados del espacio muestral que no estn en el evento A. Se denota como A

Considerando el rea sombreada del diagrama de Venn se describen las siguientes combinaciones de eventos:

a)

b)

A A B C
B'
c) d)

A BC

A
C

A
C

(A B) C

(A C)'

Definicin. Eventos Mutuamente Excluyentes: Se dice que dos eventos definidos en S, denotados como A y B, tales que A B 0 , son mutuamente excluyentes.
S
A B

Axiomas de Probabilidad. Si S es el espacio muestral aleatorio y A es cualquier evento en un experimento aleatorio: Axioma 1. P(S)=1 Axioma 2. 0<=P(A)<=1 Axioma 3. P(0)=0 Teorema 1 de Probabilidad: Si un experimento puede tener N resultados diferentes igualmente factibles, y si exactamente n de esos resultados corresponden al evento A, entonces la probabilidad de este ltimo es:

P(A)

n |A| N |S|

Ejercicio. En una estacin local de TV se desea contratar a 2 personas, si acuden a la entrevista 3 mujeres y 2 hombres determine: a) El espacio muestral. b) Defina el tamao del evento de contratar a un hombre y a una mujer c) La probabilidad de contratar a un hombre y a una mujer Considere la frmula anterior. Donde: n es el nmero de resultados posibles para el evento A (|A| tamao del evento A) y N es el nmero total de resultados posibles (|S| tamao del espacio muestral). Teorema 2: Si A y B son dos eventos cualquiera entonces:
P( A B) P( A) P( B) P( A B)

P(S)=1 P(A) P(B)

Teorema 3: Si A es el complemento de A entonces:

P( A) P( A' ) 1
P(A) P(A)

Unidad IV .Variables aleatorias discretas y continuas.


VARIABLE ALEATORIA: Es una funcin que asocia un nmero real a cada elemento del espaciomuestral. Es decir son aquellas que pueden diferir de una respuesta a otra. Una variable aleatoria se puede clasificar en: Variable aleatoria discreta. Variable aleatoria continua. Variable aleatoria discreta. Una variable discreta proporciona datos que son llamados datos cuantitativos discretos y son respuestas numricas que resultan de un proceso de conteo. La cantidad de alumnos regulares en un grupo escolar. El nmero de guilas en cinco lanzamientos de una moneda. Nmero de circuitos en una computadora. El nmero de vehculos vendidos en un da, en un lote de autos Variable aleatoria continua. Es aquella que se encuentra dentro de un intervalo comprendido entre dos valores cualesquiera; sta puede asumir infinito nmero de valores y stos se pueden medir. La estatura de un alumno de un grupo escolar. El peso en gramos de una moneda. La edad de un hijo de familia. Las dimensiones de un vehculo.

LA DISTRIBUCION BINOMIAL Esta distribucin fue elaborada por Jacobo Bernoulli y es aplicable a un gran nmero de problemas de carcter econmico y en numerosas aplicaciones como: - Juegos de azar. - Control de calidad de un producto. - En educacin. - En las finanzas. Ejemplo: Si se lanza 4 veces una moneda, calcular el evento "Nmero de guilas que caen." datos:

DISTRIBUCIN UNIFORME Una variable aleatoria X se dice que es uniforme en el intervalo [a, b] si su funcin de densidad es constante dentro de l. La funcin de densidad de la distribucin uniforme es 1 x a f ( x) x a,b F( x ) ba ba Su media y varianza son, respectivamente, ab 1 E( x ) V( x ) (b a) 2 2 12

x (a,b)

Ejemplo, el precio medio del litro de gasolina durante el prximo ao se estima que puede oscilar entre 140 y 160 pesos. Podra ser, por tanto, de 143 pesos., o de 143,4 pesos., o de 143,45 pesos., o de 143,455 pesos, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad. Su funcin de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por: 1 f (x) ab Donde, b: es el extremo superior (en el ejemplo, $160, y a: es el extremo inferior (en el ejemplo, 140 pesos). Por lo tanto, la funcin de distribucin del ejemplo sera: 1 f ( x) 0.05 160 140 , es decir, que el valor final est entre 140 pesos y 141 pesos tiene un 5% de probabilidad, que est entre 141 y 142, otro 5%, etc.

El valor medio de esta distribucin se calcula: (a+b)/2

Unidad V. Variables aleatorias discretas y continuas.


ESTIMACION POR INTERVALOS En muchas situaciones, una estimacin puntual no proporciona informacin suficiente sobre el parmetro. Por esta razn se construyen intervalos de confianza en donde el parmetro que se estima esta contenido con cierta probabilidad llamada coeficiente de confianza. Definicin 1 Un intervalo de confianza es un intervalo que tiene a lo menos un extremo aleatorio y es construdo de manera tal que el parmetro de inters que se estima esta contenido en dicho intervalo con una probabilidad 1 , llamada coeficiente de confianza.

Definicin 2 : Intervalo de confianza para la media con varianza conocida. Si es la media muestral de una muestra aleatoria de tamao n de una poblacin con varianza conocida 2 , un intervalo de confianza para del 100(1 ) por ciento est dado por:

donde Z/ 2 es el punto de la distribucin normal estndar que corresponde al porcentaje / 2 .

Ejemplo: Los datos que a continuacin se dan son los pesos en gramos de contenido de 16 cajas de cereal que se seleccionaron de un proceso de llenado con el propsito de verificar el peso promedio: 506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496. Si el peso de cada caja es una variable aleatoria normal con una desviacin estndar = 5g , obtener los intervalos de confianza estimados del 90, 95 y 99%, para la media de llenado de este proceso. Solucin: Para un coeficiente de confianza del 90%, =0.1. El valor Z 0.95 se obtiene de la tabla de la normal y es igual a 1.645. Por otro lado en base a los datos muestrales, el valor de es de 503.75g. Entonces un intervalo de confianza del 90% para la media del proceso de llenado es

503.75 1.645

o de 501.69 a 505.81. Los otros intervalos de confianza deseados se obtienen siguiendo el mismo procedimiento. Los resultados se encuentran resumidos en la siguiente tabla.

Intervalos de confianza para el ejemplo

PRUEBA DE HIPTESIS Esta tcnica estadstica es muy utilizada como soporte a la investigacin sistemtica y cientfica. Consiste en suponer algn valor para el parmetro de inters y usar los datos de la muestra para aceptar o rechazar esta afirmacin. Es importante entender las diferentes situaciones que pueden ocurrir al probar una hiptesis estadsticamente.

Sea Ho: hiptesis que se propone para el parmetro de inters Si con el resultado de la prueba estadstica rechazamos la hiptesis propuesta sin conocer que era verdadera, entonces cometemos el Error tipo I Si con el resultado de la prueba estadstica aceptamos la hiptesis propuesta sin conocer que era falsa, entonces cometemos el Error tipo II Ambos errores pueden tener consecuencias importantes al tomar una decisin en una situacin real. Por lo tanto es necesario cuantificar la probabilidad de cometer cada tipo de error.

El valor se denomina nivel de significancia de la prueba y puede darse como un dato para realizar la prueba. Algunos valores tpicos para son 10%, 5%, 2%, 1% Terminologa: Ho: Hiptesis nula. Es la hiptesis que se plantea o propone para el parmetro en estudio. Ha: Hiptesis alterna. Es la hiptesis que se plantea en oposicin a Ho y que es aceptada en caso de que Ho sea rechazada.

Ejemplo: Suponer que se desea probar, con algn nivel de significancia que la media poblacional no es igual a 5 Entonces se puede plantear: Ho: = 5 Ha: 5 Si con los datos de la muestra se puede rechazar Ho, entonces habremos probado Ha.

S-ar putea să vă placă și