Sunteți pe pagina 1din 68

del aleman Statistik, y este der. del italiano statista 'hombre de Estado'.

Para actuar acertadamente en el mundo de hoy se requiere, entre otras


cosas, estar educado en cierto pensar estadstico que permita no solo
tener presente o saber buscar resultados anteriores (recopilados en
registros tabulados o en grficos); sino tambin saberlos interpretar y
aplicar adecuadamente en la toma de decisiones Dr. Luis Santal

Llegar el da en el que el pensamiento estadstico ser una condicin


tan necesaria para la convivencia eficiente como la capacidad de leer y
escribir Herbert George Wells

Es transversal a una amplia variedad de disciplinas, desde la fsica hasta


las ciencias sociales, desde las ciencias de la salud hasta el control de
calidad.

Se usa para la toma de decisiones en reas de negocios o instituciones


gubernamentales.

Estadstica Descriptiva: ciencia que se encarga de recolectar, describir e


interpretar datos

Estadstica inferencial: Obtener conclusiones sobre una poblacin a


partir de una muestra.

Para un buen anlisis estadstico se debe 1) definir cuidadosamente la


situacin. 2) Recolectar los datos 3) resumir con precisin los datos 4)
derivar y comunicar informacin significativa.

Conceptos fundamentales:

-Poblacin: Coleccin o conjunto de individuos cuyas caractersticas se


analizaran. Se debe definir cuidadosamente. Finita e infinita. Ej: (f)
alumnos del profesorado en matemtica del isfd Cecilia bravslaski, (I)
cantidad de personas que podran consumir aspirinas.

Cuando el tamao de la poblacin es muy grande se suele tomar una


muestra

-Muestra: Subconjunto de la poblacin La seleccin al de 10 alumnos


del profesorado en matemtica del isfd CB.
-Variable (o variable de respuesta): Una caracterstica de inters acerca
de cada elemento individual, de una poblacin o muestra. Por ejemplo:
Color de cabello de los alumnos del tercer ao del profesorado en
matemtica del isfd CB

-Valor de datos: El valor de la variable asociada con un elemento de la


poblacin o muestra.

-Experimento: Actividad planificada cuyos resultados producen un


conjunto de datos.

-Parametro: Valor numrico que resume los datos de una poblacin.

-Estadistico: Valor numrico que resume los datos de una poblacin.

-Marco muestral: Listado de todos los elementos de la poblacin.

-Tecnicas de muestreo:

- Las muestras puede ser, segn sus caractersticas, probabilsticas o


aleatoreas, o estocsticas o al azar. no probabilsticas

Probabilisticas:

-Muestreo aleatorio simple: Cada elemento de la poblacin tiene las


mismas posibilidades de ser seleccionadas. Se realiza sin reposicin y
consiste en seleccionar n elementos de entre N (n<N), de tal forma que
todas las muetras de tamao n que se puedan formar tengan la misma
posibilidad de ser elegidas.

-Muestreo aleatorio estratificado: Consiste en establecer estratos, es


decir subconjuntos que sean lo ms homogneos posibles, parecidos en
cuanto a las caractersticas mas importantes para la investigacin. Cada
estrato es una suerte de subpoblacin, dentro de la cual se obtendrn
muestras al azar(una dentro de cada estrato).

-Muestreo por conglomerados: consiste en dividir a la poblacin en


subgrupos llamados conglomerados, como por ejemplo barrios, edificios,
municipios, etc. Buscando que cada uno sea representativo de la
poblacin total. En este caso, la variabilidad interna dentro de cada
conglomerado debe ser grande. Luego se selecciona la muestra al azar
de conglomerados, luego una muestra de entre los elementos de cada
conglomerado seleccionado al azar, logrando que la muestra este mas
concentrada.

Muestreo sistematico: Si el tamao de la muestra es n y el de la


poblacin N, se determina un numero k=N/n luego se elige el primer
elemento de la muestra al azar sorteando un numero entre 1 y k, y los
restantes se obtienen sumando k a numero sorteado y asi se continua
hasta completar el tamao muestral.

Clase 2)

Muestras no probabilsticas:

- Muestreo por conveniencia: Se elige una muestra fcilmente


accesible.
- -Muestreo intencional: los miembros son elegidos 1 a 1 por
considerarlos representativos.
- Muestreo por cuota: En este tipo de muestreo se fijan unas
"cuotas" que consisten en un nmero de individuos que renen
unas determinadas condiciones, por ejemplo: 20 individuos de 25
a 40 aos, de sexo femenino y residentes en Campo Grande. Una
vez determinada la cuota se eligen los primeros que se encuentren
que cumplan esas caractersticas. Este mtodo se utiliza mucho en
las encuestas de opinin.
- Muestreo bola de nieve: Se seleccionan algunos individuos que luego
conducen a otros, y luego estos a otros y as sucesivamente.

Las variables y los tipos

Variables es una caracterstica que deseamos observar (medir)

Ejemplos de variables:

-Cantidad de alumnos en carreras cientficas en Argentina.

-Color de cabello de los alumnos de la Esc. 299.

-Presin de aire que soporta un neumtico.

-Estado civil del alumnado del ISFD CB.

-Titulo de los docentes de una escuela.

-Temperatura de un pueblo x en el sur de Argentina a las 10 de la


maana.
-Libros ledos por los alumnos del 3er ao del prof. En matemtica del
isfd CB

-Cantidad de mascotas por familias en A. del Valle.

-Color de remera preferida por los adolescentes de A. del Valle.

-Nivel de organizacin de la esc. N 128.

Las variables, las podemos clasificar dependiendo de ciertos criterios.

Primero, dependiendo de los valores que puede tomar.

A partir de esto, vemos que las variables pueden ser de dos tipos.

-Cualitativas: hacen referencia a una cualidad, a una caracterstica no


numrica.

-Cuantitativa: Son las que se pueden representar por un valor


numrico. Estas, adems pueden ser Discretas o continuas, dependiendo
de los valores que pueden tomar.

A partir de esto, escriban 3 ejemplos de cada tipo de variable siguiendo


lo que entienden de cada una.

Estas variables, adems estn asociadas a ciertos niveles de medicin.

Que es medir: Asignar un nmero a un objeto o evento dependiendo de


ciertas reglas predeterminadas.

-Nivel nominal: Las variables estn representadas por palabras o


nmeros que no reflejan una cantidad sino un nombre.

Por ejemplo, sexo, estado civil, numero de documento.

-Nivel ordinal: Los valores de la variable sirven para establecer un


orden o categora, se las puede ordenar de mayor a menor, se puede dar
la posicin relativa de un dato con respecto a otro, pero sin cuantificar.
Por ejemplo: Grado de acuerdo, categora dentro de un escalafn.

-Nivel intervalar: Permite integrar el concepto de intervalo, es decir


hablar de la distancia entre valores. El cero no es un valor absoluto, es
decir que no indica la ausencia de la propiedad, es una referencia
arbitraria. Por ejemplo: temperatura en grados celcius, CI
-Nivel de razn: El cero es absoluto, es decir que el cero indica la
ausencia de la propiedad. Por ejemplo: peso, altura, distancia.

Podemos adems clasificarlas por su funcin en el estudio:

Independiente y dependiente.

Una vez seleccionada la variable y haber hecho la medicin, tenemos


los datos obtenidos. Ahora necesitamos estudiarlos.

Distribuciones de frecuencias, muestra la variacin de la variables con


sus respectivos valores.
Datos sin agrupar o datos en bruto
Los datos en bruto son los datos recolectados que an no se han
organizado.

Por ejemplo en un estudio, se encuesto a 10 alumnos de una escuela,


preguntndoles por la cantidad de personas que vivan en sus casas. Los
resultados obtenidos fueron:

1;5;2;8;4;3;2;6;2;4.

Tabla de frecuencias:

Es una tabla usada para variables cualitativas, o para variables discretas


con poca variabilidad en sus datos.

Ejemplo: En una escuela, se consult por el color de buzo de preferencia


a 20 alumnos.

Los datos obtenidos fueron:

Blanco=5, verde=8, azul=6, rojo=1.

Color Fi fi Fi%
Blanco 5 Xi/n Xi/n*100
Verde 8
Azul 6
Rojo 1
Totales 20
Fi: Frecuencia acumulada: Nmero de veces que se repite un valor de la
variable

Fi: Razn entre las frecuencias y el total. Indica la proporcin que


representa cada valor de la variable en el total.
Fi%: Frecuencia relativa porcentual: Indica el porcentaje de cada valor en
relacin a la totalidad de los datos.

Si la variable es ordinal, o de un nivel de medicin mayor adems se


pueden calcular la columna de frecuencias acumuladas.

Veamos un ejemplo donde podemos realizar este clculo.

Se realiz un estudio de opinin en CABA, donde a 40 personas se le


consulto por como viajaba en tren, que luego de volcar a una tabla de
frecuencias se obtuvo lo siguiente.

Opinin Fi fri fri% fa


Muy mal 10 10
Mal 5 15
Neutro 13 28
Bien 7 35
Muy bien 5 40
Totales 40

Construccin de tabla en intervalos de clases

Esta tabla, no ser til en el caso de variables discretas con grandes


cantidades de valores, o para variables continuas.

Por ejemplo:

Se midieron las estaturas (en metros) de los familiares concurrentes a un


acto de la escuela y se obtienen los siguientes valores

1,15 1,53 1,21 1,48 1,16 1,59


1,49 1,40 1,86 1,50 1,81 1,52
1,51 1,98 1,48 1,52 1,20 1,37
1,53 1,42 1,16 1,45 1,53 1,73
1,55 1,20 1,62 1,49 1,98 1,01

Los repartiremos en 10 intervalos con una amplitud de 10 cm cada uno,


obteniendo
Estatura Fi fri Fri% fa
[1,00-1,10) 1 1
[1,10-1,20) 3 4
[1,20-1,30) 3 7
[1,30-1,40) 2 9
[1,40-1,50) 6 15
[1,50-1,60) 4 19
[1,60-1,70) 3 22
[1,70-1,80) 3 25
[1,80-1,90) 2 27
[1,90-2,00) 3 30
30
-Fronteras de clase: extremos de cada intervalo, superior (Ls) e inferior
(Li).

-Tamao o amplitud de a clase: diferencia entre las fronteras de clase en


un mismo intervalo de clase Ls-Li=a

-Marca de clase: Punto medio del intervalo de clase. (Ls+Li)/2=xi

Clase 4: PARA OBTENER UNA DISTRIBUCIN EN INTERVALOS DE CLASE


PERFECTA SE SUELE UTILIZAR LOS SIGUIENTES PASOS.

1_ Calcular el Rango.

RANGO=VALmax-VALmin

Rango en nuestro ejemplo: 97-53=44

2_ Determinar el nmero de clases o intervalos de clases. Regla de


Sturges

NI=1+3,322*logn; Siendo n el tamao de la muestra

NI=1+3,322*log80=1+6,32=7,32= NI=7

3_ Amplitud de los intervalos (a)

A=R/NI=44/7=6,28=> a=7

a.Ni=NR=> 7.7=49
Esos 5 valores que sobran es necesario distribuirlos. Podriamos dar
iniciar 3 valores antes del Valinicial y 2 Valores posteriores al inicial.
Quedando los siguientes intervalos de la siguiente forma.

MEDIDAS DE TENDENCIA CENTRAL


Son valores tpicos o representativos de un conjunto de datos. Como
estos valores tpicos tienden a encontrarse en el centro de los conjuntos
de datos, ordenados de acuerdo con su magnitud, se les conoce como
medidas de tendencia central. Se pueden definir varios tipos de
medidas; los ms usados son la media aritmtica, la mediana, la moda,
la media geomtrica y la media armnica. Cada una de ellas tiene
ventajas y desventajas de acuerdo con el tipo de datos y el propsito de
su uso.
LA MEDIA ARITMETICA O PROMEDIO
X=sumatoria de i=1 hasta n de os n valores de x.
Ver en datos brutos, en datos agrupados en tabla de frecuencias y en
tabla de intervalos de clase.

En datos brutos:
Si sobre una vara numerada sin peso, se colocan pesos idnticos sobre
el valor de cada dato, la vara queda en equilibrio cuando se la apoya en
el punto correspondiente a la media.

La media aritmtica para tablas de frecuencia.

La media aritmtica para intervalos de clase.

-La media aritmtica es susceptible a valores extremos.

Por ejemplo.
En una empresa, los sueldos de sus empleados eran

1000, 1200 , 1250, 1300, 8000

-No necesariamente es un valor que tenga sentido en nuestra


distribucin.

Por ejemplo, cantidad de hijos.

0,0,4,3,1,4,2,1,2

1,88

-Utiliza todo el conjunto de datos.

-En un conjunto de nmeros, la suma algebraica de las desviaciones de


estos nmeros respecto a su media aritmtica es cero.

-----Calcular la media de las distribuciones realizadas en la hoja de


trabajo 1.

LA MEDIANA

Es el punto central de los datos, deja la misma cantidad de datos a un


lado como al otro de la misma. El 50% de los datos es menor a la
mediana, y el 50% de los datos es superior a la mediana.

-No esta influida por la presencia de valores extremos.

Calculo de la mediana para datos en bruto.

Primero se debe ordenar la distribucin de menor a mayor o de mayor a


menor.

Calcuamos el ORDEN de la mediana, con n+1/2

En el caso, que la cantidad de datos sea impar, la mediana es el valor


que se encuentra en la posicin obtenida. Si la cantidad de datos es par,
entonces la mediana es la media aritmtica de los dos valores centrales.

Pir ejemplo:

Teniendo el conjunto de datos.

2,6,9,3,5,8,7.

2,3,5,6,7,8,9 Orden de la mediana=7+1/2=4= Me=6


2,3,5,6,7,8. Orden de la mediana=6+1/2=3.5 6+7/2=6,5 Me=6,5

En el caso que la distribuin este en un tabla de frecuencias.

Se busca el valor obtenido en el clculo del orden de la mediana, en la


columna de frecuencias acumuladas. (Ver en tabla de cmo se viaja en
tren)

En el caso de que la distribucin este presentada en intervalos de clase,


se utiliza a siguiente formula.

Me=Li+((n/2-fa(i-1)/fi).a

Donde

-Li: limite inferior de la clse que contiene a la mediana.

-fai-1: Frecuencia acumulada hasta el intervalo anterior al que contiene a


la mediana.

-fi: frecuencia absoluta del intervalo que contiene a la mediana.

-a: amplitud del intervalo.

N: tamao de la muestra.

LA MODA:

La moda o modo es el valor de la variable que ms se repite.

La distribucin puede no tener moda, puede ser unimodal, bimodal o


multimodal (Esto puede respresenta grupos diversos en la poblacin)

Por ejemplo (Ver el de los buzos)


el caso de tablas de frecuencias es el valor de la variable que tiene
mayor frecuencia absoluta.

Y para tabla de intervalos de clase:

Mo=Li+(D1/D1+D2)*a

Li: limite inferior del intervalo modal.

D1: Exceso en la frecuencia modal con respecto al intervalo anterior al


intervalo modal: fi-fi-1

D2: Exceso en la frecuencia modal con respecto al intervalo superior al


intervalo modal: fi-fi+1

A=amplitud

La tabla muestra la distribucin


de edades de un grupo de
personas.

Hallar la media, la mediana y la


moda.
MEDIA GEOMETRICA G

La media geomtrica de un conjunto de datos es la raz n-esima de los


productos de todos los valores.

G=Raiz ensima de X1.X2.Xn

Por ejemplo, dado el conjunto de datos 2, 4 6 8 9.

MEDIA armnica h

La media armnica H de un conjunto de datos es el recproco de la media


aritmtica de los recprocos de los nmeros:

Es decir que H=n/Z 1/x

2,5, 6, 7, 9

Relacin entre media aritmtica, armonica y geomtrica

H<=G<=X
MEDIDAS DE POSICIN

Cuartiles:

Son 3 valores que dividen al conjunto de datos, una vez ordenado de manera
creciente o decreciente, en 4 partes iguales, donde cada una concentra el 25%
de los datos.

Q1 (cuartil 1): Es el valor que deja a su izquierda el 25% de la distribucin.

Q2 (cuartil 2): Es el valor que deja a su izquierda el 50% de la distribucin.

Q3 (Cuartil 3): Es el valor que deja a su izquierda al 75% de la distribucin.

Para calcular los cuartiles

En dator en bruto, o datos en frecuencia ver el orden: kn/4

Qk=Li+(nk/4+fai-1)/fixa

Deciles. El orden es nk/10 con k desde 1 hasta 9

Para los centiles, el orden es nk/100 cn k desde 1 hasta n


Medidas de dispersin

Aclaracin, los estadsticos y los parmetros se identifican mediante smbolos


distintos, generalmente los parmetros son indicados con letras griegas.

La media aritmtica x, es designada por u.

Se tomaron las longitudes de dos conjuntos diferentes de bloques A y B. Las


longitudes de los bloques en el conjunto A fueron 10, 20, 30, 40, 50 y 60 cm. y
las longitudes de los bloques en el conjunto B fueron 10, 10, 10, 60, 60 y 60
cm.

Una MTC es ms representativa si va acompaada de una medida de


dispersin

Las ms utilizadas son.

Rango: distancia entre el menor y el mayor valor que toma la variable.

Rango= Vmax-Vmin

Desvio con respecto a la media: es la distancia de un valor de la variable a la


media aritmticas: DX=xi-X. Indica cuan alejado se encuentra un valor de la
media de la distribucin

Varianza: Es el promedio de los desvos con respecto a la media elevados al


cuadrado.

o^2=Z(xi-X)^2/n

Como la varianza se calcula al cuadrado, el resultado obtenido carece de


sentido, entonces calculamos el desvi estndar. Que es la raz cuadrada de la
varianza.
O=raz o^2

Calcular o de las distribuciones de bloques

La distribucin con mayor desvo estndar es la que tiene valores ms


dispersos, ms heterogneos.

Mtodo corto para la varianza

O^2=Zx/N-u^2 Hacer el desarrollo para datos agrupados, para no confundir la


sumatoria sin la frecuencia

Por ejemplo.

En un grupo de estudiantes se considera el nmero de ensayos que necesita


cada uno para memorizar una lista de seis pares de palabras. Los resultados
fueron: 5 8 3 9 6 7 10 6 7 4 6 9 5 6 7 9 4 6 8 7

En datos muestrales, la varianza, y el desvio estndar o tpico se representa


mediante la letra S.

En algunos casos, suele utilizarse en vez de N, n-1 (Que se le suele llamar


grados de libertad)

Hallar El desvo estndar en las siguientes distribuciones.


Coeficiente de variacin

El coeficiente de variacin es un indicador de la dispersin de los datos


respecto a su promedio. Generalmente se expresa en porcentaje y no tiene
unidad de medida. Cuanto menor sea el coeficiente de variacin, menor ser la
diferencia entre los datos observados y mejor representados estarn por su
promedio

CV=S.100/X

CV=o.100/u

puede comparar una distribucin de alturas de los alumnos con la distribucin


de sus pesos y hablar, entonces, de cual de las dos tiene mayor variabilidad.

OJIVAS

Son graficos que muestran la frecuencia acumulada.


Ordenar los datos en una
tabla de frecuencias. Hallar la
media aritmtica, la moda, la
mediana y el desvo tpico.

Graficar las ojivas acumuladas


y porcentuales.

Grficos estadsticos

Una grfica es un dibujo complementario a una tabla o cuadro, que permite


observar las tendencias de un fenmeno en estudio.

De acuerdo a ciertas caractersticas de la distribucin se usan unos u otros


tipos de grficos. Veremos a continuacin los ms utilizados.
GRAFICO DE BARRAS O COLUMNAS:

Constituido por columnas verticales u horizontales rectangulares de igual


ancho y del mismo color o trazado, que:

conservan igual distancia de separacin entre s, y


la altura de las barras es proporcional a las frecuencias.
Grafico circular o grafico de torta:

Se usa para representar variables en porcentajes, o cifras absolutas cuando el


nmero de variables no es demasiado grande. Para realizar el grfico a mano
es necesario sacar el ngulo que corresponde a cada variable.

Continuemos con el ejemplo de la variable color de buzo de preferencia A los


buzos blancos les corresponde el 25%. Entonces decimos: como a 100%
corresponde un ngulo de 360 grados, entonces a 25% corresponde un ngulo
de (25 % x 360)/100%

Ac hacer la regla de 3 simple para encontrar lo anterior.


Grfico a bastones En el caso de variable Discreta el grfico es a bastones,
como se pretende ilustrar a continuacin. En lugar de barras, aparecen lneas
que representan a las frecuencias.

Pictograma El nmero de frecuencias se representa a travs de dibujos o


unidades pictricas, todas ellas de igual tamao. Son diagramas poco
precisos y, por tanto, escasamente utilizados por los expertos, pero de muy
sencilla interpretacin para los menos entendidos.

Grfico de linea

Generalmente se utiliza para representar la evolucin de la variable a travs


del tiempo (aos, meses, horas, etc.).

Sobre el eje horizontal figuran los perodos de tiempo.


Grafico polar o radial de telraa

Suele utilizarse para ver la evolucin de una variable en el tiempo.

Se divide 360 por la cantidad de valores que toma la variable, determinando


sectores circulares iguales. Luego se trazan circunferencias concntricas con
valores de la variable.

Exportaciones de maz en millones de toneladas.

Meses Fi
Enero 50
Febrero 60
Marzo 50
Abril 55
mayo 70
Junio 75
julio 80
enero

100
julio febrero

50

junio marzo

mayo abril

Histograma

En el caso de variable Continua se utilizan intervalos cuya amplitud debe ser


igual en todos los casos, siempre que esto sea posible. Se construye dibujando
barras contiguas que tienen: como base la amplitud del intervalo y como
alturas las frecuencias respectivas
Puntajes de alumnos en cierto juego de preguntas y respuestas.

Polgonos de frecuencias:

Es similar a un grfico de lneas, pero en este caso se consideran los puntos


medios de las bases superiores de los rectngulos del histograma
correspondiente a la distribucin. El rea encerrada bajo el polgono de
frecuencias es igual o proporcional al tamao de la muestra o poblacin.

Curva de densidad.

Tambin llamado

Si hacemos tender a infinito la cantidad de intervalos, es decir que a tienda a


cero, el polgono de frecuencias determinado tiene a convertirse en una curva,
en la cual podemos analizar ciertas cuestiones.

El rea encerrada bajo la curva es proporcional a la frecuencia de la


distribucin. Esta curva suele llamarse polgono de frecuencias suavizado,
curva de frecuencias o curva de densidad.
100
90
80
70
60
50
40
30
20
10
0
1 2 3 4 5 6 7 8 9

Medidas de asimetra:

Sesgo estndar:

Indica el grado de asimetra de la curva, es decir cuanto se aparta de la


simetra. Permite analizar en que rama de del recorrido de la variable hay
mayor acumulacin de datos sin necesidad de realizar el grafico.

Coeficiente de Karl Pearson:

Vara entre 3 y -3

3.( XMe)
As= S

Si As < 0 la distribucin ser asimtrica negativa.

Si As = 0 la distribucin ser simtrica.

Si As > 0 la distribucin ser asimtrica positiva.


Esta medida solo es til cuando la distribucin es cercana a la simetra y la
moda es igual a la mediana.

a 3=
(xiX )3 . fi
3
n.S

a3 =0 Curva simtrica. X=Me=Mo

a3<0---- Sesgo negativo, o sesgada a la izquierda O ASIMETRICA NEGATIVA.

---Concentracin de valores altos de la variable.

---La X est afectada por valores muy bajos de la variable.

X<Me<Mo

a3>0----- Sesgo positivo o sesgada a la derecha, asimtrica a positiva.

Con cola a la derecha. Concentracin de valores bajos de la variable.

Medidas de apuntalamiento:

Curtosis: Indica cuan puntiaguda es la curva de frecuencias de una distribucin


con respecto a la normal.

a 4=
( xiX )4 . fi
n.S
4 -3

a4=0---- Mesocurtica igual a la normal.

a4<0 Platicurtica------ Los datos estn dispersos, es una distribucin


heterognea.

a4>0 Leptocurtica---- Gran concentracin de los valores alrededor de la X.


Distribucin homognea.9

Covariacin:
Tratamos ahora de dos variables obtenidas en una misma prueba. Por ejemplo:
En un equipo de futbol, interesan tomar las alturas y los pesos de cada
jugador. Se obtienen asi dos datos de un mismo sujeto.

El trmino de covariacin expresa e incluye las siguientes situaciones:

Dependencia causal unilateral: Se da cuando una variable influye a la


otra. Por ejemplo, si relacionamos cantidad de lluvia cada y la asistencia
a clases. La cantidad de lluvia influe sobre la asistencia. Pero la
asistencia no influye en la cantidad de lluvia.
Interdependencia: La influencia de las os variables es recproca. Un
ejemplo clsico es el que vincula los precios con las cantidades
demandadas/ ofrecidas de un bien.
Dependencia indirecta: Cuando dos variables pueden registrar una
covariacin que no es real y que se da porque ambas dependen de una
tercera que ejerce su influencia entre ellas. Por ejemplo: En este decenio
se registra una mayor afluencia al comedor escolar que en el decenio
pasado, y en ese mismo perodo ha aumentado la repitencia escolar.
Esto no quiere decir que la afluencia al comedor escolar haga que mas
alumnos repitan el ao.
Concordancia: Existen casos en los que sabemos que dos variables son
independientes, pero queremos saber si hay cierta concordancia entre
sus valores. Por ejemplo las notas de concepto de los profesores de un
curso.
Covariacin casual: Existen situaciones en las que se observa una
variacin sincronizada entre dos variables, cuya observacin llevara a
concluir que existe una asociacin o dependencia entre las mismas. No
obstante, tal covariacin puede ser totalmente casual o accidental.

Grfico de dispersin:

Consiste en un grafico que representa la relacin entre 2 variables.


Podemos, a partir del grafico sacar algunas conclusiones sobre la relacin entre
las variables.

En el grafico podemos observar una clara relacin entre las dos variables.

Podemos obtener distintos tipos de grficos que representan diferentes


situaciones:

A) Una relacin lineal positiva.

B) una relacin lineal perfecta.

C) Que no haya relacin.

D) Relacin no lineal, tambin llamada curvilinea.

E) relacin lineal negativa.

F) Relacin lineal negativa perfecta. ?


Coeficiente de correlacin lineal.

Interesa conocer aqu, si dos variables estn relacionadas una con la otra, y en
el caso de estarlo, cuan fuerte es esa relacin.

A travs del coeficiente de correlacin. obtenemos un valor numrico que


expresa el grado de correlacin entre las variables.

Medida de Pearson:

x . yX . Y
r= S x . Sy

r es un valor entre 1 y -1.

si /r/=1 la correlacin es perfecta.

Si r=0 no hay correlacin, o la correlacin no es lineal.

El coeficiente de determinacin se obtiene elevando r al cuadrado. Nos brinda


el porcentaje de variacin de la variable y, que esta siendo explicada por la
variable x.

Hacer el ejemplo de las gaseosas.

En en el anlisis de correlacin encontramos un valor que nos indica que tan


fuerte es la relacin entre las variables. Con el anlisis de regresin, se busca
una line que explique de la mejor manera posible a esa relacin

Se podra decir que la produccin


de trigo depende de la cantidad de
fertilizantes que se utilicen en su
produccin?

Anlisis de regresin.

Mtodo de los mnimos cuadrados para hallar la recta de mejor ajuste.

tiene que quedar.

Zy=n.a+b.Zx
Zxy=aZx+bZx2

^y=a+bx

b:coeficiente de regresin.
UNIDAD N 3 PROBABILIDAD

Tipos de experimentos:

-Experimento determinista: aquel que relizado en las mismas condiciones


siempre nos da el mismo resultado. De estos experimentos se ocupa la fsica
clsica.

-Experimento aleatorio: es aquel susceptible a dar varios resultados. Sin poder


predecir de antemano cul de ellos va a producirse en una experiencia
concreta. Por ejemplo.

-Lanzar un dado o una moneda al aire.

-El tiempo de espera del colectivo.

- El nmero de hijos que tendr un matrimonio.

Sucesos elementales:

*Un suceso elemental es un resultado en un experimento aleatorio. Por ejemplo

en el experimento: lanzar un dado.

S1: sacar un 1 S2: sacar un 2.

*Espacio probabilstico o espacio muestral: el conjunto de todos los sucesos


elementales, es decir todos los posibles resultados de un experimento.

Se simboliza con E

Por ejemplo, en el experimento: Lanzar una moneda

S= {C;X

+Evento o suceso: un sub-conjunto del espacio muestral

sea el experimento: lanzar 1 dado.

A=Obtener un N par

A={2,4,6}

Podemos tener 4 tipos de sucesos:

Suceso simple Cumple solo una por ejemplo: sacar un 7


condicion de una baraja espaola
suceso compuesto cumple mas de una sacar un 7 de copas de
condicin una baraja espaola
suceso imposible ningn suceso del Sacar un 7 de corazones
A=O espacio muestral cumple de una baraja espaola
con las condiciones
Suceso cierto Todos los sucesos del Sacar una carta de una
A=E espacio muestral cumple baraja espaola
las condiciones

Tenga en cuenta que los sucesos son conjuntos, por lo tanto valen las
operaciones entre ellos.

Union, interseccin, complemento, diferencia.

experimento: lanzar un dado.

A=numero par

B=mayor a 3

AUB es el conjunto de todos los sucesos elementales que pertenecen a A o a


B.

AUB=numeo par o mayor a 3={2,4,5,6}

AinterB es el suceso formado por los sucesos de A y B

AinterB={4,6}

Diferencia:

A-B=es el conjunto formado por los elementos que pertenecen a A pero no a B.

A-B={2}

Complemento:

A =S-A

A=sacar un numero impar.


Teora clsica de la
probabilidad

P(x)=Nmero de casos favorables/nmero de casos posibles=k/n

A esta definicin de probabilidad se la conoce como probabilidad clsica o de


Laplace.

LA probabilidad de que ocurra un evento o suceso se la suele indicar con p que


es la probabilidad de xito de que ocurra dicho evento.

Su complemento q se le llama la probabilidad de fracaso.

q=P(p)=n-k/n=1-k/n=1-p
Esta definicin de probabilidad es aplicable nicamente cando los sucesos
elementales son equiprobables.

En casos donde esto no ocurre se utiliza la definicin frecuencial de


probabilidad, donde:

Supongamos que se repite n veces el experimento E y sean A y B dos sucesos


asociados con E.

Llamamos na y nb al respectivo nmero de veces que ocurrieron los sucesos A


y B en las n repeticiones entonces

fra=na/n es la frecuencia relativa del evento A en las n repeticiones de E.

fra tiene la siguientes propiedades.

i) 0fra1

ii) fra=1 si A ocurre cada vez en la n repeticiones.

iii) fra=0 si A nunca ocurre en las n repeticiones.

iiii) si A y B son dos sucesos que se excluyen mutuamente y sea f AUB la


frecuencia asociada al suceso AUB entonces f AUB=fA+fB

En estadstica, dada una tabla de frecuencias, la frecuencia relativa es el


cociente entre las apariciones de un suceso A, es decir la frecuencia absoluta y
el tamao muestral n

apariciones del suceso A


FrA= tamao muestral

Si se repiten el experimento infinitas veces, es decir que hacemos ninfinito,


entonces FrA=P(A).

Es decir, que en sentido funcional Fa converge a P(A)

A esta definicin se la llama definicin frecuencial de la probabilidad.

Qu diferencia a la probabilidad de Laplace a esta?

Lancemos una moneda y veamos la frecuencia de que salga cara.


Forma axiomtica de la probabilidad

Tenemos dos tipos de sucesos

* Mutuamente excluyente: es decir que son sucesos que no pueden ocurrir al


mismo tiempo.

Por ejemplo si tomamos dos eventos: casado y soltero. No se puede ser ambos.

Sucesos simultaneeos: son aquellos que pueden ocurrir al mismo


tiempo. Por ejemplo si tomamos los sucesos: mujeres, casadas.

Dados un experimento aleatorio y su correspondiente espacio muestral S

Se llama probabilidad de ocurrencia de un suceso aleatorio A a un nmero real


que cumple los siguientes axiomas.

i) la probabilidad de A es un n R en el intervalo cerrado 0 1, es decir

0P(A)1

ii) Si el suceso aleatorio A es el espacio muestral S entonces la probabilidad de


ocurrencia es 1

A=SP(A)=P(S)=1

iii) Sean A1, A2,An sucesos mutuamente excluyentes de a pares y


pertenecientes al mismo espacio muestral S. La probabilidad de que ocurra
alguno de ellos es igual a la suma de las probabilidades de los Ai. Es decir

Sean Ai y AkCS/ AiAk ik

P(A1oA2oA3ooAk)=P(A1UA2UUAk)=P(A1)+P(A2)+P(A3)++P(Ak)

Que se conoce como la regla aditiva especial.

Veamos en un ejemplo.
Sea E el espacio muestral formado por 15 bolitas de colores, de las cuales son:
6 negras, 5 rayadas y 4 blancas.

Sea A: Sacar una bolita blanca

E: es el espacio muestral

Para obtener la probabilidad de A, se debe realizar el cociente entre la cantidad


de elementos de A dividido entre l cantidad de elementos de E

A 4
P ( A )= =
E 15

Observe que #A<#E y P(A)<1 y adems #A>0 0<P(A)<1

Supongamos ahora el suceso B: sacar una bolita roja.

B 0
P (B)= = =0
E 15

Ademas. Seas S el suceso sacar una bolita

s 15
P ( S )= = =1
E 15

Por lo tanto.

Sea X un suceso incluido en E.

0P(X)1

#X=0 P(X)=0 y es un imposible.

#A=#EP(X)=1 y es una certeza.

Tenga en cuenta que esto no es aplicable a la definicin frecuencial de la


probabilidad.
Probabilidad de dos sucesos

hacer la demostracin para la unin que se llama propiedad aditiva general.

ahora ver el ejemplo de las bolitas.

Cul es la probabiliad de extraer una bolita negra que tenga la letra M?

Cul es la probabilidad de sacar una bolita negra o que tenga la letra M?


en el libo de estadstica para ingenieros. hacer los ejercicios de la pag 47 y 48.:
1; 5; 10; 15

Probabilidad condicional

Hacer el de las bolitas en el pdf unidad 3.

Tenemos 100 bolitas en una urna: 10 bolitas negras y 90 blancas

A: Sacar una bolita negra

B: Sacar una bolita blanca.

Qu ocurre si la seleccin se realiza sin reposicin?

En el primer intento:

P(A)=10/100

P(B)=90/100

Que ocurre si en la primera extraccin saco una bolita negra y qiero volver a
sacar.

P(A)=9/99

P(B)=90/99

Y que ocurre si en la primer extraccin se obtiene una bolita blanca. Cul e la


probabilidad de que en una segunda extraccin la bolita sea negra?
P(A/B)=10/89

P(AB) Probabilidad de que ocurra A, sabiendo que ha ocurrido B, o


probabilidad de A, dado B. Que es una probabilidad condicional.

Tomemos un ejemplo

Supongamos que el espacio muestral S es la poblacin de adultos en una


pequea ciudad que cumplen con los requisitos para obtener un grado en la
facultad. Debemos clasificarlos segn se sexo y situacin laboral.

Empleado Desempleado Totales


Hombre 460 40 500
Mujer 140 260 400
Totales 600 300 900
Uno de estos individuos se seleccionar al azar para que realice un viaje a
travs del pas para promover las ventajas de establecer industrias nuevas en
la ciudad.

Nos interesan que se cumplan los siguientes eventos.

H: el elegido sea hombre.

E: el elegido tenga empleo.

P(H/E)=460/600

Sea nX el nmero de elemento en cualquier conjunto A, podemos escribir:

n(HE)
n(HE) n(S) P( H E)
P ( H E )= = =
n ( E) n ( E) P( E)
n(S)

P(H E)
P ( H E )=
P(E)

P ( H E ) . P(E)=P(H E) Que se conoce como regla multiplicativa

Introduccin al teorema de Bayes.

Particiones:

Dado un espacio muestral S, se pueden realizar particiones Bi en el mismo.


Estas deben cumplir que:
i) B1UB2UUBk=S

ii)BiBj=0 para todo iJ

iii) P(Bi)>0

Consideremos una particin del espacio muestra en k partes. Entonces, para

cualquier suceso A incluido en S. P ( A )= P ( Bi A )= P ( A|Bi ) . P(B i) . tenga

en cuenta que los eventos son mutuamente exluyentes.

Demostracin

en el diagrama de Veen podemos observar


que

A=

( B 1 A ) U ( b 2 A ) U ( B3 A ) U ( B 4 A )U ( B 5 A)

y si queremos calcular

P(A)= P( ( B1 A ) U ( b 2 A ) U ( B 3 A ) U ( B 4 A ) U ( B 5 A )) .

Utilizando la ley aditiva, teniendo en cuenta que son elementos mutuamente


excluyentes nos queda

P ( A )=P ( B 1 A ) + P ( b 2 A )+ P ( B 3 A ) + P ( B 4 A ) P ( B 5 A ) .

Y utilizando la ley multiplicativa tenemos.

P ( A )=P ( B 1 A ) . P ( B 1 )+ P ( b 2 A ) . P ( B 2 ) + P ( B 3 A ) . P ( B 3 ) + P ( B 4 A ) . P ( B 4 ) + P ( B 5 A ) . P ( B 5 )

A esto le la llama teorema de probabilidad total o ley de eliminacin.

Veamoslo en un ejemplo:

En cierta planta de montaje, tres maquinas B1, B2 y B3 montan


respectivamente 30%, $45 y 25% de los productos. A su vez, se sabe que
respectivamente que el 2% el 3% y el 2% de los productos ensamblados por las
maquinas son defencuosos. Ahora, supoga que se selecciona al azar un
producto Cul es la probabilidad de que sea defectuoso?
Tenemos:

A: el producto es defectuoso.

B1: el producto fue ensamblado por la maquina 1.

B2: el producto fue ensamblado por la maquina 2.

B3: el producto fue ensamblado por la maquina 3.

Utilizando el teorema de probabilidad total tenemos.

P(A)=P(AB1).P(B1)+P(AB2).P(B2)+P(AB3).P(B3)=(0,02.0.3)+0,03.0,45+0.02
.0.25=0,006+0,0135+0,005=0,0245

Es decir que la probabilidad de que el producto sea defectuoso es de


2,45%.

Ahora, si en vez de preguntar por A, se quiere saber la probabilidad


condicional P(B3 A). Es decir, que se seleccion un producto de
manera aleatoria y este resulto defectuoso Cul es la probabilidad de
que haya sido producido por la maquina B3? Preguntas de este tipo se
pueden responder utilizando el teorema de Bayes.

Si los eventos B1, B2, ,Bk constituyen una particin del espacio
muestral S, donde P(Bk)0 para 2i=1,2,3,,k Entonces.

A Bi
k

P(). P(Bi)
i=1
P ( A|Bi ) . P(Bi)
P ( Bi| A )=

En nuestro ejemplo, por ejemplo para saber la probabilidad de que el


producto haya sido producido por la maquina 3, siendo que es
defectuoso.

P( A B 3). P( B 3) 0,02.0,25 0,005


P ( B 3| A ) = = = =
P ( A|B 1 ) . P ( B 1 ) + P ( A|B 2 ) . P ( B 2 )+ P ( A|B 3 ) . P(B 3) 0,006+0,0135+0,005 0,0245

Demostracin del teorema:

P( Br A)
P ( Br| A )= Por definicin de probabilidad condicional.
P( A)
Utilizando la ley multiplicativa en el numerador y el teorema de la probabilidad
total en el denominador

P ( A|Br ) . P(Br)
P ( Br| A )=
P ( Bi|A ) . P (B i)

1) La prevalencia de infarto cardaco para hipertensos es del 0,3% y para no


hipertensos del 0,1%. Si la prevalencia de hipertensin en una cierta poblacin
es del 25% Cul es la prevalencia del infarto en esa poblacin?

2) El 2 0% de lo s e mple ado s de una empr e sa so n in ge nier o s y o tr o 2 0%


so n e co no mis tas. El 7 5% de lo s inge nie ro s o cupa n un pue sto dir e cti vo y
e l 50 % de lo s eco no mist as ta mbi n, mie ntras que lo s no in ge nier o s y lo s
no e co no mis tas so lame nte el 20 % o cupa un pue sto dir e cti vo. C ul e s la
pro ba bili dad de que un e mple ado dir e ctivo e le gido al az ar se a inge nie r o?

3 ) En la sala de pe diatr a de un ho spi tal , e l 6 0% de lo s pacie n te s so n


nias . De lo s nio s el 35 % so n me no r e s de 2 4 me se s. El 2 0% de las
nias tie ne n me no s de 2 4 me se s. Un pe dia tra que ingr e sa a la sala
se le ccio na un inf ante al az ar.

a. De te r mine e l valo r de la pro bab ilida d de q ue se a me no r de 2 4 me se s.

b. Si e l infa nte r e sulta se r me no r de 24 me se s. De te r mine la


pro ba bili dad que se a una nia.

Distribuciones de probabilidad

Introduccin.

Variable aleatoria:

Analicemos los siguientes experimentos:


E1: Se tira un dado y se observa el nmero que queda en la cara superior.

E2: Se arroja una moneda 3 veces y se cuenta el nmero de caras obtenidas.

E3: Se fabrican artculos en una lnea de produccin y se cuentan aquellos que


resultan defectuosos.

E4: Se prueba la duracin de una lamparita, anotando el tiempo hasta que se


quema.

La pregunta principal sera Qu tienen en comn todos estos experimentos?

Es posible repetir cada experimento indefinidamente sin cambiar


esencialmente las condiciones. Aunque no podemos indicar cul ser un
resultado particular, podemos describir el conjunto de todos los resultados
posibles del experimento. A medida que el experimento se repite, los
resultados individuales parecen ocurrir de forma caprichosa. Sin embargo,
cuando se repite un gran nmero de veces, aparece un modelo definido de
regularidad. Esta regularidad hace posible la construccin de un modelo
matemtico preciso con el cual analizar el experimento. (Meyer, P.: 1986, p. 8)

Los experimentos que cumplen con las caractersticas enunciadas, se llaman


experimentos aleatorios.

Tomaremos el siguiente experimento

Dado un lote de artculos electrnicos se prueban 3 artculos, donde surge el


siguiente espacio muestral

S={NNN;NND;NDN;NDD;DNN;DND;DDN;DDD} donde N: no defectuoso y D es


defectuoso.

De esta forma se le asiganaran valores a cada uno de los elementos del


espacio muestral 0, 1, 2 o 3 Estos valores, son cantidades aleatorias
determinadas por el resultado del experimento aleatorio.

Se pueden ver como valores que toma la variable aleatoria X, el nmero de


artculos defectuosos cuando se prueban 3 artculos electrnicos.

A partir del ejemplo definiremos a la variable aleatoria como:

Es una cantidad obtenida como resultado de un experimento aleatorio que,


debido al azar, puede tomar distintos valores.

Est definicin es vlida, pero necesitamos exponerla de una manera ms


refinada. Para ello utilizaremos los diagramas de ven correspondientes al
ejemplo para lograr una definicin ms adecuada. trabajamos desde el
concepto de funcin

S(Espacio R (Recorrido [0;1]


muestral) de la
variable)
NNN X f(x)=P(X=xi)
NND 0
NDN
1 1/8
DNN
NDD 3/8
DND 2
DDN
3
DDD

Definimos entonces a la variable aleatoria x, como la funcin que asigna un


valor a cada uno de los elementos del espacio muestral. X:S R

Donde: Dominio X=S, mientras que la imX={0,1,2,3}=R

Encontraos dos posibilidades para las variables aleatorias.

Cuando R es un conjunto numerable (infinito o no) se dice que X es una


variable aleatoria discreta.

Cuando R es un conjunto no numerable, se dice que X es una variable aleatoria


Continua.

La segunda funcin f(x)=P(X=xi) es la que asocia cada valor de la variable


aleatoria X, su respectiva probabilidad. f:imX R

Distribuciones de probabilidad discreta


El conjunto de pares ordenados (x;f(x)) es una funcin de probabilidad, funcin
de masa de probabilidad o distribucin de probabilidad de la variable aleatoria
discreta x, si se cumple que:

i) f(x)0

ii) f ( x ) =1

ii) P(X=xi)=f(x)

Una distribucin de probabilidad discreta suele representarse mediante un


diagrama a bastones.

Siguiendo el ejemplo enunciado, pero pensando en que son 4 los artculos


seleccionados

De una lnea de produccin de cierto dispositivo electrnico, se seleccionan 4 al


azar, para su control. Indicaremos con N el dispositivo que funciona y con D
el defectuoso.

tendramos.

Articulos defectuosos probabilidad


0 1/16
1 4/16
2 6/16
3 4/16
4 1/16

1 2 3 4 5

Distribuciones continuas de probabilidad.

Una VAC tiene una probabilidad 0 de tomar exactamente uno de sus valores,
en consecuencia, su distribucin no puede ser dada de forma tabular. No
podemos trabajar con un valor, sino con un intervalo de valores de nuestra
variable aleatoria.

Por ejemplo: P(a<x<b); P(x>a), etc.

Notese que: P(a<xb)= P(a<x<b)+P(x=b)= P(a<x<b)


Esto significa que en una distribucin continua de probabilidades no importa si
se consideran o no los extremos del intervalo, cosa que no ocurre cuando la
variable es discreta.

A pesar de que la probabilidad no podr ser expresada de manera tabular, es


posible darla a travs de una formula, y dicha frmula necesariamente ser
funcin de la variable aleatoria X. La funcin f(x) para las variables continuas
suele llamarse funcin de densidad de probabilidad, o simplemente funcin de
densidad de X. Como X, se define sobre un espacio muestral continuo, es
posible que f(x) presente un numero finito de discontinuidades aunque no
suele ser el caso de las funciones con aplicaciones estadsticas.

La funcin de densidad, siempre ser positiva, es decir que se desarrolla


siempre sobre el eje x.

La funcin de densidad de probabilidad se construye de tal forma, que el rea


bajo la curva limitada por el eje x sea 1 cuando se calcula en el rango de X
para el cual est definida f(x). Si este rango es limitado, siempre es posible
extenderlo para comprender a todos los nmeros reales, haciendo que f(x)=0
en el intervalo extendido.

El el siguiente grfico, la probabilidad de que a<x<b es el rea bajo la curva,


entre a y b, limitada por el eje x.

Podemos obtener entonces que

Podemos obtener entonces que


b
P ( a< x< b )= f ( x ) dx
a

La fncin f(x) es una funcin de densidad de probabilidad de la variable


aleatoria continua X, definida en el conjunto de los nmeros R si:

i) f(x)0 para todo x, perteneciente a R


+

ii) f ( x ) dx=1

iii) P ( a< x< b )= f ( x ) dx


a

Tengamos en cuenta que f(x) no es una probabilidad, y puede tomar valores


mayores a 1, es simplemente el valor de una funcin en un punto.

Ejemplo:

Suponga que el error en la temperatura de reaccin en C, para un


experimento de laboratorio controlado es una VAD con funcin de densidad
dada por

La distribucin Acumulada de una variable aleatoria continua X esta dada por.


x
F ( x )=P ( X x )= f ( t ) dt

En el ejemplo:

Ejercicio:
Esperanza matemtica o valor medio de la variable aleatoria.

Supongamos el siguiente caso:

En un juego de azar, una persona ganar $5 si, cuando lance tres monedas,
ocurren tres caras o tres cruces, o perder $3 si ocurren una o dos caras. Cul
es el promedio de ganancia que el jugador espera obtener por tirada?

Es el valor promedio, a largo plazo de la variable aleatoria.


Def: Sea X una variable aleatoria con distribucin de probabilidad f(x). La
media o valor esperado esta dada por:
n

Si es discreta =E ( X )= x i . f ( x i )
i=1

Si es continua =E ( X )= x . f ( x ) dx

Varianza y desvo estndar

Sea X una variable aleatoria con distribucin de probabilidad f(x) y media u. La


varianza de la variable aleatoria x o la varianza de la distribucin de
probabilidad de X es:
+
=E [ ( X ) ] = ( x )2 . f ( x ) dx
2 2
si escontinua:

n
2=E [ ( X ) ] = ( x ) . f ( xi )
2 2
si es disceta:
i=1

En tanto que la raz cuadrada de la varianza es el desvo estndar.

Teorema de Chebyshev: La probabilidad de que cualquier variable aleatoria X


tome un valor dentro de k desviaciones estndar de la media es al menos 1-
1/k^2

Algunas distribuciones de probabilidad discreta:

Distribucion uniforme discreta:

Si la variable aleatoria X, toma los valores x1, x2,,xk con idntica


probabilidad entonces la distribucin uniforme discreta esta dada por:

f(x;k)=1/K con x=1, 2, 3 , xk

La distribucin depende del parmetro k.

Por ejemplo la variable obtenida al ver la cara superior de un dado.


f(x;k)=1/6

Teorema:

La media y la varianza de una distribucin uniforme discreta estn dadas por:

Distribucin binomial

Procesos de Bernoulli:

Si se realiza un experimento, el cual consiste en pruebas repetidas con dos


resultados posibles, catalogados como xitos o fracaso este proceso se llama
proceso de Bernoulli y cada ensayo un experimento de Bernoulli.

Debe cumplir ciertos requisitos:

1) El experimento consiste en n pruebas que se repiten.

2) Cada prueba produce un resultado que se puede clasificar como xito o


fracaso.

3) La probabilidad de un xito, que se denota p, permanece constante en cada


prueba.

4) Las pruebas que se repiten son independientes.

Si se cumple esto, estamos ante una distribucin binomial

Def:

Un experimento de Bernoulli puede tener como resultado un xito con


probabilidad p o un fracaso con probabilidad q=1-p. Entonces la distribucin de
probabilidad de la variable aleatoria binomial X, el nmero de xitos en n
pruebas independientes es:
x x n x
b(x;n;p)= Cn . p . q Donde x pertenece a Z/0xn tambin aparece n/x

Esta distribucin recibe su nombre, ya que su funcin de probabilidad es


obtenida a partir del desarrollo del binomio de newton de la forma:r

( p+q)n=C 0n . p 0 . q n0 +C 1n . p1 . qn1 ++C nn . pn . q0


Como p+q=1
n
1=( p+ q) = Cn . p . q
n x x n x
Vemos que =b( x ; n ; p)
x=0

ver los ejemplos del libro de estadstica para ingenieros. pag 132 del pdf.

Teorema:

La media y la Varianza de una distribucin binomial b(x;n;p) estn dadas por.

=n. p 2=n. p . q

Distribucin binomial negativa o de Pascal.

En relacin a los ensayos de Bernoulli, algunas veces nos interesa el nmero de


ensayos en el que ocurre el k-esimo acierto. Por ejemplo, podemos estar
interesados en la probabilidad de que el cuarto nio expuesto a una
enfermedad sea el segundo en contraerla, o bien que el quinto examen que
presente un alumno sea el segundo que repruebe, etc. Existe una distribucin
de probabilidad relacionada con la binomial que se aplica en este tipo de
situaciones y que recibe el nombre de Distribucin Binomial negativa o
distribucin de Pascal.

Una variable aleatoria X, tiene una distribucin binomial negativa o de Pascal,


si y solo si su distribucin de probabilidad est dada por.
k1 k xk
b( x ; k ; p ) =C x1 . p q Para x =k , k +1, k +2,

Estos trminos surgen de la expansin binomial de pk .(1q)k

Por ejemplo:

Si la probabilidad de que un automovilista de cierta ciudad se pase la luz roja


en el momento en que se acaba de poner es de 0,4 Cul es la probabilidad de
que el dcimo conductor que llega a una esquina en el instante en que se
acaba de poner la luz roja sea el tercero en pasarse el alto?

Tenemos. x=10k=3.p=0,4

b( 10 ; 3; 0,4 )=0,645

Teorema:
La media y la varianza de una distribucin binomial negativa estn dadas por:

k kq
= 2= 2
p p

Si consideramos el caso especial de la distribucin binomial negativa donde


k=1, tenemos la distribucin de probabilidades para el nmero de veces que se
debe realizar el experimento para obtener 1 solo xito. nos quedara:

b( x ; 1 ; p )= p q x1

A esta distribucin especial, se la llama distribucin geomtrico porque los


trminos sucesivos forman una progresin geomtrica de razn q

.definicin:

Una variable aleatoria X, obtenida a partir de un proceso de Bernoulli, tiene


una distribucin geomtrica en la que aparece el primer xito y su forma es:

g ( x ; p )= p q x1

Ejemplo:

Se sabe que en cierto proceso de fabricacin, 1 de cada 100 artculos es


defectuoso. Cul es la probabilidad de que el quinto artculo que se
inspecciona sea el primer defectuoso que se encuentra?

p=0,01 x=5

Teorema:

La media y la varianza de una distribucin geomtrica son:

1 q
= 2= 2
p p

Distribucin Hipergeomtrica
La diferencia entre una distribucin binomial y la hipergeomtrica es que la
probabilidad no permanece constante pues el muestreo se realiza sin
reposicin.

1: Se selecciona sin reemplazo una muestra n de una poblacin finita N.

2: k de los N artculos se pueden clasificar como xito y N-k como fracasos.

Ejemplo: Se selecciona al azar un comit de entre 3 qumicos y 5 fsicos. Cul


es la probabilidad de que el comit este integrado por 2 qumicos?

el ejemplo esta en la pag. 140 pdf ingenieros.

Definicin:

La distribucin de probabilidad de la variable aleatoria Hipergeometrica X, el


nmero de xitos en una muestra aleatoria de tamao n que se selecciona de
N artculos de los que k se denominan xitos y N-k fracasos, es:

C kx C Nk
N x
h ( x ; N ;n ;k )= N Con x=1,2,.,n
Cn

Teorema:

La media y la varianza de un distribucin hipergeomtrica h(x;N;n;k) estn


dadas por:

nk 2 Nn k k
= = . n . .(1 )
N N1 N N

Demostracin: realizar la demostracin para la media.

hacer algunos ejercicios.

1) En un estante de un supermercado un cliente observa que slo quedan diez


focos de una oferta, selecciona cuatro para llevarlo a su casa, pero del lote de
diez tres no funcionan. Cul es la probabilidad de que, a) todos los
seleccionados funcionen, b) por lo menos dos no funcionen?

2) Un lote contiene 100 piezas de un proveedor de tubera local y 200 unidades


de un proveedor de tubera del estado vecino. Si se seleccionan cuatro piezas
al azar y sin reemplazo,

(a) cul es la probabilidad de que todas sean del proveedor local?


(b) Cul es la probabilidad de que dos o ms piezas de la muestra sean del
proveedor local?

(c) Cul es la probabilidad de que al menos una pieza de la muestra sea del
proveedor local?

Relacin entre la distribucin binomial y la distribucin hipergeomtrica.

Para el caso en que n sea pequeo comparado con N, la naturaleza de los N


articulas varia muy poco. Por lo que el cociente K/N=p

aqu podemos ver que

nk Nn k k
= =n . p 2=n . p . q . n . .(1 )
N N1 N N

La media es la misma, mientras que la varianza difiere en el factor N-n/N-1 que


para valores altos de N y pequeos de n tiende a 1.

No es necesario que N sea muy grande para cumplirse esta relacin, algunos
autores se refieren a que se puede aproximar la distribucin hipergeometrica
por la binomial cuando N>50 y n es menor al 5% del tamao de N

Ejemplo:

Se estima que 4000 de 10000 votantes de una ciudad estn en contra de un


nuevo impuesto a las ventas. Si se selecciona al azar 15 votantes y se les pide
la opinin. Cul es la probabilidad de que 7 de ellos estn en contra del
impuesto?

Distribucin de Poisson y proceso de Poisson

Los experimentos que dan valores numricos a una variable aleatoria X, el


nmero de resultados que ocurren durante un intervalo de tiempo determinado
o una regin especifica se llaman experimentos de Poison.

Por ejemplo, la variable aleatoria X podra ser: nmero de llamadas telefnicas


que recibe una oficina durante una semana, el nmero de juegos suspendidos
durante una temporada en un deporte, la cantidad de ratas por hectrea en un
campo, el nmero de bacterias en un cultivo, etc.

Un Experimento de Poisson se deriva de un proceso de Poisson y tiene las


siguientes caractersticas:
-el numero de resultados que ocurren en un intervalo o regin especifica son
independientes del numero que ocurren en cualquier otro intervalo o regin del
espacio disjunto. De esta forma vemos que el proceso de Poisson no tiene
memoria

-La probabilidad de que ocurra un solo resultado durante un intervalo de


tiempo o regin muy pequeas es proporcional al intervalo o regin y no
depende del nmero de resultados que ocurren fuera de este intervalo.

-La probabilidad de que ocurra ms de un resultado en tal intervalo o regin


muy pequea es insignificante.

Definicin:

La distribucin de probabilidad de la variable aleatoria de Poisson X, que


representa el numero de resultados que ocurren en un intervalo dado o regin
especifica que se denota con t, esta dado po:

et ( t )x
p ( x ; t ) = x=1,2,3 . es elnmero promedio de resultados por unidad de tiempoo region
x!

lamda es igual a n.p, tamao de la muestra por la probabilidad.

Ejemplo:

Durante un experimento de laboratorio, el nmero promedio de partculas


radiactivas que pasan a travs de un contador en un milisegundo es cuatro.
Cul es la probabilidad de que pasen 6 particulas en un milisegundo dado?

x=6. lamdat: 4

Demostracion de que es una distribucin de probabilidad


x
t x t t 0

p ( x , t )= e x ! t =e t
x!
=e e =e =1

Teorema: Lamedia y la varianza de una distribucin de Poisson p(x; t) es

igual a t

Demostracin: hacemos t =u
LA distribucin de Poisson como forma limitante de la binomial.
Distribuciones continuas de probabilidad.

Distribucin uniforme continua

La funcin de densidad de la variable aleatoria uniforme continua X en el


intervalo [A;B] esta dada por:

1
f ( x ; A ; B )= A x B 0 en todo otro caso
B A

Probar que la integral da 1.

es un rectngulo de base B-A y altura, 1/B-A

Demostrar cada una.

Distribucin Normal.

Entre las distribuciones continuas, la normal es la ms utilizada.

Tambin recibe el nombre de distribucin de Gauss. Y su grafica recibe el


nombre de curva normal, campana de gauss o simplemente curva de gauss.
La funcin de densidad de la variable aleatoria Normal X con media u y
varianza sigma cuadrado, esta dada por
2
1 x
1 2
(

)
n ( x; ; )= .e , con xR
2

Las propiedades que cumple la distribucin normal son:

1) La Moda y la mediana ocurren en el punto mximo de la funcin, que se


obtiene en x=u

2) La curva es simtrica respecto a la recta que pasa por u.

3) La curva normal se acerca de manera asinttica respecto al eje x conforme


los valores d x se alejan de la media en ambas direcciones.

4) La curva tiene sus puntos de inflexin en x=u+-o. Es cncava hacia abajo u-


o<x<u+o. Y convaca hacia arriba en todo otro punto.

5) El rea total bajo la curva y sobre el eje x es igual a 1.

Basandonos en la funcin de densidad de una variable aleatoria normal, nos


encontramos con que existen infinitas distribuciones, dependiendo de los
valores de la media y la varianza. Para simplificar el trabajo, es til unificar
estas distribuciones, de manera que podamos trabjar a todas las distribuciones
normales de una sola manera.

Surge as la idea de la Distribucin Normal Estandar, con media 0 y desvio


estndar 1.

x
Z=

A la distribucin normal con media igual a 0 y desvio igual a 1, se la llama


distribucin normal estndar.

Es necesario el uso de tablas para calcular el rea bajo la curva. tabla pag 36.

Ejemplo:
Aproximacin normal de la binomial.

Con la aproximacin de Poisson vimos que es posible la aproximacin cuando n


es relativamente grande y p muy pequeo, la ventaja de la aproximacin
binomial es que no necesitamos que n sea muy grande o que p sea muy
pequeo, puede ser cercano a inclusive.

Decimos entonces:

Si X es una variable aleatoria binomial nos u=n.p y o^2=n.p.q entonces la


forma limitante de

Xnp
Z=
npq

Conforme n tiende a infinito es la distribucin normal estndar n(z,0,1)

Veamoslo en un ejemplo. Sea una distribucin binomial b(x,15,0,4)


Queremos calcular P(X=4) y P(6<x<9)

Para la aproximacin tendremos que tener el cuenta el rea del rectngulo con
centro en x. es decir que tiene un rea que va de 3,5 a 4,5. y estos valores son
los que vamos a estandarizar. La suma y resta de 0,5 comunmente se le llama
factor de correccin de continuidad.

La aproximacin ser casi perfecta cuando n es grande o cuando p es muy


cercano a

otro ejemplo

Distribuciones muestrales.

Supngase que de una poblacin finita de tamao N > n se extraen, todas las muestras posibles
de tamao n. Si se denota con
x y x respectivamente, a la media y a la desviacin estndar

de una distribucin muestral de las medias, y con y , respectivamente, a la media y la


desviacin estndar poblacionales, entonces
2
x = x =
n2
Distribucin muestral de la diferencia entre 2 medias.

Suponga que tenemos 2 poblaciones, la primera con media u1 y varianza


sigma sub 2 cuadra, y la segunda con media u2 y varianza sigma sub 2
cuadrado, representamos con el estadstico X1 raya

de las cuales se extraen muestras de tamao n1 y n2. Entonces la distribucin


muestral de la diferencia de medias X1-X2 raya, est distribuida
aproximadamente de forma normal con media y varianza dadas por.
2 2

X 1 X 2=12 2x X = 1 + 1 De aquique
1
n1 n2
2

( X 1 X 2) ( 1 2 )
Z=

21 21
+
n1 n2

Es aproximadamente una variable normal estndar.


Distribucin t.

En la plicacin del teorema del limite central del comportamiento de la


distribucin de medias en forma normal, se supone que se conoce a varianza
poblacional. Ahora, en el caso en que este valor se desconosca, se utiliza la
distribucin T, que se define como

Los grados de libertad son el nmero de variables aleatorias independientes de la muestra.

Estimaciones puntuales y por intervalos.

Una estimacin es un procedimiento que nos permite a travs de las medidas


obtenidas de una muestra, calculas los valores poblacionales.

Las medidas que se calculan con los datos extraidos de una muestra se llaman
Estimadores o estadisticosy los correspondientes a la poblacin se llaman
parmetros.

hacer cuadrito de estimacin


proporcin es: el nmero de individuos que cumple con una determinada
condicin sobre el total de la poblacin.

Es decir: Con los estimadores muestrales inferimos los parmetros


poblacionales.

Una estimacin puede hacerse de manera puntual y por intervalos.

Estimacin puntual.

Realizar una estimacin puntual es dar un nico valor como posible parmetro
poblacional.

Es decir, se toma una muestra de la poblacin y aplicando cierta frmula, se


obtiene una estimacin puntual del parmetro. Podemos decir, entonces, que
el estimador es una funcin de las observaciones de la muestra.

Estimacin por intervalos.

Esta estimacin, a diferencia de la anterior, consiste en obtener un intervalo,


que tiene una cierta probabilidad de contener al verdadero valor del
parmetro. Este intervalo puede construirse para diferentes parmetros: la
media poblacional u, el desvo estndar poblacional sigma, la proporcin
poblacional P.

Siendo un intervalo, la estimacin no se limita a un solo valor numrico, sino que


se estima mediante un rango de valores con cierta confianza
La estimacin por intervalo de confianza se realiza mediante un intervalo
aleatorio, determinado por un lmite inferior y un lmite superior. Estos lmites
son variables que dependen de elementos tales como, el tamao de la muestra
(n) y el nivel de confianza que se simboliza con 1- alfa.

Dado un parmetro poblacional decimos que

P(a< < b)=(1- ).100%

Cabe sealar que:


Para un mismo tamao de muestra n, si deseamos aumentar el nivel de
confianza, aumentar la amplitud del intervalo, es decir, que la precisin
disminuye.
Para una misma confianza 1- , si aumentamos el tamao de la muestra n,
disminuir la amplitud del intervalo; o sea, que aumenta la precisin (observe
que .n. se encuentra en los denominadores dentro del intervalo de confianza).
Para tener una confianza del 100%, hay dos alternativas: trabajar con toda la
poblacin, no con una muestra; o bien, trabajar con el intervalo (- ; + ), lo cual
no tendra ninguna utilidad.
Una sola muestra: Estimacin de la media.

La media muestral se utiliza como una estimacin de de la media poblacional.


Si la muestra se selecciona de una poblacin normal, o ante la falta de esto con
n suficientemente grande podemos establecer un intervalo de confianza para
mu considerando la distribucin muestral de medias x raya. Que de acuerdo al
teorema del lmite central nos dice que se distribuye normalmente con media u
sub aquis raya igua a mu, y sigma sub equis igual a sigma sobre raz de n.

P z Z z =1
Partimos de ( 2 2
)
De aqu que si deseamos buscar cual es el tamao de una muestra para tener
z /2 2
un error menor que un valor e tenemos que n=( )
e

En el caso en que no se conozca la desviacin estndar de la muestra,


podemos utilizar el desvio estndar de una muestra, y utilizando T estimar
igualmente la media de la poblacin.
Sabemos que la variable aleatoria T tiene una distribucin t con v=n-1 grado
de libertad.

Podemos entonces construir un intervalo de confianza para mu.

El proceso de construccin es el mismo, solo que sigma se reemplaza por S, y


la distribucin normal estndar por t.

P t T t =1
( 2 2
)
de donde

S S
(
P X t X + t =1
n
2
n 2
)

Tengamos en cuenta, que la distribucin t se supone extrada de una poblacin


normal, en el caso en que la poblacin no fuera normal, la muestra debera ser
mayor a 30, para lograr una buena aproximacin.
Para encontras t sub alfa sobre 2 se hace 1 menos alfa sobre dos. y se busca
en la tabla el valor correspondiente.

Dos muestras: estimacin de la diferencia de medias.

Podemos encontrar 2 casos, cuando se conoce y cuando se desconoce el


desvio estndar poblacional.

Si se conoce, se estima el intervalo utilizando una distribucin normal para


encontrar el intervalo de confianza.

S-ar putea să vă placă și