Sunteți pe pagina 1din 43

Estudio de la estadstica

La probabilidad de que un hecho ocurra o no un hecho partiendo de las


diferentes variables existentes .En sus comienzos la estadstica tena como
funcin registrar caractersticas o acontecimientos que fueron de inters para
los gobernantes de un territorio , este registro de datos por lo general se refiere
a la poblacin y a la riqueza existente en ella , un segundo estudio surge en
pocas ms recientes por la necesidad de estudiar algunos aspectos ms
particulares de la poblacin como por ejemplo :nacimientos ,muertes ,etc.
para estimar tazas de mortalidad por edad en la poblacin realizando los
primeros censos en Europa todos estos trabajos estadsticos eran descriptivos ,
el verdadero origen de la estadstica moderna puede situarse en la ltima
dcada del siglo XIX como el resultado de la unin de dos disciplinas como
es el clculo de probabilidades y la teora matemtica por ,lo tanto la
estadstica estudia la descripcin de los datos aplicando las ciencias como la
fsica , la antropologa, la medicina, la ingeniera ,la agronoma, la sociologa, la
economa convirtindose la estadstica en un instrumento de anlisis para todo
tipo de estudio y aplicaciones de las dems ciencias.
Definicin
Etimolgicamente proviene del vocablo latn status que significa estado porque
fueron los estados los principales en emplearlo ,por primera vez la palabra
estadstica fue utilizada en 1749 por el profesor dela universidad Godofredo
Achenwall ,son muchos los autores que han dado una definicin de estadstica
escogeremos tres como:
Definiciones de estadstica

Conrado Gun: define a la estadstica como una tcnica especial apta


para el estudio cuantitativo de los fenmenos en masa o colectivos.
Manuel Berlanga Barba: dice que la estadstica es la disciplina dedicada
a medir y analizar los hechos por medio de nmeros investigando a la
vez las relaciones existentes entre las mismas.
Cohen y Crompton: la estadstica es la recopilacin, anlisis,
presentacin e interpretacin de los datos numricos.

Objetivo
Estudiar las caractersticas y el comportamiento de cierto grupo de elementos
de un conjunto considerado como universo a partir de otros ms pequeos
llamados muestras para luego ser recopilados presentados, ordenados y
analizados para poder emitir conclusiones de lo que sucede en el presente o de
lo que puede ocurrir en el futuro.
Aplicacin

Todas las ciencias de una u otra forma aplican la estadstica, el empresario, el


industrial o el hombre de negocios; en general lo utilizan ya sea para el anlisis
financiero en eventos, o los procesos de produccin de investigacin del
mercado, para el grado de aceptacin.
Importancia
La importancia radica en sus grandes aplicaciones en las diferentes
actividades

En el conocimiento porque se aplica a diferentes ramas de la ciencia


incluyendo las sociales y las polticas.
En la vida cotidiana leemos, interpretamos o usamos datos para sacar
un mejor provecho a la informacin para ser utilizados en su campo de
accin.
Es una herramienta importante para la toma de decisiones para la
valoracin de planes y programas, es importante porque los mtodos
estadsticos se utilizan a diario tanto en el sector pblico como en el
privado.

Relacin entre la estadstica y la probabilidad.


Muchas veces son trminos confundidos. La estadstica opera a partir de una
muestra para tener resultados basados en una probabilidad en una poblacin,
la estadstica no puede existir sin la probabilidad en cambio la probabilidad si
puede existir sin la estadstica.
Ejemplo
La probabilidad de salir temprano es del 50% y de salir tarde es del 50%.

Clasificacin de la estadstica
La estadstica se clasifica en:

Estadstica descriptiva
Estadstica inferencial o inductiva

Estadstica descriptiva
Describe los datos numricos, es el puente entre la accin de recolectar los
datos numricos y la comprensin de los mismos cuando estn reunidos, esto
comprende: 1.organizar los grupos de datos u observaciones del modo ms
fcil que se puedan; 2. presentar los datos de forma que llamen la atencin; 3.
Reunir los datos mediante algunas medidas importantes.

Estadstica inferencial o inductiva


Se orienta a deducir conclusiones que traspasan los datos de la muestra y sus
aplicaciones a un conjunto mayor que no fueron tomados en cuenta en otras
palabras generalizan la informacin..
Observacin
La observacin es un hecho individual medido o contado y luego registrado con
datos numricos, representados como las medidas de las variables de una
unidad elemental que se halla comprendida en la muestra. Al nmero de
observaciones se los representa con las letras x o y que indican el nmero de
observaciones.se clasifican en: observacin directa y observacin indirecta.

Observacin directa
Es cuando el investigador obtiene los datos personalmente acudiendo al
lugar de estudio o de hecho.
Observacin indirecta
Cuando la observacin de esta se obtiene la informacin por medio de otra
persona que ha estado en contacto y que ha tenido los detalles necesarios
a travs de la fotografa radio, peridico u otros medios de video.
Debe ser comn en su presentacin para que guarden relacin con el
objeto de la investigacin.

Poblacin

Es un conjunto de individuos o elementos de un conjunto de las mismas


o similares caractersticas de donde se forman las muestras para ser
observadas .la poblacin puede ser finita o infinita.

Poblacin Finita
Es lo que se puede contar, es lo que se puede ser un nmero limitado
elementos.

de

Poblacin Infinita
Cuando sus elementos no son contables en su totalidad.
Unidad o Elemento
Puede ser una persona ,un objeto, institucin ,religin ,etc., que va a ser
sometido a estudio dependiendo de las caractersticas que ms interesan , la
unidad o elemento debe permitir ser medida o contada , que permita hacer
comparaciones ,las caractersticas que debe tener un elemento deben ser
comunes en su presentacin para que guarde relacin con el objeto de
investigacin.

Ejemplo
Determine el elemento y caractersticas de una poblacin de una
empresa comercial en lotes de unidades producidas en un perodo, en
cuentas por cobrar, nmero de empleados que laboran en la empresa.
Poblacin: empresa comercial
Elemento: 1.- lotes de unidades
2.- En cuentas por cobrar
3.- Empleados
Caracterstica: 1.- calidad, variedad, comerciabilidad.
2.- precios, crditos, facturas, tiempo de vencimiento
3.- edad, sexo, experiencia.
Variable
Una variable es una propiedad que puede fluctuar y cuya variacin es
susceptible de adoptar diferentes valores, los cuales pueden medirse u
observarse.
Variable Cuantitativa
Son las variables que toman como argumento, cantidades numricas,
son variables matemticas. Las variables cuantitativas adems pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones
en la escala de valores que puede tomar. No tienen divisin son nmeros
enteros
Variable continua: Es la variable que puede adquirir cualquier valor dentro de
un intervalo especificado de valores. Son fracciones.
Variable Cualitativa
Son el tipo de variables que indican distintas cualidades, caractersticas o
modalidad. Las variables cualitativas pueden ser dicotmicas cuando slo
pueden tomar dos valores posibles.
Variable cualitativa ordinal : La variable puede tomar distintos valores
ordenados siguiendo una escala establecida, aunque no es necesario que el
intervalo entre mediciones sea uniforme.
Variable cualitativa nominal: En esta variable los valores no pueden ser
sometidos a un criterio de orden.

Los siguientes datos corresponden a las edades de os alumnos de una


academia preuniversitaria :
16,16,16,16,16,16,16,17,16,16,16,19,18,18,18,16,16,17,17,18.
Poblacin: 20 estudaintes
Xi ni
hi
% Ni
Hi
%
Elemento: estudiantes
1 13 0,65 65 13 0,6 65
6
5
Variable:cualitativa continua
1 3
0,15 15 16 0,8 80
7
1
3
0,15 1
19 0,9 95
8
5
5
1
1
0,05
5 20
1
100
9
n =20 1,00 100

Para la variable# de hijos o hijas de una muestra de 20 familias, se


encontraron los siguientes
datos:2,1,0,3,2,2,3,1,1,0,1,2,12,0,2,4,2,3,1.elabore la tabla de
frecuencia ,indique poblacin ,variable ,naturaleza de la variable e
interprete la tabla de frecuencia con los datos anotados.
Xi
0
1
2
3
4
Total

ni
3
6
7
3
1
20

Ni
3
9
16
19
20

hi
0,15
0,3
0,35
0,15
0,05

%
15
30
35
15
5
100

Hi
0,15
0,45
0,80
0,95
1

%
Poblacin: 20 familias
15
45
Elemento: familias
80
95 Variable: cuantitativa discreta
100

3 familias no tienes hijos ,6 familias tienen 1 hijo, 7 familias tienen 2


hijos , 3 familias tienen 3 hijos ,1 familia tiene 4 hijos.
Propiedades de las frecuencias
1. la sumatoria de las frecuencias absolutas es igual al tamao muestral.
2. Las sumas de las frecuencias relativas es igual a la unidad.
3. La primera frecuencia absoluta acumulada es igual a la primera
frecuencia absoluta.
4. La ltima frecuencia absoluta acumulada es igual al tamao muestral.
5. La primera frecuencia relativa acumulada es igual a la primera
frecuencia relativa.
6. La ltima frecuencia relativa acumulada es igual a la unidad o sea a
100%.

Muestra
Subconjunto de la poblacin, se toma una muestra con el objeto de tener datos
representativos para poder estudiarlos, analizarlos, etc.
Tipos de muestreo
-

Muestreo al Azar o Aleatorio

Cumple las siguientes caractersticas los elementos de la poblacin deben


tener igual probabilidad de ser seleccionadas para formar parte de la muestra
es decir se debe elaborar un listado de los elementos que forman parte de la
poblacin y que van a ser elegidos por algn motivos al azar. Como por
ejemplo el sorteo extrayendo de un recipiente fichas o papeles no tienen
dependencia de los otros
-

Muestreo estratificado

Divide a la poblacin en grupos homogneos un elemento dado no puede


pertenecer a ms de una estado. Establecidos los estratos se elige en cada uno
de ellos una muestra al azar.
-

Muestreo sistemtico

Es muy aplicado cuando las caractersticas de la investigacin estn ordenadas


ya sea alfabticamente por valor o por cantidad se calcula un intervalo de
seleccin dividiendo al tamao de la poblacin por el nmero de elementos en
la muestra al azar se selecciona un numero dentro de este intervalo este es el
primer elemento y luego se suma el valor del intervalo.
Variable
Caractersticas o fenmenos que puede ser medido o cuantificado como el
peso, edad, suelo.
-

Variable cuantificadas (mide cualidades)


Variable cualitativas(se expresa en nmeros)

Datos univariados
Son caractersticas o variables que se consideran que interviene en la
observacin de una muestra, por ejemplo:
El sueldo de los empleados, el nmero de personas de una familia, la estatura
de una persona.
Constante

Es un valor que se repite


Dato
Es el nmero de observaciones de una muestra
Parmetro
Es cualquier caracterstica de una poblacin y esta tiene que ser medible
Ej.: El nmero de nios en edad escolar
Probabilidad
Es la ocurrencia que se repite, por ejemplo: Varios alumnos puede tener las
mismas calificaciones en la misma materia.
Frecuencia
Es el nmero de observaciones que se repiten.
Ej.: Varios alumnos pueden tener las mismas calificaciones en la misma
materia.
Distribucin de frecuencia
Es la organizacin de datos de una variable. Es una tcnica estadstica basada
en el anlisis de datos y se clasifica en frecuencia absoluta acumulada, relativa
y relativa acumulada.
Frecuencia absoluta
Es el nmero de veces que aparece un determinado valor en el estudio
estadstico, se lo representa con fi.
Frecuencia absoluta acumulada
Es en nmero de veces de n i en la muestra N, con un valor igual o menor a la
variable. La ltima frecuencia absoluta acumulada es igual a N.
Frecuencia relativa:
Es el cociente entre la Frecuencia absoluta de un determinado valor y el
nmero total de datos, se representa:

ni =

fi
N

Frecuencia relativa acumulada:

Es el cociente entre la Frecuencia absoluta acumulada por el tamao de la


muestra y la denominamos por Fi, se lo representa:

F I=

Ni
N
SEGUNDA UNIDAD

Las medidas de posicin son denominadas promedios y son aquellos que


intentan explicar mediante un valor tpico un conjunto de datos, las medidas
que existen en estadstica son medidas de posicin y medidas de dispersin.
Entre las medidas de posicin se hallan las medidas de posicin central y no
central.
Medidas de posicin central
Media aritmtica, media armnica, media geomtrica y moda
Medidas de posicin no central
Cuartiles, quintiles, deciles y percentiles
Medidas de dispersin
Rango varianza, desviacin tpica y covarianza.
Medidas de posicin son aquellas que proporcionan un valor en torno al cual
se distribuyen las observaciones, las medidas de posicin son las medidas de
posicin central y las que no son centrales.
Medidas de tendencia central son aquellos valores que se localizan hacia el
centro como la media aritmtica, la mediana y la moda

MEDIA ARITMETICA

Dnde:

xi

x simple x = i=1
n
n

xi ni

x ponderada x = i=1

X = es el nmero de valores distintos de la variable.


N = es el nmero de veces que se repita cada observacin.
Media aritmtica

simbolizada como X media, Y media conocida

como media, mide el centro de gravedad de una distribucin de datos, no


representa el punto medio sino el punto de equilibrio, la media aritmtica
puede ser simple o ponderada.
Media aritmtica simple es la suma de todas las observaciones de una
distribucin dividida entre el tamao muestral.
n

Xi
i =1

Ejemplo
las
calificaciones
de
los
estudiantes
fueron
15,16,18,20,17,13,19,14,18,20,17.cul es el promedio de calificaciones ?

15+ 16+18+20+17+13+ 19+ 14+18+20+ 17


11

=17

Media aritmtica ponderada


es la suma de las observaciones
multiplicada por su frecuencia absoluta y dividida para el total de
las( observaciones)sumas de las frecuencias .cuando se aplica cuando
los datos estn agrupados en una tabla de frecuencias.se calcula la
media aritmtica ponderada cuando la variable es cuantitativa discreta o
continua, no se aplica cuando la variable es cualitativa.

Cuando mis datos estn agrupados en tablas de frecuencia, cuando tenemos


variables cuantitativas (edad), no se aplica para variables cualitativas (color,
sexo).

Los siguientes son datos que comprenden a las edades de 20 alumnos de una
academia pre universitaria los datos son:
16, 16, 16, 16, 16, 16, 16, 16, 17, 16, 16, 16, 19, 18, 18, 18, 16, 17, 17, 17

a) Determine la poblacin, unidad o elemento, variable a analizar.


POBLACIN = 20 alumnos
UNIDAD = Alumnos
VARIABLE = Edad
b) Elabore la tabla de frecuencias y calcule la edad promedio.
Xi
16
17
18
19

ni
13
3
3
1
20

hi
0.65
0.15
0.15
0.005
1.00

%
65
15
15
5
100

Ni
13
16
19
20

Hi
0.65
0.80
0.95
1.00

%
65
80
95
100

xi ni

x = i=1

x =

(16 )( 13 )+ (17 )( 3 )+ (18 )( 3 ) +(19)(1)


20

x =16,6
c) Interprete los datos de la tabla de frecuencia.
13 alumnos tienen 16 aos
3 alumnos tienen 17 aos
3 alumnos tienen 18 aos
1 alumno tiene 19 aos
d) Cuando las edades estn ordenadas cual es el valor intermedio.
16 16 16 16 16 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19

Me=

20
=10
2

Me=

16+16
=16
2

e) Cul es la edad que ms se repite.

Mo=16
PROPIEDADES
Las propiedades ms destacadas de esta medida son:
1 La suma de las desviaciones de los calores de la variable respecto a su
media es cero (Z) por ejemplo:
En la serie
4,4,6,7,7,9,8,4

x =

+ 4+ 6+7+7+ 9+8+ 4
=5.25
8

z=( 45.25 )+ ( 45.25 ) + ( 65.25 ) + ( 75.25 )+ (75.25 ) + ( 95.25 ) + ( 85.25 ) + ( 45.25 ) =0


2 Cuando
un conjunto de la misma variable de valores puede
descomponerse en dos o ms subconjuntos, disjunto, la media
aritmtica de todo el conjunto se relaciona con las medias aritmticas
de, los diferentes subconjuntos, disjuntos y se aplica:

x =

( n1 a1 ) + ( n2a2 )
n

Donde:

n =Valores de la variable que pueden descomponerse en dos subconjuntos


disjuntos.

n1 = Son los valores de la primera variable.


n2 =Son los valores de la segunda variable.
a1 =Media aritmtica de la primera variable.
a2 =Media aritmtica de la segunda variable.

3 Cuando la media aritmtica una constante ms una variable esta es


igual a las constante ms la media de la variable
n

x1 n1

x =k + i=1

x1

x =k + i=1
n

no hay n

Por ejemplo
Cul es la calificacin promedio de 3 pruebas que han obtenido 12, 13 y
15 sabiendo que el profesor les adiciono 3 puntos al promedio
n=3
k=3

x =3+

12+ 13+15
3

x =16.33
4)la media aritmtica de la suma de dos o ms variables es igual a la
suma de las medias de las variables.
MEDIANA (Me)
Es otro parmetro de frecuencia central que se encuentra situado en un punto
medio.
Para calcular la mediana es necesario ordenar las observaciones ascendente o
descendentemente.
Existen dos pares o dos tipos de observaciones cuando son pares e impares
Cuando la observacin es impar la mediana es el dato central
Ejemplo

8,2,5,3,4,6,2,7,9,11,13,6,9,2,8,4,16,17,10
2,2,2,3,4,4,5,5,6,7,8,9,9,10,11,13,16,17

Me=

19+ 1
=10
2

Me=6

La mediana es el promedio de las observaciones


Cuando las observaciones son par la mediana es el promedio de las dos
observaciones centrales .
Ejemplo

30,26,25,28,46,50,83,75,48,60

25,26,28,30,46,48,50,60,75,83

Me=

46+ 48
=47
2
MODA (Mo)

Representa el punto ms alto de una distribucin de frecuencia. Es el nmero


de observaciones que ms se repite pudiendo aparecer 2,3 o ms
observaciones con la misma frecuencia y se llamaran unimodal, bimodal,
trimodal y multimodal.
Medidas de posicin no central
Cuartiles dividen a la distribucin en cuatro partes iguales
Deciles dividen a la distribucin en diez partes iguales
Percentiles dividen a la distribucin en cien partes iguales
Estas medidas de posicin no central se generan cuando la mediana no divide
a la distribucin en partes iguales.
TERCERA UNIDAD
UNIDAD 3: PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD.
Probabilidad
Un suceso de que ocurra basado en la experiencia para tomar decisiones.
La probabilidad A es igual al nmero de casos favorables
P(A)=

nmeros de casos favorables


nmero de casos posibles

La probabilidad de un suceso est comprendida favorablemente entre 0 y 1 las


sumas de las probabilidades de todos los sucesos elementales es 1.

0 P ( A ) =1
P ( A )+ P ( B ) + P ( C ) ..+ P ( n )=1
La probabilidad de un suceso imposible es cero.
Probabilidad a priori no necesita experimento.
Probabilidad emprica necesita experimento
Experimento: Es un conjunto de pruebas o la realizacin de un proceso para
obtener resultados. Ejemplo, el lanzamiento de una moneda para observar el
lado que aparezca tendr dos posibles resultados. Examinar las unidades
producidas por una mquina para detectar el nmero de unidades defectuosas.
Lanzar un dado al hacer esto tendr 6 posibles resultados.
Prueba: Es la relacin o realizacin de un acto, el conjunto de prueba
conforma un experimento, los datos del experimento se pueden obtener por
una observacin directa o por experimento controlada en el laboratorio.
Evento: resultados posibles que se pueden tener de un experimento.
Tamao muestral: total de eventos que se tiene dentro de un experimento.
Conjunto: agrupacin de elementos definidos por sus caractersticas
Ejemplo.
En el siguiente ejercicio determine el tamao muestral, experimento, evento y
probabilidad.
El lanzamiento de una moneda.
Experimento: lanzamiento de una moneda
Evento: cara, sello.
Espacio muestral:{c,s}
Probabilidad:(1/2) (1/2)
Experimento : Lanzar dos monedas
Evento: cara, sello; sello, cara

Tamao: muestral {c,c}{c,s}{s,s}{s,c}


Sucesos: 4
Probabilidad: ;
Ejercicio:
Hallar la probabilidad que en 3 lanzamientos de una moneda aparezcan:
a)
b)
c)
d)

3
2
2
3

caras
caras y 1 cruz
cruces y 1 cara
cruces

C=cara; X=cruz

CCC; CCX; CXC; CXX; XXC, XCC;XCX; XXX

(2) (2) (2) = 8 caras posibles


a) 3 caras (CCC) = 1 sola vez = 7
b) 2 caras y 1 cruz = 3 veces

P {2 caras y 1 cruz }=

3
8

c) 2 cruz y 1 cara = 3 veces

P=

3
8

d) 3 cruces

1
1 1 3 3
P= PT = + + + =1
8
8 8 8 8
Por la frmula:

P ( x )=N C x Px q N x

P {3 caras }=3 C3

1
2

33

1
2

( )( )

P {2 caras , 1cruz }=3 C2

1
2

1
8

1
2

32

( )( )

3
8

P {3 caras }=

1
8

P {2 cruces , 1 cara }=3 C 1

P {3 cruces }=3 C0

1
2

1
2

1
2

31

( )( )

3
8

1
1
=
2
8

( )( )

Leyes o Reglas de la Probabilidad


Evento favorable: es el nmero de eventos posibles que se pueden dar en un
experimento.
Eventos complementarios : es el complemento de u n evento ,constan de
todos los resultados del espacio muestral que forma parte de ella.
La probabilidad representada por el espacio muestral es 100%.
La probabilidad de cualquier evento corresponde a un valor que puede variar
entre 0 y 1.
La probabilidad de que un evento no ocurra es igual a 1 o menos que la
posibilidad de que si ocurra. P(A)=1 - P(A).
Evento mutuamente excluyente se da cuando la aparicin de un evento
excluye la aparicin de otro.
Dos o ms eventos son mutuamente excluyentes cuando uno de los eventos
ocurre, ningunos de los otros puede ocurrir al mismo tiempo.
Cuando dos eventos A y B son mutuamente excluyentes se debe aplicar la
regla de adicin, es decir que la probabilidad de que ocurra el uno o el otro de
los eventos es igual a la suma de las probabilidades.
Ejemplo
La probabilidad de que en el dado aparezca el 2 es 1/6
PA + PB = 1/6 +1/6 = 2/6 = 1/3 x100= 3,3%
Cuando dos sucesos son compatibles o no son mutuamente excluyentes se da
la posibilidad de que ocurra un suceso, no implica la ocurrencia del otro en este
caso la probabilidad de un de los dos secesos se halla as.
P(A o B) = PA +PB P(A y B)
Ejemplo
Al lanzar un dado usted apuesta un dlar a que el nmero obtenido debe ser
par o divisible por tres Cul es la probabilidad de que usted gane este
lanzamiento?

P(A o B) = PA + PB P(A y B)
lanzamiento de un dado
P(A)= (2 x 4 x 6) + (3 x 6 ) (3 x 4 )
P(A)= 48 +18 -12
{2,4,6,} {3 ,6 }

Experimento:
Evento:1,2,3,4,5,6
Espacio Muestral:

P(A)= 54%
54%

Probabilidad :

.
Cmo se calcula la probabilidad?
La probabilidad se calcula hallando el cociente entre los casos favorables al
suceso y todos los casos posibles, es decir que la probabilidad de A, es igual al
nmero de casos favorables sobre el nmero de casos posibles.

P ( A )=

N de casos favorables
N de casos posibles

DISTRIBUCION DE PROBABILIDADES:
Muestra los resultados esperados al realizar el experimento son los valores
posibles de una variable con sus respectivas probabilidades .
SE CLASIFICAN EN:
Variables Aleatorias Discretas y estas a su vez en el modelo de Bernauth, en el
modelo binomial de Poisson , multinominal,hipergeometricay exponencial.
Variable Aleatoria: Cuando los valores que toman estn determinados por
factores en los que intervienen al azar
Variable Aleatoria Discreta: Es aquella que puede tomar un valor cierto
nmero de valores, que se puede contar, dentro de esta est la distribucin
binomial.
1.- Existe un nmero fijo o constante n de pruebas repetidas.
2.- Cada una de las n pruebas da lugar a un acontecimiento favorable o
desfavorable uno de los dos debe presentarse.
3.- La probabilidad de esta es aquel acontecimiento que consideramos
favorables debe ser la misma en cada una de las pruebas por lo tanto P es
constante ( P nmero de xitos y el nmero de fracasos )
4.- Las pruebas son independientes
5.- No interesa determinar el nmero de xitos en las n pruebas por lo tanto la
distribucin binomial se puede escribir

P ( x )=

( nx ) p q
x

nx

Dnde:
n es el nmero de ensayos
x es el nmero de xitos
p es la probabilidad de xitos en un solo ensayo
q es la probabilidad de fracaso

n
son las conbinaciones posibles
x
Variable Aleatoria Continua:
Es aquella que puede asumir cualquier valor dentro de un determinado
intervalo, es decir comprende un nmero infinito de valores posibles
La distribucin normal se aplica la distribucin Gaussiana, se aplica en la
siguiente formula:
1

y=

1
e 2 ( xa ) / y
2

Ejemplo:

c,c,c

a) P(x=2) =

1
2

c,c,s

c,s,c

c,s,s

=(

n x nx
p q
x

=3*(25)*(0.5)
= 37.5 %

s,c,c

s,c,s

s,s,c
s

B) (Px=1) + (Px=2)

4
8 +

2
8

= 62.5 %

s,s,s

sucesos =8

n=3 ;X=2 ;P= 2 ; p= 2


Ejercicio:
La probabilidad de que en un producto salga defectuoso es de 0.012. Cul es
la probabilidad de que entre 800 productos ya fabricados, hallan 5
defectuosos?
P = 0.012

<0.1

n = 800

e = 2.71

= p*n <10 = 96 <10


P(x=k) =

k
k!

96

P(x=5) = e

k=5

( 96 )8
5!

P(x=5) = 0.0892*100 = 8.9%


Distribucin binominal
1. Se debe tomar en cuenta cinco caractersticas, existe N pruebas repetidas.
2. Cada una de las N pruebas da lugar a un acontecimiento favorable o
desfavorable, uno de los dos debe presentarse.
3. La probabilidad de xito es aquel acontecimiento que consideramos
favorable debe ser la misma en cada una de las pruebas P ser constante, las
pruebas son independientes.4. No interesa determinar el nmero de xitos en
las N pruebas, la frmula es

P(x)= X

donde N es el nmero de ensayos, X es el nmero de

xitos, P la probabilidad de xito en un solo ensayo , que probabilidad


de fracaso son combinaciones donde C es igual N!
N!
C(x)= ( N X ) ! X !
CUARTA UNIDAD
Anlisis de regresin
El anlisis estadstico permite descubrir y evaluar el grado de relacin entre
las variables X y Y mediante el anlisis de regresin y correlacin.
El anlisis de regresin tiene por objeto establecer la naturaleza de la relacin
entre variables , es decir calcular una funcin que estime y represente mejor a
un conjunto de puntos de modo cualitativo que a ms de estimar sirve para
predecir una variable dependiente con el conocimiento de una variable
independiente.
El diagrama de dispersin es la grfica de las coordenadas X ,Y de una
distribucin bidimensional en un plano de dos ejes perpendiculares , estos
diagramas es posible que indiquen la existencia o relaciono ninguna relacin
entre dos variables s segn la alineacin de lo0s dos puntos , existe regresin
lineal positiva ,negativa y la que3 no tiene ninguna relacin.
Lneas de regresin
Para 0065presar la relacin entre dos variables se utiliza una ecuacin
matemtica siendo la ms simple la ecuacin lineal cuya grafica es una lnea
recta y=bx+a ,x=yb+a en donde b indica la pendiente o coeficiente angular ,
que es la ordenada por donde la recta intercepta el eje de las y cuando x=0 ,X
y Y son valores conocidos a dems X es la variable independiente y Y es la
variable dependiente cuando la relacin sea Y/X
Variable independiente es aquella cualidad o caracterstica de la variable
independiente que tiene la capacidad para influir o afectar en la otra
variable .no depende de otra.
Variable dependiente depende de una variable independiente puede ser
manipulada por el investigador.
Mtodo de los mnimos cuadrados

Este mtodo en trminos matemticos establece la recta mejor adaptada que


reduce al mnimo la suma de los cuadrados de las distancias verticales de
cada punto disperso a ellas se simboliza como

(Y Yf )2

es igual al

mnimo que quiere decir que la suma de los cuadrados de las desviaciones de
un conjunto de nmeros que es mnimo, cuando este ltimo es la media
aritmtica de las primeras en donde

y es igual a b

+Na , la

X Y =b X 2 +a X
Y = (bX + a)
La segunda ecuacin
YX =bX2+aX
A=

Y b X
N

2
2
X
B=
N
N X Y ( X . Y )

CORRELACIN.

La correlacin es la forma numrica en la que la estadstica ha podido evaluar


la relacin de dos o ms variables, es decir, mide la dependencia de una
variable con respecto de otra variable independiente.

Para poder entender esta relacin tendremos que analizarlo en forma grfica:

edad

peso

15

60

30

75

18

67

Si tenemos los datos que se presentan en la tabla y


consideramos que la edad determina el peso de las
personas entonces podremos observar la siguiente
grfica:

Donde los puntos representan cada uno de los


pares ordenados y la lnea podra ser una recta que
represente la tendencia de los datos, que en otras palabras podra decirse que
se observa que a mayor edad mayor peso.
42

80

La correlacin se puede explicar con la


pendiente de esa recta estimada y de esta
forma nos podemos dar cuenta que tambin
existe el caso en el que al crecer la variable
independiente
decrezca
la
variable
dependiente. En aquellas rectas estimadas
cuya pendiente sea cero entonces podremos
decir que no existe correlacin.

100

pesos

80
60
40
20
0
0

20

40

60

edades

As en estadstica podremos calcular la correlacin para datos no agrupados


con la siguiente formula.

En
R
N

i 1

i 1

i 1

donde:

n xi y i xi * y i
2
n 2
n x xi n y i
i 1 i 1

i 1
n

2
i

X
Y = variable independiente

= coeficiente de correlacin
2

y
i 1

=
nmero
ordenados

de

pares

= variable independiente

Ejemplo:
X2

Y2

Edad (x)

Peso (y)

X* Y

15

60

225

3600

900

30

75

900

5625

2250

18

67

324

4489

1206

42

80

1764

6400

3360

28

60

784

3600

1680

19

65

361

4225

1235

31

92

961

8464

2852

Supngase que deseamos obtener la correlacin de los datos de la tabla


anterior:
Ahora podemos observar que:

n
n
n
n xi yi xi * yi
i 1
i 1
i 1

n 2 n
n 2 n 2
n xi xi n yi yi
i 1
i 1 i 1
i 1

7 *13483 (183 * 499)


0.65638606
7 * 5319 (183) 2 7 * 36403 ( 499) 2

Se
debe aclarar que el coeficiente de correlacin slo puede variar de la siguiente
1 r 1

manera:
y que para entenderlo mejor se debe obtener el
coeficiente de determinacin que se obtiene con r cuadrada, ya que
este representa el porcentaje que se explica y mediante los datos de x .
En nuestro ejemplo decimos que la correlacin es casi perfecta, ya que, esta
muy cerca de 1 y que el porcentaje de datos que explican a y es
(0.65638606)2= 0.430842 o sea el 43.08 %
En el caso de que fueran datos agrupados tendremos lo siguiente:
Primero tendremos que pensar que se genera una matriz, ya que, ahora
estamos juntando dos tablas de distribucin de frecuencias y por ello nuestros
clculos sern ms laboriosos, por lo que les recomiendo el uso de una hoja de
calculo o al menos una calculadora con regresin para datos agrupados.
De cualquier forma aqu tambien estamos evaluando numricamente si existe
relacin entre dos variables y lo haremos con la siguiente ecuacin.
k

i 1

i 1

n f xi y i fx xi * fy y i
j 1 i 1

2
2
l
k
k

n fx x fx xi n fy y i fy y i
i 1
i 1
i 1

i 1
l

2
i

En
donde
podemos
encontrar k como el
nmero de clases para la
variable "y" y l para el
nmero de clases de "x".

Tambin podemos observar que hay varios tipos de "f" es decir, la que se
encuentra sola (sin subndice) que nos habla de las frecuencias celdares (cada
una de las frecuencias que se encuentran en la interseccin entre una columna
y un rengln) y las "f" con subndices que representan las frecuencias de cada
una de las variables.

i 1

i 1

n f x i y i f x x i * fy y i

j 1 i 1

2
2
2

k
k

n f x x i f x x i n fy y i fy y i
i 1
i 1
i 1

i 1
l

48 * 5380.77 - (82.06 * 3116)


((48 * 140.8982) - 82.06 2 ) * (( 48 * 212072) - 3116 2 )

0.695

Al interpretar nuestro resultado podemos concluir que si existe relacin entre el


peso y la estatura, es decir, que a mayor estatura mayor peso.

En muchas ocasiones el resultado de la correlacin es negativo y lo que


debemos pensar es que la relacin de las variables involucradas en el clculo
es inverso es decir que en la medida que crece la variable independiente la
variable dependiente decrece:

demanda
150
1698
100 2045
1348
50
1268
0
1000

47
15
100
120
1500

2000

1. INTRODUCCIN
Si sabemos que existe una relacin entre una variable denominada
dependiente y otras denominadas independientes (como por ejemplo las
existentes entre: la experiencia profesional de los trabajadores y sus
respectivos sueldos, las estaturas y pesos de personas, la produccin agraria y
la cantidad de fertilizantes utilizados, etc.), puede darse el problema de que la
dependiente asuma mltiples valores para una combinacin de valores de las
independientes.
La dependencia a la que hacemos referencia es relacional matemtica y no
necesariamente de causalidad. As, para un mismo nmero de unidades
producidas, pueden existir niveles de costo, que varan empresa a empresa.
Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresin en
los cuales se obtiene una nueva relacin pero de un tipo especial denominado
funcin, en la cual la variable independiente se asocia con un indicador de
tendencia central de la variable dependiente. Cabe recordar que en trminos
generales, una funcin es un tipo de relacin en la cual para cada valor de la
variable independiente le corresponde uno y slo un valor de la variable
dependiente.
2. ASPECTOS TERICOS
REGRESIN SIMPLE Y CORRELACIN

La Regresin y la correlacin son dos tcnicas estadsticas que se pueden


utilizar para solucionar problemas comunes en los negocios.
Muchos estudios se basan en la creencia de que es posible identificar y
cuantificar alguna Relacin Funcional entre dos o ms variables, donde una
variable depende de la otra variable.
Se puede decir que Y depende de X, en donde Y y X son dos variables
cualquiera en un modelo de Regresin Simple.
"Y es una funcin de X"
Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
X es la variable independiente.
En el Modelo de Regresin es muy importante identificar cul es la variable
dependiente y cul es la variable independiente.
En el Modelo de Regresin Simple se establece que Y es una funcin de slo
una variable independiente, razn por la cual se le denomina tambin
Regresin Divariada porque slo hay dos variables, una dependiente y otra
independiente y se representa as:
Y = f (X)
"Y est regresando por X"
La variable dependiente es la variable que se desea explicar, predecir. Tambin
se le llama REGRESANDO VARIABLE DE RESPUESTA.
La variable Independiente X se le denomina VARIABLE EXPLICATIVA
REGRESOR y se le utiliza para EXPLICAR Y.
ANLISIS ESTADSTICO: REGRESIN LINEAL SIMPLE
En el estudio de la relacin funcional entre dos variables poblacionales, una
variable X, llamada independiente, explicativa o de prediccin y una variable Y,
llamada dependiente o variable respuesta, presenta la siguiente notacin:
Y=a+bX+e
Donde:

a es el valor de la ordenada donde la lnea de regresin se intercepta con el eje


Y.
b es el coeficiente de regresin poblacional (pendiente de la lnea recta)
e es el error
SUPOSICIONES DE LA REGRESIN LINEAL
1. Los valores de la variable independiente X son fijos, medidos sin error.
2. La variable Y es aleatoria
3. Para cada valor de X, existe una distribucin normal de valores de Y
(subpoblaciones Y)
4. Las variancias de las subpoblaciones Y son todas iguales.
5. Todas las medias de las subpoblaciones de Y estn sobre la recta.
6. Los valores de Y estn normalmente distribuidos y son estadsticamente
independientes.
ESTIMACIN DE LA ECUACIN DE REGRESIN MUESTRAL
Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,
encontrar los valores de a y b con los datos observados de la muestra. El
mtodo de estimacin es el de Mnimos Cuadrados, mediante el cual se
obtiene:

Luego, la ecuacin de regresin muestral estimada es

Que se interpreta como:


a es el estimador de a

Es el valor estimado de la variable Y cuando la variable X = 0


b es el estimador de b , es el coeficiente de regresin
Est expresado en las mismas unidades de Y por cada unidad de X. Indica el
nmero de unidades en que vara Y cuando se produce un cambio, en una
unidad, en X (pendiente de la recta de regresin).
Un valor negativo de b sera interpretado como la magnitud del decremento en
Y por cada unidad de aumento en X.
El objetivo del anlisis de regresin es la estimacin de los parmetros.
El primer paso es la representacin grfica de las variables (y,x) en un
diagrama de dispersin

El objetivo del anlisis de regresin es la estimacin de los parmetros.


El primer paso es la representacin grfica de las variables (y,x) en un
diagrama de dispersin

Dado que la relacin de dependencia entre ambas var


iables es aleatoria o estocstica, las observaciones no se encontrarn a lo largo
de una recta

La estimacin de losparmetros supone encontrar la ordenada en el origen y


la pendiente de una recta que mejor se aproxime a los puntos

Recta de Regresin Especificada

Yt = 1+2 X t + u t
quinta unidad
ANLISIS DE VARIANZA
En estadstica, el anlisis de la varianza, es una coleccin de modelos
estadsticos y sus procedimientos asociados, en el cual la varianza est
particionada en ciertos componentes debidos a diferentes variables
explicativas. El anlisis de la varianza parte de los conceptos de regresin
lineal. Puede ser visto como una generalizacin del test de Student.
En el modelo probabilista, cada modalidad corresponde a una muestra. Para

h=1, , k

(h )
, denotamos por: ( 1(h) , , x nh )

a las variables aleatorias

que modelan los datos del h-simo grupo, que se suponen independientes y

con una misma ley

N (h , )

. Se supone que en particular la varianza

es constante, hiptesis que puede ser validada a travs de un test.


Se denota por:

x(h)

(h)

la media emprica de la h-sima clase,


la varianza emprica de la h-sima clase,
la media de la muestra global,
k

V intra=
h=1

nh (h)
V
n

x(h)

nh

la media de las varianzas (varianza intra-clases),

la varianza de las medias (varianza inter-clases),


k

V inter =
h=1

S 2 la varianza de la muestra global.

Demostracin: Desarrollemos:

Una observacin individual se representa como:


El primer subndice indica el nivel del primer factor, el segundo el nivel del
segundo factor y el tercero la observacin dentro de la muestra.
Modelo I Los factores pueden ser ambos de efectos fijos
Modelo II de efectos aleatorios
Modelo mixto efectos fijos y el otro de efectos aleatorios. El modelo
matemtico de este anlisis es:

Anlisis de Varianza a una va: Diseo completamente aleatorizado


Hay distintas formas en las cuales puede disearse un experimento ANOVA.
Quizs el ms comn es el diseo completamente aleatorizado a una va.
Si de un tratamiento al otro la variacin es significativamente alta, puede
concluirse que los tratamientos tienen efectos diferentes en las poblaciones.
.Variacin total.- Esta variacin entre el nmero total de las 14
observaciones.
variacin entre muestras.Existe variacin entre los diferentes tratamientos
(muestras). variacin dentro de la muestra.- Existe variacin dentro de un
tratamiento dado (muestra).
Fundamentos del ANOVA
Utilizados para conocer si tratamientos diferentes tienen efectos diferentes en
sus respectivas poblaciones, se hizo una comparacin entre la variacin dentro
de las muestras y la variacin entre muestras. La variacin de los puntajes de
una muestra dada puede ser productiva por una variedad de factores: la
inhabilidad innata de los empleados en dicha muestra, la motivacin personal,
los esfuerzos individuales y la destreza, el factor suerte, y una gran cantidad de
otras circunstancias aleatorias. El tratamiento en s mismo no producir
ninguna variacin en las observaciones dentro de alguna muestra, debido a
que todas las observaciones en dicha muestra reciben el mismo tratamiento.

La razn F tal y como se utiliza en ANOVA: es una razn de la variacin entre


muestras y la variacin dentro de las muestras.
Contrastes de hiptesis en un anlisis de la varianza de dos factores
Con el anlisis de varianza a una va, se pens que solo un factor influenciaba
las unidades experimentales. Sin embargo, con frecuencia se encuentra que
una segunda influencia exterior puede impactar las unidades experimentales.
Por ejemplo, el inters puede ser comparar la productividad promedio de los
tres tipos de mquinas (tratamientos). Sin embargo, se observa que al probar
estas mquinas, la destreza del operador y su experiencia pueden afectar la
produccin de la mquina, produciendo confusin sobre cul mquina es
realmente mejor.
Modelo I

Por tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen como


una F con los grados de libertad correspondientes y permiten contrastar,
respectivamente, las hiptesis:
No existe interaccin (MSAB/MSE)

No existe efecto del primer factor, es decir, diferencias entre niveles del primer
factor (MSA/MSE)

No existe efecto del segundo factor (MSB/MSE)

Al rechazar la primera hiptesis de no interaccin, no tiene sentido contrastar


las siguientes. En este caso lo que est indicado es realizar un anlisis de una
va entre las a b combinaciones de tratamientos para encontrar la mejor
combinacin de los mismos.

Ejemplo: Los miembros de un equipo ciclista se dividen al azar en tres grupos


que entrenan con mtodos diferentes. El primer grupo realiza largos recorridos
a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el
tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta
frecuencia. Despus de un mes de entrenamiento se realiza un test de
rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos
empleados fueron los siguientes:
Mtodo
I
15
16
14
15
17

Mtodo
II
14
13
15
16
14

Mtodo III
13
12
11
14
11

A un nivel de confianza del 95% Puede considerarse que los tres mtodos
producen resultados equivalentes? O por el contrario Hay algn mtodo
superior a los dems?
Solucin:
Comenzamos calculando los totales y los cuadrados de los totales divididos por
el nmero de observaciones:
Metd. I
Suma
Sum2/
n

77
1185,8

Metd. II
72
1036,8

Metd.
III
61
744,2

Total
210
2966,
8

Sum2/n
2940

A continuacin calculamos los cuadrados de las observaciones y su total:

Metd. I
Metd. II
Metd. III
225
196
169
256
169
144
196
225
121
225
256
196
289
196
121
1191
1042
751
2984
A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados:
SC(total) = 2984 - 2940 = 44

SC(intra) = 2984 2966,8 = 17,2


SC(entre) = 2966,8 2940 = 26,8
Los cuadrados medios sern:
CM(entre) = 26,8/2 = 13,4
CM(intra) = 17,2/12 = 1,43
Por consiguiente el estadstico de contraste vale:
F = 13,4/ 1,43 = 9,37
El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza
del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye
que los tres mtodos de entrenamiento producen diferencias significativas.
TEST DE FISHER
La prueba de Fisher calcula un valor exacto de probabilidad para la relacin
entre dos variables dicotmicas, como se encuentra en una de dos en dos
cruzado. Se calcula la diferencia entre los datos observados y los datos de
esperar, teniendo en cuenta el marginal dado y los supuestos del modelo de
independencia.
La probabilidad de un solo lado de la prueba exacta de Fisher se calcula
mediante la generacin de todas las tablas que son ms extremas que la mesa
propuesta por el usuario, en una direccin.
Hiptesis nula
La hiptesis nula es que las proporciones relativas de una variable son
independientes de la segunda variable.
Hiptesis alternativa (H1)
La hiptesis alternativa es igualmente una afirmacin acerca de la poblacin de
origen. aunque No siempre, consiste simplemente en negar la afirmacin de
H0.
Cmo funciona la prueba
La prueba exacta de Fisher no utiliza una funcin matemtica que calcula la
probabilidad de un valor de un estadstico de prueba; en cambio, se calcula la
probabilidad de obtener los datos observados, y todos los conjuntos de datos
con desviaciones ms extremas, bajo la hiptesis nula de que las proporciones
son las mismas.
Caractersticas de la distribucin F

Existe una distribucin F diferente para cada combinacin de tamao de


muestra y nmero de muestras.. En el caso de la distribucin F, los
valores crticos para los niveles 0,05 y 0,01
La distribucin es continua respecto al intervalo de 0 a + . La razn
ms pequea es 0. La razn no puede ser negativa, ya que ambos
trminos de la razn F estn elevados al cuadrado.
La forma de cada distribucin de muestreo terico F depende del
nmero de grados de libertad que estn asociados a ella. Tanto el
numerador como el denominador tienen grados de libertad relacionados.
Determinacin de los grados de libertad
Los grados de libertad para el numerador y el denominador de la razn F se
basan en los clculos necesarios para derivar cada estimacin de la variancia
de la poblacin. As, k - 1 es el nmero de grados de libertad para el
numerador. Los grados de libertad para el denominador son entonces, k(n -l).
Clculo de la razn F a partir de datos mustrales
Calcular la estimacin interna (Denominador). Determinar la varianza de cada
muestra utilizando la formula
Varianza = s

(x i x )2
n1

Obtener a estimacin interna de varianza mediante la formula

sw2 =
Calcular la media de las varianzas de las medias mustrales utilizando la
formula

s x 2 =

Multiplicar las varianzas medias por n

n s x

Razn de F

s
F Prueba= w2
s x

Ejemplo :
Los pesos en kg de 1.7 se ilustran en la siguiente tabla

La finalidad es determinar si existen diferencias reales entre las cuatro


muestras
Empleamos un valor significativo de 0.5

Hiptesis nula =

H o=Todas las proporciones de la pobacion son iguales

Hiptesis alternativa =

H 1=no todas las proporciones de a poblacion son iguales

Calculando los grados de libertad del numerador se tiene:

k-1 ; 4-1=3

Calculando os grados de libertad de denominador se tiene:


=20

K(n-1) ; 4(6-1)

Con 3 grados de libertad del numerador y 20 del denominador y con una


significacin de 0.05 con la lectura e taba se tiene que

FTabla =3.10

Clculo de la razn F a partir de datos mustrales


Para calcular F se debe seguir el siguiente procedimiento
Calcular la estimacin interna (Denominador)
Determinar la varianza de cada muestra utilizando la formula
Varianza = s

(x i x )2

Obtener a estimacin interna de varianza


mediante la formula
n1

sw2 =
s 12 + s22 +s 32 .+ s k 2
Calcular La Estimacin Intermediante
k
Calcular la media de las varianzas de las medias mustrales utilizando la
formula

s x

Multiplicar las varianzas medias por n


n s x

Razn de F

F Prueba=

sw 2
s x2

EJERCICIO:

Un profesor quiere encontrar la mejor forma de presentar un importante


tema frente al grupo que tiene a su cargo. Para eso puede escoger una
de las 3 opciones siguientes:

a.- Dar clase


b.- Dar clase y asignar una lectura complementaria
c.- Proyectar una pelcula y asignar una lectura complementaria
El decide hacer un experimento para evaluar las 3 opciones. Entonces solicita
27 voluntarios de su grupo y signa aleatoriamente 9 a cada una de las 3
condiciones. Bajo la condicin 1 el da clase a los estudiantes, bajo la condicin
2 el da clase y asigna una lectura complementaria, bajo la condicin 3 el los
alumnos presencian una pelcula acerca del tema y realizan la misma lectura
complementaria que los estudiantes de la condicin.
Despus se aplica a los alumnos un examen sobre el material. Se obtuvieron
los siguientes datos:

a.- Cual es la hiptesis nula global


b.- Cual es la conclusin Utilice = 0,05

SC B

PASO 1: Calculo de

( X 1)
n1

SC B = [

(767)
9

(819)
9

PASO 2: Calculo de

SC W =

X 2 [

= 200428 - [
= 671,778

(767)
9

( X 2)
n2

( X 3)
n3

(734)
9

]-

]-

(2320)
27

( X )
N

= 408,074

SC w
( X 1)
n1

(819)
9

( X 2)
n2

(734)
9

( X 3)
n3

+.+

+.+

( XK )

nk

( XK )
nk

( X )
N

SC T =X -

= 200428 -

= 1079,852

SC T

PASO 3: Calculo de

SC T =

SC W

( 2320 )
27

SC B

1079,852 = 408,074 + 671,778

1079,852 = 1079,852

PASO 4: Grados de Libertad para cada estimacin

gl B = K-1 = 3-1 = 2
glW = N k = 27 3 = 24
glT

= N-1 = 27 1 = 26

PASO 5: Calculo de SB

SC B
gl B

SB =

PASO 6: Calculo de

SC W
gl W

408,074
2

SW =

PASO 7: Calculo de

Fobt

SB
SW

SW

671,778
24

= 204,037

= 27,991

Fobt
204,037
27,991

= 7,29

Evaluar Fobt como = 0,005

gl numerador = 2

gl denominador = 24 viendo en la tabla el valor es


Como Fobt > 3,40 rechazamos

Fcrit= 3,40

Ho

CHI-CUADRADA
Como ya se ha visto varias veces, los resultados obtenidos de muestras no
siempre concuerdan exactamente con los resultados tericos esperados, segn
las reglas de probabilidad. Por ejemplo, aunque consideraciones tericas
conduzcan a esperar 50 caras y 50 cruces cuando se lanza 100 veces una
moneda bien hecha, es raro que se obtengan exactamente estos resultados.
Se considera el problema general.
Definicin de X2
Una medida de la discrepancia existente entre las frecuencias observadas y
esperadas es suministrada por el estadstico X2, dado por:

Donde si el total de frecuencias es N,

Si X2 = 0, las frecuencias observadas y esperadas concuerdan exactamente,


mientras que si X2 >0, no coinciden exactamente. A valores mayores de X 2,
mayores son las discrepancias entre las frecuencias observadas y esperadas.
Si las frecuencias esperadas son al menos iguales a 5, la aproximacin mejora
para valores superiores.
El nmero de grados de libertad

est dado por:

=k1m
En donde:
K = nmero de clasificaciones en el problema.

m = nmero de parmetros estimados a partir de los datos muestrales para


obtener los valores esperados.
Ensayo de Hiptesis
En la prctica, las frecuencias esperadas se calculan de acuerdo con la
hiptesis Ho. Si bajo esta hiptesis el valor calculado de X 2 dado es mayor que
algn valor crtico, se deduce que las frecuencias observadas
difieren significativamente de las esperadas y se rechaza Ho al nivel de
significacin correspondiente. En caso contrario, no se rechazar. Este
procedimiento se llama ensayo o prueba de chi-cuadrado de la hiptesis.
Ejemplos:
1

La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120


veces. Ensayar la hiptesis de que el dado est bien hecho al nivel de
significacin del 0.05.

Cara

Frecuencia
Observada

25

17

15

23

24

16

Solucin:
Ensayo de Hiptesis:
Ho; Las frecuencias observadas y esperadas son significativamente
iguales
H1; Las frecuencias observadas y esperadas son diferentes (dado
cargado).

Cara

Total

Frecuencia
Observada

25

17

15

23

24

16

120

Frecuencia
esperada

20

20

20

20

20

20

Grados de libertad = k-1-m = 6-1-0 = 5


No se tuvo que calcular ningn parmetro para obtener las frecuencias
esperadas.

Regla de decisin:
Si X2R

11.1 no se rechaza Ho.

Si X2R >11.1 se rechaza Ho.


Clculos:

Justificacin y decisin:
Como 5 es menor a 11.1 no se rechaza Ho y se concluye con una
significacin de 0.05 que el dado est bien hecho.
Justificacin y decisin:
Como 0.470 es menor que 11.3 no se rechaza H o y se concluye con un
nivel de significacin de 0.01 que la teora de Mendel es correcta.
Como el valor de 0.470 est cercano a cero, se procede a hacer un
ensayo unilateral izquierdo:
Ensayo de Hiptesis:

Ho; La teora de Mendel es acertada.


H1; La teora de Mendel es muy acertada.

Regla de decisin:
Si X2R

0.115 no se rechaza Ho.

Si X2R < 0.115 se rechaza Ho.


Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o
la teora de Mendel solo es buena.

S-ar putea să vă placă și