Sunteți pe pagina 1din 111

UNIVERSIDAD DE ORIENTE

NCLEO DE SUCRE
ESCUELA DE ADMINISTRACIN
DEPARTAMENTO DE CONTADURA

FUNDAMENTOS DE LA ESTADSTICA INFERENCIAL

ASESOR ACDEMICO:

AUTORES:

Prof. Miguel Romero

Mariangeles Gmez R.
C.I:13.836.535
Yaritza Ramos S.
C.I:13.499.178

Trabajo de Curso Especial de Grado presentado como requisito parcial para


optar al ttulo de Licenciada en Contadura Pblica
Cuman, abril de 2008

NDICE GENERAL

AGRADECIMIENTOS ................................................................................................. i
DEDICATORIA .......................................................................................................... iii
LISTA DE TABLAS .................................................................................................... v
LISTA DE FIGURAS .................................................................................................. vi
RESUMEN.................................................................................................................. vii
INTRODUCCIN ........................................................................................................ 1
PLANTEAMIENTO DE PROBLEMA ........................................................................ 4
OBJETIVOS ................................................................................................................. 6
Objetivo General ....................................................................................................... 6
Objetivos Especficos ................................................................................................ 6
JUSTIFICACIN ......................................................................................................... 7
MARCO METODOLGICO ....................................................................................... 9
Nivel de Investigacin............................................................................................... 9
Diseo de la Investigacin ........................................................................................ 9
Fuentes de Informacin ........................................................................................... 10
CAPTULO I............................................................................................................... 11
ESTADSTICA

INFERENCIAL,

DISTRIBUCIONES

MUESTRALES,

INTERVALO DE CONFIANZA Y PRUEBAS DE HIPTESIS ............................. 11


1.1. Definicin de Estadstica Inferencial ............................................................... 11
1.2. Distribuciones Muestrales ................................................................................ 12
1.2.1. Procedimientos de Muestreo ..................................................................... 14
1.2.1.1. Errores y Sesgos ................................................................................. 14
1.2.1.2. Mtodos de Muestreo ........................................................................ 15
1.3. Intervalo de Confianza ..................................................................................... 25
1.3.1. Intervalo de Confianza para la Media ..................................................... 26
1.3.2. Intervalo de Confianza para una Proporcin ............................................. 28
1.4. Pruebas de Hiptesis ........................................................................................ 29

1.4.1. Procedimientos para Probar una Hiptesis ............................................... 30


1.4.2. Prueba de Hiptesis para la Media ............................................................ 36
1.4.3. Prueba de Hiptesis para una Proporcin ................................................. 37
CAPITULOII .............................................................................................................. 39
ANLISIS DE REGRESIN Y CORRELACIN ................................................... 39
2.1. Anlisis de Regresin....................................................................................... 39
2.1.1. Principio de Mnimos Cuadrados .............................................................. 44
2.1.2. Trazo de la Lnea de Regresin ................................................................. 45
2.2. Anlisis de Regresin Mltiple ........................................................................ 50
2.3. Anlisis de Correlacin .................................................................................... 51
2.3.1. Coeficiente de Correlacin ........................................................................ 52
2.3.2. Coeficiente de Determinacin ................................................................... 56
2.3.3. Coeficiente de no Determinacin .............................................................. 56
2.4. Anlisis de Correlacin Mltiple ..................................................................... 59
CAPITULOIII ............................................................................................................. 61
ANLISIS DE VARIANZA Y PRUEBAS NO PARAMETRICAS ......................... 61
3.1. Anlisis de Varianza o Anova .......................................................................... 61
3.1.1. Distribucin F ........................................................................................... 65
3.1.2. Comparacin de dos Varianzas Poblacionales .......................................... 67
3.2. Pruebas no Paramtricas .................................................................................. 68
3.2.1. Distribucin de ji-cuadrado ....................................................................... 69
3.2.1.1. Prueba de Bondad de Ajuste .............................................................. 69
3.2.1.2. Prueba de Independencia o Tablas de Contingencias ........................ 74
CONCLUSIONES ...................................................................................................... 81
RECOMENDACIONES ............................................................................................. 83
BIBLIOGRAFA ........................................................................................................ 84
ANEXOS .................................................................................................................... 86

AGRADECIMIENTOS
Hoy da estoy convencida de que con empeo y optimismo podemos alcanzar lo
que nos proponemos. Un milln de gracias les doy:

A Dios Todopoderoso, por otorgarme ese privilegio tan grande como es el


VIVIR y darme la fortaleza para aprender a luchar por lo que se quiere.

A la Virgen del Valle y al Divino Nio Jess, por ayudarme a mantener la fe en


todo instante y, a creer en la esperanza y a que en el momento menos pensado las
cosas se dan.

A mi madre, Ana Teresa Romero, por estar siempre en los momentos difciles,
y por darme el valor para no dejar de desistir en mi carrera.

A mi padre, Bautista Gmez, por tratar de motivarme y colaborar conmigo a lo


largo de mi carrera.

A la Universidad de Oriente, por abrirme las puertas para pertenecer a esta gran
casa de estudio.

A nuestro Asesor Acadmico, Profesor Miguel Romero, por ayudarnos a


culminar de una manera satisfactoria nuestro trabajo.

A mis compaeros de curso, en especial a Yaritza Ramos, por mostrar ser un


grupo unido durante toda la trayectoria del mismo.

Mariangeles Gmez R.
i

AGRADECIMIENTOS
En primer lugar le doy gracias a Dios todo poderoso por su fortaleza y por haberme
permitido terminar mis estudios Universitarios. Por ser la luz que gua nuestros pasos,
por darme la vida y permitirme realizar una de mis metas ms anheladas, de obtener
mi titulo.
A mis padres Orlando Ramos y Gloria Serrada de Ramos quienes con mucho amor,
constancia y dedicacin se hicieron presentes. Gracias a ustedes por tener tanto afecto
y consejos. El triunfo que hoy obtengo es de ustedes, a ustedes le debo lo que soy hoy
en la vida.
A mis hermanos Jacqueline, Yngrid, Jannifher, Orlando y la consentida Glorianny,
por haber compartido todos los momentos buenos y los momentos difciles, por su
confianza y por estar ah cuando los necesitos.
A mi novio Jos Manuel Pens por la colaboracin de este trabajo.
A mi profesor Miguel Romero, por ser nuestro asesor en el desarrollo de la
investigacin, por orientarnos para la elaboracin de este trabajo, apoyarnos en todo
cuando necesitbamos y brindarnos su amistad.
A mis compaeros del curso de especial de grado, por todos los momentos
compartidos en este curso. En especial a mi compaera de tesis Mariangeles, porque
juntas emprendimos el camino con esfuerzos y esmero, para elaborar este trabajo.
A nuestra casa de estudio la Universidad de Oriente, Ncleo de sucre por brindarnos
la oportunidad de realizarnos como profesionales.

Yaritza Ramos S.

ii

DEDICATORIA
A mi abuela Ana del Valle Romero (mi querida MIMA); como me hubiese
gustado que estuvieras hoy da compartiendo esta alegra que me embarga!, pero
aunque ya no ests presente, se que desde el cielo me has tendido tu mano para salir
adelante.

A mis padres, Ana Teresa Romero y Bautista Gmez, por guiarme a lo largo de
mi vida, dndome los principios y valores fundamentales de toda educacin.

Mariangeles Gmez R.

iii

DEDICATORIA
A mis padres Orlando Ramos y Gloria Serrada de Ramos, quienes siempre han estado
a mi lado brindndome su confianza, comprensin, apoyo y amor, guindome en
todos los aspecto de mi vida.

A mis hermanos Jacqueline, Yngrid, Jannifher, Orlando y la consentida Glorianny ,


porque junto a ellos aprend, que alcanzar una meta, hay que hacer muchos esfuerzos
y sacrificio. Hermanos este triunfo es tambin de ustedes, ya que siempre han estado
a mi lado, llenndome de fuerzas para luchar contra las adversidades y salir siempre
triunfante.

A mis sobrinos Samuel y Michelle, espero que mi ejemplo los motive a lograr sus
metas y ayude a obtener lo que quieren en la vida para que sean orgullo de sus padres.

A mi novio Jos Manuel Pens porque con su amor y comprensin, estuvo a mi lado
dndome palabras de aliento para que luchara por m meta. Mi amor te dedico mi
triunfo, gracias por compartir conmigo los momentos ms bello de mi vida.

A todos mis compaeros del curso especial de grado, en especial a Mariangeles,


quien realizo junto a mi, este trabajo de investigacin.

Yaritza Ramos S.

iv

LISTA DE TABLAS
Tabla 1-1 Muestreo Estratificado .............................................................................. 22
Tabla 1-2 Tipos de Muestreo .................................................................................... 24
Tabla 2-1 Anlisis de Regresin Lineal .................................................................... 48
Tabla 3-1 Frecuencias Esperadas .............................................................................. 72
Tabla 3-2 Tabla de contingencia 2x2. Frecuencias Observadas ............................... 77
Tabla 3-3 Tabla de contingencia 2x2. Frecuencias Observadas y Esperadas ........... 78
Tabla 3-4 Valor calculado de ji-cuadrado ................................................................. 79

LISTA DE FIGURAS
Figura 1-1 Clasificacin de los Mtodos de Muestreo.............................................. 16
Figura 1-2 Pasos para Efectuar una Prueba de Hiptesis .......................................... 31
Figura 1-3 Zonas crticas en la curva normal ............................................................ 32
Figura 1-4 Posibilidades que se Tienen al Tomar una Hiptesis .............................. 33
Figura 1-5 Prueba Unilateral Izquierda ..................................................................... 34
Figura 1-6 Prueba Unilateral Derecha....................................................................... 35
Figura 2-1 Relacin Positiva entre las Variables ...................................................... 42
Figura 2-2 Relacin Negativa entre las Variables..................................................... 42
Figura 2-3 No Existe Relacin entre las Variables ................................................... 43
Figura 2-4 Diferentes formas que toma el Trazo de la Lnea de Regresin ............. 45
Figura 2-5 Diagrama de Dispersin con respecto a las ventas y publicidad ............. 48
Figura 2-6 Intensidad y Direccin del Coeficiente de Correlacin........................... 52
Figura 2-7 Correlacin Positiva ................................................................................ 53
Figura 2-8 Correlacin Negativa ............................................................................... 54
Figura 2-9 Correlacin Negativa ............................................................................... 54
Figura 2-10 Correlacin Positiva Fuerte ................................................................... 54
Figura 2-11 Sin Correlacin ....................................................................................... 55
Figura 2-12 Valores del Coeficiente de Correlacin Mltiple .................................. 60
Figura 3-1 Grados de Libertad en la Distribucin F ................................................. 66
Figura 3-2 Representacin Grfica de ji-cuadrado como Prueba de Bondad de Ajuste
..................................................................................................................................... 73
Figura 3-4 Distribucin ji-cuadrado para Diferentes Grados de Libertad ................ 76
Figura 3-5 Representacin Grfica de ji-cuadrado como Prueba de Independencia 80

vi

UNIVERSIDAD DE ORIENTE
NCLEO DE SUCRE
ESCUELA DE ADMINISTRACIN
DEPARTAMENTO DE CONTADURA

FUNDAMENTOS DE LA ESTADSTICA INFERENCIAL

Autores:

Mariangeles Gmez R.
Yaritza Ramos S.
Asesor:
Prof. Miguel Romero
Fecha: 08-04-2008.

RESUMEN
Inferir significa deducir algo de otra cosa. Nuestra investigacin se refiere, a los Fundamentos de la
Estadstica Inferencial, que se encarga de hacer deducciones de una poblacin por medio de una
muestra tomada a partir de sta; sirviendo as para las organizaciones, porque le permite a la Gerencia
tomar decisiones vlidas, respecto a las predicciones futuras. Para realizar este anlisis estadstico se
requiere utilizar la distribucin muestral, porque a partir de la muestra seleccionada de una poblacin,
puede construirse variables aleatorias alternativas, de cuyo anlisis se desprenden interesantes
propiedades estadsticas (distribucin muestral de la media y de la proporcin). Los problemas que se
tratan en Inferencia Estadstica, se basan en dos clases: la estimacin o intervalo de confianza y las
pruebas de hiptesis. En donde el intervalo de confianza viene dado por un rango de valores, dentro del
cual se espera encontrar el valor del parmetro estudiado; y las pruebas de hiptesis, que son supuestos
que se plantea el investigador antes de iniciar una investigacin, partiendo de una muestra aleatoria
significativa, para extraer conclusiones que permitan aceptar o rechazar una hiptesis previamente
emitida, sobre el valor de un parmetro desconocido, el cual aborda una serie de pasos. El anlisis de
regresin y correlacin, permite relacionar dos o ms variables (variable independiente y variable
dependiente). El anlisis de varianza sirve para comparar si los valores de un conjunto de datos
numricos, son significativamente distintos a los valores de otro o ms conjunto de datos. Como en la
prctica todas las poblaciones no pueden tomarse como normales, por situacin en donde no es posible
formular una hiptesis segura sobre el valor de un parmetro, surgen las pruebas no paramtricas (ji
cuadrado), stas no dependen de un slo tipo de distribucin.
Palabras claves: Inferir, Estimacin, Hiptesis, Regresin, Correlacin.

vii

INTRODUCCIN
La palabra estadstica proviene del latn statiscus y significa del estado.

La Estadstica, desde su origen y a lo largo de la historia ha mostrado un


respetable prestigio en las estrategias de hacer uso de la informacin recopilada, con
la finalidad de analizarla por medio de los datos que se recogen de un evento
cualquiera.

La Estadstica es una ciencia de la rama de las Matemticas, que estudia la


recopilacin, organizacin, presentacin, anlisis e interpretacin de datos de manera
cuantitativa y cualitativa, la cual nos sirve de gran utilidad para una toma de
decisiones ms efectiva por medio de resultados precisos y predicciones hacia el
futuro. Dicha ciencia es aplicable a una amplia variedad de disciplinas que van desde
la fsica hasta las ciencias sociales, as como la psicologa, la medicina, entre otras; se
puede decir que la Estadstica se puede aplicar a casi todo el quehacer humano, que
genere informacin cuantitativa y cualitativa.

La Estadstica se divide en dos ramas, que van desde el clculo ms sencillo


hasta el anlisis ms complejo: la Estadstica Descriptiva y la Estadstica Inferencial.

La Estadstica Descriptiva, se basa en hechos ya ocurridos, y no es ms que la


aplicacin de aquellos mtodos que por medio de la recoleccin de datos nos van a
permitir describir, resumir y presentar la informacin a travs de tablas, grficas o
cualquier valor numrico, llamadas tambin medidas descriptivas.

Inferir significa deducir algo de otra cosa. Existen algunos eventos, que para ser
analizados requieren de elementos estadsticos, que van ms all de la Estadstica

Descriptiva, es decir, que no basta con recolectar, describir y resumir los datos,
para presentarlos en grficas, tablas o valor numrico, razn por la cual surge la
Estadstica Inferencial.

La Estadstica Inferencial, es un mtodo inductivo, que trata de estimar las


caractersticas de universo estadstico o poblacin total, a travs del estudio de una
parte del universo, a esta parte se le denomina muestra.

El investigador, pudiera estar interesado en conocer informacin que traspase


los hechos ocurridos, a travs del estudio de una porcin de la poblacin objeto de
estudio. Es por eso que la Estadstica Inferencial permite entre otras cosas:

Comparar las actuaciones de dos o ms grupos y comprobar la significacin de


cualquier diferencia entre ellos.
Probar la significacin de las relaciones entre variables.
Predecir el comportamiento futuro de una o ms variables.

La Estadstica Inferencial, es de gran importancia para las organizaciones, ya


que le permite a la Gerencia tomar decisiones ms vlidas, acerca de lo que puede
acontecer en la empresa por medio de las predicciones futuras analizadas.

Este trabajo de investigacin, est estructurado en tres captulos, los cuales van
a permitir comprender mejor los fundamentos de la Estadstica Inferencial:

En el captulo I, se da una definicin de la Estadstica Inferencial, para luego


hablar de las distribuciones muestrales, en donde se analiza el por qu es necesario

muestrear y se explica los procedimientos y mtodos de muestreo. Adems se hace


referencia del intervalo de confianza y el uso de las pruebas de hiptesis.

El captulo II, trata sobre el anlisis de regresin y correlacin ms que todo


lineal. En el anlisis de regresin lineal, se habla del principio de mnimos cuadrados
y el trazo de la lnea recta. En el anlisis de correlacin lineal, se muestra el
coeficiente de correlacin, el coeficiente de determinacin, etc.

El captulo III, se refiere al anlisis de varianza y las pruebas no paramtricas,


en especial la distribucin de ji-cuadrado.

PLANTEAMIENTO DE PROBLEMA
La Estadstica es una ciencia perteneciente a la rama de las Matemticas, que se
encarga de reunir, organizar y analizar informacin cuantitativa y cualitativa, y
deducir a travs del anlisis de los datos significados precisos o previsiones hacia el
futuro; adems que nos sirve de ayuda para la toma de decisiones, ya que nos
proporciona informacin, as como la relacin de datos econmicos

administrativos, o cualquier otra variable.

La Estadstica como todas las ciencias, no se origin

de improviso, sino

mediante un proceso largo de desarrollo y evolucin, desde hechos que van de una
simple recoleccin de datos hasta la diversidad rigurosa e interpretacin de los
mismos (datos) que se dan hoy en da.

Dependiendo del tipo de informacin, la Estadstica se divide en dos grandes


ramas: la Estadstica Descriptiva y la Estadstica Inferencial. La Estadstica
Descriptiva se encarga ms que todo de la presentacin de datos en forma de grficas,
tablas y valores numricos; y la Estadstica Inferencial que en este caso es nuestro
problema de estudio, va ms all, se deriva de muestras, de observaciones hechas
solo acerca de una parte de un conjunto numeroso de elementos, por lo cual su
anlisis necesita de generalidades ms profundas.

La Estadstica Inferencial, es la parte de la Estadstica, que nos permite


comprender las tcnicas con las que, con base nicamente en una muestra sometida a
observacin, se toman decisiones sobre una poblacin o proceso estadstico. Dado
que estas decisiones se toman en condiciones de incertidumbre, suponen el uso de
conceptos de probabilidad. Mientras que a las caractersticas medidas de una muestra

se les llama estadsticas muestrales y a las caractersticas medidas de una poblacin o


universo, se conoce como parmetro de la poblacin.

Dado nuestro objeto de estudio surgieron algunas interrogantes:

En qu se fundamenta la Estadstica Inferencial?

A qu nos referimos cuando hablamos de Estadstica Inferencial?

Cules son las tcnicas fundamentales utilizadas en la Estadstica Inferencial?

En qu consisten las pruebas de hiptesis?

Qu es el anlisis de regresin y correlacin simple y mltiple?

Cmo identificar una variable dependiente y una variable independiente en el


anlisis de regresin?

Cules son las pruebas no paramtricas?

OBJETIVOS
Objetivo General

Estudiar los Fundamentos de la Estadstica Inferencial.

Objetivos Especficos

Definir los aspectos conceptuales de la Estadstica Inferencial.


Definir las tcnicas elementales de la Estadstica Inferencial.
Estudiar las distribuciones muestrales.
Explicar las pruebas de hiptesis.
Identificar la variable dependiente y la variable independiente en el anlisis de
regresin.
Estudiar el anlisis de regresin y correlacin simple.
Describir las pruebas no paramtricas.
Analizar la distribucin ji-cuadrado.

JUSTIFICACIN
La Estadstica es una ciencia que est diseada para aplicar algunos mtodos y
tcnicas que nos van a permitir tomar decisiones ms efectivas, a travs de la
recoleccin, organizacin, anlisis e interpretacin de datos.

La Estadstica se divide en dos categoras o ramas: Estadstica Descriptiva y


Estadstica Inferencial.

La primera (Estadstica Descriptiva), se refiere a aquellos mtodos mediante los


cuales se organizan, resumen y presentan los datos en forma cuantitativa, a travs de
tablas, grficas o valores numricos, permitiendo as que la informacin sea
interpretada cmoda y rpidamente, y de esta manera utilizarlas eficazmente para el
fin que se desee.

Sin embargo, muchas veces se requiere ir ms all de los hechos ya ocurridos,


es por eso que surge la Estadstica Inferencial, la cual se dedica a la generacin de los
modelos, inferencias y predicciones asociados a los fenmenos en cuestin, teniendo
en cuenta lo aleatorio e incertidumbre en las observaciones. Esta Estadstica, trabaja
con muestras, ya que son subconjuntos formados por algunos individuos de la
poblacin; y a partir del estudio de la muestra se pretende inferir aspectos relevantes
de toda la poblacin.

La Estadstica Inferencial juega un papel importante en las organizaciones y


en el mundo empresarial, ya que actualmente sta se ha convertido en un mtodo muy
efectivo para estudiar con mucha precisin los valores de datos econmicos, polticos,
sociales, psicolgicos, biolgicos y fsicos; adems, sirve como herramienta para
relacionar y analizar dichos datos.

Por lo anteriormente mencionado, se puede decir que la Estadstica Inferencial


es de gran ayuda para la Gerencia, ya que por medio de la muestra que se toma de una
poblacin, se pueden hacer predicciones a futuro en una organizacin, analizando as
la Gerencia

los posibles cambios que pueda sufrir una empresa en cualquier

departamento y por ende llegar a conclusiones vlidas; permitiendo as lograr una


adecuada planeacin y control apoyados en los estudios de pronsticos, presupuestos,
etc.

MARCO METODOLGICO
La metodologa incluye el tipo o tipos de investigacin, las tcnicas y
procedimientos que sern utilizados para llevar a cabo la indagacin, con el fin de
lograr el objetivo de la misma.

Nivel de Investigacin

Se refiere al grado de profundidad con que se aborda un objeto o fenmeno.

El nivel de investigacin en este caso fue exploratorio y descriptivo.

Exploratorio, porque se necesit tener una visin general del tema a estudiar,
adems de ser ste un tema poco estudiado.

Descriptivo, porque consisti en la caracterizacin de un hecho con el fin de


establecer su estructura o comportamiento.

Diseo de la Investigacin

Se refiere a la estrategia que adopta el investigador, para responder al problema


planteado.

Este estudio se realiz en base a una investigacin documental.

Segn FIDIAS G. ARIAS (1999: p.47), seala: la investigacin


documental es aquella que se basa en la obtencin y anlisis de datos
provenientes de materiales impresos u otros tipos de documentos.

Fuentes de Informacin

Tienen que ver con el suministro de datos o informacin, que se utilizan para el
estudio.

Para este estudio se requiri de una revisin bibliogrfica basada en


documentos escritos o fuentes secundarias (trabajos de investigacin, textos,
enciclopedias, etc.), lo cual permiti darle soporte a la investigacin.

10

CAPTULO I
ESTADSTICA INFERENCIAL, DISTRIBUCIONES
MUESTRALES, INTERVALO DE CONFIANZA Y PRUEBAS DE
HIPTESIS
De acuerdo con el diccionario de la Real Academia Espaola, inferir significa
Sacar una consecuencia o deducir algo de otra cosa

Existen algunos eventos, que para ser analizados, necesitan elementos


estadsticos que van ms all de la Estadstica Descriptiva, es decir, que no basta con
recolectar, describir y resumir los datos, para presentarlos en grficas, tablas o valores
numricos. Es por eso que surge la Estadstica Inferencial, la cual se encarga de hacer
deducciones de una poblacin por medio de una muestra tomada a partir de sta.

1.1. Definicin de Estadstica Inferencial

Para Mason, Lind, y Marchal (2001:p19), Se refiere al conjunto de


mtodos utilizado para saber algo acerca de una poblacin, basndose
en una muestra.
Segn Berenson y Levine (1996:p3), La Estadstica Inferencial puede
definirse como aquellos mtodos que hacen posible la estimacin de
una caracterstica de una poblacin o la toma de decisin de una
poblacin, basndose slo en los resultados de la muestra
La Estadstica Inferencial nos permite comprender las tcnicas, con las que con
base nicamente en una muestra sometida a observacin, se toman decisiones sobre
una poblacin o proceso estadstico.

11

sta se dedica a la generacin de los modelos, inferencias y predicciones


asociados a los fenmenos en cuestin, teniendo en cuenta lo aleatorio e
incertidumbre en las observaciones. Esta Estadstica trabaja con muestra, que no son
ms que subconjuntos formados de algunos individuos de la poblacin; y a partir del
estudio de la muestra se pretende inferir aspectos relevantes de toda la poblacin.

Adems, sirve de gran ayuda para las organizaciones, ya que le permite a la


Gerencia tomar decisiones vlidas, acerca de lo que puede acontecer en una empresa,
a travs de las predicciones futuras analizadas.

1.2. Distribuciones Muestrales

Quizs a veces nos preguntamos: Por qu se requiere muestrear? Pues el


muestrear surge de la necesidad que se tiene cuando se evala la calidad de un
producto, cuando se quiere conocer la opinin de los consumidores, si es eficaz o no
el producto, etc. En muchos casos no es factible estudiar a la poblacin entera, bien
sea porque el costo sea muy alto, o se necesita de mucho tiempo para contactar a toda
la poblacin, entre otras, son algunas de las razones por lo que es indispensable
muestrear.

Para hacer dicho estudio, se necesitan tomar muestras, que no son ms que una
parte de la poblacin. Entendindose por poblacin, el conjunto de elementos que son
seleccionados para llevar a cabo una investigacin.

Una muestra, es un mtodo para inferir algo acerca de una poblacin, es decir,
no es ms que una parte tomada de la poblacin a estudiar. Por medio del muestreo,
surge el uso de los mtodos estadsticos inferenciales.

12

Una vez seleccionada la muestra, se pueden construir variables aleatorias


alternativas, desprendindose de stas, propiedades estadsticas de gran inters. Las
dos formas ms comunes de estas variables corresponden a las distribuciones
muestrales de la media y las distribuciones muestrales de la proporcin.

Cabe destacar, que cuando se usan valores muestrales o estadsticos para


estimar parmetros o valores poblacionales, se puede correr el riesgo de que ocurran
dos tipos de errores: el error muestral y el error no muestral (sesgo muestral).

Para Webster, Allen (1996:p296), las distribuciones muestrales se


refieren a la lista de todos los valores posibles de un estadstico y la
probabilidad asociada a cada valor.
La distribucin muestral, se refiere a la distribucin de los valores que tomar el
estimador al escoger diferentes muestras de la poblacin. sta distribucin se basa
fundamentalmente en dos medidas: la media, que indica el valor promedio del
estimador; y la desviacin tpica o error tpico de estimacin, que se refiere a la
desviacin promedio que se puede esperar entre el estimador y el valor del parmetro.

Existen dos tipos de distribuciones muestrales, de las cuales se definirn


brevemente: la distribucin muestral de la media y la distribucin muestral de la
proporcin.

Distribucin Muestral de la Media: puede definirse como aquella distribucin


que consta de todas las medias muestrales posibles de un tamao de muestra
dado. En donde cada muestra de tamao n, extrada de una poblacin
proporciona una media, la cual es considerada como una variable aleatoria para
estudiar su distribucin.

13

Distribucin Muestral de la Proporcin: es una distribucin que se da, cuando


muchas veces se plantea estimar una proporcin o porcentaje, en donde la
variable aleatoria toma nicamente dos valores diferentes, que no son ms, que
el xito o el fracaso, en otras palabras, sigue una distribucin binomial.

1.2.1. Procedimientos de Muestreo

Antes de hablar en s de los mtodos de muestreo, es necesario mencionar los


riesgos asociados al procedimiento de muestreo. Estos son: el error muestral y el
sesgo muestral.

1.2.1.1. Errores y Sesgos

a) Error Muestral

Para Mason, Lind y Marchal (2001:p.285), el error muestral Es la


diferencia entre un valor estadstico de muestra y su parmetro
correspondiente.
Linconl, Chao (1993:p.137), opina que es la diferencia entre el valor
de una estadstica obtenido mediante los datos muestrales y el valor
correspondiente al parmetro de la poblacin debido a variaciones
fortuitas en la seleccin de las unidades.
b) Sesgo Muestral

Para Mason, Lind y Marchal (2001:p263), el sesgo muestral es


cuando los resultados de la muestra no probabilstica pueden no ser
representativos de la poblacin.

14

Cuando se usan valores muestrales o estadsticos para estimar parmetros o


valores poblacionales, se puede correr el riesgo de que ocurran dos tipos de errores;
en donde las muestras no son representativas a la poblacin, debido a que los datos no
son cien por ciento reales. Entendindose por muestras no representativas, aquellas
que dan lugar a una estimacin errnea del parmetro y a un error muestral.

Estos tipos de errores son: el error muestral, que se conoce como azar de la
extraccin, el cual se refiere a la variacin natural que se da con las muestras tomadas
de la misma poblacin y por ende se encarga de determinar que esas muestras no
contengan elementos que no sean caractersticos de la poblacin; y el error no
muestral, que es a lo que se refiere el sesgo muestral, aunque para algunos autores
este es un tipo de error muestral; no es ms que una tendencia inherente a un mtodo
de muestreo, que da estimaciones de un parmetro, las cuales pueden ser menores o
mayores en promedio que el parmetro real (sesgo positivo y sesgo negativo), debido
a factores que dependen de la recoleccin, anlisis, interpretacin y revisin de los
datos; permitiendo as, llegar a conclusiones que son sistemticamente diferentes de
la verdad o incorrectas acerca de los objetivos de una investigacin.

1.2.1.2. Mtodos de Muestreo

A continuacin, se presenta un esquema, el cual muestra los diferentes mtodos


de muestreo:

15

Figura 1-1 Clasificacin de los Mtodos de Muestreo

a.1. Muestreo por juicio


a.2. Muestreo casual o fortuito
a. No probabilstico
a.3. Muestreo de cuota
a.4. Muestreo de poblaciones mviles

Muestreo
b.1.1 m.a.s sin reposicin
b.1. Muestreo aleatorio simple
b.1.2 m.a.s con reposicin
b. Probabilstico

b.2. Muestreo aleatorio sistemtico


b.3. Muestreo estratificado
b.4. Muestreo por conglomerado

Fuente: Las autoras.

Ahora, se explicarn los diferentes tipos de muestreo, expuestos en la figura


anterior:

Existen dos tipos de muestreo: el muestreo no probabilstico y el muestreo


probabilstico.

16

a. - Muestreo no Probabilstico

Es conocido tambin como muestreo no aleatorio o de juicio, en l interviene


solamente la opinin personal del investigador, para identificar as los elementos de la
poblacin que deben incluirse en la muestra, evitando el anlisis estadstico requerido
para realizar muestras de probabilidad.

a.1. - Muestreo por Juicio

El investigador toma la muestra seleccionando los elementos que a l le parecen


representativos o tpicos de la poblacin, por lo que depende del criterio del
investigador.

a.2. - Muestreo Casual o Fortuito

Se usa en los casos en donde no es posible seleccionar los elementos, y deben


sacarse conclusiones con los elementos que estn disponibles.

a.3. - Muestreo de Cuota

Se utilizan en estudios de opinin del mercado. Los enumeradores, reciben


instrucciones de obtener cuotas especficas, a partir de las cuales se constituye una
muestra relativamente proporcional a la poblacin.

a.4. - Muestreo de Poblaciones Mviles

Este tipo de muestreo utiliza mtodos de captura, marca y recaptura. Se utiliza


mucho en el estudio de migracin de poblaciones de animales y otras caractersticas.

17

b. - Muestreo Probabilstico o Aleatorio

Es un tipo de muestreo en donde se elige una muestra, de modo que cada


integrante de una poblacin tenga una probabilidad conocida de ser incluida en la
muestra. Este muestreo se basa en datos previamente obtenidos, de los cuales se sacan
conclusiones, y se clasifica en cuatro tipos:

b.1. - Muestreo aleatorio simple


b.2. - Muestreo aleatorio sistemtico
b.3. - Muestreo estratificado
b.4. - Muestreo por conglomerado

b.1. - Muestreo Aleatorio Simple

Es un tipo de muestreo en donde intervienen las leyes de la probabilidad, y por


tal motivo, cada elemento de la poblacin tiene la misma posibilidad de ser elegido
para formar parte de la muestra.

En este muestreo existen dos modalidades:

b.1.1. - Muestreo Aleatorio sin Reposicin


b.1.2. - Muestreo Aleatorio con Reposicin

18

b.1.1. - Muestreo Aleatorio Simple sin Reposicin

Consiste en que una vez seleccionado un elemento de la poblacin para formar


parte de la muestra y, hecho el estudio correspondiente, dicho elemento no puede
volver a formar parte de la poblacin de origen.

b.1.2. - Muestreo Aleatorio Simple con Reposicin

Aqu, una vez que es seleccionado un elemento de la poblacin para formar


parte de la muestra y, ya anotadas sus caractersticas, dicho elemento regresa a la
poblacin de origen.

b.2. - Muestreo Sistemtico

En este tipo de muestreo, los elementos que van a formar parte de la muestra,
son seleccionados de manera ordenada, tomando en cuenta el tamao de la poblacin
y el tamao de la muestra.

Se debe determinar un intervalo regular o una razn. Se elige un punto de


partida, representando ste el primer elemento de la muestra, el cual es al azar y debe
de estar comprendido o incluido en el valor de k. A este punto de partida, se le
suma el valor de k o intervalo regular, obteniendo de esta manera el segundo
elemento de la muestra, al cual se le suma nuevamente el valor de k para encontrar
el tercero y as sucesivamente hasta completar el tamao de la muestra.

Ejemplo:

Si queremos tener una idea de la edad promedio de los estudiantes que cursan el
ltimo semestre en la Universidad de Oriente (Ncleo Sucre). Entonces,

19

primeramente se toma un punto de partida y luego de forma sistemtica se van


eligiendo las posibles muestras.

Supongamos que son 1.000 estudiantes y vamos a usar una muestra de 20


estudiantes.

Como debemos determinar un intervalo regular o una razn antes de elegir el


punto de partida, usamos la siguiente frmula:
Error! Marcador no definido.
k=

N
n

Donde:

k = Razn o intervalo regular


N = Tamao de la poblacin
n = Tamao de la muestra

Sustituyendo la frmula:

N = 1.000
n = 20

k=

1.000
= 50
20

Ahora para determinar los elementos muestrales de acuerdo al tamao de la


muestra(n), primeramente elegimos un punto de partida al azar con el tamao de la

20

poblacin (N), luego de una forma sistemtica vamos a ir sumando el valor de k


hasta completar el tamao de la muestra, que en este caso es 20.

Punto de partida = 2

Elementos Muestrales
(20)

2, 52, 102, 152, 202, 252, 302, 352, 402, 452,


502, 552, 602, 652, 702, 752, 802, 852, 902, 952

2 + 50 = 52
52 + 50 = 102
.
.
.
902 + 50 = 952
b.3. - Muestreo Estratificado

El muestreo estratificado, se encarga de separar a la poblacin en diferentes


estratos o grupos, para despus elegir una muestra aleatoria de cada uno, lo cual dar
como resultado una muestra global.

Ejemplo:

Supongamos que nos interesa obtener una muestra de la comunidad


universitaria. En donde la poblacin esta formada por 40.000 personas, para ello se
toma una muestra de 600 personas, las cuales estn clasificadas en: estudiantes,
obreros, empleados y profesores.

21

Tabla 1-1 Muestreo Estratificado


Comunidad Universitaria
(estratos)

nh =

Nh

Estudiantes (A)

30.000

75

Obreros (B)

3.000

7,5

Empleados (C)

2.000

Profesores (D)

5.000

12,5

Total

40.000

100%

Nh
* nError! Marcador no definido.
N

Donde:

nh = Tamao de la muestra de cada estrato


Nh = Nmero de elementos de cada estratos
N = Tamao de la poblacin
n = Tamao de la muestra

nh (A) =

30.000
* 600 = 450
40.000

nh (B) =

3.000
* 600 = 45
40.000

nh (C) =

2.000
* 600 = 30
40.000

nh (D)=

5.000
* 600 = 75
40.000

600

22

b.4. - Muestreo por Conglomerado, de Racimo o de Agregados

El muestreo por conglomerado es un tipo de muestreo aleatorio, en el cual la


poblacin se divide en grupos o conglomerados de elementos, para luego seleccionar
una muestra aleatoria de esos grupos.

Este tipo de muestreo su usa en reas geogrficas grandes, permitiendo as


reducir el costo de muestrear una poblacin dispersa.

Ejemplo:

Para una investigacin de mercado, queremos determinar por muestreo el


nmero promedio de ventiladores que hay en una casa. Como la ciudad es grande
geogrficamente, se puede usar un mapa de sta, en donde se divida el territorio en
manzanas, para luego escoger un cierto nmero de las manzanas y a travs de cada
casa poder encuestar a sus habitantes.

Una vez expuesto cada uno de los tipos de muestreo, ahora se muestra un
cuadro, que presenta las caractersticas, ventajas y desventajas de los diferentes tipos
de muestreo probabilstico:

23

Tabla 1-2 Tipos de Muestreo


TIPOS DE
MUESTREO
Aleatorio Simple

CARACTERSTICAS

VENTAJAS

DESVENTAJAS

Se selecciona una muestra


de tamao n de una
poblacin de N unidades,
cada elemento tiene una
probabilidad de inclusin
igual y conocida n/N

Sencillo y de fcil
comprensin.
Clculo rpido de
medias y varianzas.
Se basa en la teora
estadstica, y por
tanto
existen
paquetes
informticos
para
analizar los datos.

Requiere que se posea


de
antemano
un
listado completo de
toda la poblacin.
Cuando se trabaja con
muestras pequeas es
posible
que
no
represente
a
la
poblacin
adecuadamente.

Sistemtico

Conseguir un listado de los


N
elementos
de
la
poblacin.
Determinar
el
tamao
muestral n.
Definir un intervalo k=N/n.
Elegir un nmero aleatorio,
r, entre 1 y k (r=arranque
aleatorio).
Seleccionar los elementos de
la lista.

Fcil de aplicar.
No
siempre
es
necesario tener un
listado de toda la
poblacin.
Cuando la poblacin
est
ordenada
siguiendo
una
tendencia conocida,
asegura
una
cobertura
de
unidades de todos
los tipos.

Si la constante de
muestreo
est
asociada
con
el
fenmeno de inters,
entonces,
las
estimaciones
obtenidas a partir de la
muestra
pueden
contener sesgo de
seleccin.

Estratificado

En
ciertas
ocasiones
resultar
conveniente
estratificar la muestra segn
ciertas variables de inters.
Para ello debemos conocer
la composicin objetivo a
muestrear.
Una vez calculado el tamao
muestral adecuado, ste se
reparte
de
manera
proporcional
entre
los
distintos estratos definidos
en la poblacin usando una
simple regla de tres.

Tiende a asegurar
que
la
muestra
represente
adecuadamente a la
poblacin
en
funcin de unas
variables
seleccionadas.
Por medio de ste,
se
obtienen
estimaciones
ms
precisas.
Su
objetivo
es
obtener una muestra
lo ms semejante
posible
a
la
poblacin en lo que
a
las
variables
estratificadotas
se
refiere.

Se ha de conocer la
distribucin en la
poblacin
de
las
variables
utilizadas
para la estratificacin.

24

Continuacin de Tabla N 1-2


Conglomerados

Se realizan varias fases de


muestreo sucesivas.
La necesidad de listados de
las unidades de una etapa se
limita a aquellas unidades de
muestreo seleccionadas en la
etapa anterior.

Es muy eficiente
cuando la poblacin
es muy grande y
dispersa.
No es preciso tener
un listado de toda la
poblacin, slo de
las
unidades
primarias
de
muestreo.

El error estndar es
mayor que en el
muestreo
aleatorio
simple o estratificado.
El clculo del error
estndar es complejo.

Fuente:http://www.hsa.es/id/investigacion/uai/uai_docs/muestreo/muestreo.htm

1.3. Intervalo de Confianza

A partir de la normalizacin de estudios estadsticos por medio de las


distribuciones muestrales, se pueden determinar parmetros de una poblacin a travs
de sus valores estadsticos. Esto, es lo que se conoce como estimacin, la cual se
clasifica en: estimacin puntual y estimacin por intervalo.

La estimacin puntual, es aquella donde se estima un parmetro poblacional por


medio de un slo estadstico o valor del estimador.

La estimacin por intervalo o intervalo de confianza, es aquella que viene dada


por un rango de valores dentro del cual se espera encontrar el valor del parmetro que
se estime. En otras palabras, el intervalo de confianza, se refiere a todos los valores
obtenidos a partir de los datos de una muestra, en el que hay una determinada

25

probabilidad de que se encuentre el parmetro estudiado con cierta certeza. Dicho


intervalo viene dado por un lmite inferior ( Li ) y un lmite superior ( Ls ).

Pero antes, de empezar a hablar, tanto del intervalo de confianza de la media


como el de la proporcin, es necesario definir que es un nivel de confianza, as como
el coeficiente de confianza, y el teorema central del lmite.

Nivel de confianza: es la mxima probabilidad de encontrar el valor del


parmetro que se estima dentro del intervalo establecido, es decir, es el coeficiente de
confianza expresado en porcentaje.

Coeficiente de confianza: es la probabilidad que existe, de que el intervalo de


confianza contenga el parmetro poblacional.

Teorema central del lmite: permite el uso de probabilidad normal para crear los
intervalos de confianza de la media poblacional y realizar pruebas de hiptesis.

1.3.1. Intervalo de Confianza para la Media

Es un intervalo cuya finalidad es hallar dos valores (lmite inferior y lmite


superior), los cuales pueden permitir calcular la media poblacional verdadera. Si se
conoce la desviacin tpica poblacional () se usa la siguiente frmula:
Li = X z
X z

n
Ls = X + z

26

Donde:
X i = Media muestral

z = Valor encontrado en la tabla de rea bajo la curva normal, segn el nivel de


confianza

= Desviacin estndar poblacional


n = Tamao de la muestra

En caso de desconocerse la desviacin estndar de la poblacin, la frmula es la


siguiente:
X z

s
n

Donde:
X i = Media muestral

z = Valor encontrado en la tabla de rea bajo la curva normal, segn el nivel de


confianza
s = Desviacin estndar muestral
n = Tamao de la muestra

El teorema central del lmite, se aplica cuando la poblacin es infinita o el


muestreo es con reemplazamiento, utilizando el factor de correccin. Las frmulas
son las siguientes:

27

Si se conoce la desviacin tpica poblacional:

X z

N n
n 1

Si se desconoce la desviacin tpica poblacional:

X z

s
n

N n
n 1

Todas las frmulas anteriormente mencionadas, se usan cuando las muestras


son grandes (mayor que 30 elementos) o si la fraccin muestral (n/N) es mayor a
0,05 5%.

Si se trata de muestras pequeas, se utiliza la distribucin de Student, utilizando


las frmulas anteriores pero z (rea bajo la curva normal) se sustituye por t.

1.3.2. Intervalo de Confianza para una Proporcin

Una proporcin, es una razn o porcentaje que indica la porcin de la muestra o


la poblacin que posee una caracterstica determinada. El procedimiento es semejante
al de la media. Empleando la siguiente frmula:

pz

28

p (1 p )
n

Donde:
p = Proporcin muestral del evento estudiado
z = Valor encontrado en la tabla de rea bajo la curva normal, asociado al nivel
de confianza
n = Tamao de la muestra
p = Proporcin de la poblacin

1.4. Pruebas de Hiptesis

Una hiptesis es una afirmacin o suposicin respecto al valor de un parmetro


poblacional. Como por ejemplo: el ingreso mensual promedio de los trabajadores es
Bs. 615.000,. Otro podra ser, que el 90% de las formas fiscales son llenadas
correctamente.

Todas estas hiptesis tienen algo en comn, las poblaciones de inters son tan
grandes que no es factible estudiar todos sus elementos. Una solucin para estudiar la
poblacin entera, es tomar una muestra de la poblacin de inters; y de esta manera se
puede probar una aseveracin para determinar si la evidencia soporta o no la
afirmacin.

Para Mason, Lind y Marchal (2001:p.353), una prueba de hiptesis Es


un procedimiento estadstico que se basa en evidencias muestrales y en
la teora probabilstica, y se emplea para determinar si la declaracin
planteada acerca del parmetro poblacional es racionable
La prueba de hiptesis, viene a ser un supuesto que se plantea el investigador
antes de iniciar una determinada investigacin. Supuesto que al final de la
investigacin puede ser cierto y aprobarse, as como tambin puede ser falso y
rechazarse.

29

La finalidad de la prueba de hiptesis, no es cuestionar el valor calculado del


estadstico muestral, sino que se encarga de hacer juicio con respeto a la diferencia
entre el estadstico muestral y un valor planteado del parmetro.

1.4.1. Procedimientos para Probar una Hiptesis

Para probar una hiptesis, se sigue un procedimiento sistemtico que consta de


una serie de pasos, los cuales le van a permitir al investigador tomar una decisin.

A continuacin se presenta una figura donde se muestran los pasos para realizar
una prueba de hiptesis:

30

Figura 1-2 Pasos para Efectuar una Prueba de Hiptesis


Paso 1

Planteamiento de la hiptesis
nula y alternativa

Seleccionar el nivel de

Paso 2

significancia
Identificacin del valor

Paso 3

estadstico de prueba

PRUEBA DE HIPTESIS
Paso 4

Formulacin de una regla de


decisin

Paso 5

Aceptar

Tomar una muestra y decidir

H0

Aceptar

Ha

rechazarla

Fuente: Las autoras

Explicando en profundidad cada paso, se tiene lo siguiente:

Paso 1: Plantear la hiptesis nula ( H 0 ) y la hiptesis alternativa ( H a )

Toda investigacin estadstica requiere de la existencia de hiptesis o


afirmaciones acerca de la poblacin que se estudia.

El primer paso, es establecer la hiptesis a ser probada. sta es llamada


hiptesis nula ( H 0 ), es una afirmacin que no se rechaza tan solo que los datos de la
muestra proporcionen evidencia convincente de que es falsa; indica que no existe

31

diferencia significativa entre los resultados obtenidos esperados en la investigacin


determinada. Si se acepta la hiptesis nula, se dice que la evidencia no es suficiente
para rechazarla pero tampoco se puede afirmar que es verdadera.

La hiptesis alternativa ( H a ), es una afirmacin que se acepta si se rechaza la


hiptesis nula. Indica que existe diferencia significativa entre los resultados obtenidos
y los resultados esperados en una determinada investigacin. Se acepta si la evidencia
proporcionada por la muestra es suficiente para afirmar que la hiptesis nula es falsa.

Paso 2: Seleccionar el nivel de significancia

Se determina el criterio de contraste, especificando el nivel de significancia, el


tipo de distribucin y los valores crticos, como se muestra en la siguiente figura:

Figura 1-3 Zonas crticas en la curva normal

El nivel de significancia o de confianza, es la probabilidad de rechazar una


hiptesis nula verdadera. Si la hiptesis planteada es verdadera, entonces, el nivel de
confianza indicar la probabilidad de no aceptarla por estar en el rea de aceptacin.
El nivel de confianza (1-), indica la probabilidad de aceptar la hiptesis planteada
cundo es verdadera en la poblacin.

El tipo de distribucin va a depender de la naturaleza de la hiptesis y del


tamao de la muestra. Si la hiptesis es relativa a las medias poblacionales y las

32

muestras son grandes (n > 30) se usa la distribucin normal. En caso contrario, de
tratarse de una muestra pequea (n 30) se utiliza la distribucin t de Student.
Toda decisin tomada por medio de una prueba de hiptesis, puede conllevar a
un error. Existen cuatro posibilidades cuando se va a tomar una decisin respecto a
una hiptesis, las cuales se observan en la figura siguiente:

Figura 1-4 Posibilidades que se Tienen al Tomar una Hiptesis


Posibilidades

Aceptar H 0

H 0 Verdadera

Decisin correcta

H 0 Falsa

Error tipo I

H 0 Verdadera

Error tipo II

H 0 Falsa

Decisin correcta

Hiptesis Nula
( H0 )
Rechazar H 0

Fuente: Las autoras


El error tipo I, que se denota con la letra griega , se da en el caso de que la
hiptesis nula sea rechazada en vez de ser aceptada cuando es verdadera. Mientras
que el error tipo II, denotado con la letra griega , existe cuando se acepta la hiptesis
nula en vez de ser rechazada, por ser sta falsa.

Los valores crticos, separan a la regin de no rechazo de la de rechazo. Son


aquellos valores de la variable de la distribucin que limitan el rea crtica, que no es
ms que la parte de la curva que corresponde al nivel de significancia.

33

La prueba de hiptesis est conformada por dos regiones. Una regin de


rechazo, conocida como regin crtica; y una regin de no rechazo, conocida como
regin de aceptacin.

Si el estadstico de prueba cae dentro de la regin de aceptacin, no se puede


rechazar la hiptesis nula. Sin embargo, la regin de rechazo es considerada como el
conjunto de valores de la prueba de hiptesis que no tienen posibilidad de presentarse
si la hiptesis nula es verdadera.

Por otra parte, es indispensable saber que existen dos tipos de prueba: la prueba
de una cola y la prueba de dos colas.

La prueba unilateral, de una cola o de un extremo; es aquella en donde la


hiptesis planteada indica una sola direccin, formulada con mayor igual que () o
menor igual que ().
Las siguientes figuras muestran, los diferentes tipos de prueba unilateral:

Figura 1-5 Prueba Unilateral Izquierda

34

Figura 1-6 Prueba Unilateral Derecha

La prueba bilateral, de dos colas o de dos extremos; es aquella en donde la


hiptesis planteada no indica direccin. H 0 , se formula con la igualdad (=) y, H a
con diferencia (). La figura 1-3, muestra la prueba de dos colas o bilateral.
Paso 3. Calcular el valor estadstico de prueba

El estadstico de prueba, se refiere a un valor determinado por medio de la


informacin de la muestra, el cual se debe comparar con el criterio de contraste,
permitiendo as rechazar o aceptar la hiptesis.

Este estadstico, va a variar con la cantidad de muestras que se tomen. Si las


muestras a utilizar son mayores a treinta, se utiliza el estadstico z, de ser el caso
contrario, es utilizado el estadstico t.

Paso 4. Formular la regla de decisin

Es cuando se establecen las condiciones en las que se rechaza o se acepta la


hiptesis nula. En donde, la regin de rechazo, define la ubicacin de todos los
valores que son tan grandes o demasiado pequeos y, por lo tanto es muy remota la
probabilidad que se de una hiptesis nula verdadera.

35

Paso 5. Tomar decisin

El ltimo paso es tomar una decisin, para ver si se rechaza o se acepta la


hiptesis nula. Si el estadstico de prueba queda dentro de la zona crtica, la hiptesis
nula se tendr que rechazar y se aceptar la hiptesis alternativa. Si dicho valor se
encuentra fuera de la zona crtica, entonces, la hiptesis nula no deber rechazarse.

1.4.2. Prueba de Hiptesis para la Media

Si se trata de una muestra grande, se usa el valor estadstico de prueba z, es


decir, se aplica la distribucin normal, utilizando las siguientes frmulas:

z=

X =

Donde:

X = Media muestral
= Media poblacional

X = Error estndar de la media


= Desviacin tpica poblacional
n = Tamao de la muestra

36

Si se refiere a una muestra pequea, se desconoce la desviacin tpica


poblacional. En este caso se utiliza el valor estadstico t y para lo cual se debe
conocer los grados de liberta (gl), adems del nivel de significacin.

t=

Xi
SX

s
n

SX =

gl = n -1

Donde:

X i = Media aritmtica muestral

= Media poblacional
S X = Error estndar de media

n = Tamao de la muestra
gl = Grados de libertad

1.4.3. Prueba de Hiptesis para una Proporcin

Se utiliza para conocer el porcentaje de elementos de una poblacin en una


investigacin. Slo se utiliza para muestras grandes, por lo tanto se requiere de la
distribucin normal z. Sus frmulas son las siguientes:
z=

37

pP

p (1 p )
n

p=

X
n

Donde:

p = Proporcin muestral de evento


n = Tamao de la muestra
P = Proporcin poblacional

= Error estndar de la proporcin poblacional


p

p = Proporcin poblacional
X = Nmero de xitos de la muestra

38

CAPTULO II
ANLISIS DE REGRESIN Y CORRELACIN
El anlisis de regresin y correlacin, son muy usados en la Investigacin
Cientfica, una herramienta muy til cuando se trata de relacionar dos o ms
variables, relacionadas entre s. La Correlacin implica el grado de dependencia de
una variable respecto a otra y la Regresin es otra tcnica que ayuda en la
investigacin.

El anlisis de regresin y correlacin simple muestra la relacin entre dos


variables, la variable independiente y la variable dependiente. Al usar slo una
variable independiente estamos ignorando la relacin que pudiera tener la variable
dependiente con otras variables independientes. Al estudio de la influencia de dos o
ms variables independientes (x) sobre la variable dependiente (y) se le llama anlisis
de regresin y correlacin mltiple.

Las tcnicas de regresin, permiten hacer predicciones sobre los valores de


cierta variable y (dependiente), a partir de los de otra x (independiente), entre las
que intuimos que existe una relacin.

2.1. Anlisis de Regresin

La regresin, es un procedimiento por el medio del cual se trata de determinar


si existe relacin de dependencia o no entre dos o ms variables.

En un Anlisis de Regresin simple existe una variable dependiente (y) que


puede ser el nmero de especies, la abundancia o la presencia-ausencia de una sla
especie y una variable explicativa o independiente (x).

39

El propsito es obtener una funcin sencilla de la variable explicativa (x), que


sea capaz de describir lo ms ajustadamente posible la variacin de la variable
dependiente (y). Como los valores observados de la variable dependiente difieren
generalmente de los que predice la funcin, sta posee un error. La funcin ms
eficaz es aquella que describe la variable dependiente con el menor error posible o,
dicho en otras palabras, con la menor diferencia entre los valores observados y
predichos. La diferencia entre los valores observados y predichos (el error de la
funcin) se denomina variacin residual o residuos. Para estimar los parmetros de la
funcin se utiliza el ajuste por mnimos cuadrados. Es decir, se trata de encontrar la
funcin en la cual la suma de los cuadrados de las diferencias entre los valores
observados y esperados sea menor. Sin embargo, con este tipo de estrategia es
necesario que los residuos o errores estn distribuidos normalmente y que varen de
modo similar a lo largo de todo el rango de valores de la variable dependiente. Estas
suposiciones pueden comprobarse examinando la distribucin de los residuos y su
relacin con la variable dependiente.

Cuando la variable dependiente es cuantitativa (por ejemplo, el nmero de


especies) y la relacin entre ambas variables sigue una lnea recta, la funcin es del
tipo yi * = a + bxi , en donde:

a es el intercepto o valor del punto de corte de la lnea de regresin con el eje


de la variable dependiente (una medida del nmero de especies existente cuando la
variable ambiental tiene su mnimo valor).

b es la pendiente o coeficiente de regresin (la tasa de incremento del nmero


de especies con cada unidad de la variable ambiental considerada).

40

Si la relacin no es lineal pueden transformarse los valores de una o ambas


variables para intentar linearizarla. Si no es posible convertir la relacin en lineal,
puede comprobarse el grado de ajuste de una funcin polinomial ms compleja. La
funcin polinomial ms sencilla es la cuadrtica (y = a + bx + bx2) que describe una
parbola, pero puede usarse una funcin cbica u otra de un orden aun mayor capaz
de conseguir un ajuste casi perfecto a los datos. Cuando la variable dependiente se
expresa en datos cualitativos (presencia-ausencia de una especie) es aconsejable
utilizar las regresiones logsticas (Y= [exp (a + bx)] / [1 + exp (a + bx)]).

De lo anteriormente dicho, se deduce, que el anlisis de regresin simple,


estudia el comportamiento de una variable dependiente (y) en funcin de una variable
independiente (x) de manera tal que se pueda precisar la relacin entre dichas
variables, con el propsito de hacer pronsticos o predicciones.

La relacin entre dos variables se puede determinar mediante un grfico o


diagrama de dispersin, un modelo de lnea recta a travs del mtodo de los mnimos
cuadrados y mediante un contraste de hiptesis.

Diagrama de Dispersin

Cuando los valores de la variable dependiente e independiente son llevados a un


eje de coordenadas cartesianas, se puede apreciar un conjunto de puntos que muestran
a simple vista la relacin entre las variables, el cual recibe el nombre de diagrama de
dispersin; es decir, no es ms que graficar los pares de puntos de la variable, lo cual
le permite al investigador, aproximar que tipo de relacin hay entre las variables.

En otras palabras, el diagrama de dispersin, es un trazo en un sistema de


coordenadas rectangulares o cartesianas de manera tal que se grafican los puntos
apareados de las variables estudiadas.

41

Este grfico permite precisar si existe relacin o no entre las variables, y si la


misma es positiva o negativa (ascendente o descendente).

Las figuras presentadas a continuacin, muestran la relacin existente entre las


variables para el coeficiente de regresin:

Figura 2-1 Relacin Positiva entre las Variables

Figura 2-2 Relacin Negativa entre las Variables

42

Figura 2-3 No Existe Relacin entre las Variables

Ecuacin de Regresin: es una ecuacin que define la relacin lineal entre dos
variables.
y i * = a + bxi
Donde:

y i * = es el valor pronosticado de la variable y para un valor seleccionado de


x.

a = es la ordenada de la interseccin con el eje y, o sea el valor estimado de


y cuando x = 0. Es decir, corresponde al valor estimado de y, donde la recta de
regresin cruza el eje y, cuando x es igual a cero.

b= es la pendiente de la recta, o sea, el cambio promedio en y*por unidad de


cambio (incremento o decremento) en la variable independiente x.

x = es cualquier valor seleccionado de la variable independiente.

43

Las frmulas para b y a son:

Pendiente de la lnea de regresin:

b=

n y i xi y i xi
n xi ( xi ) 2
2

Interseccin con el eje x:


a=

b xi
n

Donde:

xi = es un valor de la variable independiente.


y i = es un valor de la variable dependiente.
n = es el nmero de elementos en la muestra.

2.1.1. Principio de Mnimos Cuadrados

Es la tcnica utilizada para lograr la ecuacin de regresin, minimizando la


suma de los cuadrados de las distancias verticales entre los valores verdaderos de "y"
y los valores pronosticados "y".

Esta tcnica nos permite seleccionar la lnea recta que mejor se ajusta a los
datos de manera tal que la suma de los cuadrados de la diferencia de cada valor
observado y cada valor esperado (tendencia) sea la misma.

44

2.1.2. Trazo de la Lnea de Regresin

El trazo de la lnea recta, es una lnea ajustada a un grupo de puntos para


estimar la relacin entre dos variables, como se puede observar en las figuras que se
presentan a continuacin:

Figura 2-4 Diferentes formas que toma el Trazo de la Lnea de Regresin


Lineal Directa

Lineal Inversa

Curvilnea Directa

Lineal Inversa con


Curvilnea Inversa

ms Dispersin

Ninguna Relacin

Error Estndar de Estimacin

Es la medida de confiabilidad de la ecuacin de estimacin, que indica la


variabilidad de los puntos observados alrededor de la lnea de regresin, esto, es hasta
que punto los valores observados difieren de sus valores predichos sobre la lnea de
regresin.

En otras palabras, el error estndar de estimacin, es la medida de la dispersin


de los valores observados, con respecto a la lnea de regresin.

45

Para comprender mejor la aplicacin del error estndar de estimacin en el


anlisis de regresin, deben enunciarse primero las consideraciones bsicas con
respectos a la regresin lineal y la correlacin:

1.- Para cada valor de x existe un grupo de valores y, y estos valores y se


distribuyen en forma normal.

2.- Las medias de estas distribuciones normales de valores y, se encuentran


todas en la lnea de regresin.

3.- Las desviaciones estndares de dichas distribuciones normales son iguales.

4.- Los valores de y son estadsticamente independientes. Esto significa que


al seleccionar una muestra, los valores y seleccionados para un valor x especfico
no dependen de los valores y para cualquier otro valor x.

Frmula para el clculo del error estndar de estimacin

Mtodo Directo

Si la muestra es pequea:

Sx y =

( y y )
i

n2

46

Si la muestra es grande:

(y

Sx y =

yi ) 2
n

Donde:

S x y = Error estndar
yi = Valor de la variable dependiente
yi * = Valor pronosticado de la variable dependiente
n = Nmero de la muestra

Mtodo Abreviado

Si la muestra es pequea:

Sx y =

a yi b yi xi
n2

Si la muestra es grande:

Sx y =

a yi b yi xi
n

Donde:

yi = Valor de la variable dependiente

47

a = Valor estimado de y cuando x es igual a cero


b = Pendiente de la recta

Para ilustrar el procedimiento del anlisis de regresin lineal, se presenta a


continuacin un ejemplo:

Tabla 2-1 Anlisis de Regresin Lineal


Ventas
(miles Bs.)

Publicidad
(miles Bs.)

yi

xi

y i xi

xi

yi

yi

( yi yi ) 2

100

1,25

125

1,5625

10.000

101,4322692

2,0449

125

1,80

225

3,24

15.625

136,1335203

123,8769

200

2,5

500

6,25

40.000

180,2987489

388,09

250

4,8

1.200

23,04

62.500

325,4130716

5.686,6681

400

4,9

1.960

24,01

160.000

331,72239

4.656,6976

1.075

15,25

4.010

58,1025

288.125

1.075

10.857,3775

Primeramente realizamos el diagrama de dispersin:

Figura 2-5 Diagrama de Dispersin con respecto a las ventas y publicidad


500
400
300

VENTAS

200
100
0
0

yi * = a + bxi

n=5

48

b=

b=

n yi xi yi xi
n xi ( xi ) 2

5(4.010) 1.075(15,25)
20.050 16.393,75
3.656,25
=
=
= 63,09318378
2
290,5125 232,5625
57,95
5(58,1025) (15,25)

a=

a=

b xi
n

1.075 63,09318378(15,25) 1.075 962,1710526 112,8289474


=
=
= 22,56578947
5
5
5

Sustituyendo la frmula, se tiene:


y i * = 22,56579947 + 63,09318378 xi

Este es un modelo matemtico que permite predecir o estimar el valor de yi


(ventas), a travs del valor de xi (publicidad).

Supongamos que se quiere tener el monto de las ventas para cuando el monto
invertido en publicidad sea igual a Bs.3.000.000,

yi

(3 )

= 22,56578947 + 63,09318378(3) = 211,85

Se estima que las ventas sern de 211,85 miles de Bs. Para cuando la inversin
de publicidad es de Bs.3.000.000,

49

Clculo del error estndar de estimacin:

Supongamos que la muestra es grande y el mtodo aplicado es el directo.

Sx y =

(y

yi ) 2
n

Sustituyendo la frmula:

Sx y =

10.857,38
= 46,60 miles de Bs.
5

Se estima, que el promedio de variaciones entre los valores observados y los


estimados es de 46,60 miles de Bs., tanto por encima como por debajo de stos.

2.2. Anlisis de Regresin Mltiple

Se puede definir como el proceso, a travs de cual, se utilizan varias variables


para predecir otra. Para este anlisis, la ecuacin tiene varias variables
independientes:
y* = a + b1 x1 + b2 x2 + ... + bk xk

Donde:

x1 , x2 ,...xk , son las variables independientes.


a, es el punto donde la lnea de regresin cruza el eje de las y.
b1 , b2 ,...bk , son los coeficientes de regresin.

50

2.3. Anlisis de Correlacin

La correlacin, es un conjunto de tcnicas estadsticas utilizadas para medir la


fuerza que existe entre la relacin de dos variables, como por ejemplo: Existe alguna
relacin entre los gastos de publicidad de una empresa y sus ventas?, Hay relacin
entre la edad de los adultos y la estatura?, etc.

Para Levin y Rubin (1996:p.680), el anlisis de correlacin es una


herramienta estadstica que podemos usar para describir el grado hasta
el cual una variable est linealmente relacionada con otra.
El anlisis de correlacin lineal o simple, permite medir y precisar la intensidad
con que una variable se relaciona, es decir, su propsito primordial es encontrar que
tan fuerte es la relacin entre dos variables.

Usualmente, el anlisis de correlacin es, usado junto con el anlisis de


regresin para medir los cambios que explica la lnea de regresin con respecto a la
variable dependiente y.

Pero, la correlacin, tambin se puede utilizar para medir el grado de asociacin


entre dos variables; y para realizar dicho anlisis, es necesario contar con varias
medidas estadsticas como lo son: el

diagrama de dispersin, el coeficiente de

correlacin, el coeficiente de determinacin y el coeficiente de no determinacin.

Diagrama de Dispersin

El diagrama de dispersin, no es ms que una grfica, en donde se describe en


un plano cartesiano con una serie de puntos, la relacin entre dos variables de inters.
En donde, la variable dependiente se grafica sobre el eje vertical y, y la variable
independiente sobre el eje horizontal x.

51

2.3.1. Coeficiente de Correlacin

El coeficiente

de correlacin, llamado tambin coeficiente de correlacin

momento de Pearson, fue creado por Kart Pearson, aproximadamente en el ao 1.900,


el cual, es denotado con la letra r.

Dicho coeficiente, mide la intensidad de la relacin entre dos variables y, tiene


un campo de variabilidad o puede asumir valores entre -1 y +1, indicando stos los
puntos crticos de r.

La siguiente figura que se presenta a continuacin, muestra la fuerza y


direccin del coeficiente de correlacin

Figura 2-6 Intensidad y Direccin del Coeficiente de Correlacin


Correl. perf.

Correl.

No existe

Correl.

Correl. Perf.

negativa

moderada.

correlacin

moderada.

positiva

negativa

-1

positiva

-0,5

Correl. fuert
negativa

0,5

Correl. dbil
Correl. dbil

positiva

negativa

Correl. fuerte
positiva

Fuente: Las autoras

Si r = -1, se dice que la correlacin es perfecta negativa, es decir, entre las dos
variables existe una relacin matemtica inversamente proporcional. En otras
palabras, mientras una variable crece, la otra disminuye exactamente en la misma
proporcin. Vase figura 2-8

52

Ejemplo:

El salario real y la inflacin.

Si r = 0, las variables no guardan relacin y por lo tanto no existe correlacin.


Vase figura 2-11

Si r = 1, la correlacin es perfecta positiva, implicando sta una relacin


directamente proporcional, lo que quiere decir, que mientras una variable crece, la
otra aumenta en la misma proporcin. Vase figura 2-7

Ejemplo:

La inflacin y el ndice de precio.

A continuacin, se muestran una serie de grficas, en donde se presentan las


diferentes formas del coeficiente de correlacin:

Figura 2-7 Correlacin Positiva

53

Figura 2-8 Correlacin Negativa

Figura 2-9 Correlacin Negativa

Figura 2-10 Correlacin Positiva Fuerte

54

Figura 2-11 Sin Correlacin

Frmula del coeficiente de correlacin:

r=

[n x

n yi xi yi xi
2

][

( xi ) n yi ( yi )
2

Donde:

n = Nmero de pares de observaciones

x = Suma de la variable independiente (x)


y = Suma de la variable dependiente (y)
x = Suma de los cuadrados de x
( x ) = Cuadrado de la suma de x
2

y = Suma de los cuadrados de y


( y ) = Cuadrado de la suma de y
2

55

2.3.2. Coeficiente de Determinacin

Permite establecer si el modelo estudiado es confiable o no. Por medio del


resultado de r, es posible calcular el coeficiente de determinacin, el cual mide la
proporcin en que la variable dependiente explica los cambios ocurridos por la
variable independiente.

Su frmula es la siguiente:
CD = r 2 * 100

Error! Marcador no definido.

2.3.3. Coeficiente de no Determinacin

El coeficiente de no determinacin o indeterminacin, es la proporcin de la


variacin total en y que no esta explicada por la variacin en x. Este coeficiente
se calcula con la siguiente frmula:
CI = (1 r2.)*100

Los coeficientes de determinacin y de no determinacin pueden solamente ser


positivos y pueden asumir valores entre 0 y 1 inclusive.

Siguiendo el mismo ejemplo del anlisis de regresin lineal, ahora se ilustrar


el anlisis de correlacin lineal.

56

Clculo del coeficiente de correlacin lineal de Pearson:

r=

[n x

n yi xi yi xi
2

][

( xi ) n yi ( yi )
2

Sustituyendo la frmula con los valores calculados en la tabla, se tiene:

r=

5 * 4.010 1.075 * 15,25

[5 * 58,1025 (15,25) ]*[5 * 288.125 (1.075) ]


2

r=

20.050 16.393,75
[290,5125 232,5625]*[1.440.625 1.155.625]

r=

3.656,25
3.656,25
=
= 0,90
57,95 * 285.000 4.063,957431

El valor del coeficiente obtenido, es positivo y se considera alto, ya que tiende a


+1. En conclusin, la variable ventas, est fuertemente relacionada con la publicidad
que se paga por el producto, mientras ms publicidad haya respecto al producto, las
ventas sern mayores.

Una vez calculado y analizado el coeficiente de correlacin, se calcula el


coeficiente de determinacin:
CD = r 2 * 100

57

CD = (0,90 ) * 100
2

CD = 81%
Para hacer el anlisis respectivo, calculemos ahora el coeficiente de no
determinacin o de indeterminacin:

CI = (1 r2)*100
CI = (1 0,81) * 100 = 0,19 * 100 = 19%

Otra manera de calcular el coeficiente de indeterminacin es:

CI = 100% CD

CI = 100% 81%

CI = 19%
Lo que significa, que el 81% de las variaciones de las ventas se debe a la
publicidad, mientras que el 19% restante se deben a otras variables que han sido al
azar o que no estn dentro del modelo.

81% publicidad
Ventas 100%
19% otras variables o al azar

58

2.4. Anlisis de Correlacin Mltiple

Al igual que el anlisis de correlacin lineal o simple, ste utiliza las mismas
medidas estadsticas pero en este caso mltiples, para describir la relacin entre las
variables (el diagrama de dispersin, el coeficiente de correlacin, el coeficiente de
determinacin y el coeficiente de no determinacin).

Coeficiente de Correlacin Mltiple

Se puede definir como una medida de la fuerza de la asociacin entre la


variable dependiente y dos o ms variables independientes. Este coeficiente est
representado con la letra R, y slo puede tener valores comprendidos entre 0 y +1.

Si el coeficiente est cercano a +1, quiere decir que hay una fuerte correlacin
entre la variable dependiente y las variables independientes. En caso de estar cercano
a 0, indica que existe una dbil correlacin.

La siguiente figura, es para visualizar los diferentes valores que toma el


coeficiente de correlacin mltiple:

59

Figura 2-12 Valores del Coeficiente de Correlacin Mltiple


Moderada
Correlacin
Dbil
Correlacin

Fuerte
Correlacin

0,5

+1

Sin
Correlacin

Correlacin
Perfecta

Fuente: Las autoras

Coeficiente de Determinacin Mltiple

Se simboliza con " R 2 " y, representa la proporcin de la variacin total en la


variable dependiente y, que es explicada por las variables independientes

Coeficiente de no Determinacin Mltiple

Este coeficiente, se encarga de medir

la

proporcin

existente entre la

variacin en la variable dependiente, la cual no es explicada por las variables


independientes.

60

CAPTULO III
ANLISIS DE VARIANZA Y PRUEBAS NO PARAMTRICAS
El anlisis de varianza, es utilizado para comparar si los valores de un grupo de
datos numricos, son significativamente distintos a los valores de otro o ms conjunto
de datos. El procedimiento para comparar estos valores, est basado en la varianza
global observada en los grupos de datos numricos a comparar.

3.1. Anlisis de Varianza o Anova

Para Levin y Rubin (1996:p.631), el anlisis de varianza, es una


tcnica estadstica utilizada para probar la equidad de tres o ms
medias de muestra y, de este modo, hacer inferencias sobre si las
muestras provienen de poblaciones que tienen la misma media.
El anlisis de varianza, es una herramienta que se aplica para probar
simultneamente si las medias de varias poblaciones son iguales. Dicho anlisis tiene
una serie de pasos a seguir:

1.

Se debe determinar una estimacin de la varianza de la poblacin, a

partir de la varianza entre las medias muestrales.

2.

Se determina una segunda estimacin de la varianza de la poblacin

desde la varianza dentro de de las muestras.

3.

Se comparan las dos estimaciones, a travs del cociente y; si un valor

es aproximadamente igual, se acepta la hiptesis nula.

Ahora, se hablar un poco de los pasos antes mencionados:

61

Para obtener la primera estimacin de la varianza de la poblacin o varianza


entre columnas, se utilizan las siguientes frmulas:

(x x )
=

n 1

Donde:

s 2 = Varianza de la muestra

n = Tamao de la muestra
x = Media de muestra

Luego se busca la varianza entre las medias de muestras

sx

x x
=
k 1

Donde:

s x = Varianza entre las medias de muestras


k = Nmero de muestras

x = Gran media

Para calcular el error estndar de la media, que no es ms que la desviacin


estndar de todas las medias de muestras posibles a partir de un tamao de muestra
dado. Se usa la siguiente frmula:

62

x =

Donde:

x = Error estndar de la media

= Desviacin estndar
n = Raz cuadrada del tamao de la muestra

Se puede simplificar la frmula, multiplicndose de forma cruzada los trmino,


y despus elevar ambos lados al cuadrado, con la finalidad de cambiar la desviacin
estndar de la poblacin ( ), en la varianza de la poblacin ( 2 ).

2 = x2 * n
Donde:

2 = Varianza de la poblacin

x = Error estndar elevado al cuadrado (igual a la varianza entre las medias


2

de muestras)

Entonces, se tiene que la frmula general de la primera estimacin de la


varianza de la poblacin es:

n j x j x
2
=
k 1

63

Donde:

2 = Primera estimacin de la varianza de la poblacin, basada en la varianza


entre columnas
n j = Tamao de la j-sima muestra

x = Gran media
k = Nmero de muestras

Para buscar la segunda estimacin de la varianza de la poblacin o varianza


dentro de columnas, se emplea la frmula siguiente:

nj 1
* s j 2
nt k

2 =

Donde:

2 = Segunda estimacin de la varianza de la poblacin, basada en la varianza


dentro de columnas
n j = Tamao de le j-sima muestra
2

s j = Varianza de muestra de la j-sima muestra


k = Nmero de muestras

nt = n j = Tamao de muestra total

El ltimo paso es comparar las dos estimaciones. Para esto, se calcula el


cociente F.

64

Segn Levin y Rubin (1996:p.631), es un cociente utilizado en el


anlisis de varianza, entre otras pruebas, para comparar la magnitud de
dos estimaciones de la varianza de la poblacin para determinar si las
estimaciones son aproximadamente iguales.
Este cociente se calcula de la siguiente manera:
F = Varianza entre columnas / varianza dentro de columnas

Si la hiptesis nula es verdadera, el denominador y el numerador deben ser


aproximadamente iguales. Mientras ms cercano a 1 est el cociente F, se est
ms inclinado en aceptar la hiptesis nula. Si el cociente F se hace ms grande, la
hiptesis nula se inclina ms al rechazo y se acepta la hiptesis alternativa.

Cuando las poblaciones no son las mismas, la varianza entre columnas tiende a
ser mayor que la varianza dentro de columnas, y por ende, el valor del cociente F
tender a ser grande, lo que implica que la hiptesis nula debe ser rechazada.

3.1.1. Distribucin F

La distribucin F o de Fisher, es utilizada como valor estadstico de prueba para


problemas de Anlisis de Varianza o ANOVA. Su nombre se debe a Sir Ronald
Fisher, quien fue uno de los fundadores de la Ciencia Estadstica moderna.

Esta distribucin, es usada en los casos en donde se quiere probar si dos


muestras se derivan de poblaciones con varianzas iguales, as como cuando se quieren
comparar simultneamente varias medias poblacionales.

Segn Levin y Rubin (1996:p.631), definen la distribucin de F como


una familia de distribuciones diferenciadas por dos parmetros
(grados de libertad del numerador, grados de libertad del

65

denominador), utilizada principalmente para probar hiptesis con


respecto a varianzas.
Caractersticas de la distribucin F:

Existe una familia de distribuciones F. Cada distribucin F, posee una pareja


de grados de libertad, tanto para el numerador del cociente F como para el
denominador. En donde, la forma de las curvas cambia a medida que varan los
grados de libertad, como se muestra en la figura siguiente:

Figura 3-1 Grados de Libertad en la Distribucin F

Para hallar los grados de libertad del numerador (varianza entre columnas), se
realiza de la siguiente manera:
nm de gl en el numerador del cociente " F " = (nm. de muestra 1)

66

En cambio, los grados de libertad del denominador, se obtienen de la siguiente


forma:

Nm. De gl en el denominador del cociente F =

(n

1) = nt k

Donde:

n j = Tamao de la j-sima muestra

k = Nmero de muestras

nt = n j = Tamao de muestra total

El valor de F no debe ser negativo y se trata de una distribucin continua.


La distribucin F tiene sesgo positivo.
A medida que aumenta el valor de F, la curva se aproxima al eje x, sin nunca
tocarlo.

3.1.2. Comparacin de dos Varianzas Poblacionales

En este caso, la distribucin F, es utilizada para probar la hiptesis de que la


varianza de una poblacin normal, es igual a la variacin de otra poblacin normal,
por lo cual, es importante comparar dos poblaciones para ver si una vara ms que la
otra en algunas medidas especficas.

Si una poblacin posee ms variacin que otra, primeramente se tiene que


realizar el planteamiento de hiptesis. En donde, la hiptesis nula, es que las dos
poblaciones tienen la misma varianza; y la hiptesis alternativa, es que una poblacin
tiene mayor varianza que la otra, es decir, aqu las variaciones difieren.

67

Esta prueba de hiptesis se denota:

H0 : 1 = 2

H0 : 1 2

Para realizar las pruebas de hiptesis, es necesario obtener una muestra


aleatoria de " n1 " (observaciones a partir de una poblacin), una muestra de n2
(observaciones de una segunda poblacin), y se calculan las variaciones muestrales o
valor estadstico de prueba. Si la hiptesis nula es verdadera, entonces, el valor
estadstico de prueba sigue la distribucin F con ( n1 -1) y ( n2 -1) grados de libertad.

3.2. Pruebas no Paramtricas

Debido a que en la prctica todas las poblaciones no pueden tomarse como


normales, ya que se generan situaciones en donde no es posible formular una
hiptesis segura sobre el valor de un parmetro o la forma de la distribucin
poblacional, para las que las pruebas paramtricas de z y t no son adecuadas;
surgen las pruebas no paramtricas, las cuales no dependen de un solo tipo de
distribucin o de unos valores especficos de los parmetros.

Segn Webster, Allen (1996:p.836), las pruebas no paramtricas, son


procedimientos estadsticos que se pueden utilizar para contrastar
hiptesis cuando no es posible fijar ningn supuesto sobre parmetros
o distribuciones poblacionales.

Existen diferentes tipos de pruebas no paramtricas, que se pueden utilizar para


una necesidad determinada. Entre las cuales, se encuentra primordialmente ji-

68

cuadrado, dividindose sta en: prueba de bondad de ajuste y prueba de


independencia o tablas de contingencias.
Cabe destacar, que existen otras pruebas no paramtricas como lo son: la
prueba de los signos, la prueba de rachas, la prueba de Mann-Whitney, la correlacin
de rangos de Spearman y la prueba de Kruskal; las cuales no se van a abordar en el
captulo, porque se va hacer nfasis en la prueba de ji-cuadrado.

3.2.1. Distribucin de ji-cuadrado

La distribucin de ji-cuadrado, puede definirse como una familia de


distribuciones de probabilidad que se diferencian por sus grados de libertad. Se
encarga de probar un cierto nmero de hiptesis diferentes, referente de varianzas,
porciones y bondad de ajuste de distribuciones.

Esta distribucin abarca la prueba de bondad de ajuste, la cual comprende una


serie de pruebas: distribucin uniforme, estructura especfica, distribucin de Poisson,
distribucin binomial y distribucin normal; y la prueba de independencia.

3.2.1.1. Prueba de Bondad de Ajuste

Para Levin y Rubin (1996:p.632), la prueba de bondad de ajuste, es


una prueba estadstica para determinar si existe una diferencia
significativa entre una distribucin de frecuencias observadas y una
distribucin de probabilidad terica hipotetizada para describir la
distribucin observada.
Esta prueba, mide el grado en que los datos muestrales observados cumplen una
distribucin hipottica determinada, y si el grado de cumplimiento es razonable,
entonces se puede deducir que la distribucin hipottica existe.

69

La prueba de ji-cuadrado como prueba de bondad de ajuste, es utilizada para


decidir si una distribucin de probabilidad en especial (distribucin binomial,
distribucin de Poisson o la distribucin normal), es la distribucin apropiada.

Una vez elegida la prueba, se realiza el planteamiento de hiptesis:

H 0 : La muestra procede de la poblacin especificada


H a : La muestra no procede de la poblacin especificada

Pasos para el clculo de la prueba de bondad de ajuste:

1.

Establecer la hiptesis nula y la hiptesis alternativa.

2.

Calcular las frecuencias esperadas.

3.

Determinar el valor crtico de ji-cuadrado.

4.

Hallar el valor calculado de ji-cuadrado.

5.

Comparar el valor crtico con el calculado.

6.

Conclusiones.

Frmulas para calcular la prueba de bondad de ajuste:

( f o f e )2

fe

fe

x2 =

Donde:

f 0 = Frecuencia observada en la muestra


f e = Frecuencia esperada
k = Nmero de categoras o clases

70

gl = k-1-c

Donde:

gl = Grados de libertad
k = Nmero de categoras
c = Nmero de parmetros a estimar

Ejemplo:

Supongamos, que una empresa de servicios varios, quiere contratar a un grupo


de personas para que laboren en las diferentes actividades que sta realiza. Para ello,
utiliza la siguiente estructura, la cual va acorde con la edad:

30% entre 18-25 aos


50% entre 25-35 aos
20% de 35 aos en adelante

La empresa toma una muestra de 70 personas, distribuidas as:

20 (entre 18-25 aos)


40 (entre 25-35 aos)
10 (de 35 aos en adelante)

El nivel de significancia a utilizar es de 10%, si se mantienen las reglas


establecidas.

71

Primeramente, se tiene que establecer el planteamiento de hiptesis:

H 0 = las reglas establecidas por la empresa se mantienen igual


H a = las reglas establecidas por la empresa son diferentes

Luego, se determinan las frecuencias esperadas:

Tabla 3-1 Frecuencias Esperadas


Edades

Frecuencias

Frecuencias

observadas ( f 0 )

esperadas ( f e )

Entre 18-25 aos

20

21

Entre 25-35 aos

40

35

35 aos en adelante

10

14

70

70

Totales

70 * 0,30 = 21

70 * 0,50 = 35

70 * 0,20 = 14

Ahora, se calcula el valor crtico de ji-cuadrado para un nivel de significancia


del 10%:

gl = k-1-c = 3-1-0 = 2

k = 3 porque hay divisiones de las edades para seleccionar el grupos de


personas.

c = 0 porque no hubo ninguna estimacin de parmetro poblacional.

72

Buscando con los grados de libertad el valor de ji-cuadrado en la tabla, para un


nivel de significancia del 10%, se tiene:

x 2 = 4,605

Seguidamente, se determina el valor calculado de ji-cuadrado, para luego


comparar y sacar conclusiones:

( f o f e )2

i =1

fe

x2 =

x2 =

(20 21)2 + (40 35)2 + (10 14)2


21

21

21

1 25 16 42
=
=2
+
+
21 21 21 21

Figura 3-2 Representacin Grfica de ji-cuadrado como Prueba de Bondad de Ajuste

2,00

4,605

Se puede observar en la grfica, que el valor de ji-cuadrado, est dentro de la


zona de rechazo de H 0 . Por lo tanto, se puede concluir diciendo que se acepta la
hiptesis nula ( H 0 ) y se rechaza la hiptesis alternativa ( H a ). Y se puede afirmar
con un nivel de confianza del 90%, que las reglas establecidas por la empresa se
mantienen igual.

73

3.2.1.2. Prueba de Independencia o Tablas de Contingencias

Levin y Rubin (1996:p.632), definen la prueba de independencia como


una prueba estadstica de porciones de frecuencias que se utiliza para
determinar si la pertenencia de una variable a categoras es diferente
como funcin de la pertenencia a la categora de una segunda
variable.
La prueba de independencia, permite determinar a travs de unas tablas de
contingencias, si dos variables categricas se relacionan entre s. Dichas tablas,
poseen una serie de renglones y columnas; cada rengln corresponde a un nivel de
una variable y cada columna a un nivel de otra variable. Las entradas del cuerpo de
las tablas, vienen a ser las frecuencias, con que cada combinacin de variable se
presenta.

Esta prueba, es utilizada frecuentemente para el anlisis de aspectos


importantes de los datos investigados, los cuales consisten en medidas muestrales
sobre dos variables categricas. Una vez examinado los datos de la muestra, se
procede al planteamiento de hiptesis, en donde la hiptesis nula y la alternativa
permanecen constantes para todos los casos:

H 0 : Las variables en las filas y las columnas son independientes


H a : Las variables en las filas y columnas son dependientes

Para probar la hiptesis nula, se debe comparar las frecuencias que fueron
observadas con las frecuencias que se esperaran en caso de que la hiptesis nula
fuera verdadera. Si los grupos de frecuencias observadas y esperadas son casi iguales,
de manera intuitiva se puede razonar que la hiptesis nula se aceptar. De lo
contrario, si existe una diferencia grande entre las frecuencias observadas y las

74

esperadas, intuitivamente la hiptesis nula se puede rechazar y por ende, se llega a la


conclusin de que hay diferencias significativas.

La prueba de tablas de contingencias o de independencia, se calcula de la


siguiente manera:

x2 =

( f o f e )2
fe

Donde:

x 2 = Ji-cuadrado

f 0 = Una frecuencia observada


f e = Una frecuencia esperada

Para hallar la frecuencia esperada, se utiliza la siguiente frmula:

fe =

(total fila ) * (total columna )


n

n = Tamao de la muestra

Adems, se debe determinar el nmero de grados de libertad en la tabla de


contingencias, de la siguiente manera:

gl = (r-1)*(c-1)

75

Donde:

gl = grados de libertad
r = nmero de filas o de renglones
c = nmero de columnas

En la siguiente figura, se muestra una distribucin ji-cuadrada, para cada grado


de libertad (1, 5, 10):
Figura 3-4 Distribucin ji-cuadrado para Diferentes Grados de Libertad

x2
Se puede observar en la figura 3-4, que para un nmero muy pequeo de grados
de libertad, la distribucin ji-cuadrado est seriamente sesgada hacia la derecha; y
mientras va aumentando el nmero de grados de libertad, rpidamente la curva se va
haciendo cada vez ms simtrica, hasta que el nmero de grados de libertad se torna
bastante grande, permitiendo que la distribucin se pueda aproximar con la normal.

De todo lo anteriormente dicho, se puede resumir que para el clculo de la


prueba de independencia o tablas de contingencias se utilizan los siguientes pasos:

76

1.

Plantear de la hiptesis nula y la hiptesis alternativa.

2.

Calcular las frecuencias esperadas, correspondientes a cada frecuencia

observada.
3.

Calcular el crtico de ji-cuadrado.

4.

Determinar el valor calculado de ji-cuadrado.

5.

Comparar el valor crtico con el valor esperado.

6.

Conclusin.

Ejemplo:

Supongamos, que una muestra tomada con relacin al consumo de un


determinado producto, qued estructurada de la siguiente forma:

Tabla 3-2 Tabla de contingencia 2x2. Frecuencias Observadas


Sexo

Consumo del
producto

totales
Mujeres

Hombres

40

20

60

No

15

25

40

Totales

55

45

100

Primeramente, se realiza el planteamiento de hiptesis:

H 0 = El consumo del producto es independiente del sexo


H a = El consumo del producto es dependiente del sexo

77

Luego, se procede a calcular las frecuencias esperadas, correspondiente a cada


frecuencia esperada:
Tabla 3-3 Tabla de contingencia 2x2. Frecuencias Observadas y Esperadas
Sexo
Consumo del

Mujeres

Hombres

f0

fe

f0

fe

40

33

20

27

60

No

15

22

25

18

40

producto

Totales

55

fe =

45

Totales

100

(total fila ) * (total columna )


n

Mujeres

Hombres

fe =

(60) * (55) 3.300


=
= 33
100
100

fe =

(60) * (45) 2.700


=
= 27
100
100

fe =

(40) * (55) 2.200


=
= 22
100
100

fe =

(40) * (45) 1.800


= 18
=
100
100

Ahora, se calcula el valor crtico de ji-cuadrado, determinando los grados de


libertad:
gl = (r-1)*(c-1)

78

Donde:

r = Nmero de filas = 2
c = Nmero de columnas = 2

gl = (2-1)*(2-1) = 1

Entonces, se busca en la tabla el valor que le corresponde al nivel de


significacin de 5%:

x 2 = 3,841

Se procede a determinar el valor calculado de ji-cuadrado:

x2 =

( f o f e )2
fe

Tabla 3-4 Valor Calculado de Ji-cuadrado


fo

fe

( fo fe )

( fo fe )2

( fo fe )2 / fe

40

33

49

1,485

20

27

-7

49

1,815

15

22

-7

49

2,227

25

18

49

2,722

x2 =

8,249

79

Por ltimo, se compara el valor crtico de ji-cuadrado con el valor calculado de


ji-cuadrado, para as dar las conclusiones:

Figura 3-5 Representacin Grfica de Ji-cuadrado como Prueba de Independencia

3,481

8,249

Como el valor calculado est dentro de la zona de rechazo de la hiptesis nula,


se concluye, que se puede afirmar que la demanda del producto depende del sexo del
consumidor.

80

CONCLUSIONES
La Estadstica Inferencial, es utilizada en aquellos casos en donde el
investigador requiere ir ms all de una simple recoleccin de datos, lo cual le
permite realizar un anlisis profundo, por medio de una parte tomada de la poblacin
en estudio, conocida sta como muestra.

La Estadstica Inferencial, le permite a la Gerencia tomar decisiones ciertas,


acerca de los acontecimientos futuros. Y de esta manera, obtener una adecuada
planeacin y control para el mejor funcionamiento de la empresa, en los respectivos
departamentos que sta conforma.

La Distribucin Muestral, es de gran importancia, porque a travs de la muestra


tomada de la poblacin, se puede por ejemplo, conocer la opinin que tienen los
consumidores respecto a un producto determinado, permitiendo as al investigador
evaluar la calidad del producto.

La

Inferencia Estadstica, genera una serie de problemas, basados

fundamentalmente, en las estimaciones y las pruebas de hiptesis. En donde, las


estimaciones, son utilizadas para determinar parmetros de una poblacin por medio
de sus valores estadsticos; y las pruebas de hiptesis, no son ms que supuestos que
se hace el investigador antes de empezar la investigacin, para finalmente poder sacar
conclusiones, aceptando o rechazando las hiptesis planteadas.

El Anlisis de Regresin y Correlacin, son muy usados, siendo stos una


herramienta de gran utilidad para la investigacin, ya que se pueden relacionar dos o
ms variables, conocidas stas como variable dependiente y variable independiente.

81

Existen dos pruebas estadsticas de gran importancia, las cuales estn


elaboradas para datos cualitativos y categricos. Estas pruebas, abarcan a la conocida
Distribucin de Ji-cuadrado, entre las que se encuentran, la Prueba de Bondad de
Ajuste y la Prueba de Independencia o Tablas de Contingencias.

82

RECOMENDACIONES
Como ya sabemos, la Estadstica es utilizada en toda organizacin, bien sea
desde una simple recoleccin de datos, hasta un anlisis ms profundo que le permita
al investigador llegar a conclusiones que predigan el futuro de la empresa.

Como la Distribucin Muestral se considera la parte ms importante de la


Estadstica Inferencial, se recomienda a las organizaciones para realizar una
determinada investigacin hacer uso de sta, ya que tomando una muestra de toda la
poblacin, le permite reducir en gran parte los costos que le generaran en caso de que
estudiaran a toda la poblacin. Adems, por medio de la muestra, se puede reducir el
tiempo, en aquellos casos en donde se tardara mucho contactar a toda la poblacin y
por ende, el trabajo se hara ms largo, lo que implicara tambin ms gastos para la
empresa.

Una hiptesis, es una afirmacin respecto al valor de un parmetro poblacional.


Si el investigador quiere efectuar una Prueba de Hiptesis, se la recomienda que siga
los diferentes pasos, los cuales lo van a conllevar a aceptar o rechazar las hiptesis, y
de esta forma, a tomar una decisin cierta respecto a lo que acontece en la empresa.

Ya que el mundo empresarial, est ntimamente enlazado con todo lo referente


a los datos numricos, se le recomienda al investigador, examinar las relaciones entre
las diferentes variables, para ver si stas se relacionan o no.

83

BIBLIOGRAFA
Textos

Arias, F. (2004). El Proyecto de Investigacin. Cuarta Edicin. Episteme.


Caracas.

Berenson, Mark y Levine, David. (1.982). Estadstica para Administracin y


Economa. Primera Edicin. Interamericana. Mxico.

Berenson,

Mark

Levine,

David.

(1.996).

Estadstica

Bsica

en

Administracin. Segunda Edicin. Prentice Hall Hispanoamricana. Mxico.

Chao, Lincoln. (1.993). Estadstica para las Ciencias Administrativas. Segunda


Edicin. Mac. Graw-Hill. Colombia.

Levin, Richard y Rubin, David (1.996). Estadstica para Administradores. Sexta


Edicin. Prentice Hall. Mxico.

Mason, Lind y Marchal. (2.001). Estadstica para Administracin y Economa.


Dcima Edicin. Alfaomega. Colombia.

Webster, Allen. (1.996). Estadstica Aplicada a la Empresa y a la Economa.


Segunda Edicin. Espaa.

84

Citas de Internet

Molina,

Gonzalo.

Estadstica.

http://html.rincondelvago.com/nociones-

basicas-de-estadstica.html (18-11-07).

Velasco,R.EstadsticaInferencial.<http://www.universidadabierta.edu.mx/Ser
Est/Apuntes/VelascoRoberto_EstadisticaInferencial.html> (15-11-07).

Wikipedia. Probabilidad. http://es.Wikipedia.org/wiki/Probabilidad (15-1107).

85

ANEXOS

86

87

88

89

90

91

92

x2

93

Valores posibles de x

Hoja de Metadatos

94

Hoja de Metadatos para Tesis y Trabajos de Ascenso


1/5
Ttulo

Fundamentos de la Estadstica Inferencial

Subttulo

Autor(es)
Apellidos y Nombres

Cdigo CVLAC /

e-mail

13836535
CVLAC
e-mail Angeles23acuario@hotmail.com
e-mail
13499178
CVLAC
e-mail Yaritza78@hotmail.com
e-mail
CVLAC
e-mail
e-mail
CVLAC
e-mail
e-mail

Gmez R., Mariangeles


Ramos S., Yaritza

Palabras o frases claves:


Estadstica
Estadstica Inferencial
Distribuciones muestrales
Hiptesis Hiptesis
Regresin
Correlacin

95

Hoja de Metadatos para Tesis y Trabajos de Ascenso


2/5
Lneas y sublneas de investigacin:
rea
Ciencias Econmicas

Subrea
Contadura Pblica

Resumen (abstract):
Inferir significa deducir algo de otra cosa. Nuestra investigacin se refiere, a los fundamentos de la Estadstica
Inferencial, que se encarga de hacer deducciones de una poblacin por medio de una muestra tomada a partir de
sta; sirviendo as para las organizaciones, porque le permite a le Gerencia tomar decisiones vlidas, respecto a
las predicciones futuras. Para analizar este anlisis estadstico se requiere utilizar la distribucin muestral
porque a partir de la muestra seleccionada de una poblacin, puede construirse variables aleatoria alternativa, de
cuyo anlisis se desprenden interesantes propiedades estadsticas (distribucin muestral de la media y de la
proporcin). Los problemas que se tratan en Inferencia Estadstica, se basan en dos clases: la estimacin o
intervalo de confianza y las pruebas de hiptesis. En donde el intervalo de confianza viene dado por un rango de
valores, dentro del cual se espera encontrar el valor del parmetro estudiado; y las pruebas de hiptesis, que son
supuestos que se plantea el investigador antes de iniciar una investigacin, partiendo de una muestra aleatoria
significativa, para extraer conclusiones que permitan aceptar o rechazar una hiptesis previamente emitida, sobre
el valor de un parmetro desconocido, el cual aborda una serie de pasos. El anlisis de regresin y correlacin,
permite relacionar dos o ms variables (variable independiente y variable dependiente). El anlisis de varianza,
sirve para comparar si los valores de un conjunto de datos numricos, son significativamente distintos a los
valores de otros o ms conjunto de datos. Como en la prctica todas las poblaciones no pueden tomarse como
normales, por situaciones en donde no es posible formular una hiptesis segura sobre el valor de un parmetro,
surgen las pruebas no paramtricas (ji-cuadrado), stas no dependen de un solo tipo de distribucin.

96

Hoja de Metadatos para Tesis y Trabajos de Ascenso


3/5
Contribuidores:
Apellidos y Nombres

ROL
ROL

Romero, Miguel

Cdigo CVLAC

CA

AS

TU

AS

TU

/
x

e-mail
JU

CVLAC 8.879.006
e-mail
e-mail
ROL

Gmez R., Mariangeles

CA

JU

CVLAC 13.836.535.
e-mail Angeles23acuario@hotmail.com
e-mail
ROL

CA

AS

TU

JU

Ramos S., Yaritza


CVLAC 13.499.178
e-mail Yaritza78@hotmail.com
e-mail
ROL
CVLAC
e-mail
e-mail

Fecha de discusin y aprobacin:


Ao
Mes
Da
2008
04
08

Lenguaje: spa

97

CA

AS

TU

JU

Hoja de Metadatos para Tesis y Trabajos de Ascenso


4/5
Archivo(s):

Nombre de archivo
Tesis-Gomez yRamos

Tipo MIME
Application/.doc

Alcance:
Espacial : Universal

(Opcional)

Temporal: 6 meses

(Opcional)

Ttulo o Grado asociado con el trabajo:


Licenciada en Contadura Pblica

Nivel Asociado con el Trabajo: Licenciatura

rea de Estudio:
Ciencias Econmicas

Institucin(es) que garantiza(n) el Ttulo o grado:


Universidad de Oriente

98

99

S-ar putea să vă placă și