Documente Academic
Documente Profesional
Documente Cultură
FACULTAD DE INGENIERIA
Especialidad: Ing. Sistemas y Computación
ESTADÍSTICA DESCRIPTIVA E
INFERENCIAL
Impreso en el Perú.
L
a palabra estadística se origina, en las técnicas de recolección, organización,
conservación, y tratamiento de los datos propios de un estado, con que los
antiguos gobernantes controlaban sus súbditos y dominios económicos. Estas
técnicas evolucionaron a la par con el desarrollo de las matemáticas, utilizando sus
herramientas en el proceso del análisis e interpretación de la información.
Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes,
aunque sin mayores restricciones legales. El febril jugador De Meré consultó al
famoso matemático y filósofo Blaise Pascal (1623-1662) para que le revelara las
leyes que controlan el juego de los dados, el cual, interesado en el tema, sostuvo
una correspondencia epistolar con el tímido Pierre de Fermat (1601-1665,
funcionario público apasionado por las matemáticas; célebre porque no publicaba
sus hallazgos) dando origen a la teoría de la probabilidad, la cual se ha venido
desarrollando y constituyéndose en la base primordial de la estadística.
En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas
que partiendo de observaciones muestrales o históricas, crean modelos lógico-
matemáticos que se "aventuran" describir o pronosticar un determinado fenómeno
con cierto grado de certidumbre medible.
El presente texto no pretende teorizar el saber estadístico, desde luego, no
es un libro para estadísticos, ya que, adrede se obvia el rigor científico de lo
expuesto en beneficio de la sencillez necesaria para el neófito; con un lenguaje
coloquial se conduce al lector a través del contenido, a partir de dos o tres
ejemplos que ilustran la aplicabilidad de los temas tratados.
El avance tecnológico en la informática ha contribuido enormemente al
desarrollo de la estadística, sobre todo en la manipulación de la información, pues
en el mercado existen paquetes estadísticos de excelente calidad, como el SAS,
SPSS, SCA, STATGRAPHICS, amén de otros, que "corren" en un ordenador sin
mayores exigencias técnicas, permitiendo el manejo de grandes volúmenes de
información y de variables.
La estadística, entonces, dejó de ser una técnica exclusiva de los estados,
para convertirse en una herramienta imprescindible de todas las ciencias, de donde
proviene la desconcertante des-uniformidad en las definiciones de los diferentes
autores, ya que cada estudioso la define de acuerdo con lo que utiliza de ella y
tenemos definiciones como que: la estadística es la tecnología del método
científico, o que es el conocimiento relacionado con la toma de decisiones en
condiciones de incertidumbre, o que la estadística son métodos para obtener
conclusiones a partir de los resultados de los experimentos o procesos, o que es un
método para describir o medir las propiedades de una población. En fin, no se trata
de discutir si la estadística es una ciencia, una técnica o una herramienta, sino de
la utilización de sus métodos en provecho de la evolución del conocimiento.
La estadística hace inferencias sobre una población, partiendo de una
muestra representativa de ella. Es a partir del proceso del diseño y toma de la
muestra desde donde comienzan a definirse las bondades y confiabilidad de
nuestras aseveraciones, hechas, preferentemente, con un mínimo costo y mínimo
error posible.
El Autor
Índice
Págs.
Dedicatoria
Prólogo
Índice
páginas web
Anexos
Anexo N° 1: Tabla de la Distribución Normal
Anexo N° 2: Tabla de 500 Números Generados Aleatoriamente
Anexo N° 3: Contraste de Hipótesis a partir del p-valor
Anexo N° 4. Error de Tipo II – Cálculo
Anexo N° 5. Guía para Elaborar una Tesis
Anexo N° 6: Registro de la Información. Modelos de Fichas
ESTADÍSTICA DESCRIPTIVA E INFERENCIAL
Capítulo 1
Generalidades de la Estadística
************************************
"El poder se nutre de la información y el conocimiento".
1.1. INTRODUCCION:
1.2. IMPORTANCIA:
1.5. DIVISIÓN:
Por último, decir que hay otros tipos de falta de respuesta en una encuesta
debidos a situaciones como:
Una hipótesis es ante todo, una explicación provisional de los hechos objeto
de estudio, y su formulación depende del conocimiento que el investigador posea
sobre la población investigada. Una hipótesis estadística debe ser susceptible de
docimar, esto es, debe poderse probar para su aceptación o rechazo.
2.6. LA RECOLECCIÓN
2.8. LA TABULACIÓN
2.10. EL ANÁLISIS
2.11. PUBLICACIÓN
PRACTIQUEMOS N° 1
Para una mayor sencillez, en la exposición del tema, nos valemos del siguiente
ejemplo: Supongamos que en la Fábrica Textil Manufacturas del Centro S.A. ha
estallado un conflicto laboral y sus cincuenta operarias solicitan un aumento en el
salario integral diario sopena de paralizar la fábrica.
Tabla No. 2
Tabla No. 4
Como se puede observar, hay una gran diferencia entre los datos brutos de
la Tabla No.1 y el ordenamiento y agrupamiento de la Tabla No. 4.
Con el fin de obtener una mejor tabla interpretativa, introduciremos la
siguiente simbología:
Tabla No. 5
Distribución de Frecuencias del Salario Diario de 50 Obreras
Tabla No. 6
PRACTIQUEMOS N° 2
5.1. ¿Qué porcentaje de las obreras tiene experiencia inferior o igual a 6 años?.
5.2. ¿Que porcentaje tiene experiencia entre 5 y 7 años (incluyendo los
extremos)?.
6.
Palabras por Minuto Escritas por un Grupo de Mecanógrafas
Tabla No. 7
(“a”) También puede ser definida como la cantidad positiva más pequeña que le
hace falta al rango o recorrido para ser divisible exactamente por la
amplitud.
N: Número de observaciones
LIPI: Límite inferior del primer intervalo
LSUI: Límite superior del último interval
Xi: Punto medio del intervalo, o marca de clase
3.3.2 Rango ,
3.3.3 Número de
,
intervalos
,
3.3.6 Tenemos por tanto, que distribuir adecuadamente la diferencia entre los
rangos
Tabla No. 9
Conclusiones:
• El 72% de las baldosas tiene una resistencia entre 300 y 600 Kg/Cm 2.
• El 86% de las baldosas resiste menos de 600 Kg/Cm 2.
• Sólo el 5% resiste 700 o más Kg/Cm2.
PRACTIQUEMOS N° 3
4.1. DEFINICIÓN
Una gráfica, al igual que un cuadro o una tabla, debe constar de:
4.2.1. Título adecuado: El cual debe ser claro y conciso, que responda a las
preguntas: Qué relaciona, cuándo y dónde se hicieron las observaciones.
4.2.2. El cuerpo: o gráfico en sí, cuya elección debe considerar el o los tipos
variables a relacionar, el público a quien va dirigido y el diseño artístico del
gráfico.
Gráfico No. 1
Gráfico No. 2
Gráfico No. 3
Como se puede observar, el gráfico No.1 “realza” el decrecimiento de la variable
inflación, mientras que el No.2 intenta mostrar una estabilización o decrecimiento
parsimonioso.
Los dos dibujos son incorrectos debido a que no conservan una proporción
adecuada entre sus ejes. Sin embargo, el gráfico No. 3 tiene una buena proporción
entre los ejes. Pero, la distorsión se debe a la mala numeración en el eje “Y” pues,
el punto de origen O ha sido eliminado y asignado un valor arbitrario, la escala es
inadecuada para resaltar el decrecimiento inflacionario de los dos últimos periodos.
“La longitud del eje vertical es igual a tres cuartos de la longitud del eje
horizontal”.
PRACTIQUEMOS N° 04
. . . Lunes: 18
Martes: 21
Miércoles: 22
Jueves: 21
Viernes: 20
Sábado: 19
Domingo: 19
Ejemplo:
Ejemplo:
Ejemplo:
Demostración:
pero
Como
Ejemplo de Comprobación:
Centro S.A.
que
Para
Demostración:
veamos:
Pero (propiedad a.)
entonces:
como
luego
constante.
Demostración:
1 2, n .
Sea
5.1.1.4.
Si cada uno de los datos se multiplica por una constante k,
constante:
1 2, n
Sea
tenemos:
una constante
Hemos visto que la Media Aritmética se calcula con base a la magnitud de los
datos, otorgándoles igual importancia a cada uno de ellos. Sin embargo en muchas
ocasiones la magnitud del dato esta ponderada con un determinado peso que lo
afecta relativamente.
donde
Ejemplo:
5.2. LA MEDIANA
se
define
Mediana = , si n es impar ó
, si n es
Mediana =
par
n, es impar, entonces
Mediana=
Me: Mediana
LI: Límite inferior del intervalo donde se encuentra la
mediana (intervalo mediano), el cual se determina
observando en que clase se encuentra la posición n/2.)
n: Número de observaciones
: Frecuencia acumulada anterior al intervalo mediano
: Frecuencia del intervalo mediano
A: Amplitud del intervalo
Ejemplo:
5.3. LA MODA
Donde:
Mo: Moda
LI: Límite inferior del intervalo modal
fm: Frecuencia de la clase modal
f(m-1) : Frecuencia de la clase premodal
f(m+1) : Frecuencia de la clase posmodal
A: Amplitud de los intervalos
Ejemplo:
PRACTIQUEMOS N° 5
6.1. CUARTILES
Gráficamente:
Ejemplo:
Primer cuartil:
6.2. QUINTILES
Gráficamente:
k=2,
El 40% de las baldosas resiste menos de 415.15kg/cm 2 y el 60%
resiste más.
6.3. DECILES
6.4. CENTILES
6.5. RESUMEN
Donde:
PRACTIQUEMOS N° 6
En dos informaciones con igual media aritmética, no significa este hecho, que
las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el
grado de homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene
igual media aritmética, y mediana que los valores 49, 50,51; sin embargo, para la
primera información la media aritmética , se encuentra muy alejada de los valores
extremos 5 y 95, cosa que no ocurre con la segunda información que posee igual
media aritmética y mediana, vemos entonces que la primera información es mas
heterogénea o dispersa que la segunda.
Es la medida de dispersión mas sencilla ya que solo considera los dos valores
extremos de una colección de datos, sin embargo, su mayor utilización está en el
campo de la estadística no paramétrica.
R = Xmax – Xmin
Donde:
DM : Desviación media
xi : Diferentes valores de la variable X
fi : Número de veces que se repite la observación xi
Media aritmética de la información
n: Tamaño de la muestra.
M: Número de agrupamientos o intervalos
Ejemplo:
7.3. VARIANZA
Donde:
S2:Varianza
xi : Valor de la variable X
: Media aritmética de la información
fi: Frecuencia absoluta de la observación xi
n: Tamaño de la muestra.
m Número de agrupamientos o intervalos
para el salario:
para la resistencia
Las tablas de doble entrada también pueden usarse para variables cualitativas,
o combinarse variables cualitativas con cuantitativas.
8.2. CORRELACIÓN
En el análisis conjunto para dos o más variables es básica la búsqueda del tipo y
grado de la relación que pueda existir entre ellas, o si por el contrario, las
variables sean independientes entre sí y la relación que puedan mostrar se debe
únicamente al azar, o a través de terceras variables.
Para fortalecer el indicio de correlación inicial, se grafica cada uno de los pares
ordenados de las variables (xi,yj) en un plano cartesiano, para observar la “nube de
puntos” o diagrama de dispersión, donde se advierte la tendencia o no, de la
información representada.
A pesar de la ilustración visual que ofrecen las gráficas, solo podemos percibir la
tendencia, mas no el grado o fortaleza de la relación, entre la variable
independiente “X” y la variable dependiente “Y”.
Donde:
Cuando r toma un valor extremo, ya sea r=1 ó r=-1 existe una correlación
perfecta positiva o negativa según el signo, como lo podemos corroborar en el
siguiente ejemplo:
Sin embargo, no todas las relaciones son tan ideales, en el común de los
casos –1< r <1. Empíricamente se afirma que:
1. Si Correlación perfecta
2. Si ó Correlación excelente
3. Si ó Correlación buena
4. Si ó Correlación regular
5. Si ó Correlación mala
6. Si No hay correlación
con:
X :Variable independiente
Y : Variable dependiente
a Término independiente o
: intercepto
b : Coeficiente de X
Las ecuaciones (1) y (2) son llamadas ecuaciones normales de la línea recta,
de donde se pueden despejar los parámetros a, b en función de los datos originales.
De (1) tenemos:
Remplazando (3) en (2):
El programa calcula:
y consecuentemente el modelo
el paquete hace también las pruebas t student para la hipótesis nula H0 : a=0
vs la hipótesis alternativa H1 : y H0 : b = 0 vs H1 : , dado que el valor “p”
para ambos casos p= 0.0000, con una confiabilidad superior al 99% se rechazan
ambas hipótesis de nulidad, a favor de las hipótesis alternativas. En cuanto al valor
p = 0.0000 (para la prueba F) en la tabla de análisis de varianza, también se
interpreta la validez del modelo con un nivel de confiabilidad superior al 99%.
R-cuadrado para este modelo es 95.58% , es decir el porcentaje del salario que
está siendo explicado por las variables independientes, es ligeramente menor al R-
cuadrado anterior (95.8%), sacrificio insignificante cuando se trata de reducir la
complejidad del modelo.
Veamos las estimaciones producidas por la ecuación
2 4 5 52 5 3 1 52.51 0.51
2 5 5 54 6 2 1 53.23 - 0.77
3 7 4 55 8 1 4 55.25 0.25
3 6 4 54 9 1 3 54.36 0.36
1 5 3 53 3 2 2 52.91 - 0.09
0 7 8 56 1 1 4 55.84 - 0.16
1 5 3 54 2 2 3 53.26 - 0.74
0 9 9 58 0 0 5 57.79 - 0.21
3 3 3 51 10 3 1 51.35 0.35
3 6 3 54 9 2 2 53.59 - 0.41
1 7 6 54 3 2 3 54.98 0.98
2 3 3 51 6 5 1 50.82 - 0.18
0 6 7 54 1 1 2 54.55 0.55
0 7 7 55 1 1 3 55.34 0.34
0 6 5 54 2 2 3 53.93 - 0.07
0 8 8 56 3 1 4 56.18 0.18
1 4 3 52 2 3 2 52.20 0.20
2 6 4 54 5 2 2 53.87 - 0.13
2 5 4 53 5 3 2 53.05 0.05
0 7 9 55 4 2 3 55.26 0.26
0 7 8 55 4 1 3 55.29 0.29
1 7 6 55 4 2 3 54.89 - 0.11
2 4 3 52 7 3 1 51.82 - 0.18
1 7 6 55 3 1 3 55.26 0.26
3 5 3 53 7 2 2 53.25 0.25
0 8 9 57 3 1 5 56.67 - 0.33
4 6 5 54 13 2 3 54.30 0.30
3 6 5 55 8 2 3 54.43 - 0.57
3 5 4 53 8 2 2 53.40 0.40
3 7 4 55 9 0 3 55.18 0.18
1 8 6 56 4 0 4 56.23 0.23
2 5 4 53 6 2 2 53.23 0.23
0 9 8 57 2 0 4 57.10 0.10
1 6 5 54 3 1 3 54.47 0.47
2 5 3 53 6 2 3 53.23 0.23
2 2 3 50 7 5 1 50.18 0.18
2 6 5 55 6 0 3 54.82 - 0.18
2 4 3 52 6 4 1 51.64 - 0.36
2 5 4 53 8 3 1 52.50 - 0.50
2 6 4 54 8 1 2 53.85 - 0.15
3 4 3 52 11 4 1 51.51 - 0.49
1 8 9 57 3 0 4 57.07 0.07
0 7 8 56 5 0 4 55.72 - 0.28
2 3 3 51 6 4 1 51.10 0.10
1 8 9 58 3 0 4 57.07 - 0.93
2 6 5 55 4 0 2 54.77 - 0.23
1 5 5 53 2 4 1 52.71 - 0.29
2 6 4 54 3 1 1 54.10 0.10
2 6 5 53 7 3 1 53.39 0.39
1 7 6 56 3 0 3 55.54 - 0.46
(2)
(3)
, ,
El programa Statgraphics produce el siguiente reporte:
Parábola Ajustada
PRACTIQUEMOS N° 8
1.
9.1. TASA
Ejemplos:
Donde:
Valga anotar que a las tasas se les debe multiplicar por una constante k, la cual
generalmente es 100, 1000 o múltiplos de ellos, con el fin de convertirlos en
porcentajes, por millares etc.
En demografía, las tasas son de uso frecuente, entre otras, mencionaremos las
siguientes:
Donde:
TM :Tasa de mortalidad.
D : Número de defunciones en un periodo y área dada.
P : Población total en esa área a mitad del periodo.
Donde
TN :Tasa de natalidad
N : Número de nacidos vivos ocurridos en un periodo y área dada
P : Población total del área a mitad del periodo.
Donde:
TC :Tasa de nupcialidad.
M : Número de matrimonios efectuados en un periodo y área
dada.
P : Total de la población a mitad del periodo.
El siguiente cuadro muestra la evolución de la tasa de desempleo en Perú,
resultados obtenidos de la encuesta nacional de hogares para los periodos
comprendidos entre los años 1.990 –2.000
9.2. ÍNDICE
Un número índice simple, es aquel que se calcula para una sola variable,
dividiendo cada uno de los valores de la serie cronológica, por el valor
correspondiente al "periodo base" previamente definido.
Solo hemos considerado, los índices simples de base fija, esto es, con
un periodo base determinado. Es común que interese comparar un
índice con el índice del periodo inmediatamente anterior, en
consecuencia se debe fijar el periodo base en el periodo anterior al
referenciado, y así sucesivamente hasta completar la serie, al cual se
le nombra índice de base móvil.
Donde:
PRACTIQUEMOS N° 9
Tomando como año base 1995, calcular para los otros años:
6.1. Los índices de precios.
6.2. Los índices de cantidades.
6.3. Los índices de valores.
7. A continuación se relacionan los precios y las cantidades del año base, de cuatro
artículos diferentes:
Introducción.
Se dice que dos eventos son mutuamente excluyentes si uno y sólo uno de
ellos puede tener lugar a un tiempo.
Sí, por ejemplo lanzamos una moneda al aire para observar de cual lado cae,
no podemos pronosticar con certeza, si se presenta sello o se presenta cara.
Tenemos entonces presente el componente del azar y por consiguiente un
experimento aleatorio. No ocurriría igual si la moneda estuviese diseñada igual por
ambos lados y por consiguiente sería un experimento determinístico:
Ejemplo:
Lanzamos una moneda para observar, si cae del lado de cara o del lado
de sello:
• Espacio muestral
• Eventos elementales
,
• Evento seguro
• Evento imposible
• E1 y E2 son eventos excluyentes.
Ejemplo:
Espacio muestral
Ejemplo:
En una mesa hay un juego (28 fichas) de dominó, se voltea una ficha
para observar sus números:
Espacio muestral
Ejemplo:
10.1.3. Permutaciones:
Ejemplo:
Cuantas palabras diferentes se pueden formar con las letras n, l, o, e; así no tengan
sentido?.
nloe, nleo, nelo, neol, nole noel, lnoe, lneo, leno, leon, lone, loen, elon,
elno, enlo, enol, eoln, eonl, olne, olen, oeln, oenl, onle, onel.
10.1.4. Variaciones
Ejemplo:
Ejemplo:
Ejemplo:
Ejemplo:
¿Cuántos números de cuatro cifras existen?
PRACTIQUEMOS N° 10
1. ¿De cuántas maneras se pueden colocar dos anillos diferentes en la misma mano,
de modo que no estén en el mismo dedo?.
2. Al lanzar cinco dados de distintos colores ¿cuántos resultados podemos
obtener?.
3. Con los números 1,2,3,4,5 y 6:
3.1 ¿Cuántos números distintos de siete cifras podríamos formar?.
3.2 ¿Podremos numerar a los 3224564 habitantes de una ciudad con esos
números?.
4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. ¿Cuál es
el número de casos posibles?.
5. ¿Cuántos números de seis cifras existen que estén formados por cuatro
números dos y por dos números tres?.
6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar.
Engarzando las 25 bolitas en un hilo, ¿cuántos collares distintos podrá
realizar?.
7. ¿Cuántas palabras distintas, con o sin sentido, podremos formar con las letras
de la palabra educación? ¿y con la palabra vacaciones?.
8. Un grupo de amigos formado por Raúl, Sonia, Ricardo y Carmen organizan una
fiesta, acuerdan que dos de ellos se encargarán de comprar la comida y las
bebidas ¿De cuántas formas posibles puede estar compuesta la pareja
encargada de dicha misión?.
9. Una fábrica de helados dispone de cinco sabores distintos (vainilla, chocolate,
nata, fresa y cola) y quiere hacer helados de dos sabores ¿Cuántos tipos de
helado podrán fabricar?.
10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si
se han dado en total 21 besos, ¿cuántas personas había?.
11. En una carrera de 500 metros participan doce corredores ¿De cuántas
maneras pueden adjudicarse las medallas de oro, plata, bronce?.
12. ¿De cuántas formas pueden cubrirse los cargos de presidente, vicepresidente,
secretario y tesorero de un club deportivo sabiendo que hay 14 candidatos?.
Ejemplo:
en tal caso
10.2.3. Probabilidad Subjetiva
10.3.1.
10.3.2.
10.3.3. Si dos o más sucesos son incompatibles entre sí, entonces la probabilidad
de la unión de ellos, es igual a la suma de sus probabilidades respectivas
10.3.3.4 .
10.3.3.5
Ejemplo:
PRACTIQUEMOS N° 11
1. Defina:
1.1 Experimento aleatorio, y experimento determinístico.
1.2 Evento elemental, suceso seguro, suceso imposible, eventos
excluyentes y eventos independientes.
2. Para cada uno de los eventos definidos en el lanzamiento de dos dados, calcular
su respectiva probabilidad de ocurrencia.
3. En el experimento de seleccionar una ficha de dominó, determinar las
probabilidades para todos sus eventos elementales.
4. Para el ejemplo de la intención de voto según el sexo, calcular la probabilidad de
no votante dado que es de sexo masculino.
X(s) = 1
Ejemplo:
Ejemplo:
PRACTIQUEMOS N° 12
si X es discreta ó
si X es continua
Ejemplo:
PRACTIQUEMOS N° 13
(1)
(1) se puede expresar como:
y la función de distribución:
Solución:
2.
3.
4.
5.
6.
7.
8.
Donde:
Ejemplo:
Un cajero de un banco atiende en promedio 7 personas por hora, cual es la
probabilidad de que un una hora determinada:
1.
2.
3.
4.
Ejemplo:
Solución:
1.
2.
Sin embargo, existen infinitas distribuciones normales, ya que por cada media
aritmética ó varianza diferente se describe una función también diferente:
Ejemplo:
• E (X) =
• Var (X) = 2
F(X) = 1 - e-x/
PRACTIQUEMOS N° 14
el almacén realice:
¿Pero bajo que condiciones, resulta apropiada una muestra?. Existen una
serie de factores que inciden en la respuesta de esta pregunta, y que resultan
fundamentales en Estadística Inferencial.
12.2.1. SIMPLE
12.2.2. SISTEMÁTICO
12.2.3. ESTRATIFICADO
A veces nos interesa, cuando las poblaciones son muy grandes, dividir
éstas en subpoblaciones o estratos, sin elementos comunes, y que cubran
toda la población.
Una vez hecho esto podemos elegir, por muestreo aleatorio simple, de
cada estrato, un número de elementos igual o proporcional al tamaño del
estrato.
A partir de aquí, debe ser realizado el "trabajo de campo", es decir las entrevistas
previstas, por medio de los encuestadores. Este trabajo también ha de hacerse
bajo unas ciertas condiciones, que garanticen que las respuestas sean sinceras.
Imagina que de la población formada por todos los alumnos del instituto,
extraes aleatoriamente una muestra de 40 alumnos, y les preguntas por su edad,
encontrando que la edad media obtenida es de 15,8 años .
Imagina que tienes una población con media y desviación típica . y que
extraes aleatoriamente todas las posibles muestras, todas ellas de tamaño n. Si
obtuvieras las medias de todas estas muestras, y las consideras una distribución
de datos (la distribución muestral de medias), comprobarías que:
(1)
NOTAS IMPORTANTES
EJEMPLO:
Una compañía aérea sabe que el equipaje de sus pasajeros tiene como media 25 kg.
con una d.t. de 6 kg. Si uno de sus aviones transporta a 50 pasajeros, el peso medio
de los equipajes de dicho grupo estará en la distribución muestral de medias
Si el avión no debe cargar más de 1300 kg en sus bodegas, la media del conjunto de
los 50 pasajeros no debe superar los
En consecuencia en un 11,9% de los casos los aviones de esta compañía superan el
margen de seguridad.
1º.- Si nos habían dicho que la media de distancia de todo el instituto era el año
pasado de 3,8 km, ¿es significativamente diferente esta media?, o lo que es lo
mismo, ¿podemos decir que la media del instituto ha cambiado este año, o por
el contrario la diferencia de medias es normal y se debe al azar al elegir los
elementos de la muestra?.
Esta pregunta implica una decisión, que podremos tomar a través de los
denominados test de contraste de hipótesis.
2º.- Tomando como base la muestra (es decir si suponemos que desconocemos la
distancia media), ¿qué estimación puede hacerse sobre la media poblacional
(es decir la de todo el Colegio)?.
PRACTIQUEMOS N° 15
5.- De los 500 directores de complejos turísticos de las costas peruanas, 300
corresponden a complejos de 20 o menos habitaciones, 150 a complejos de
entre 20 y 50 habitaciones y por último 50 corresponden a complejos de más de
50 habitaciones.
8.- Para realizar una encuesta sobre el consumo de un producto en una ciudad, se
tomó una muestra de forma que de cada barrio se consultaba a un número de
personas proporcional a la superficie ocupada por el barrio. ¿Te parece un
método fiable?. Escribe un comentario.
10.-Sabemos que el tiempo medio de espera en las colas del Banco "El interés
interesado" es de 15 min. con una desviación típica de 5 minutos. Si tomásemos
al azar a un grupo de 35 clientes:
c) ¿Entre qué valores se encontraría el tiempo medio con una seguridad del
95%?. ¿Y del 99%?.
11.-En un almacén se trabaja con bultos de igual volúmen, cuyo peso se distribuye
según N(250,45) expresados en kg. Los elevadores encargados de su transporte
dentro del almacén, pueden aguantar hasta un peso máximo total de 2000 kg. Si
la empresa decide que las carretillas se carguen con 7 bultos cada vez:
12.-En unos grandes almacenes, la media de los salarios es de 105.000 pts, con una
d.t. de 25.000 pts. Si preguntaramos a 35 empleados elegidos aleatoriamente,
por su sueldo, ¿Cuál es la probabilidad de que la media correspondiente a los 35
fuera inferior a 100.000 pts?.
INTERVALO DE CONFIANZA
Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de
confianza específico
Además, al valor 0,2 (200 metros), que mide la mitad de la anchura del
intervalo, se le denomina error máximo de la estimación. Lo anteriormente
argumentado se expresa en términos estadísticos como:
"A un nivel de confianza del 95%, la media poblacional es 3 km, con un error
máximo de estimación de km."
Por tanto:
NIVEL DE CONFIANZA
Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99%
y 99,9%
Este valor nos dice que la medias muestrales se encuentran en un 95% de los
casos como máximo a 1.96 desviaciones típicas de la media buscada, es decir,
nuestra media , en un 95% de los casos, dista de la media poblacional menos
de 1,96.0,063=0,124 km.
( -E, + E)
siendo la media de la muestra, y el error de estimación.
Pero imaginemos ahora, que nos disponemos a elegir una muestra para poder
determinar con un 95% de confianza la media, con un margen de error de 50
metros. Desde luego hará falta una muestra mayor para tener tan poco margen de
error ¿Cuál deberá ser el tamaño de la muestra para conseguirlo? .
Despejando en
obtenemos que
....
Por tanto, si en una población, una determinada característica de tipo binomial (es
decir la población se divide entre los que la tienen y los que no), se presenta en una
proporción p, al tomar muestras de tamaño n, las proporciones p' obtenidas, se
distribuirán según
EJEMPLO:
En una empresa está establecido que si una máquina opera correctamente, como
máximo un 5% de su producción es defectuosa. Si se elige aleatoriamente una
muestra de 40 artículos producidos por una máquina y 15 de ellos son defectuosos,
¿existe razón para pensar que la máquina está averiada?.
, es decir se distribuyen de forma "normal" alrededor del 5% con una d.t. del 3'4%.
resulta ser:
Imaginemos que hemos tomado una muestra aleatoria de 500 personas, y que
les preguntamos si creen que el Presidente del Gobierno debe dimitir, obteniendo
el SÍ un 70%. Supongamos que nos planteamos un intervalo de confianza del 90%
para poder estimar el porcentaje p de toda la población que diría SÍ.
Llevando a cabo los mismos pasos que en el caso de la estimación de medias, vemos
que un 90% de las proporciones muestrales que se obtengan estarán a como
Esto lo podemos expresar como: "Con un nivel de confianza del 90%, la proporción
de españoles que creen que el Presidente del Gobierno debe dimitir es de un 70%,
con un error máximo de 3,3 % "
PRACTIQUEMOS N° 16.
2.- Súper Mercados Día, desea conocer cuanto gastan como media los poseedores
de una de sus tarjetas, a lo largo de un mes. Ha diseñado un muestra de 1000
clientes, y sabe por experiencia que la desv. típica poblacional es de 25.000
puntos. Si desea tener una confianza del 99% en la estimación, ¿cuál será el
error máximo que cometerá?.
3.- Se desea establecer, con un nivel de confianza del 95%, el peso medio de las
naranjas de un barco que acaba de atracar, de forma que el error no
sobrepase los 15 gramos. Si la desviación típica (conocida por numerosos casos
anteriores) es de 60 g., ¿cuántas naranjas deberán ser escogidas al azar para
poder establecer dicha media?.
4.- Razona que efecto tiene cada uno de los siguientes conceptos sobre el ancho
de un intervalo de confianza:
a) Nivel de confianza
b) Tamaño muestral
c) Variabilidad de las características que se miden
5.- Para conocer con un 95% de confianza y un error máximo de 500 pts, se
quiere hacer una encuesta a júvenes, sobre sus gastos durante el fín de
semana. ¿Cuál deberá ser el tamaño de la muestra? (supóngase que s=750 pts)
6.- Una encuesta realizada sobre 40 aviones comerciales, revela que la antigüedad
media de estos es de 13,41 años, con una desviación típica muestral s=8,28.
9.- La duración de las bombillas fabricadas por una empresa sigue una distribución
normal de media desconocida y desviación típica 50 horas. Para estimar la
duración se experimenta con una muestra de tamaño n. Calcular el valor de n
para que, con un nivel de confianza del 95%, se consiga un error en la
estimación inferior a las 5 horas.
10.- Una muestra aleatoria de 60 personas tiene una media de 235 mg/dl
(miligramos por decilitro) en medidas de colesterol. Suponiendo que la
desviación típica de la variable que mide las unidades de colesterol es =28
mg/dl, se pide:
11.- Una revista, tras comentar los resultados de una encuesta, afirma, "En
teoría en 19 de cada 20 casos, los resultados de esta encuesta, difieren en un
punto porcentual de la proporción que se obtendría si hubiéramos encuestado
a todos los españoles". ¿Podrías decir, cual fué el nivel de confianza y el
tamaño de la muestra empleados en esta encuesta?.
12.- Se pretende conocer la proporción de alumnos que beben alcohol durante el
fín de semana. Se establece un margen de confianza del 95%, y se quiere que
el error máximo sea del 3%. ¿cuántos elementos deberían componer la
muestra?.
13.-En una muestra aleatoria de 1000 personas, están a favor del divorcio el 65%.
Halla con un 99% de confianza el intervalo para la proporción real en la
población. En una encuesta realizada un año antes nos había salido un 69% de
favorables al divorcio. ¿Cae este valor dentro del intervalo de la actual
encuesta? ¿Qué interpretación das al resultado?.
Más adelante, afirmaba: " Dado que 1223 personas representan a 40 millones,
mi carta representa la opinión de 32706 personas (división de 40 millones
entre 1223) que comparten mi punto de vista".
17.-En un sondeo a 800 personas elegidas al azar, realizado antes de una elección
con sólo dos candidatos A y B, se obtuvo el siguiente resultado: 57% para A y
43% para B. ¿Cuál es la probabilidad de que A gane las elecciones?. ¿Y si la
muestra hubiera estado formada por 2000 personas?.
Supongamos que una empresa privada, decide otorgar una premio a aquellos
centros, en los que la nota media de una prueba realizada por los alumnos supere
los 7 puntos.
Si esto es así, en como mínimo (*) el 95% de los casos, la media muestral
habría de ser menor que el valor t=7,726 para el que se verifica que
Este valor t se obtiene buscando en primer lugar la puntuación típica k para la que
p(Z<k)=0,95 , que resulta ser k=1,65. Los valores que se encuentran a más de 1,96
desviaciones de la media, es decir, superiores a t=7+1,65x0,44=7,726 son los que
forman la región crítica, es decir las notas medias que tienen una probabilidad de
producirse menor del 5%.
Podría ocurrir que la hipótesis (2) fuera cierta y la media muestral 7'9
perteneciera a esa distribución y fuera un valor correspondiente a la región crítica
(y la probabilidad de que ello ocurra es del 5%), o bien que lo que ocurra realmente,
es que (2) sea falsa, y la media obtenida pertenezca a una distribución muestral
con media superior
( por ejemplo 7,5 ), con lo cual tal valor no sería tan raro.
En cualquier caso, lo que hacemos es tomar una decisión, una vez vistas las
evidencias (datos obtenidos de la muestra), y asumido un margen de error para
nuestra decisión.
En primer lugar se han de hacer dos hipótesis (1) y (2) que barran el
conjunto de posibilidades para la media ( o en general el parámetro poblacional
sobre el que se quiere tomar una decisión). En el caso estudiado fué:
"No existe suficiente evidencia al nivel de significación que indique que ...
(significado de la hipótesis alternativa)"
Veremos ahora varios ejemplos que nos ilustrarán sobre el proceso y los
diferentes casos que pueden presentarse.
EJEMPLO 1:
El instituto cree poder probar que la edad media de los alumnos del turno de
Noche es inferior a los 30 años. Se ha tomado una muestra de 40 alumnos, y ha
resultado que la media es 29,5 , y la desviación típica muestral es s=2.
Se deberá en primer lugar establecer las hipótesis nula y alternativa, que deberían
ser:
Donde:
EJEMPLO 2:
H0:
HA:
,y
De hecho, esto no significa que sea cierta la hipótesis nula, sino sólo que no
se puede rechazar a este nivel de significación. Si hubiéramos tomado un nivel de
significación del 10%, la región crítica correspondiente habría estado delimitada
por los valores 482'78 y 517'22, con lo que habríamos rechazado la hipótesis nula
para ese nivel de significación.
De la misma forma que hemos estado realizando tests sobre medias, pueden
ser realizados tests sobre otros parámetros de una población. En particular
resulta muy interesante hacerlo sobre una proporción en una determinada
población. Veremos ahora un ejemplo de como hacerlo:
EJEMPLO 3:
Diego dice a Diana que al menos un 15% de los alumnos del Instituto, tiene
una moto. Como discrepan, Luis realiza una encuesta aleatoria a 200 compañeros
del Instituto, y encuentra que 18 de ellos tiene moto. A un nivel de significación del
10%, ¿cual de los dos tiene estadísticamente la razón?
Supongamos que H0 es cierta, y que por tanto en el peor de los casos sería p=0,15.
Sabemos que si así fuera, las proporciones muestrales, se habrían de distribuir
según:
Premisas
Potencia-Eficiencia
La prueba de una muestra de K-S puede en todos los casos en que se aplique ser
más poderosa que su prueba alternativa, la prueba de 2 ( ji-cuadrado.
Características de la dócima
La prueba de K-S de una muestra es una dócima de bondad de ajuste. Esto es, se
interesa en el grado de acuerdo entre la distribución de un conjunto de valores de
la muestra y alguna distribución teórica específica. Determina si razonablemente
puede pensarse que las mediciones muéstrales provengan de una población que
tenga esa distribución teórica. En la prueba se compara la distribución de
frecuencia acumulativa de la distribución teórica con la distribución de frecuencia
acumulativa observada. Se determina el punto en el que estas dos distribuciones
muestran la mayor divergencia.
Hipótesis
También:
Ft(x): es la función teórica. Esta puede ser por ejemplo la función normal con cierta
media y varianzas conocidas.
D = máxima
Ejemplo
Salto_Largo
1 1.60
2 1.65 Ho: Los datos están distribuidos normalmente
3 1 .55 H1: Los datos no están distribuidos normalmente.
4 1.62
5 1.64
6 1.70
7 1.71
8 1.68
9 1.66
10 1.67
11 1.65
12 1.68
13 1.69
14 1.70
Salidas de la dócima
Conclusiones:
Tabla de frecuencias
Histograma.
1-Tabla de frecuencias.
1-Histogramas.
Dócima de Kolmogorov-Smirnov para dos muestras independientes.
Premisas
Potencia-Eficiencia
Características de la dócima
La dócima de Kolmogorov-Smirnov está construida, teniendo como base detectar
las discrepancias existentes entre las frecuencias relativas acumuladas de las dos
muestras objeto de estudio. Lo anterior propicia que esta dócima pueda advertir
diferencias no tan solo entre los promedios, sino que éstas sean debidas a la
dispersión, o la simetría o la oblicuidad. Esta característica la hace distintiva de
aquellas en que solamente se ocupan de analizar las diferencias entre los
promedios.
Hipótesis
Salidas de la dócima
Es necesario señalar que las dos primeras opciones suministran información en los
casos en que sea conveniente realizar una dócima unilateral, además de reflejar
información acerca de lo que está ocurriendo en la dócima.
Existe un grupo de técnicas adicionales a la dócima, las que hemos dividido en los
siguientes grupos.
Ejemplo
Salida de la dócima
Histogramas
A continuación se muestran los histogramas de las dos muestras. Los que pueden
proporcionar una mayor idea del proceso ocurrido.
Glosario de Términos
1. Alcance: distancia entre los valores más bajo y más alto de un conjunto de datos.
2. Codificación: método para calcular la media de datos agrupados mediante la
recodificación de los valores de los puntos medios de las clases a valores más sencillos.
3. Coeficiente de variación: medida relativa de la dispersión, comparable por medio
de distribuciones diferentes, que expresa la desviación estándar como porcentaje de la
media. Proporción o porcentaje de la media que representa la desviación estándar.
4. Cuartiles: fractiles que dividen los datos en cuatro partes iguales.
5. Curtosis: el grado de agudeza de una distribución de puntos.
6. Datos: colección de cualquier número de observaciones relacionadas sobre una o
más variables.
7. Deciles: fractiles que dividen los datos en diez partes iguales.
8. Dependencia estadística: condición en la que la probabilidad de presentación de un
evento depende de la presentación de algún otro evento, o se ve afectada por ésta.
9. Desviación estándar: raíz cuadrada positiva de la varianza; medida de dispersión
con las mismas unidades que los datos originales.
10. Diagrama de barras: representación gráfica de la distribución de frecuencias de
un atributo o de una variable discreta.
11. Dispersión: la extensión o variabilidad de un conjunto de datos.
12. Distribución binomial: modelo para variable aleatoria discreta que permite calcular
la probabilidad de obtener x éxitos en n ensayos repetidos de tipo Bernoulli.
Distribución discreta que describe los resultados de un experimento conocido como
proceso de Bernoulli.
13. Distribución continua de probabilidad: distribución de probabilidad en la que la
variable tiene permitido tomar cualquier valor dentro de un intervalo dado.
14. Distribución de frecuencias: despliegue organizado de datos que muestran el
número de observaciones del conjunto de datos que entran en cada una de las clases de
un conjunto de clases mutuamente exclusivas y colectivamente exhaustivas. Asignación
de frecuencias a cada uno de los valores de una variable o atributo.
15. Distribución de Poisson: modelo para variable aleatoria discreta que permite
calcular la probabilidad de obtener x éxitos en un intervalo continuo.
16. Distribución de probabilidad: lista de los resultados de un experimento con las
probabilidades que se esperarían ver asociadas con cada resultado.
17. Distribución exponencial: modelo para variable aleatoria continua que permite
representar variables del tipo "tiempo entre" o "distancia entre" dos eventos y vida
útil de ciertos componentes.
18. Distribución normal: modelo para variable aleatoria continua que permite
representar un gran número de fenómenos físicos. Distribución de una variable
aleatoria continua que tiene una curva de un solo pico y con forma de campana.
19. Error de muestreo: error o variación entre estadísticas de muestra debido al
azar, es decir, diferencias entre cada muestra y la población, y entre varias muestras,
que se deben únicamente a los elementos que elegimos para la muestra.
20. Error estándar: la desviación estándar de la distribución de muestreo de una
estadística.
21. Espacio muestral: conjunto de todos los resultados posibles de un experimento
aleatorio.
22. Estimación: valor particular de un estimador, que caracteriza a una muestra
específica.
23. Evento: uno o más de los resultados posibles de hacer algo, o uno de los resultados
posibles de realizar un experimento.
24. Experimento aleatorio actividad que tiene como resultado o que produce un evento.
Prueba donde existen dos o más resultados posibles, y no se pude anticipar cuál de
ellos va a ocurrir.
25. Histograma: gráfica de un conjunto de datos compuesta de una serie de
rectángulos, cada uno con un ancho proporcional al alcance de los valores de cada clase
y altura proporcional al número de elementos que entran en la clase, o altura
proporcional a la fracción de elementos de la clase.
26. Independencia estadística: condición en la que la presentación de algún evento no
tiene efecto sobre la probabilidad de presentación de otro evento.
27. Inferencia estadística: proceso de análisis que consiste en inferir las propiedades
de una población en base a la caracterización de la muestra.
28. Media: medida de tendencia central que representa el promedio aritmético de un
conjunto de observaciones.
29. Mediana: punto situado a la mitad de conjunto de datos, medida de localización que
divide al conjunto de datos en dos partes iguales.
30. Medida de dispersión: medida que describe cómo se dispersan o distribuyen las
observaciones de un conjunto de datos. Cantidades que describen la variabilidad de los
datos.
31. Medida de tendencia central: medida que indica el valor esperado de un punto de
datos típico o situado en el medio. Cantidades numéricas que dan una idea sobre la
ubicación de la distribución de frecuencias.
32. Moda: el valor que más a menudo se repite en un conjunto de datos. Está
representado por el punto más alto de la curva de distribución de un conjunto de datos.
33. Muestra representativa: muestra que contiene las características importantes de
la población en las mismas proporciones en que están contenidas en la población.
34. Muestra: subconjunto de la población seleccionado mediante algún criterio
particular. Porción de elementos de una población elegidos para su examen o medición
directa.
35. Muestreo aleatorio simple: métodos de selección de muestras que permiten a cada
muestra posible una probabilidad igual de ser elegida y a cada elemento de la población
completa una oportunidad igual de ser incluido en la muestra.
36. Muestreo aleatorio: conformación de la muestra usando métodos al azar.
37. Muestreo no aleatorio: conformación de la muestra en base al conocimiento o
experiencia del observador.
38. Parámetro: valor fijo que caracteriza a una población. Valores que describen las
características de una población.
39. Población: conjunto formado por todas las unidades objeto de un estudio
estadístico. Colección de todos los elementos que se están estudiando y sobre los
cuales intentamos llegar a conclusiones.
40. Probabilidad clásica: número de resultados favorables a la presentación de un
evento dividido entre el número total de resultados posibles. Asignación de
probabilidad "a priori", si necesidad de realizar el experimento.
41. Probabilidad condicional: probabilidad de que se presente un evento, dado que otro
evento ya se ha presentado.
42. Probabilidad subjetiva: probabilidad basada en las creencias personales de quien
hace la estimación de probabilidad. Asignación de probabilidad en forma intuitiva, en
base a la experiencia o el conocimiento.
43. Probabilidad: la posibilidad de que algo suceda.
44. Prueba de Kolmogorrov-Smirnov: prueba no paramétrica que no requiere que los
datos se agrupen de ninguna manera para determinar si existe diferencia significativa
entre la distribución de frecuencia observada y la distribución de frecuencia teórica.
45. Pruebas de bondad de ajuste: pruebas de hipótesis que ponen bajo prueba una
afirmación acerca de la distribución de una variable aleatoria.
46. Pruebas no paramétricas: técnicas estadísticas que no hacen suposiciones
restrictivas respecto a la forma de la distribución de población al realizar una prueba
de hipótesis.
47. Sesgo: grado en que una distribución de puntos está concentrada en un extremo o
en el otro; falta de simetría. Asimetría en distribuciones de frecuencias no simétricas.
48. Simétrica: característica de una distribución en la que cada mitad es la imagen
especular de la otra.
49. Tabla de frecuencias: tabla donde se asienta la distribución de frecuencias.
50. Teorema del Límite Central: teorema que especifica las condiciones bajo las
cuales puede esperarse que una variable aleatoria tenga distribución normal.
51. Unidad de observación: persona o casa sobre la que se mide una o varias
características de interés.
52. Valor esperado: promedio pesado de los resultados de un experimento.
53. Variable aleatoria continua: variable aleatoria que puede tomar infinitos valores
dentro de un rango cualquiera.
54. Variable aleatoria discreta: variable que toma un número finito o infinito de
valores numerables.
55. Variable aleatoria: variable que toma diferentes valores como resultado de un
experimento aleatorio.
56. Varianza: medida de la distancia cuadrada promedio entre la media y cada
observación de la población. Promedio de los desvíos cuadráticos con respecto a la
media.
Referencias
Libros:
1. Alatorre, et al., Introducción a los métodos estadísticos, México, UPN.
1998.
2. Azorín, Poch. Francisco. Curso de muestreo y aplicaciones, Aguilar, 1989.
3. Barahoma, Abel y otro. Metodología de trabajos científicos, Ipler, 1999.
4. Bencardino M., Ciro. Estadística, Apuntes y 600 Problemas Resueltos, 2a
Edición, Ecoe, 1992.
5. Castillo, Juana, Estadística inferencial básica, México, CCH, UNAM. 1996.
6. CHAO. Lincoln L. Estadística para Ciencias Administrativas, 2a Edición,
MCGRAW-HILL, 1990.
7. Dixon, Wilfrid J y otro. Introducción al Análisis Estadístico, 2a Edición,
MCGRAW-HILL, 1995.
8. Doms, Fernan P. La Estadística Qué Sencilla, 5a Edición, Paraninfo, 1999.
9. Downie, N. M. y otro. Métodos Estadísticos Aplicados. Harper Row
Publishers Inc., 2000.
10. Giardina, Basilio. Manual de Estadística, 3 Edición, 1992.
11. Haber, Audrey. Estadística General, Fondo Educativo Interamericano, 1993.
12. Hoel, Paul G. Estadística Elemental, México, CECSA. 2001.
13. Johnson, Robert, Estadística elemental, Buenos Aires, Grupo Editorial
Iberoamericana. 1996.
14. Kazmier, Leonard J. Estadística Aplicada a la Administración y la Economía,
MCGRAW-HILL, 1998.
15. Levin Yack. Fundamentos de Estadística en la Investigación Social, 2a
Edición, Harla S., 1997.
16. Llerena, León, Ricardo y otro. Curso de Estadística General, U. de A., 1991.
17. Mejía V., William. Bioestadística General, Escuela Nal. De Salud Pública, U.
de A., 1990.
18. National Council of Teachers. Of. Mathematics USA. Recopilación,
Organización e interpretación de Datos, Trilla, 2000.
19. Portilla, Ch. Enrique. Estadística, Primer Curso. Interamericano, 1990.
20. Richards, Larry E. Y otro. Estadística en los Negocios. ¿porqué y cuándo?,
MCGRAW-HILL,1998.
21. Seymour, Lipschutz, Teoría y problemas de probabilidad , México, McGraw-
Hill. 1970.
22. Shao, Stephen P. Estadística para Economistas y Administradores de
Empresas, 15a Edición, 1989.
23. Spiegel, Murray R. Estadística, MCGRAW-HILL, 1970.
24. Spiegel, Murray, Teoría y problemas de estadística , México, McGraw-Hill.
1970.
25. Stevenson, William, Estadística, México, Harla. 1981.
26. Yamane, Taro, Estadística, México, Harla. 1986.
Páginas Web:
1. Librería Virtual Elaleph: www.elaleph.com/
2. Universidad Nacional de Colombia sede Medellín: www.unalmed.edu.co/
3. El Portal de las Matemáticas: www.matematicas.net/
4. Libros y Software Gratis: www.recursosgratis.com/
5. DANE Colombia: www.dane.gov.co/
6. Planeación Nacional Colombia N.N.P.: www.dnp.gov.co/
7. Ministerio de Desarrollo Colombia: www.mindesa.gov.co/
8. Web Estadístico de Navarra: www.lander.es/
9. Bioestadística: Métodos y Aplicaciones: ftp.medprev.uma.es/libro
10. Aula Fácil: www.aulafacil.org/
11. Probabilidad y Estadística: www.mor.itesm.mx/
12. Diseño de Experimentos y Teoria de Muestras:www.libros.netstoreusa.com/
13. Distribuciones Estadísticas:www.sisweb.com/
14. Probabilidad:www.thales.cica.es/
15. Distribución de Poisson:www.ual.es/
16. Tratamiento de la Incertidumbre:www.dc.fi.udc.es/
17. Universidad de Antioquia:extension.udea.edu.co/
18. Estadística Lejarza:www.uv.es/
Anexos
Anexo N° 1:Tabla de la Distribución Normal
p(Z<k)
0 '00 0'01 0'02 0'03 0'04 0'05 0'06 0'07 0'08 0'09
k
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92786 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96637 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99897 0.99900
3.1 0.99903 0.99906 0.99910 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.99940 0.99942 0.99944 0.99946 0.99948 0.99950
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.99960 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.99970 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.99980 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.99990 0.99990 0.99990 0.99991 0.99991 0.99991 0.99992 0.99992 0.99992
Anexo N° 2
49035 39250 26420 44343 86730 00094 74043 65106 72384 40298
34650 61029 41870 93056 07492 11854 54849 48034 53807 32851
37944 42974 47550 91625 95455 66107 49743 94663 15075 16998
96501 14020 97799 58005 70661 12170 49250 29349 13070 67066
83882 97885 21981 99586 14053 62953 87632 62027 22690 52283
13967 58987 51301 06732 90588 40925 74328 74721 95415 35883
76357 15538 32168 66301 00456 45252 36652 35549 93901 49812
21965 62747 41846 36966 75159 94638 49952 01953 66456 29732
13808 41499 87080 52612 95907 66465 92820 95272 20290 35563
97901 17521 90387 60885 37302 29952 37418 20541 95588 70662
ANEXO N° 3: Contraste de Hipótesis a partir del p-Valor
(I)
Esta forma de abordar los tests, nos permite una visión más amplia, por cuanto nos
dá información de para qué niveles de significación puede rechazarse la hipótesis
nula, y para cuales no se puede.
Hemos comentado ya, que cuando se establecen la hipótesis nula y alternativa, y se lleva a cabo
el test, pueden ocurrir cada uno de los cuatro casos:
Para estimar la diferencia existente entre cada uno de los casos, imagina a un médico que acaba
de llegar al lugar de un accidente, y debe contrastar la hipótesis nula: "esta víctima está viva".
Mirando la tabla anterior, podemos ver los 4 resultados posibles, y la gravedad de cada tipo de
error.
Aunque nos gustaría que no existiera posibilidad de error, esto es imposible dado que utilizamos
para tomar nuestra decisión información muestral y no poblacional. Se trata pues de que estos
errores sean lo menores posibles. En cada caso en concreto se debería de estudiar la gravedad de
cada tipo de error, para minimizar los riesgos inherentes a un proceso de decisión de este tipo.
Ahora veremos el procedimiento para el cálculo del error del tipo II, suponiendo que ya han
sido fijados el de tipo I y el tamaño de la muestra.
"Si H0 es cierta, en el mejor de los casos =7, y por tanto en al menos un 95% de los casos, la
media muestral que obtengamos habrá de ser menor que 7'726"
Es decir, rechazaremos la hipótesis nula, siendo en realidad cierta en como máximo un 5% de
los casos ( los correspondientes a la región sombreada). Imaginemos que H0 fuese en realidad
falsa, es decir que por ejemplo =7'5. ¿Cuál es el riesgo de que aceptemos que la media es
menor o igual a 7?
Si un valor es menor que 7,726, estaremos aceptando que la media es menor que 7, a pesar de
ser 7'5. La probabilidad de que esto ocurra es sobre N(7'5,0'44).
Podemos observar a la vista de lo expuesto, que fijado el valor de n, cuanto menor es el valor
del riesgo , mayor es el valor del riesgo , o lo que es lo mismo, para un determinado tamaño
muestral, no podemos reducir simultáneamente los dos errores, de forma que deberemos de
sacrificar uno de los errores si queremos disminuir el otro.
Por último, vemos que el riesgo de aceptar erróneamente una hipótesis nula es función
del verdadero parámetro poblacional, de forma que cuanto más alejado esté éste de los valores
ponderados en la hipótesis nula, menor es el riesgo es decir, mayor la probabilidad de tomar
la decisión correcta.
Anexo N° 5. Guía para elaborar una Tesis
Elaboración de un plan de trabajo.
Para iniciar una investigación, es necesario organizar adecuadamente las actividades y tener un
conocimiento amplio sobre el tema u objeto de estudio. Hay que distinguir aquellas actividades que
requerirán de mayor tiempo para su concreción y aquellas que demandan un esfuerzo personal más
específico.
Elaboración de un anteproyecto.
Antes de elaborar este anteproyecto, debe realizarse una amplia búsqueda bibliográfica, que brindará
una idea más clara del tema. También es importante relacionarse con personas que traten o trabajen en
el tema.
Esquema.
1. Definición del problema: título descriptivo del proyecto, formulación del problema. Formular un
problema es caracterizarlo, definirlo, enmarcarlo teóricamente. La caracterización o definición
del problema nos lleva a otorgarle un título en el que de manera clara indiquemos los elementos
esenciales. La formulación del problema es la estructuración de toda la información. Se debe
sintetizar la cuestión proyectada para investigar a través de un interrogante.
2. Justificación: una vez que se ha seleccionado el tema de investigación, definido por el
planteamiento del problema, y establecido los objetivos, se debe indicar las motivaciones que
llevan al investigador a desarrollar el proyecto. Responde a la pregunta: ¿por qué se investiga?.
3. Definiciones.
4. Objetivos: Es el propósito de la investigación. Responde a la pregunta ¿para qué?. Un objetivo
debe redactarse con verbos en infinitivo.
5. Hipótesis: Es una proposición de carácter afirmativo enunciada para responder tentativamente a
un problema. Toda hipótesis constituye un juicio, o sea una afirmación o una negación de algo.
6. Limitaciones y delimitaciones: Es pertinente precisar los límites del problema, su alcance, para
ello es necesario tener en cuenta la viabilidad, lugar, tiempo y financiación.
7. Marco de referencia: Fundamentos teóricos, antecedentes del problema. Debe ser una
búsqueda detallada y concreta, donde el tema y la temática del objeto a investigar tenga un
soporte teórico, que se pueda debatir, ampliar, conceptualizar y concluir. Ninguna investigación
debe privarse de un fundamento o marco teórico o de referencia. Estos fundamentos teóricos
permiten presentar una serie de conceptos, que constituyen un cuerpo unitario y no un simple
conjunto arbitrario de definiciones.
8. Metodología: diseño de técnicas de recolección, población y muestras, técnicas de análisis,
índice analítico tentativo, guía de trabajo de campo.
9. Cronograma: es un plan de trabajo o plan de actividades, que muestra la duración del proceso
investigativo.
10. Presupuesto.
11. Bibliografía.
Anexo N° 6: Registro de la Información. Modelos de Fichas.
Cuando una publicación ingresa a una biblioteca se registra, se anotan los datos más importantes para localizarla fácilmente. El
criterio que se sigue en las bibliotecas para clasificar libros, revistas, tesis y artículos sueltos, es el siguiente: Por autor, p or título
y por tema.
Ficha bibliográfica.
Los índices que se refieren a los libros se encuentran generalmente en cajones que contienen tarjetas de 3 x 5 pulgadas,
ordenadas alfabéticamente. Los datos que se enumeran a continuación son los que se registran en las fichas:
1. Autor. Apellido, nombre
2. Título (siempre va subrayado)
3. Subtítulo (si lo hay)
4. Traductor, prologuista, etc. (si el original se escribió en otro idioma)
5. Edición (si es la primera no se anota, se anota a partir de la segunda)
6. Número de volumen (si cuenta con más de uno)
7. Lugar (donde se editó la obra)
8. Editorial
9. Fecha
10. Número total de páginas, láminas, ilustraciones
11. Colección o serie.
Los datos que corresponden a 7, 8 y 9 se conocen como pie de imprenta.
Entre paréntesis rectangulares o corchetes, se anotan los datos que se deseen agregar: si contiene mapas, ilustraciones,
comentarios o apreciaciones personales sobre el libro.
Cuando no aparecen algunos datos indispensables, se usan las siguientes abreviaturas:
[et. al]: cuando son varios autores se anotan los datos del primero y esta abreviatura significa: y otros. [s. tr.]: sin traductor, [s.
l.]: sin lugar, [s. f.]: sin fecha, [s. e.]: sin editorial, [s. p. i.]: sin pie de imprenta.
Las anotaciones particulares, hechas por el investigador para su empleo personal, se encierran también entre corchetes.
En algunas fichas se incluye también un breve resumen del libro y/o un índice de contenido. A este fichero se recurre cuando se
conoce el nombre del autor del libro que se desea consultar.
Otras veces se recurre a ficheros clasificados por temas y por título, porque se desconoce el nombre del autor. En ocasiones,
cuando no hay referencias en el fichero sobre el concepto investigado, se deben buscar sinónimos o temas afines.
Ficha de diarios y revistas.
En las bibliotecas existen generalmente dos formas de clasificar las revistas: por tema y por artículo.
La clasificación por temas es muy general y se refiere principalmente a disciplinas tan amplias como la psicología, la sociología,
la economía, la antropología, etc.
A la clasificación que con mayor frecuencia se recurre en relación con las revistas, es a la clasificación por títulos, ya que es la
manera más práctica de hacerlo.
Una ficha, cuando el dato se toma de diarios y revistas, debe contener:
1. Nombre del autor
2. Título y subtítulo del artículo (entre comillas)
3. Título y subtítulo del periódico o revista (subrayado). Institución que la publica
4. Número del columen, año, tomo (con números romanos)
5. Número del fascículo (con números arábigos)
6. Fecha
7. Número de página o páginas que ocupa el artículo o dato
8. Información (dato). Cuando aparece sin datos de lo que trata el artículo, se le conoce como ficha de artículo.
En ocasiones se recorta el artículo o parte de él. En estos casos, los datos de esta ficha se anotan en la hoja o tarjeta en donde se
pegó el recorte.
Ficha de tesis.
Las tesis se encuentran archivadas en un fichero especial y están clasificadas de la misma manera que los libros, es decir, tanto
por tema como por autor.
Los datos que deben contener son:
1. Autor
2. Título
3. Tesis (se menciona al grado que se aspira con ella)
4. Lugar (colegio o institución donde se presenta)
5. Editor (si lo hay)
6. Fecha
7. Número de páginas (cuando el texto está escrito por un solo lado de la hoja, se usará la abreviatura h, en lugar de p).
Ficha de publicación oficial.
1. País
2. Dependencia
3. Año
4. Título (época que comprende el trabajo, ensayo, memoria, etc.)
5. Editorial (o los talleres donde se imprimió)
6. Número de páginas (si la dependencia que la publica no es la responsable del contenido, el registro se iniciará con el
nombre del autor.
Ficha de textos jurídicos.
1. Territorio en donde se aplican
2. Referencia al tipo de normas de que trata
3. Nombre de la ley o decreto (subrayado)
4. Editor o talleres donde se imprimió (o el conducto por el cual se dio a conocer)
5. Fecha
6. Número de páginas.
Ficha de documentos nacionales.
1. Título (o asunto de que trata)
2. Lugar
3. Fecha
4. Archivo
5. Legajo
6. Foja
7. Demás especificaciones
8. Número de páginas
9. Características de interés particular, si el investigador juzga indispensable registrarlas)
Ficha de documentos internacionales.
1. Órgano responsable
2. Título (o asunto)
3. Número, clave o codificación
4. Lugar donde se publicó
5. Editor (o conducto por el que se da a conocer
6. Fecha
Ficha de registro de obras de recopilación de constituciones o leyes.
1. Nombre del compilador o editor
2. Referencia al tipo de norma o documento (subrayado)
3. Número de volumen (con números romanos)
4. Lugar
5. Editor
6. Fecha
7. Número de páginas en donde está comprendido.
Ficha de registro de pactos, acuerdos o tratados internacionales.
1. País u organismo (con mayúsculas)
2. Tipo de norma o documento
3. Autor del prólogo, comentario o nota
4. Lugar
5. Editor
6. Fecha
7. Número de páginas en donde está comprendido.
Ficha de artículos contenidos en libros o enciclopedias.
1. Autor del capítulo o artículo
2. Título del capítulo o artículo (entre comillas)
3. Páginas en que está comprendido
4. Autor de la obra que contiene el artículo o capítulo
5. Título de la obra (subrayado)
6. Demás datos de la ficha bibliográfica de la obra.
Ficha de campo.
1. Tema de investigación
2. Nombre del investigador
3. Institución
4. Lugar
5. Fecha
6. Hora
7. Datos de la fuente (edad, sexo, ocupación).
Ficha de noticiario.
1. Agencia noticiosa / comentarista
2. Nombre del noticiario
3. Número / horario
4. Estación / canal / cine
5. Lugar
6. Fecha
7. Noticia o comentario
Ficha de institución.
Nombre de la institución (subrayado)
1. Institución de la que forma parte
2. Objetivos que tiene en su función
3. Ubicación
• Dirección
• Lugar que ocupa en la disciplina a la que pertenece o practica
1. Funciones y servicios
2. Información que puede proporcionar
3. Conexión, nexos, relación con otras fuentes similares
4. Forma de acceso (procedimientos para obtener sus servicios, o persona u oficina por cuyo conducto se pueden obtener
sus servicios).
5. Publicaciones que emite
6. Otros datos importantes.
Ficha para registrar información que aparece en mapas, dibujos, fotografías, etc.
1. Nombre (de lo que se trata, subrayado)
2. Autor
3. Fuente (lugar, libro, revista, museo, etc., dónde está)
4. Descripción del objeto (colores, medidas, material de que está hecho, datos indispensables para tener noción de cómo
es)
5. Contenido (descripción de lo que se ilustra o representa)
6. Otros datos que interesen al investigador (fecha, sala, en el caso de museos, exposición, etc.)
FICHA DE TRABAJO.
Es aquella donde se registran los datos que interesan al investigador.
Cuando el dato está contenido en más de una tarjeta, las tarjetas que ocupe constituirán una sola ficha. En estos casos, conviene
marcar las tarjetas con el número de ficha y una letra (ej.: 5a y 5b).
Una ficha debe contener un solo dato, éste puede ser un solo detalle (una fecha, un nombre, un acontecimiento, etc.) o estar
formado por más información (una carta, la descripción de un hecho, una biografía, etc.). Para saber qué información debe
registrarse en una ficha de trabajo, en el momento de hacer la anotación debe pensarse si esa información va a aparecer en un
solo lugar o hay detalles que se utilizarán en otros lugares del escrito; en el primer caso se tratará de una ficha; en el segundo,
será necesario hacer una ficha por cada información que aparecerá en distintas partes del escrito.
El regesto es el asunto, tema o título del contenido de la ficha de trabajo. Debe ser breve y reflejar fielmente la información
anotada.
La información (dato) puede registrarse textualmente o resumirse.
Datos fundamentales:
1. Autor
2. Título (entre comillas)
3. Número de página (s) donde aparece el dato
4. Regesto (asunto, tema; va subrayado)
Datos complementarios:
1. Fecha en que se recogió el dato
2. Razón o motivo por el que se recabó la información.
Ficha de transcripción textual.
Como su nombre lo indica, es aquella a la que se traslada íntegramente el texto tomado de la fuente, por lo que esta información
siempre irá entre comillas.
Ficha de síntesis.
Es la que se utiliza para consignar, en pocas palabras, el extracto del texto consultado. Se debe tener cuidado de no omitir o
tergiversar el contenido
No es necesario utilizar una tarjeta especial para los comentarios personales acerca de la fuente, puesto que es conveniente
incluirlos en la misma ficha que la registra. Se escriben entre corchetes.
Fichas metodológicas.
Se refieren a aquellos puntos obtenidos de las lecturas, concretamente relacionados con notas metodológicas, es decir, con qué
sujetos se hizo la investigación, cómo se eligieron éstos, qué hipótesis se emplearon, cómo se analizaron los datos, algún
instrumento original que se utilizó, alguna cuestión interesante que se investigó, es decir, con las cuestiones operativas del
estudio. El origen de estas fichas, al igual que en los casos anteriores, debe identificarse utilizando la abreviación de la fuente
original y el número de página.