Investigacion Estadistica

Alumno: Sarai Adilene Escribano Córdoba.
Carrera: LIC. Administración
Grupo: 309-D
Asignatura: Estadística para la Administración II
Docente: ING. Ind. Grisel Esmeralda Cortés Utrera
Trabajo: Investigación unidad II, III y IV
Fecha: 13/ENE/2018
1
Contenido
INTRODUCCION GENERAL .................................................................................. 4
UNIDAD 2 ANALISIS DE REGRESION LINEAL Y MULTIPLE ............................... 5
INTRODUCCION .................................................................................................... 5
2.7 Análisis de regresión múltiple ............................................................................ 6
2.8 Residuales y graficas de residuales ................................................................ 14
2.9 Interpretación del intervalo de confianza ......................................................... 20
2.10 Uso del coeficiente de determinación múltiple .............................................. 22
UNIDAD 3 SERIES DE TIEMPO ........................................................................... 23
INTRODUCCION .................................................................................................. 23
3.6 Tendencia irregular ......................................................................................... 24
3.7 Pronósticos basados en factores de tendencia y estacionales ....................... 25
3.8 Pronósticos, cíclicos e indicadores económicos .............................................. 28
3.9 Técnica y uso de promedios móviles y suavización exponencial en las
organizaciones ...................................................................................................... 30
Métodos de Promedios Simples......................................................................... 33
El pronóstico es la media de los valores precedentes hasta el dato actual. ...... 33
Métodos de Promedios Móviles ......................................................................... 34
Se especifica un número de puntos de datos y se calcula la media para las ‘n’
observaciones más recientes. ............................................................................ 34
3.10 Ventajas y desventajas de análisis de las series de tiempo .......................... 36
Ventajas ................................................................................................................ 36
UNIDAD 4 ESTADISTICA NO PARAMETRICA .................................................... 37
INTRODUCCION .................................................................................................. 37
4.1 Escalas de medición ....................................................................................... 38
4.2 Métodos estadísticos paramétricos contra no paramétricos............................ 42
4.3 Prueba de rachas para aleatoriedad ............................................................... 44
4.4 Una muestra: Prueba de signos ...................................................................... 45
2
4.4 Una muestra: Prueba de Wilcoxon .................................................................. 46
4.5 Dos muestras: Prueba de Mann- Whitney ....................................................... 48
4.7 Observaciones pareadas: Prueba de Signos ................................................. 49
4.8 Observaciones pareadas: Prueba de Wilcoxon ............................................... 52
4.9 Varias muestras independientes: Prueba de Krauskal- Wallis ........................ 59
4.10 Aplicaciones con el uso del software ............................................................. 64
CONCLUSION GENERAL .................................................................................... 65
BIBLIOGRAFIA ..................................................................................................... 66
3
INTRODUCCION GENERAL
En la siguiente investigación se abordaran los temas que conforman las unidades

dos, tres y cuatro de esta materia llamada estadística para la administración II.
En la segunda unidad se abordan los temas de análisis de regresión múltiple y

correlación, residuales y graficas de residuales, interpretación del intervalo de
confianza y el uso del coeficiente de determinación múltiple por lo que
aprenderemos en esta unidad como se realiza cada uno de los temas que en esta
se mencionan, esta unidad tiene el propósito de desarrolla en el Licenciado en
administración la capacidad para relacionar variables dependientes con variables
independientes que le permitan estudiar el comportamiento de sistemas o
métodos de trabajo en las organizaciones.
En la tercera unidad de la misma forma se abordan los siguientes temas:

tendencia irregular, pronósticos basados en factores de tendencia y estacionales,
pronósticos, ciclos e indicadores económicos, técnica y uso de promedios móviles
y suavización exponencial en las organizaciones y de la misma forma ventajas y
desventajas del análisis de las series de tiempo. La aplicación de las técnicas que
se requieren para comprender las series de tiempo debe desarrollar habilidades
para analizar de manera holística las variables involucradas en el fenómeno de
estudio.
En la unidad cuatro nos habla de la estadística no paramétrica, La estadística no

paramétrica es una rama de la estadística que estudia las pruebas y modelos
estadísticos cuya distribución subyacente no se ajusta a los llamados criterios
paramétricos. La utilización de estos métodos se hace recomendable cuando no
4
se puede asumir que los datos se ajusten a una distribución conocida, cuando el
nivel de medida empleado no sea, como mínimo, de intervalo.
Es así como investigaremos estos temas de estas unidades.
UNIDAD 2 ANALISIS DE REGRESION LINEAL Y MULTIPLE
INTRODUCCION
La unidad dos nos enseña a cómo resolver los análisis de regresión lineal y
múltiple tomando como primer tema el análisis de regresión múltiple y correlación
donde aprenderemos que es cada uno de estos temas de la misma forma
veremos cómo se elaboran los gráficos de residuales y que son los residuales.
En esta misma unidad se verá como se interpreta el intervalo de confianza y cuál

es el uso del coeficiente de determinación múltiple y sabremos cual es el propósito
de esta unidad y que es lo que aportara al licenciado en administración.
5
2.7 Análisis de regresión múltiple
En algunos problemas de investigación no solo se presenta una variable

independiente “x” y una dependiente “y”, sino que influyen varias variables o
elementos para hacer un pronóstico más acertado, es decir si deseamos
pronosticar el peso final de un animal buscamos las variables que pueden influir
en el peso final (y) por ejemplo:
1. Peso de animal cuando nació (X1)

2. La alimentación, proteínas, vitaminas (X2)
3. Semanas que ha sido alimentado (X3)
O si estamos interesados en saber cuántas ventas (y) tendremos

1. Cantidad de unidades vendidas (X1)
2. Número de anuncios colocados. (X2)
Se pueden tomar muchas variables como se crea que influyan en la respuesta, en

este caso cuando tenemos tres variables una dependiente y dos independientes
podemos graficar tridimensionalmente como se muestra en la siguiente figura:
Y
Plano formado a a = intersección en Y
partir de los
puntos
muestrales:
ŷ = β0+ β1 X1 + β2 X2 Punto
observado
Error
Punto
correspondiente
en el plano
X1
6
X2
Una de las ventajas de regresión múltiple es que utilizamos mayor información
para obtener un pronóstico más acertado y para ello debemos de definir la
ecuación de regresión múltiple ya que se pueden tener más de tres variables. El
modelo de regresión lineal múltiple es:
𝜇𝑥1, 𝑥2, 𝑥3,…, 𝑥𝑘 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 + 𝛽3𝑥3 + ⋯ + 𝛽𝑘𝑥𝑘

La ecuación de regresión múltiple es:
Para obtener los valores de tenemos la siguiente

formula general:
n + ∑ + ∑
+. . . + ∑ = ∑y
y
. . . . .
. . . . .
. . . . .
∑ + ∑ + ∑ +. . . + ∑ =∑ y
Solución del problema por medio de matrices en términos

generales.
Estimación de parámetros
Para expresar el modelo en regresión múltiple general en términos de matrices:
7
Dónde:
Consecuentemente el vector aleatorio “y” tiene un valor esperado
Y la matriz de varianza- covarianza de “y”
Las ecuaciones normales de mínimos cuadrados para el modelo

lineal general múltiple son:
Las ecuaciones resultantes que es necesario resolver son:
Donde denota el vector de coeficientes de regresión estimados.
Los estimadores de mínimos cuadrados son:
8
Estos estimadores tienen las propiedades de ser insesgado, con varianza mínima
insesgado, consistente y suficiente.
La matriz es:
Inferencias sobre el
modelo
Primeramente estimamos la variación aleatoria. Al igual que en el caso de la

regresión lineal simple la estimación de está definida en términos de la suma de
cuadrados de los residuos (SSE):
Un estimador insesgado de esta dado por el cuadrado medio

error (MSE):
Prueba de significancia de la regresión
Es una prueba para determinar si existe una relación lineal entre la respuesta “y” y
un subconjunto de las variables de regresión . Las hipótesis apropiadas
son:
9
El rechazo de implica que al menos una de las variables de regresión
tiene una contribución significativa en el modelo.
En la prueba de significancia la suma total de cuadrados se divide en la suma de
cuadrados debida a la regresión y la suma de cuadrados debida al error digamos:
Debe rechazarse si el valor calculado del estadístico de prueba es mayor que

. El procedimiento se puede resumir en la tabla de análisis de varianza.
Grados
Fuentes de
de SS MS
variación
libertad
𝑆𝑆𝑅
Regresión k-1
𝑘 −1
𝑆𝑆𝐸
Error n-k
𝑛−𝑘
′ (∑ 𝑦)2
Total n-1 𝑆𝑆𝑇 = 𝑦 𝑦 −
𝑛
Inferencias para los parámetros de regresión
Para poder hacer inferencias acerca de los parámetros de regresión

primeramente debemos estimar la varianza de las esta se expresa en términos
de los elementos de la inversa de la matriz . La inversa de multiplicada por la
constante representa la matriz varianza-covarianza o matriz de covarianza
(Varianza conjunta de dos variables) de los coeficientes de regresión . Los
elementos de la diagonal de son las varianzas de mientras que
los elementos que están fuera de la diagonal de
Esta matriz son las covarianzas.
Análisis de correlación
10
Creado por Karl Pearson en 1900, que también se le llama coeficiente de
correlación momento - producto de Pearson (r de Pearson), describe la fuerza de
la relación entre dos variables. Los coeficientes de correlación r siempre oscilan
entre valores de 1 y –1. El valor cero 0 significa que no existe correlación entre
ambas variables. Un valor positivo indica que a incrementos en la variable A se
producen incrementos proporcionales en B y un valor negativo indica lo contrario.
Podemos graficar la correlación entre las dos variables a través de una gráfica de
dos ejes (abscisas y ordenadas) cartesianos.
Para interpretar el coeficiente de correlación:
Valor de r de 0 a 0.25 implica que no existe correlación entre ambas variables.
Valor de r de 0.25 a 0.50 implica una correlación baja a moderada.
Valor de r de 0.50 a 0.75 implica correlación moderada a buena.
Valor de r de 0.75 o mayor, implica una muy buena a excelente correlación.
Estos rangos de valores se pueden extrapolar a correlaciones negativas también.
Un coeficiente de correlación cercano a cero, digamos +0.08 o -0.08, muestra que
la relación entre las variables es débil. Coeficientes de -0.91 y +0.91 tienen igual
fuerza, ambos indican una muy fuerte correlación entre las dos variables.
El siguiente dibujo resume la fuerza y dirección del coeficiente de correlación.
El coeficiente de correlación permite predecir si entre las dos variables que

estamos existe o no una relación o dependencia matemática.
Se debe tener cuidado al analizar la correlación entre dos variables, de que ambas
varíen juntas permanentemente. Esto parece redundante, pero es importante. Por
ejemplo, supongamos que queremos estudiar la correlación existente entre peso y
altura de un grupo de personas tomadas al azar. Sometemos los datos recogidos
de peso y altura al análisis de correlación y encontramos el coeficiente de
11
correlación entre ambas, que se representa con la letra r. El r = 0.88. Esto significa
que a mayor altura correspondería mayor peso.
Cuando r = 1 existe una relación funcional entre las dos variables de modo que el
valor de cada variable se puede obtener a partir de la otra. Los puntos de la nube
están todos situados sobre una recta de pendiente positiva.
Cuando r = -1 todos los

puntos de la recta están
sobre una recta de
pendiente negativa. Existe
una relación funcional entre
las dos variables.
Esto ocurre, por ejemplo, cuando una barra metálica se somete a distintas
temperaturas, x1, x2,…, xn, y se miden con precisión sus correspondientes
longitudes, y1, y2,…, yn. Las longitudes se obtienen funcionalmente a partir de las
temperaturas de modo que, conociendo la temperatura a que se va a calentar, se
podría obtener la longitud que tendría la barra.
Es el caso de las estaturas, x1, x2,…, xn, y los pesos, y1, y2,…, yn, de diversos
atletas de una misma especialidad. A mayor estatura cabe esperar que tengan
mayor peso, pero puede haber excepciones.
Cuando r es próximo a cero (por ejemplo, r = -0,12 o r = 0,08) se dice que la
correlación es muy débil (prácticamente no hay correlación). La nube de puntos es
amorfa.
12
Es lo que ocurriría si lanzáramos simultáneamente dos dados y anotáramos sus
resultados: puntuación del dado rojo, xi; puntuación del dado verde, yi. No existe
ninguna relación entre las puntuaciones de los dados en las diversas tiradas.
Cuando r es próximo a -1 (por ejemplo, r = -0,93) se dice que hay una correlación
fuerte y negativa. Los valores de cada variable tienden a disminuir cuando
aumentan los de la otra. Los puntos de la nube están próximos a una recta de
pendiente negativa.
Si se hiciera un estudio de los carros conforme pasa el tiempo, xi, y su devaluación

en unidades monetarias, yi, se obtiene una distribución de este tipo, pues suele
ocurrir que, a grosso modo, puede suceder que entre más pasa el tiempo se va
devaluando el valor del carro.
Los procedimientos de regresión y correlación, establece una interrelación entre
las variables y es utilizado como una herramienta de predicción, la correlación sólo
produce un coeficiente que mide el grado de asociación entre las variables y su
sentido.
Para calcular el coeficiente de correlación utilizaremos:
Se llama recta de regresión a una recta que marca la tendencia de la nube de

puntos. Si la correlación es fuerte (tanto positiva como negativa) y, por tanto, los
puntos de la nube están próximos a una recta, ésta es la recta de regresión.
13
2.8 Residuales y graficas de residuales
Análisis residual
Cuando un modelo de regresión, tal como el modelo de regresión
lineal se selecciona para su uso, uno no puede estar seguro por
adelantado que el modelo es apropiado. El analista debe realizar
análisis para examinar cuan adecuado es el modelo que se propone
de manera tentativa. El ajuste de un modelo de regresión requiere
varias suposiciones.
1. La estimación de los parámetros del modelo requiere la

suposición de que los errores son variables aleatorias
independientes con media cero y varianza constante (0, 𝜎2 ).
2. La pruebas de hipótesis y la estimación de intervalos
requiere que los errores estén distribuidos de manera normal.
(0, 𝜎2).
3. Además se supone que el grado del modelo es correcto; esto
es, si se ajusta un modelo de regresión lineal simple,
entonces el fenómeno en realidad se comporta de una
manera lineal o de primer grado.
14
Hay algunos gráficos que estudian la valides del modelo, así como
algunas pruebas estadísticas formales. Análisis de Residuales es
útil para verifica la hipótesis de que los errores tienen una
distribución que es aproximadamente normal con una varianza
constante, así como para determinar la utilidad que tiene la adición
de más términos al modelo.
Los residuos de un modelo de regresión es la diferencia entre el
valor observado y el valor ajustado a partir del modelo.
𝑒𝑖 = 𝑦𝑖 − 𝑦̂𝑖 𝑑𝑜𝑛𝑑𝑒 𝑖 = 1,2,3 … 𝑛

Como tal corresponde al error observado, en diferencia con el error
verdadero desconocido 𝐸𝑖 en el modelo de regresión.
𝐸𝑖 = 𝑌𝑖 − 𝐸(𝑌𝑖)
Para el modelo de regresión se asume que 𝐸𝑖 puede ser una

variable aleatoria independiente normal (0, 𝜎2). Si el modelo es
apropiado para los datos observados o actuales, los residuales
observados 𝑒𝑖 deben reflejar las características asumidas para 𝐸𝑖
Propiedades de los residuales:
La media de los “n” residuales es:
Donde 𝑒̅ simboliza la media de los residuales. Así, pues 𝑒̅ siempre

es cero, no proporciona ninguna información para los errores
verdaderos, excepto si el valor esperado (𝐸𝑖) = 0. La varianza de los
“n” residuales 𝑒𝑖 es definida para el modelo como:
Si el modelo es apropiado, el MSE es un estimador de la variación

de los errores en términos de 𝜎̂2.
Estandarización de residuales
15
En ocasiones en el análisis de residuales es conveniente hacer un
análisis de los residuales estandarizando,
puesto que la desviación estándar del error es 𝜎 y es estimada por

√𝑀𝑆𝐸, definiremos el residual estandarizado como sigue:
Conclusiones del modelo por un estudio de residuales

Cuando usamos residuales, hay seis tipos importantes de
conclusiones del modelo (hay seis tipos de consideraciones
importantes que tomar para concluir un modelo).
1. La función de regresión es no lineal.

2. Los términos del error no tienen variación constante
3. Los términos del error no son independientes
4. El modelo presenta todas; si no una o varias observaciones
extremas
5. Los términos del error no se distribuyen normalmente
6. Una o varias variables importantes se han omitido del
modelo.
Grafico de residuales
Los gráficos de residuales se pueden analizar para proporcionar

información si se cumple con cualquiera de las seis
consideraciones anteriores y eliminar el modelo.
Como comprobación el experimento puede construir un histograma
de frecuencias de los residuos o una gráfica de probabilidad normal
de los residuos.
Puesto que los tamaños de las muestras en la regresión a menudo
son pequeños como para el histograma sea de utilidad, la gráfica de
probabilidad normal en el método preferido.
Cuando se estandarizan los residuos, los errores tienen una
distribución normal si aproximadamente el 95% de los residuos
estandarizados deben caer en el intervalo (-2, +2).
16
Los residuos que se alejan mucho de este intervalo puede indicar la
presencia de una observación que no es común con respecto a los
demás datos. Vale la pena analizarla, ver que ocurrió.
Las gráficas residuales a menudo se construyen:
1. Como una consecuencia en el tiempo (si se conoce).
2. Contra las
3. Contra la variable independiente “x”.
Un diagrama de residuales tiene ventajas sobre el diagrama de

dispersión ya que muestra más claramente cualquier patrón
sistemático en las desviaciones alrededor de la línea de regresión
o cuando se presenta una varianza del error no constante o también
presentada de observaciones extremas.
Podemos tener los siguientes diagramas de residuales no lineal.
𝑒𝑖
2 𝑒𝑖
1
0 0
-1
-2
𝑥𝑖 , 𝑦̂ 𝑖 , 𝑛 𝑦̂ 𝑖
Indica que el modelo es inadecuado, se sugiere fuertemente una

función de regresión lineal no es apropiada, esto es que es
necesario añadir al modelo términos de orden superior, considerar
una transformación de la variable “x” o “y” o considerar otro
regresor.
Otros diagramas que se pueden presentar son los de embudo:
17
En estos gráficos la varianza de las observaciones puede aumentar
con el tiempo o con la magnitud de 𝑦̂𝑖 o 𝑥𝑖 o pueden disminuir, esto
es, cuando aumenta 𝑦̂𝑖 aumenta la variación de las observaciones,
residuante o a mayor valor de , la varianza de la observación
disminuye. Esto indica que la varianza no es constante.
Otro grafico que indica esta situación doble arco.
𝑒𝑖
𝑥𝑖 , 𝑦̂ 𝑖
𝑦̂ 𝑖 o 𝑥𝑖medio
Hay mayor varianza para las observaciones en el punto . de
Esto también se puede eliminar con una transformación.
Todos aquellos diagramas que presentan una tendencia, indican
que el modelo no es apropiado.
El diagrama que se presenta con una tendencia ascendente o
descendente indica que el error no es independiente.
𝑒𝑖
𝑒𝑖
𝑒𝑖
0
0
𝑥𝑖 , 𝑦̂ 𝑖 𝑥𝑖𝑥,𝑖𝑦̂ ,𝑖𝑦̂ , 𝑖𝑛, 𝑛 ,

𝑥𝑖 𝑦̂ 𝑖 , 𝑛
18
El grafico que nos indica la distribución de probabilidad de los errores es normal
es que al graficar la probabilidad acumulada normal centra los residuos nos da
que los puntos se ubican de manera aproximada a lo largo de una línea recta.
50
40
30
20
10
-1 0 1 𝑒𝑖
Para detectar observaciones extremas hacemos el grafico estandarizado, si

observamos algún punto que está muy alejado más allá de la dispersión de los
residuales restantes, puede ser a más de ±3𝜎 se marca ese punto hay que
identificar que paso con ese punto que pudo haber ocurrido un efecto extraño una
vez identificada la causa se desecha y volver a diseñar el modelo ya que ese
punto puede desproporcionar la suma de cuadrados error y podemos reducirla aún
más.
Z
6
5
4
3
2
1
0
-1
-2
-3
-4
-5
-6
𝑥𝑖 , 𝑦̂ 𝑖 , 𝑛
La siguiente grafica representa la situación ideal o satisfactoria para que se

cumplan todas las suposiciones del modelo.
19
𝑒𝑖
𝑥𝑖 , 𝑦̂ 𝑖 , 𝑛
2.9 Interpretación del intervalo de confianza
El proceso de inferencia es aquel mediante el cual se pretende estimar el

valor de un parámetro a partir del valor de un estadístico. Esta estimación
puede ser puntual o bien por intervalo. La mejor estimación puntual de un
parámetro es simplemente el valor del estadístico correspondiente, pero es
poco informativa porque la probabilidad de no dar con el valor correcto es
muy elevada, es por eso que se acostumbra a dar una estimación por
intervalo, en el que se espera encontrar el valor del parámetro con una
elevada probabilidad. Esta estimación recibe el nombre de estimación
mediante intervalos de confianza.
20
La estimación por intervalos de confianza consiste en determinar un
posible rango de valores o intervalo (a; b), en el que, con una determinada
probabilidad, sus límites contendrán el valor del parámetro poblacional que
andamos buscando. Para cada muestra obtendremos un intervalo distinto
que, para el X % de ellas, contendrá el verdadero valor del parámetro. A este
intervalo se le denomina intervalo de confianza.
Evidentemente esta técnica no tiene porqué dar siempre un resultado

correcto, tal y como hemos comentado para algunas muestras el intervalo
correspondiente contendrá el verdadero valor del parámetro y para otras no.
A la probabilidad de que hayamos acertado al decir que el intervalo contiene
al parámetro se la denomina nivel de confianza (o simplemente confianza).
También se denomina nivel de significación a la probabilidad de errar en
esta afirmación, es decir la significación (probabilidad de errar
Con nuestro intervalo) será igual a 1-(nivel de confianza), ya que el nivel de
confianza corresponde a la probabilidad de que el intervalo contenga el valor
verdadero del parámetro.
Ejemplo.
Un estudio pretende estimar el porcentaje de hipertensos que hay entre las
personas mayores de 65 años en la Comunidad Valenciana. Además de una
estimación puntual de este porcentaje, interesa obtener un intervalo de confianza
al 95% para este parámetro de la población (P). Para llevar a cabo este estudio,
han sido seleccionadas 350 personas mayores de 65 años en toda la Comunidad,
resultando tras realizar las pruebas correspondientes que 167 padecen de
hipertensión.
Estimador puntual: (167/350) x100=47.71%
Intervalo de confianza: [42.48, 52.94]
Con un 95% de confianza, el porcentaje de hipertensos entre las personas
mayores de 65 años en la Comunidad Valenciana estaría contenido en el intervalo
[42.48, 52.94], es decir, aproximadamente entre el 42.5% y 53% de la población.
21
2.10 Uso del coeficiente de determinación múltiple
La bondad de la predicción depende de la relación entre las variables. Si dos

variables no covarían, no podremos hacer predicciones válidas, y si la intensidad
de la covariación es moderada, las predicciones no serán demasiado buenas. En
consecuencia, hay que disponer de alguna medida de la capacidad de la ecuación
de Regresión para obtener predicciones buenas (en el sentido de que sean lo
menos erróneas posible).
Esta medida es el Coeficiente de Determinación, que es el cuadrado del

coeficiente de correlación de Pearson, y da la proporción de variación de la
variable Y que es explicada por la variable X (variable predictora o explicativa). Si
la proporción es igual a 0, significa que la variable predictora no tiene NULA
22
capacidad predictiva de la variable a predecir (Y). Cuanto mayor sea la proporción,
mejor será la predicción. Si llegara a ser igual a 1 la variable predictora explicaría
TODA la variación de Y, y las predicciones NO tendrían error.
Ejemplo
En el siguiente cuadro puedes comprobar:
a) que la Varianza total de la variable Y (0.76) es igual a la suma de las Varianzas

de las puntuaciones estimadas (Y') y de los errores de predicción (Y-Y').
b) Que el coeficiente de determinación (r2xy) es igual a la proporción de la

Varianza explicada (s2y') respeto de la Varianza total (s2y)
UNIDAD 3 SERIES DE TIEMPO
INTRODUCCION
En esta unidad estudiaremos lo que son las series de tiempo pero principalmente
lo que es la tendencia irregular, los pronósticos basados en factores de tendencia
y estacionales, pronósticos, ciclos e indicadores económicos, técnica y uso de
promedios móviles y suavización exponencial en las organizaciones y ventajas y
desventajas del análisis de las series de tiempo.
Aprenderemos en qué forma o cual es la manera de resolver estos problemas

basados en estas técnicas de resolución, de la misma forma sabremos cuales son
23
las ventajas y las desventajas de hacer un análisis a las series de tiempo y las
distintas técnicas.
3.6 Tendencia irregular
Variación irregular
El componente aleatorio mide la variabilidad de las series de tiempo después de

que se retiran los otros componentes. Contabiliza la variabilidad aleatoria en una
serie de tiempo ocasionada por factores imprevistos y no ocurrentes. La mayoría
de los componentes irregulares se conforman de variabilidad aleatoria, si
embargo, los sucesos impredecibles pueden provocar irregularidad en una
variable.
Movimientos irregulares, al azar, ó ruido estadístico

24
Si bien pueden ser generados por factores de tipo económico, generalmente sus
efectos producen variaciones que solo duran un corto intervalo de tiempo.
El criterio más lógico a seguir es aislarlos secuencialmente partiendo de la serie

original para luego analizarlos de manera individual.
La mejor forma de apreciarlos es a través de su observación visual. Movimientos

irregulares, al azar, ó ruido estadístico
En un estudio de la producción diaria en una fábrica se presentó la siguiente

situación:
Los puntos enmarcados en un círculo corresponden a un comportamiento anormal

de la serie. Al investigar estos dos puntos se vio que correspondían a dos días de
paro, lo que naturalmente afectó la producción en esos días. El problema fue
solucionado eliminando las observaciones e interpolando.
3.7 Pronósticos basados en factores de tendencia y estacionales
Una consideración particularmente importante en los pronósticos a largo plazo,

es el componente cíclico de las series de tiempo.
25
ECUACION DE LA LÍNEA DE TENDENCIA:
YT = bo + b1 X = bo + b1 x
12 12 12 12 144
YT = bo + b1 X= bo + b1 x
4 4 44 16
Los valores de tendencia se asocian con periodos y no con puntos

temporales, por lo que deben reducirse los tres elementos de la
ecuación de tendencia anual. (b0, b1 y X)
Para efecto de la transformación a datos mensuales, el punto base del año

anteriormente codificado como X = O, se ubicaría en el punto medio del año
(01/07)
ECUACIÓN DE TENDENCIA MODIFICADA PARA OBTENER

VALORES MENSUALES:
26
YT = bo - (5.5)
b1 + b1
x 12
144 144
YT = bo - (1.5) b1 + b1 x
4 16 16
27
3.8 Pronósticos, cíclicos e indicadores económicos
Los pronósticos basados en los componentes de tendencia y estacional de

una serie de tiempo son apenas el punto de partida de los pronósticos
económicos.
La primera razón es la necesidad de considerar el probable efecto del

componente cíclico durante el periodo de pronóstico.
La segunda es la importancia de identificar los factores causales específicos

que han influido en las variables de series de tiempo.
Pronósticos a corto plazo.
Suele suponerse que el efecto del componente cíclico es el mismo que se ha

incluido en los valores recientes de la serie de tiempo.
Cuando se trata de periodo más prolongado, o incluso de periodos cortos en

épocas de inestabilidad económica, es importante identificar los puntos de
cambio de ciclo de la economía nacional.
Las variaciones cíclicas asociadas con un producto en particular pueden
coincidir o no con el ciclo económico general.
EJEMPLO. Históricamente, las ventas industriales de automóviles han
coincidido estrechamente con el ciclo económico general de las economías
nacionales. Por el contrario, las ventas de autopartes han sido comúnmente
opuestas, en cuanto al factor cíclico, respecto del ciclo económico general.
El Instituto Nacional de Investigación Económica (NBER) de Estados Unidos

ha identificado y dado a conocer series de tiempo históricamente
indicadoras de expansiones y recesiones cíclicas respecto del ciclo
económico general.
Indicadores líder: han llegado habitualmente a puntos de cambio de ciclo

antes del cambio correspondiente en la actividad económica general.
• -Las horas semanales promedio laboradas en manufactura.

• -El valor de nuevos pedidos de bienes de consumo y materiales -Índice
común de precios de las acciones.
28
Indicadores coincidentes: está compuesto por series de tiempo cuyos puntos
de cambio han coincidido usualmente con el ciclo económico general.
o -La tasa de empleo

o -El índice de producción industrial.
Indicadores rezagados: es el integrado por series de tiempo cuyas cumbres y

valles suelen retardarse en comparación con las del ciclo económico general.
o -Los inventarios de manufactura y comerciales y la tasa

preferencial promedio que cobran los bancos.
Además de considerar el efecto de las fluctuaciones cíclicas y de pronosticar
tales fluctuaciones, también: deben estudiarse las variables causales
específicas que han influido históricamente en los valores de series de
tiempo.
Los análisis de regresión y correlación son particularmente aplicables a tales

estudios
Relación entre estrategia de precios y volumen de ventas.
o Áreas que demandan especial atención.

o Los análisis históricos
o Las posibles implicaciones de nuevos productos y de cambios en el
ámbito de la comercialización.
29
3.9 Técnica y uso de promedios móviles y suavización
exponencial en las organizaciones
Modelos No Formales
Las más simples suponen que los periodos recientes son los mejores.
Pronóstico realizado en el periodo t para el periodo t+1:
El número y complejidad de modelos no formales posibles, sólo está limitado por

el ingenio del analista. Trime t Ven
stre tas
Estas técnicas deben utilizarse de manera juiciosa. 20
Ejemplo: Empresa que vende un producto. 06
Se cuenta con historial trimestral. 20

07
Se emplea la técnica no formal para el pronóstico de las

ventas del siguiente trimestre basádose en no cambios 20
08
del anterior.
20
Para el 1er. Trimestre 2012: 09
20
Para el periodo 25 se tiene: 10
Proyecciones no
Error de pronóstico:
20
muy 11
coherentes
20
Para el periodo 26 se tiene 850 error: - 12
250
De los datos se visualiza una tendencia:
30
Modificación
model
del
o
Nueva adopción: Cantidad absoluta de cambio
Modelo:
Se considera el cambio entre trimestres.
Para el 1er. Trimestre 2012:
El error del pronóstico:

Otro modelo: Proporción de cambio
31
Modelo:

El error del pronóstico:
Observación: De los datos pareciera estacional
Las ventas en el 1er. Trimestre son por lo regular mayores que aquellas
en cualquier otro trimestre.
Para una fuerte estacionalidad:
La variable tomará el valor que tenia el trimestre del año anterior. Asi
para el 1er. Trimestre 2012:
Problema: Ignora todo lo ocurrido desde el año pasado incluyendo

cualquier patrón de tendencia.
Observación: Añadir información reciente
32
Combinación variación
estacional + tendencia.
Modelo posible:
Métodos de Promedios Simples
El pronóstico es la media de los valores precedentes hasta el dato actual.

Aplicable cuando los datos son estacionarios: sin tendencia, estacionalidad,
etc.Ejemplo: Caso anterior Para el 1er. Trimestre 2012:
33
Error:
Para el 2do. Trimestre

2012:
Métodos de Promedios Móviles
Se especifica un número de puntos de datos y se calcula la media para las ‘n’

observaciones más recientes.
A ser escogido por un analista
Responde mejor a datos estacionarios.
34
No maneja muy bien la tendencia o la estacionalidad, aunque lo hace
mejor que el método de promedio simple
Uso juicioso para determinar el número de semanas, meses o trimestres

A menor número mayor peso a los datos recientes.
Ejemplo: Caso anterior
Para el 1er. Trimestre 2013:
Error:
35
3.10 Ventajas y desventajas de análisis de las series de tiempo
Ventajas
Solo se requiere conocer una cantidad limitada de datos para hacer pronóstico sin
importar el horizonte de tiempo y es bastante simple.
No requiere tener información de las variables exógenas que afectan la serie para
su análisis, pero pueden ser univariadas o multivariadas.
Las series de tiempo se estiman fácilmente en comparación con otros métodos de

análisis de datos.
Los pronósticos basados en series de tiempo son bastante efectivos en el corto

plazo (1 a 2 años) en comparación con otros métodos.
Desventajas
Existen modelos econométricos complejos que pueden ser más eficientes y

precisos, y por tanto más útiles que las series de tiempo.
Identifica un patrón con base a datos pasados, lo que implica que debe hacerse
nuevas estimaciones con base a datos nuevos.
No considera la interrelación con otras variables que tengan influencia en el

fenómeno analizado.
No es efectivo en el pronóstico de mediano y largo plazo debido a que solo se

considera el comportamiento histórico de una variable.
36
UNIDAD 4 ESTADISTICA NO PARAMETRICA
INTRODUCCION
En esta unidad los temas nos servirán para conocer más y sobre todo como
resolver los ejercicios o problemas con las pruebas de signos, las pruebas de
Wilcoxon, pruebas de Mann- whitney pero sobre todo para entender en que nos
sirve o en que podemos aplicar todos estos métodos para poder llegar a
resultados concretos y que nos ayude a resolver cada problema de este tipo.
De la misma manera nos servirá para conocer cuáles son los softwares que
podemos ocupar para resolver los problemas de este tipo de una manera
computarizada y mucho mas practica.
37
4.1 Escalas de medición
Existen diversas definiciones del término "medición", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la
cuantificación y el proceso mismo de la construcción de una escala o instrumento
de medición. En general, se entiende por medición la asignación de números a
elementos u objetos para representar o cuantificar una propiedad. El problema
básico está dado por la asignación un numeral que represente la magnitud de la
característica que queremos medir y que dicho números pueden analizarse por
manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los
atributos de nuestras percepciones se transforman en entidades conocidas y
manejables llamadas "números". Es evidente que el mundo resultaría caótico si no
pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la
físico saber que el hierro tiene una alta temperatura de fusión.
Niveles o Escalas de mediciones
 Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y
consiste en la asignación, puramente arbitraria de números o símbolos a cada una
de las diferentes categorías en las cuales podemos dividir el carácter que
observamos, sin que puedan establecerse relaciones entre dichas categorías, a
no ser el de que cada elemento pueda pertenecer a una y solo una de estas
categorías. Se trata de agrupar objetos en clases, de modo que todos los que
pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en
estudio, después de lo cual se asignan nombres a tales clases, y el hecho de que
a veces, en lugar de denominaciones, se le atribuyan números, puede ser una de
las razones por las cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la

UNESR Núcleo San Carlos de acuerdos a la carrera que cursan.
38
Carrera Número asignada a la categoría
Educación 1
Administración 2
Se ha de tener presente que los números asignados a cada categoría sirven única y
exclusivamente para identificar la categoría y no poseen propiedades cuantitativas.
 Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de
un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse
a la propiedad de "orden" de los números asignándolo a los objetos en estudio de
modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse
que A posee un mayor grado de atributo que B.
La asignación de números a las distintas categorías no puede ser completamente

arbitraria, debe hacerse atendiendo al orden existente entre éstas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho
mismo de poder ordenar todas sus categorías, el cálculo de las medidas
estadísticas de posición, como por ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el orden de
llegada, estamos llevando una escala ordinal, es decir que al primero en llegar
ordinal, es decir que al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y
así sucesivamente, de esta forma, cada número representará una categoría en
general, con un solo elemento y se puede establecer relaciones entre ellas, ya que
los números asignados guardan la misma relación que el orden de llegada a la
consulta.
39
 Escalas de intervalos iguales:
La escala de intervalos iguales, está caracterizada por una unidad de medida
común y constante que asigna un número igual al número de unidades
equivalentes a la de la magnitud que posea el elemento observado. Es importante
destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta
escala, además de poseer las características de la escala ordinal, encontramos
que la asignación de los números a los elemento es tan precisa que podemos
determinar la magnitud de los intervalos (distancia) entre todos los elementos de
la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la
primera escala verdaderamente cuantitativa y a los caracteres que posean esta
escala de medida pueden calculársele todas las medidas estadísticas a excepción
del coeficiente de variación.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.
 Escala de coeficientes o Razones:

El nivel de medida más elevado es el de cocientes o razones, y se diferencia de
las escalas de intervalos iguales únicamente por poseer un punto cero propio
como origen; es decir que el valor cero de esta escala significa ausencia de la
magnitud que estamos midiendo. Si se observa una carencia total de propiedad,
se dispone de una unidad de medida para el efecto. A iguales diferencias entre los
números asignados corresponden iguales diferencias en el grado de atributo
presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario,
sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
40
Ejemplo: En una encuesta realizada en un barrio de esta localidad se observó
que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el
doble de hijos que aquellas que tienen 3 hijos.
41
4.2 Métodos estadísticos paramétricos contra no paramétricos
Es una rama de la estadística que estudia las pruebas y modelos estadísticos

cuya distribución subyacente no se ajusta a los llamados criterios paramétricos.
Su distribución no puede ser definida a priori, pues son los datos observados los
que la determinan. La utilización de estos métodos se hace recomendable cuando
no se puede asumir que los datos se ajusten a una distribución conocida, cuando
el nivel de medida empleado no sea, como mínimo, de intervalo. Las principales
pruebas no paramétricas son las siguientes:
Prueba χ² de Pearson
Prueba binomial
Prueba de Anderson-Darling
Prueba de Cochran
Prueba de Cohen kappa
Prueba de Fisher
Prueba de Friedman
Prueba de Kendall
Prueba de Kolmogórov-Smirnov
Prueba de Kruskal-Wallis
Prueba de Kuiper
Prueba de Mann-Whitney o prueba de Wilcoxon
Prueba de McNemar
Prueba de la mediana
Prueba de Siegel-Tukey
Coeficiente de correlación de Spearman
Tablas de contingencia
Prueba de Wald-Wolfowitz
Prueba de los signos de Wilcoxon
La mayoría de estos test estadísticos están programados en los paquetes
estadísticos más frecuentes, quedando para el investigador, simplemente, la tarea
de decidir por cuál de todos ellos guiarse o que hacer en caso de que dos test nos
den resultados opuestos. Hay que decir que, para poder aplicar cada uno existen
42
diversas hipótesis nulas que deben cumplir nuestros datos para que los resultados
de aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y
quedarse con el que mejor convenga para la investigación sin verificar si se
cumplen las hipótesis necesarias. La violación de las hipótesis necesarias para un
test invalida cualquier resultado posterior y son una de las causas más frecuentes
de que un estudio sea estadísticamente incorrecto. Esto ocurre sobre todo cuando
el investigador desconoce la naturaleza interna de los test y se limita a aplicarlos
sistemáticamente.
43
4.3 Prueba de rachas para aleatoriedad
Una corrida es una serie de observaciones similares. La prueba de corridas se usa

para probar la aleatoriedad de una serie de observaciones cuando cada
observación puede ser asignada a una de dos categorías.
Ejemplo. En relación con una muestra aleatoria de n = 10 individuos, supongamos
que cuando se les clasifica por sexo la secuencia de observaciones es: M, M, M,
M, F, F, F, F, M, M. Estos datos contienen tres corridas, o series de elementos
semejantes.
Respecto de datos numéricos, un medio para obtener el esquema requerido de
dos categorías es clasificar cada observación según si es superior o inferior a la
mediana del grupo. En general, mucho menos corridas o mucho más corridas que
las que serían de esperar al azar resultarían en el rechazo de la hipótesis nula de
que la secuencia de observaciones es una secuencia aleatoria.
El número de corridas de elementos semejantes se determina de acuerdo con los
datos muéstrales, con el uso del símbolo R para designar el número de corridas
observadas. Si n1 equivale al número de elementos muestreados de un tipo y n2
al número de elementos muestreados del segundo tipo, la media y el error
estándar asociados con la distribución de muestreo de la estadística de prueba R
cuando la secuencia es aleatoria son
Sin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución
normal. Por lo tanto, en estas circunstancias la estadística R puede convertirse a
la estadística de prueba z.
44
4.4 Una muestra: Prueba de signos
La prueba de los signos puede utilizarse para probar una hipótesis nula referente
al valor de la medida de la población. En consecuencia, es el equivalente no
paramétrico a la prueba de una hipótesis referente al valor de la medida de la
población. Es necesario que los valores de la muestra aleatoria se encuentren al
menos en la escala ordinal, aunque no se requiere de supuestos acerca de la
forma de la distribución de la población.
Las hipótesis nula y alternativa pueden aludir ya sea a una prueba bilateral o
unilateral. Si Med denota la mediana de la población y Med0 designa al valor
hipotético, las hipótesis nulas y alternativa para una prueba de dos extremos son:
H0: Med=Med0
H1: Med≠Med0
Se aplica un signo de más a cada valor muestra observada mayor que el valor
hipotético de la mediana y un signo de menos a cada valor menor que el valor
hipotético de la mediana. Si un valor maestral es exactamente igual a la mediana
hipotética, no se le aplica ningún signo, con lo que el tamaño de muestra efectivo
se reduce. Si la hipótesis nula sobre el valor de la mediana es cierta, el número de
signos de más debería ser aproximadamente igual al número de signos de menos.
O, para decirlo de otra manera, la proporción de signos de mas debe ser de
alrededor de 0.50. Por consiguiente, la hipótesis nula que se prueba en una
prueba bilaterales H0: π=0.50, donde π es la proporción de la población de los
signos de mas o de menos. Así, una hipótesis referente al valor de la mediana se
prueba en realidad como una hipótesis sobre π. Si la muestra es grande, se puede
hacer uso de la distribución normal.
45
4.4 Una muestra: Prueba de Wilcoxon
La prueba de Wilcoxon puede usarse para probar una hipótesis nula referente al
valor de la medida de la población. Pero dado que la prueba Wilcoxon considera la
magnitud de la diferencia entre cada valor muestral y el valor hipotético de la
mediana, es una prueba más sensible que la prueba de los signos.
Sea X una variable aleatoria continua. Podemos plantear cierta hipótesis sobre la
mediana de dicha variable en la población, por ejemplo, M=M0. Extraigamos una
muestra de tamaño m y averigüemos las diferencias Di = X - M0. Consideremos
únicamente la n diferencias no nulas (n “m). Atribuyamos un rango u orden (0i) a
cada diferencia según su magnitud sin tener en cuenta el signo. Sumemos por un
lado los 0+i, rangos correspondientes a diferencias positivas y por otro lado los 0-i,
rangos correspondientes a diferencias negativas.
La suma de los órdenes de diferencias positivas sería igual a la suma de los

órdenes de diferencias negativas, caso que la mediana fuera el valor propuesto
M0. En las muestras, siendo M0 el valor de la verdadera mediana, aparecerán por
azar ciertas discrepancias, pero si la suma de los rangos de un ciclo es
considerablemente mayor que la suma de los rangos de otro signo, nos hará
concebir serias dudas sobre la veracidad de M0.
La prueba de Wilcoxon va a permitir contrastar la hipótesis de que una muestra

aleatoria procede de una población con mediana M0. Además, bajo el supuesto de
simetría este contraste se puede referir a la media, E(X). Esta prueba es mucho
más sensible y poderosa que la prueba de los signos; como se puede apreciar
utiliza más información, pues no solo tiene en cuenta si las diferencias son
positivas o negativas, sino también su magnitud.
El contraste de Wilcoxon puede ser utilizado para comparar datos por parejas.
Supongamos que la distribución de las diferencias es simétrica, y nuestro
propósito es contrastar la hipótesis nula de que dicha distribución está centrada en
0. Eliminando aquellos pares para los cuales la diferencia es 0 se calculan los
rangos en orden creciente de magnitud de los valores absolutos de las restantes
diferencias.
Se calculan las sumas de los rangos positivos y negativos, y la menor de estas

sumas es el estadístico de Wilcoxon. La hipótesis nula será rechazada si T es
menor o igual que el valor correspondiente. Cuando n≥25 y la hipótesis nula es
cierta, la estadística t tiene una distribución aproximadamente normal. La media y
el error estándar asociados con esta distribución de muestreo son,
respectivamente: µ_T=(N(N+1))/4 σ_T=√ ((N(N+1) (2N+1))/24) En el caso de una
muestra relativamente grande la prueba puede realizarse usando la distribución
46
normal de probabilidad y calculando la estadística de prueba z, de la siguiente
manera: Z= (T-µ_R)/σ_T.
47
4.5 Dos muestras: Prueba de Mann- Whitney
La prueba de Mann-Whitney se emplea en aquellos casos en los que deseamos

contrastar si existen diferencias entre las poblaciones de donde se extraen dos
muestras, que han de ser aleatorias e independientes. La utilidad de esta prueba
es la misma que la de la prueba t, pero no parte de supuestos y puede ser
aplicada a datos medidos en escala ordinal.
El procedimiento es el siguiente:
1. Hipótesis:
Hipótesis nula: No existen diferencias entre los dos grupos.
Hipótesis alternativa: Hay diferencias entre los dos grupos.
2. Estadístico de contraste:
En este caso, el estadístico a emplear se denomina U de Mann-Whitney, que se
calcula siguiendo estos pasos:
a) Se procede a ordenar las puntuaciones de las dos muestras como si fueran una
sola.
b) A cada una de ellas se le asigna un rango.
c) Se calcula el estadístico T, a partir de la suma de los rangos de la muestra de
menor tamaño.
d) Teniendo T, se calcula U:
Donde U = n1n2 + n1 (n1 + 1)/2 -

T
Donde n1 es el número de sujetos de la muestra de menor tamaño, y n 2 el de la
muestra mayor.
3. Como en el caso anterior, el valor observado es comparado con valores

tabulados. En dicha tabla encontramos la probabilidad asociada a cada valor del
estadístico para una prueba unilateral. Si nuestro contraste es bilateral, sólo
tendremos que multiplicar por dos el valor tabular correspondiente a una cola.
48
4.7 Observaciones pareadas: Prueba de Signos
También se puede utilizar la prueba de signo para probar la hipótesis nula
para observaciones pareadas. Aquí se reemplaza cada diferencia, di, con un signo
más o menos dependiendo si la diferencia ajustada, di-d0, es positiva o negativa. A
lo largo de esta sección suponemos que las poblaciones son simétricas. Sin
embargo, aun si las poblaciones son asimétricas se puede llevar a cabo el mismo
procedimiento de prueba, pero las hipótesis se refieren a las medianas
poblacionales en lugar de las medias.
Ejemplo:
1. Una compañía de taxis trata de decidir si el uso de llantas radiales en lugar

de llantas regulares con cinturón mejora la economía de combustible. Se
equipan 16 automóviles con llantas radiales y se manejan por un recorrido
de prueba establecido. Sin cambiar de conductores, se equipan los mismos
autos con llantas regulares con cinturón y se manejan una vez más por el
recorrido de prueba. Se registra el consumo de gasolina, en kilómetros por
litro, de la siguiente manera:
Llantas con
Automóvil Llantas radiales
cinturón
1 4.2 4.1
2 4.7 4.9
3 6.6 6.2
4 7.0 6.9
5 6.7 6.8
6 4.5 4.4
7 5.7 5.7
8 6.0 5.8
9 7.4 6.9
10 4.9 4.9
49
11 6.1 6.0
12 5.2 4.9
13 5.7 5.3
14 6.9 6.5
15 6.8 7.1
16 4.9 4.8
¿Se puede concluir en el nivel de significancia de 0.05 que los autos equipados
con llantas radiales obtienen mejores economías de combustible que los
equipados con llantas regulares con cinturón?
Solución:
Regla de decisión:
Si zR 1.645 no se rechaza Ho.
Si zR> 1.645 se rechaza Ho.
Se procede a realizar las diferencias entre de los kilómetros por litro entre llantas
radiales y con cinturón:
50
Llantas con d
Automóvil Llantas radiales
cinturón
1 4.2 4.1 +
2 4.7 4.9 -
3 6.6 6.2 +
4 7.0 6.9 +
5 6.7 6.8 -
6 4.5 4.4 +
7 5.7 5.7 0
8 6.0 5.8 +
9 7.4 6.9 +
10 4.9 4.9 0
11 6.1 6.0 +
12 5.2 4.9 +
13 5.7 5.3 +
14 6.9 6.5 +
15 6.8 7.1 -
16 4.9 4.8 +
Al observar las diferencias se ve que sólo existe una n=14, ya que se descartan
los valores de cero. Se tiene r+ = 11
Decisión y conclusión:
Como 2.14 es mayor a 1.645 se rechaza H0 y se concluye con un = 0.05 que

las llantas radiales mejoran la economía de combustible.
51
4.8 Observaciones pareadas: Prueba de Wilcoxon
Prueba de rango con signo de wilcoxon
Se puede notar que la prueba de signo utiliza sólo los signos más y menos de las
diferencias entre las observaciones y 0 en el caso de una muestra, o los signos
más y menos de las diferencias entre los pares de observaciones en el caso de la
muestra pareada, pero no toma en consideración la magnitud de estas diferencias.
Una prueba que utiliza dirección y magnitud, propuesta en 1945 por Frank
Wilcoxon, se llama ahora comúnmente prueba de rango con signo de
Wilcoxon.
Esta prueba se aplica en el caso de una distribución continua simétrica. Bajo esta
condición se puede probar la hipótesis nula 0. Primero se resta de cada
valor muestral y se descarta todas las diferencias iguales a cero. Se asigna un
rango de 1 a la diferencia absoluta más pequeña, un rango de 2 a la siguiente más
pequeña, y así sucesivamente. Cuando el valor absoluto de dos o más diferencias
es el mismo, se asigna a cada uno el promedio de los rangos que se asignarían si
las diferencias se distinguieran. Por ejemplo, si la quinta y sexta diferencia son
iguales en valor absoluto, a cada una se le asignaría un rango de 5.5. Si la
hipótesis 0 es verdadera, el total de los rangos que corresponden a las
diferencias positivas debe ser casi igual al total de los rangos que corresponden a
las diferencias negativas. Se representan esos totales como w+ y w-,
respectivamente. Se designa el menor de w+ y w- con w.
Al seleccionar muestras repetidas esperaríamos que variaran w+ y w-, y por tanto

w. De esta manera se puede considerar a w+ y w-, y w como valores de las
correspondientes variables aleatorias W+, W -, y W. La hipótesis nula
0 se puede rechazar a favor de la alternativa 0 sólo si w+ es
pequeña y w- es grande. Del mismo 0 modo, la alternativa se puede
aceptar sólo si w+ es grande y w- es pequeña. Para una alternativa
bilateral se puede rechazar H0 a favor de H1 si w+ o w- y por tanto w son
suficientemente pequeñas. No importa cuál hipótesis alternativa puede ser,
rechazar la hipótesis nula cuando el valor de la estadística apropiada W +, W -, o W
es suficientemente pequeño.
Dos Muestras con Observaciones Pareadas
Para probar la hipótesis nula de que se muestrean dos poblaciones simétricas

continuas con para el caso de una muestra pareada, se clasifican las
52
diferencias de las observaciones paradas sin importar el signo y se procede como
en el caso de una muestra. Los diversos procedimientos de prueba para los casos
de una sola muestra y de una muestra pareada se resumen en la siguiente tabla:
No es difícil mostrar que siempre que n<5 y el nivel de significancia no exceda

0.05 para una prueba de una cola ó 0.10 para una prueba de dos colas, todos los
valores posibles de w+, w-, o w conducirán a la aceptación de la hipótesis nula. Sin
n
embargo, cuando 5 30, la tabla A.16 muestra valores críticos aproximados
de W + y W - para niveles de significancia iguales a 0.01, 0.025 y 0.05 para una
prueba de una cola, y valores críticos de W para niveles de significancia iguales a
0.02, 0.05 y 0.10 para una prueba de dos colas. La hipótesis nula se rechaza si el
+ 17 para que la alternativa

unilateral sea significativa en el nivel 0.05.
53
valor calculado w+, w-, o w es menor o igual que el valor de tabla apropiado. Por
ejemplo, cuando n=12 la tabla A.16 muestra que se requiere un valor de w
Ejemplos:
1. Los siguientes datos representan el número de horas que un compensador
opera antes de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0,
1.2 y 1.7. Utilice la prueba de rango con signo para probar la hipótesis en el
nivel de significancia de 0.05 que este compensador particular opera con
una media de 1.8 horas antes de requerir una recarga.
Solución:
H0;
H1;
Se procederá a efectuar las diferencias y a poner rango con signo a los
datos.
1.
Dato di = dato - 1.8 Rangos
1.5 -0.3 5.5
2.2 0.4 7
0.9 -0.9 10
1.3 -0.5 8
2.0 0.2 3
1.6 -0.2 3
1.8 0 Se anula
54
1.5 -0.3 5.5
2.0 0.2 3
1.2 -0.6 9
1.7 -0.1 1
Regla de decisión:
Para una n = 10, después de descartar la medición que es igual a 1.8, la
tabla A.16 muestra que la región crítica es w 8.
Cálculos:
W+ = 7 + 3 + 3 = 13
w- = 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42
Por lo que w = 13 (menor entre w+ y w-).
Decisión y Conclusión:
Como 13 no es menor que 8, no se rechaza H0 y se concluye con un =
0.05 que el tiempo promedio de operación no es significativamente
diferente de 1.8 horas.
1. Se afirma que un estudiante universitario de último año puede aumentar su

calificación en el área del campo de especialidad del examen de registro de
graduados en al menos 50 puntos si de antemano se le proporcionan
problemas de muestra. Para probar esta afirmación, se dividen 20 estudiantes
del último año en 10 pares de modo que cada par tenga casi el mismo
promedio de puntos de calidad general en sus primeros años en la universidad.
Los problemas y respuestas de muestra se proporcionan al azar a un miembro
de cada par una semana antes del examen. Se registran las siguientes
calificaciones del examen:
55
Par Con problemas de Sin problemas de
muestra muestra
1 531 509
2 621 540
3 663 688
4 579 502
5 451 424
6 660 683
7 591 568
8 719 748
9 543 530
10 575 524
Pruebe la hipótesis nula en el nivel de significancia de 0.05 de que los problemas

aumentan las calificaciones en 50 puntos contra la hipótesis Alternativa de que el
aumento es menor a 50 puntos.
Solución: ajustadas sin importar el signo y se aplica el mismo procedimiento.

En este caso d0 = 50, por lo que se procede a calcular las diferencias entre las
y
muestras y luego restarles el valor de 50. Se representara con la
56
calificación media de todos los estudiantes que resuelven el examen en cuestión
con y sin problemas de muestra, respectivamente.
H0;
H1;
Regla de decisión:
Para n=10 la tabla muestra que la región crítica es w+ 11.
Cálculos:
La prueba de rango con signo también se puede utilizar para probar la hipótesis
nula
d0. En este caso las poblaciones no necesitan ser simétricas. Como con
la prueba de signo, se resta d0 de cada diferencia, se clasifican las diferencias
Par Con Sin di di Rangos

problemas problemas
–
de muestra de
d0
muestra
1 531 509 22 - 5
28
2 621 540 81 31 6
3 663 688 - - 9
25 75
4 579 502 77 27 3.5
5 451 424 27 - 2
23
57
6 660 683 - - 8
23 73
7 591 568 23 - 3.5

27
8 719 748 - - 10
29 79
9 543 530 13 - 7
37
10 575 524 51 1 1
W+ = 6 + 3.5 + 1 = 10.5
Decisión y Conclusión:
Como 10.5 es menor que 11 se rechaza H0 y se concluye con un = 0.05 que

los problemas de muestra, en promedio, no aumentan las calificaciones de
registro de graduados en 50 puntos.
58
4.9 Varias muestras independientes: Prueba de Krauskal- Wallis
Esta prueba estadística de análisis de varianza de entrada simple de Kruskal-

Wallis es una extensión de la prueba de U Mann-Whitney, en razón de que se
usan rangos para su aplicación; por otra parte, este procedimiento se emplea
cuando el modelo experimental contiene más de dos muestras independientes.
Dicha prueba se define matemáticamente de la forma siguiente:

Donde:
H = valor estadístico de la prueba de
Kruskal-Wallis.
N = tamaño total de la muestra.

Rc2 = sumatoria de los rangos elevados
al cuadrado.
ni = tamaño de la muestra de cada
grupo. L = ajuste dado por el ajuste de
ligas o empates de los rangos.
El ajuste L se calcula de la manera siguiente:

Donde:
Li = valor de número de empates de un rango.
N = tamaño total de la muestra.
Se utiliza cuando:
Cuando son diferentes tratamientos o condiciones.
Muestras pequeñas.
Se utiliza escala ordinal.
Si las muestras se seleccionaron de las diferentes poblaciones.
59
Contrastar hipótesis (direccional o no direccional).
Pasos:
1. Ordenar las observaciones en rangos de todos los grupos, del más pequeño
al mayor.
2. Asignar el rango para cada observación en función de cada grupo de
contraste, elabora la sumatoria de rangos, elevar al cuadrado este valor y
dividirlo entre el número de elementos que contiene (ni).
3. Detectar las ligas o empates entre los rangos de cada grupo y aplicar la
ecuación (L) para obtener el ajuste.
4. Aplicar la ecuación de Kruskal-Wallis y obtener el estadístico H.
5. Calcular los rangos de libertad (gl): gl = K grupos - 1.
6. Comparar el estadístico H, de acuerdo con los grados de libertad, en la tabla
de distribución de ji cuadrada en razón de distribuirse de forma similar.
7. Decidir si se acepta o rechaza la hipótesis.
Ejemplo:
Un investigador estudia el efecto benéfico de cuatro sustancias
anticonvulsionantes (fenobarbital, difenilhidantoinato -DFH-, diacepam y
clonacepam), para proteger contra la muerte producida por un convulsionante, la
tiosemicarbazida, la cual se manifiesta después de crisis clónica y tónica,
respectivamente. El investigador elige al azar a 24 ratones de la misma edad y
peso y les inyecta anticonvulsionante previamente a la tiosemicarbazida. A partir
de este momento, inicia la cuenta en tiempo, hasta que mueren los ratones;
además mide las observaciones en horas de tiempo transcurrido.
Elección de la prueba estadística.
60
Las mediciones se realizan en horas, por lo que la variable puede ser continua y,
en consecuencia, una escala de intervalo; sin embargo, algunos ratones no
murieron y el tiempo está calificado nominalmente como infinito. Este obstáculo
impide concederle la calificación de escala de intervalo, por lo cual se elige una
escala de tipo ordinal.
Planteamiento de la hipótesis.
Hipótesis alterna (Ha).

La protección de la muerte por drogas anticonvulsionante contra el fármaco
convulsionante tiosemicarbazida, se muestra diferente entre los cuatro grupos, y
hay mejor protección por el diacepam.
Hipótesis nula (Ho).

Las diferencias observadas en los cuatro grupos de fármacos anticonvulsionantes,
para evitar la muerte producida por la tiosemicarbazida, se deben al azar.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se
rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha
Tiempo en horas que tarda el fármaco en causar la muerte en ratones.
Aplicación de la prueba estadística.
61
De acuerdo con los pasos, se inicia con el ordenamiento de todas las
observaciones a partir del valor más pequeño hasta el mayor y la detección de las
ligas o empates.
Arreglo de los datos para asignar rangos y detectar las ligas o empates.
Una vez efectuado el ordenamiento en rangos de las observaciones, se hacen las

sumatorias de los rangos. Para facilitar esta tarea, elabórese una tabla en la que
sustituyan los datos.
Sustitución por rangos. Observaciones de la primera tabla.
Se calcula el valor de ajuste por ligas con la siguiente fórmula:
62
Con el ajuste de L, se procede a calcular el valor estadístico de la prueba de
KruskalWallis.
Calculamos los grados de

libertad. gl = K grupos - 1 = 4 - 1
=3
El estadístico H calculado de 15.4, se compara con los valores críticos de ji
cuadrada. En seguida se busca en esa hilera la cifra de grados de libertad (3)
hasta el nivel de significancia de 0.05 y se observa el valor 7.82, hasta los críticos
11.34 y 16.27, donde se encuentra el calculado. Esto quiere decir que la
probabilidad de que exista una diferencia se halla a una probabilidad de error
entre 0.01 y 0.001.
Decisión.
Como el valor estadístico H tiene una probabilidad menor que 0.01 y éste es
menor que el nivel de significancia, se acepta Ha y se rechaza Ho.
Interpretación.
Entre las drogas anticonvulsionantes, existe diferencia significativa en cuanto a la
protección de muerte a los ratones cuando se les inyecta el fármaco
tiosemicarbazida. El diacepam se manifestó principalmente con los rangos más
altos y se muestra distinto de los demás anticonvulsionantes (véase la siguiente
figura). Sumatoria de rangos de las observaciones.
63
4.10 Aplicaciones con el uso del software
Software estadístico
El uso de ordenadores y calculadoras facilita el que los alumnos comprendan
mejor temas complejos de matemáticas. Es evidente que en muchos casos la
tecnología agiliza y supera, la capacidad de cálculo de la mente humana, con
ayuda de la tecnología, los alumnos tienen más tiempo para concentrarse en
enriquecer su aprendizaje matemático.
Las nuevas tecnologías han venido a cambiar por completo el panorama

tradicional de como se hacían, se veían y se enseñaban las matemáticas.
Introducirse en este nuevo panorama implica realizar profundos cambios en
nuestros programas educativos.
Es muy amplia la variedad de aplicaciones informáticas disponibles para

estadística y probabilidad:
 Excel o Calc
 Javascript
 Applet de Java, Geogebra
 Proyecto Descartes
 Software Libre
 Otros Software
64
CONCLUSION GENERAL
Al termino de esta investigación aprendimos a como realizar los diferentes

ejercicios que se muestran en la información encontrada, tomando en cuenta que
los temas de esta matera aportan al licenciado en administración la capacidad de
manejar variables tanto dependientes como independientes para poder saber las
probabilidades futuras dentro de una empresa y así poder darse cuenta cuales
son las necesidades de esta misma. De la misma forma aprender a hacer uso de
los diferentes software estadísticos aplicados a estos temas.
Para la resolución de problemas e hipótesis por resolver en las organizaciones y

en la vida.
65
BIBLIOGRAFIA
https://es.slideshare.net/isaacgflores/anlisis-de-series-de-tiempo
https://www.uv.es/~mamtnez/IECRC.pdf
Sprent P. Applied nonparametric statistical methods. 2nd Ed., ChapmanHall,

London, 1993:1-3.
Glantz SA. Primer of Biostatistics, 3th ed., McGraw Hill, New Yor, 1992
https://campusvirtual.univalle.edu.co/moodle/pluginfile.php/1006795/mod_resource
/content/1/Exposici%C3%B3n%209%20An%C3%A1lisis%20de%20Series%20de
%20Tiempo.pdf
http://www.estadisticaparatodos.es/software/software_otros.html
http://www.virtual.sepi.upiicsa.ipn.mx/mdid/anasetie.pdf
66

Investigacion Estadistica

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Investigacion Estadistica

Încărcat de

Drepturi de autor:

Formate disponibile

Alumno: Sarai Adilene Escribano Córdoba.

Carrera: LIC. Administración

Asignatura: Estadística para la Administración II

Docente: ING. Ind. Grisel Esmeralda Cortés Utrera

Trabajo: Investigación unidad II, III y IV

En la siguiente investigación se abordaran los temas que conforman las unidades

En la segunda unidad se abordan los temas de análisis de regresión múltiple y

En la tercera unidad de la misma forma se abordan los siguientes temas:

En la unidad cuatro nos habla de la estadística no paramétrica, La estadística no

Es así como investigaremos estos temas de estas unidades.

UNIDAD 2 ANALISIS DE REGRESION LINEAL Y MULTIPLE

En esta misma unidad se verá como se interpreta el intervalo de confianza y cuál

En algunos problemas de investigación no solo se presenta una variable

1. Peso de animal cuando nació (X1)

O si estamos interesados en saber cuántas ventas (y) tendremos

Se pueden tomar muchas variables como se crea que influyan en la respuesta, en

𝜇𝑥1, 𝑥2, 𝑥3,…, 𝑥𝑘 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 + 𝛽3𝑥3 + ⋯ + 𝛽𝑘𝑥𝑘

Para obtener los valores de tenemos la siguiente

Solución del problema por medio de matrices en términos

Para expresar el modelo en regresión múltiple general en términos de matrices:

Consecuentemente el vector aleatorio “y” tiene un valor esperado

Y la matriz de varianza- covarianza de “y”

Las ecuaciones normales de mínimos cuadrados para el modelo

Las ecuaciones resultantes que es necesario resolver son:

Donde denota el vector de coeficientes de regresión estimados.

Los estimadores de mínimos cuadrados son:

Primeramente estimamos la variación aleatoria. Al igual que en el caso de la

Un estimador insesgado de esta dado por el cuadrado medio

Prueba de significancia de la regresión

Debe rechazarse si el valor calculado del estadístico de prueba es mayor que

Inferencias para los parámetros de regresión

Para poder hacer inferencias acerca de los parámetros de regresión

El siguiente dibujo resume la fuerza y dirección del coeficiente de correlación.

El coeficiente de correlación permite predecir si entre las dos variables que

Cuando r = -1 todos los

Si se hiciera un estudio de los carros conforme pasa el tiempo, xi, y su devaluación

Se llama recta de regresión a una recta que marca la tendencia de la nube de

1. La estimación de los parámetros del modelo requiere la

𝑒𝑖 = 𝑦𝑖 − 𝑦̂𝑖 𝑑𝑜𝑛𝑑𝑒 𝑖 = 1,2,3 … 𝑛

Para el modelo de regresión se asume que 𝐸𝑖 puede ser una

Propiedades de los residuales:

La media de los “n” residuales es:

Donde 𝑒̅ simboliza la media de los residuales. Así, pues 𝑒̅ siempre

Si el modelo es apropiado, el MSE es un estimador de la variación

puesto que la desviación estándar del error es 𝜎 y es estimada por

Conclusiones del modelo por un estudio de residuales

1. La función de regresión es no lineal.

Los gráficos de residuales se pueden analizar para proporcionar

Un diagrama de residuales tiene ventajas sobre el diagrama de

Podemos tener los siguientes diagramas de residuales no lineal.

Indica que el modelo es inadecuado, se sugiere fuertemente una

Otro grafico que indica esta situación doble arco.

𝑥𝑖 , 𝑦̂ 𝑖 𝑥𝑖𝑥,𝑖𝑦̂ ,𝑖𝑦̂ , 𝑖𝑛, 𝑛 ,

Para detectar observaciones extremas hacemos el grafico estandarizado, si

La siguiente grafica representa la situación ideal o satisfactoria para que se

2.9 Interpretación del intervalo de confianza

El proceso de inferencia es aquel mediante el cual se pretende estimar el

Evidentemente esta técnica no tiene porqué dar siempre un resultado

La bondad de la predicción depende de la relación entre las variables. Si dos

Esta medida es el Coeficiente de Determinación, que es el cuadrado del

En el siguiente cuadro puedes comprobar:

a) que la Varianza total de la variable Y (0.76) es igual a la suma de las Varianzas

b) Que el coeficiente de determinación (r2xy) es igual a la proporción de la

UNIDAD 3 SERIES DE TIEMPO