Documente Academic
Documente Profesional
Documente Cultură
SUPERIOR DE ALVARADO
Campus Lerdo.
INGENIERA
INDUSTRIAL
Materia:
Mercadotecnia
.
Semestre - Grupo - Sistema:
6 Semestre - Grupo A Semi-Escolarizado.
Producto Acadmico:
Investigacion Unidad 1
Presenta:
Oscar rodrguez Hernndez.
Docente:
Ingrid Dianet
LERDO DE TEJADA, VER. FEB-JULIO. 2015
Primera Unidad
1.1 El trmino "regresin" fue acuado por Sir Francis Galton
(1822-1911), primo de Charles Darwin. Galton estudiaba la eugnica,
trmino tambin introducido por s mismo para definir el estudio de la
mejora de la raza humana a partir de los caracteres hereditarios.
Galton estudi la altura de los hijos con relacin a la altura de sus
padres, y prob que la altura de hijos altos regresaba hacia la media
de la altura de la poblacin a lo largo de sucesivas generaciones. En
otras palabras, hijos de padres extraordinariamente altos tendan a ser
en promedio ms bajos que sus padres, e hijos de padres muy bajos
tendan a ser en promedio ms altos que sus padres. En la actualidad, el
trmino de regresin se utiliza siempre que se busca predecir una
variable en funcin de otra, y no implica que se est estudiando si se
est produciendo una regresin a la media. Anteriormente a Galton se
debe mencionar a Legendre (1752-1833), quien introdujo el mtodo de
los mnimos cuadrados utilizndolos para definir la longitud de 1 metro
como una diez millonsima parte del arco meridional. Con posterioridad
a Galton, las propiedades de las tcnicas de regresin fueron estudiadas
por Edgeworth, Pearson y Yule.
La tcnica de regresin lineal simple est indicada cuando se pretende
explicar una variable respuesta cuantitativa en funcin de una variable
explicativa cuantitativa tambin llamada variable independiente,
variable regresora o variable predictora. Por ejemplo, se podra intentar
explicar el peso en funcin de la altura. El modelo intentara aproximar
la variable respuesta mediante una funcin lineal de la variable
explicativa.
Las suposiciones que se realizan al aplicar las tcnicas de regresin
lineal son:
-El modelo propuesto es lineal (es decir existe relacin entre la variable
explicativa y la variable explicada, y esta relacin es lineal). Es decir se
asume que:
var.respuesta0var. explicativa1
Regresin lineal simple. Tiene como objeto estudiar cmo los cambios
en una variable, no aleatoria, afectan a una variable aleatoria, en el caso
de existir una relacin funcional entre ambas variables que puede ser
establecida por una expresin lineal, es decir, su representacin grfica
es una lnea recta. Cuando la relacin lineal concierne al valor medio o
esperado de la variable aleatoria, estamos ante un modelo de regresin
lineal simple. La respuesta aleatoria al valor x de la variable controlada
se designa por Yx y, segn lo establecido, se tendr
Estimacin de parmetros.
12
10
11
10
14
58
42
51
54
40
39
49
56
ya que
Por tanto el ajuste lineal es muy bueno. Se puede decir que el ngulo
entre el vector formado por las desviaciones del peso con respecto a su
valor medio y el de la edad con respecto a su valor medio, , es:
Ejemplo de regresin no
lineal
En estadstica, la regresin no lineal es un problema de inferencia para
un modelo tipo:
y = f(x, ) +
Basado en datos multidimensionales x, , donde f es alguna funcin no
lineal respecto a algunos parmetros desconocidos . Como mnimo, se
pretende obtener los valores de los parmetros asociados con la mejor
curva de ajuste (habitualmente, con el mtodo de los mnimos
cuadrados). Con el fin de determinar si el modelo es adecuado, puede
ser necesario utilizar conceptos de inferencia estadstica tales como
intervalos de confianz a para los parmetros as como pruebas de
bondad de ajuste.
El objetivo de la regresin no lineal se puede clarificar al considerar el
caso de la regresin polinomial, la cual es mejor no tratar como un caso
de regresin no lineal. Cuando la funcin f toma la forma:
f(x) = ax2 + bx + c
la funcin f es no lineal en funcin de x pero lineal en funcin de los
parmetros desconocidos a, b, y c. Este es el sentido del trmino "lineal"
en el contexto de la regresin estadstica. Los procedimientos
computacionales para la regresin polinomial son procedimientos de
regresin lineal (mltiple), en este caso con dos variables predictoras x y
x2. Sin embargo, en ocasiones se sugiere que la regresin no lineal es
necesaria para ajustar polinomios. Las consecuencias prcticas de esta
mala interpretacin conducen a que un procedimiento de optimizacin
no lineal sea usado cuando en realidad hay una solucin disponible en
ln( y ) b x ln( a)
a e[ln( y ) b x ]
Ejemplo
x
1
1,2
1,5
2
3
3,7
4
4,5
20,9
y
3
3,4
5
2
4,1
5
7
6,5
36
In y
1,0986
1,2237
1,6094
0,6931
1,4109
1,6094
1,9459
1,8718
11,4628
x2
1
1,44
2,25
4
9
13,69
16
20,25
67,63
x Iny
1,0986
1,4684
2,4141
1,3862
4,2327
5,9547
7,7836
8,4231
32,7614
In y2
1,2069
1,4974
2,5901
0,4803
1,9906
2,5901
3,7865
3,5056
17,6455
Numero de datos = n = 8
x
x promedio =
= 2,6125
ln( y )
y promedio =
ln( y)
= 1,43285
b=
= 0,216047
a e[ln( y ) b x ]
a = eb = e0,216047 = 2,38316
La ecuacin final que modela el sistema es
y 2.38316 e 0.2166047x
Regresin Logartmica
La curva logartmica
es tambin una recta, pero en lugar
de estar referida a las variables originales
e
, est referida a
ya
Ejemplo
y
ln x
ln x2
3
3.4
5
2
4.1
5
7
6.5
36
0
0.1823
0.4054
0.6931
1.0986
1.3083
1.3862
1.5040
6.5779
0
0.0332
0.1643
0.4803
1.2069
1.7116
1.9215
2.2620
7.7798
x
1
1.2
1.5
2
3
3.7
4
4.5
20.9
ln x * y
0
0.6198
2.027
1.3862
4.5042
6.5415
9.7034
9.776
34.5581
y2
9
11.56
25
4
16.81
25
49
42.25
182.62
n=8
y 36 4.5
n
ln( x)
a=
= 2.090513
Regresin Polinomial
Algunas veces cuando la relacin entre las variables dependientes e
independientes es no lineal, es til incluir trminos polinomiales para
ayudar a explicar la variacin de nuestra variable dependiente.
Las regresiones polinomiales se pueden ajustar la variable
independiente con varios trminos
Ejemplo
x
xy
x2
y2
x2y
x3
x4
1
1.2
1.5
2
3
3.7
4
4.5
20.9
3
3.4
5
2
4.1
5
7
6.5
36
3
4.08
7.5
4
12.3
18.5
28
29.25
106.63
1
1.44
2.25
4
9
13.69
16
20.25
67.63
9
11.56
25
4
16.81
25
49
42.25
182.62
3
4.896
11.25
8
36.9
68.45
112
131.625
376.121
1
1.728
3.375
8
27
50.653
64
91.125
246.881
1
2.0736
5.0625
16
81
187.4161
256
410.0625
958.6147
Linealizacin
Algunos problemas de regresin no lineal pueden linealizarse mediante
una transformacin en la formulacin del modelo.
INSTITUTO TECNOLOGICO
SUPERIOR DE ALVARADO
Campus Lerdo.
INGENIERA
INDUSTRIAL
Materia:
Mercadotecnia
VENTAJAS:
1.- Permite estudiar los efectos principales, efectos de interaccin de
factores, efectos simples y efectos cruzados.
2.- Todas las unidades experimentales intervienen en la determinacin
de los efectos principales y de los efectos de interaccin de los factores,
por lo que el nmero de repeticiones es elevado para estos casos.
3.- El nmero de grados de libertad para el error experimental es alto,
comparndolo con los grados de libertad de los experimentos simples de
los mismos factores, lo que contribuye a disminuir la variancia del error
experimental, aumentando por este motivo la precisin del experimento.
DESVENTAJA:
CONCEPTOS GENERALES:
FACTOR.- Es un conjunto de tratamientos de una misma clase o
caracterstica. Ejemplo: tipos de riego, dosis de fertilizacin, variedades
de cultivo, manejo de crianzas, etc.
FACTORIAL.- Es una combinacin de factores para formar tratamientos.
NIVELES DE UN FACTOR.- Son los diferentes tratamientos que
pertenecen a un determinado factor. Se acostumbra simbolizar algn
elemento "i" por la letra minuscula que representa al factor y el valor del
respectivo subindice.
Ejemplo:
A: Tipos de riego: Secano Goteo Aspersin
Niveles: a0 a1 a2
TIPOS DE FACTORES:
1.- Factores Cuantitativos.
2.- Factores Cualitativos.
a1
b0 b1
a0 b0
a0 b1
b0 b1
a1 b0
a2
b0 b1
a1 b1
a2b0
a2 b1 } tratamientos
Repeticione
s
a0 b0
a0 b1
a1 b0
a1 b1
a1b0
a2 b 1
FORMACION DE FACTORIALES:
En la informacin de factoriales, se debe tener presente lo siguiente:
1.- Que factores deben incluirse.
2.- Que factores son fijos (modelo I) y que factores son al azar (modelo
II).
3.- Cuantos niveles se tiene por factor.
4.- Si son factores cuantitativos , cual debe ser el espaciamiento entre
los niveles del factor.
Por ejemplo:
0%, 5% y 10% de nitrgeno, significa igual espaciamiento.
pA x qB dos factores "A y "B", con "p" niveles para "A" y "q" niveles para
"B"
Nmero de factores.
Anlisis de la varianza
En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance,
segn terminologa inglesa) es una coleccin de modelos estadsticos y
sus procedimientos asociados, en el cual la varianza est particionada
en ciertos componentes debidos a diferentes variables explicativas.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el
estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas
veces conocido como "Anova de Fisher" o "anlisis de varianza de
Fisher", debido al uso de la distribucin F de Fisher como parte del
contraste de hiptesis.
El anlisis de la varianza parte de los conceptos de regresin lineal.
El primer concepto fundamental es que todo valor observado puede
expresarse mediante la siguiente funcin:
Por tanto...
Y reorganizando la ecuacin:
Por tanto:
Y desarrollamos el cuadrado:
O lo mismo que:
Donde:
es un nmero real relacionado con la varianza, que mide la
variacin debida al "factor", "tratamiento" o tipo de situacin
estudiado.
es un nmero real relacionado con la varianza, que mide la
variacin dentro de cada "factor", "tratamiento" o tipo de
situacin.
En el caso de que la diferencia debida al factor o tratamiento no sean
estadsticamente significativa puede probarse que las varianzas
muestrales son iguales:
Donde:
es el nmero de situaciones diferentes o valores del factor se
estn comparando.
es el nmero de mediciones en cada situacin se hacen o nmero
de valores disponibles para cada valor del factor.
As lo que un simple test a partir de la F de Snedecor puede decidir si el
factor o tratamiento es estadsticamente significativo.
Visin general
Existen tres clases conceptuales de estos modelos:
1. El Modelo de efectos fijos asume que los datos provienen de
poblaciones normales las cuales podran diferir nicamente en sus
medias. (Modelo 1)
2. El Modelo de efectos aleatorios asume que los datos describen una
jerarqua de diferentes poblaciones cuyas diferencias quedan
restringidas por la jerarqua. Ejemplo: El experimentador ha
Tipos de modelo
Modelo I: Efectos fijos
El modelo de efectos fijos de anlisis de la varianza se aplica a
situaciones en las que el experimentador ha sometido al grupo o
material analizado a varios factores, cada uno de los cuales le afecta
slo a la media, permaneciendo la "variable respuesta" con una
distribucin normal.
Este modelo se supone cuando el investigador se interesa nicamente
por los niveles del factor presentes en el experimento, por lo que
Suma de
cuadrados
Grados de
libertad
Intergrupo
t-1
Intragrupo o
Error
N-t
Total
N-1
Cuadrado medio
resulta til, por motivos estadsticos, suponer que siempre hay una
constante en el modelo, y contrastar la hiptesis de si es distinta, o no,
de cero para reescribirlo de acuerdo con ello.
Adems, se supone que esta relacin no es del todo determinista, esto
es, existir siempre un cierto grado de error aleatorio (en realidad, se
entiende que encubre a todas aquellas variables y factores que no se
hayan podido incluir en el modelo) que se suele representar aadiendo a
la suma una letra representa una variable aleatoria.As:
Se suele suponer que es una variable aleatoria normal, con media cero
y varianza constante en todas las muestras (aunque sea desconocida).
Se toma una muestra estadstica, que corresponda a observaciones de
los valores que hayan tomado esas variables en distintos momentos del
tiempo (o, dependiendo del tipo de modelo, los valores que hayan
tomado en distintas reas o zonas o agentes econmicos a considerar).
Por ejemplo, en un determinado modelo podemos estar interesados en
averiguar como la renta ha dependido de los niveles de precios, de
empleo y de tipos de inters a lo largo de los aos en cierto pas,
mientras que en otro podemos estar interesados en ver como, a lo largo
de un mismo ao, ha dependido la renta de distintos pases de esas
mismas variables. Por lo que tendramos que observar, en el primer
caso, la renta, niveles de empleo, precios y tipos de inters del ao 1, lo
mismo, pero del ao 2, etctera, para obtener la muestra a lo largo de
varios aos, mientras que en el segundo caso tendramos que tener en
cuenta los valores de cada uno de los pases para obtener la muestra.
Cada una de esas observaciones para cada ao, o pas, se llamara
Anlisis de la varianza
En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance,
segn terminologa inglesa) es una coleccin de modelos estadsticos y
sus procedimientos asociados, en el cual la varianza est particionada
en ciertos componentes debidos a diferentes variables explicativas.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el
estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas
veces conocido como "Anova de Fisher" o "anlisis de varianza de
Fisher", debido al uso de la distribucin F de Fisher como parte del
contraste de hiptesis.
Por tanto...
Y reorganizando la ecuacin:
Por tanto:
Y desarrollamos el cuadrado:
O lo mismo que:
Donde:
es un nmero real relacionado con la varianza, que mide la
variacin debida al "factor", "tratamiento" o tipo de situacin
estudiado.
es un nmero real relacionado con la varianza, que mide la
variacin dentro de cada "factor", "tratamiento" o tipo de
situacin.
Donde:
es el nmero de situaciones diferentes o valores del factor se
estn comparando.
es el nmero de mediciones en cada situacin se hacen o nmero
de valores disponibles para cada valor del factor.
As lo que un simple test a partir de la F de Snedecor puede decidir si el
factor o tratamiento es estadsticamente significativo.
Visin general
Existen tres clases conceptuales de estos modelos:
4. El Modelo de efectos fijos asume que los datos provienen de
poblaciones normales las cuales podran diferir nicamente en sus
medias. (Modelo 1)
5. El Modelo de efectos aleatorios asume que los datos describen una
jerarqua de diferentes poblaciones cuyas diferencias quedan
restringidas por la jerarqua. Ejemplo: El experimentador ha
aprendido y ha considerado en el experimento slo tres de muchos
ms mtodos posibles, el mtodo de enseanza es un factor
aleatorio en el experimento. (Modelo 2)
6. El Modelo de efectos mixtos describen situaciones que ste puede
tomar. Ejemplo: Si el mtodo de enseanza es analizado como un
factor que puede influir donde estn presentes ambos tipos de
factores: fijos y aleatorios. (Modelo 3)
Supuestos previos
El ANOVA parte de algunos supuestos que han de cumplirse:
Tipos de modelo
Modelo I: Efectos fijos
El modelo de efectos fijos de anlisis de la varianza se aplica a
situaciones en las que el experimentador ha sometido al grupo o
material analizado a varios factores, cada uno de los cuales le afecta
slo a la media, permaneciendo la "variable respuesta" con una
distribucin normal.
Este modelo se supone cuando el investigador se interesa nicamente
por los niveles del factor presentes en el experimento, por lo que
cualquier variacin observada en las puntuaciones se deber al error
experimental.
Modelo II: Efectos aleatorios (componentes de varianza)
Los modelos de efectos aleatorios se usan para describir situaciones en
que ocurren diferencias incomparables en el material o grupo
experimental. El ejemplo ms simple es el de estimar la media
desconocida de una poblacin compuesta de individuos diferentes y en
el que esas diferencias se mezclan con los errores del instrumento de
medicin.
Este modelo se supone cuando el investigador est interesado en una
poblacin de niveles, tericamente infinitos, del factor de estudio, de los
que nicamente una muestra al azar (t niveles) estn presentes en el
experimento.
Grados de libertad
Pruebas de significacin
El anlisis de varianza lleva a la realizacin de pruebas de significacin
estadstica, usando la denominada distribucin F de Snedecor.
Tablas ANOVA
Una vez que se han calculado las sumas de cuadrados, las medias
cuadrticas, los grados de libertad y la F, se procede a elaborar una
tabla que reuna la informacin, denominada "Tabla de Anlisis de
varianza o ANOVA", que adopta la siguiente forma:
Fuente de
variacin
Suma de
cuadrados
Grados de
libertad
Intergrupo
t-1
Intragrupo o
Error
N-t
Total
N-1
Cuadrado medio
resulta til, por motivos estadsticos, suponer que siempre hay una
constante en el modelo, y contrastar la hiptesis de si es distinta, o no,
de cero para reescribirlo de acuerdo con ello.
Se suele suponer que es una variable aleatoria normal, con media cero
y varianza constante en todas las muestras (aunque sea desconocida).
Se toma una muestra estadstica, que corresponda a observaciones de
los valores que hayan tomado esas variables en distintos momentos del
tiempo (o, dependiendo del tipo de modelo, los valores que hayan
tomado en distintas reas o zonas o agentes econmicos a considerar).
Por ejemplo, en un determinado modelo podemos estar interesados en
averiguar como la renta ha dependido de los niveles de precios, de
empleo y de tipos de inters a lo largo de los aos en cierto pas,
mientras que en otro podemos estar interesados en ver como, a lo largo
de un mismo ao, ha dependido la renta de distintos pases de esas
mismas variables. Por lo que tendramos que observar, en el primer
caso, la renta, niveles de empleo, precios y tipos de inters del ao 1, lo
mismo, pero del ao 2, etctera, para obtener la muestra a lo largo de
varios aos, mientras que en el segundo caso tendramos que tener en
cuenta los valores de cada uno de los pases para obtener la muestra.
Cada una de esas observaciones para cada ao, o pas, se llamara
observacin muestral. Ntese que an se podra hacer un anlisis ms
ambicioso teniendo en cuenta pas y ao.
Una vez tomada la muestra, se aplica un mtodo, que tiene su
justificacin matemtica y estadstica, llamado mtodo de mnimos
cuadrados. Este consiste en, bsicamente, minimizar la suma de los
errores (elevados al cuadrado) que se tendran, suponiendo distintos
valores posibles para los parmetros, al estimar los valores de la
variable endgena a partir de los de las variables exgenas en cada una
de las observaciones muestrales, usando el modelo propuesto, y
comparar esos valores con los que realmente tom la variable
endgena. Los parmetros que lograran ese mnimo, el de las suma de
los errores cuadrticos, se acepta que son los que estamos buscando, de
acuerdo con criterios estadsticos.
Tambin, este mtodo nos proporcionar informacin (en forma de
ciertos valores estadsticos adicionales, que se obtienen adems de los
parmetros) para ver en qu medida los valores de los parmetros que
hemos obtenido resultan fiables, por ejemplo, para hacer contrastes de
hiptesis, esto es, ver si ciertas suposiciones que se haban hecho
acerca del modelo resultan, o no, ciertas. Se puede usar tambin esta
aqu
s r p
x
MSE
n
0.0015
12
0.011
2
2.85
multiplicando rp por
P
Rp
3
3.00
4
3.09
= 0.011:
2
0.031
3
0.033
4
0.034
yij i 2
i 1 j 1
i 1 j 1
2 yij i
yij
i 1 j 1
k
i 1 j 1
i 1 j 1
yij k n 0
i1 j 1
para un i dado:
n
2 yij i
j 1
j 1
yij
j 1
j1
1
3
11.69
0.244
48
3.21 11.69
12
48
2.76
12
11.69
48
0.024
0.0135
2.72 11.69
12
48
3.00
12
11.69
48
0.017
0.006
Muestra i yi1
y12
y1j
y22
y2j
yi2
yij
.
Muestra
k
yk2
ykj
yk1
si
ni 1
ni
y
ij i
j
SST
yij
Ti 2
SS ( Tr)
i1 j 1
i1
ni
siendo:
ni
i 1 j 1
yij
Ti
i 1
yij
Respuesta:
a)
y1 2.2
y2
SST
y1j 3
SS ( Tr)
y.
4.05
y2j 3 2
2.2
146.25
ni yi 3
8 ( 2.2 3) 6 ( 4.05 3)
11.74
Grados
de
Liberta
d
Tratamien
1
tos
Error
12
Total
13
Suma
Media Cuadrada F
de
Cuadra
dos
11.74
11.74
134.51
146.25
1.05
11.21
x1 x2
n1 1 s1 2 n2 1 s2 2
s1
8.15
s2
n1 n2 n1 n2 2
n1 n2
15.48
2.2 4.05
( 8 1) 8.15 ( 6 1) 15.48
8 6 ( 8 6 2 )
8 6
1.0234