Sunteți pe pagina 1din 9

Qu es la suma de los cuadrados?

La suma de cuadrados representa una medida de variacin o desviacin con


respecto a la media. Se calcula como una suma de los cuadrados de las diferencias
con respecto a la media. El clculo de la suma total de los cuadrados considera
tanto la suma de los cuadrados de los factores como de la aleatoriedad o el error.

Suma de los cuadrados en ANOVA


En el anlisis de varianza (ANOVA), la suma total de los cuadrados ayuda a
expresar la variacin total que se puede atribuir a diferentes factores. Por ejemplo,
usted hace un experimento para probar la efectividad de tres detergentes para
ropa.
La suma total de los cuadrados = suma de los cuadrados del tratamiento (SST) +
suma de los cuadrados del error residual (SSE)
La suma de los cuadrados del tratamiento es la variacin atribuida a, o en este
caso entre, los detergentes para ropa. La suma de los cuadrados del error residual
es la variacin atribuida al error.
El convertir la suma de los cuadrados en cuadrados medios al dividir entre los
grados de libertad le permitir comparar estas relaciones y determinar si existe
una diferencia significativa debido al detergente. Mientras mayor sea esta relacin,
ms afectarn los tratamientos el resultado.

Suma de los cuadrados en regresin


En la regresin, la suma total de los cuadrados ayuda a expresar la variacin total
de las Y. Por ejemplo, usted recoge datos para determinar un modelo que explique
las ventas generales en funcin de su presupuesto de publicidad.
La suma total de los cuadrados = suma de los cuadrados de la regresin (SSR) +
suma de los cuadrados del error residual (SSE)

La suma de los cuadrados de la regresin es la variacin atribuida a la relacin


entre las X y las Y o, en este caso, entre el presupuesto de publicidad y las ventas.
La suma de los cuadrados del error residual es la variacin atribuida al error.
Al comparar la suma de los cuadrados de la regresin con la suma total de los
cuadrados, se determina la proporcin de la variacin total que es explicada por el

modelo de regresin (R2, el coeficiente de determinacin). Mientras ms grande


sea este valor, mejor ser la relacin que explique las ventas en funcin del
presupuesto de publicidad.

Comparacin de las sumas secuenciales de los


cuadrados y las sumas ajustadas de los cuadrados
Minitab desglosa el componente SC Regresin o Tratamientos de la varianza en las
sumas de los cuadrados para cada factor.

Sumas secuenciales de los cuadrados


Las sumas secuenciales de los cuadrados dependen del orden en que los
factores se ingresan en el modelo. Es la porcin nica de la SC Regresin
explicada por un factor, dados los factores ingresados previamente.
Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la
suma secuencial de los cuadrados para X2 muestra la proporcin de la
variacin restante que es explicada por X2, dado que X1 ya se encuentre en
el modelo. Para obtener una secuencia diferente de factores, repita el
procedimiento de regresin ingresando los factores en un orden diferente.

Sumas ajustadas de los de cuadrados


Las sumas ajustadas de los cuadrados no dependen del orden en que los
factores se ingresan en el modelo. Es la porcin nica de la SC Regresin
explicada por un factor, dados todos los dems factores en el modelo,
independientemente del orden en que se ingresaron en el mismo.
Por ejemplo, si usted tiene un modelo con tres factores, X1, X2 y X3, la
suma ajustada de los cuadrados para X2 muestra la proporcin de la
variacin restante que es explicada por X2, dado que X1 y X3 tambin se
encuentren en el modelo.

Cundo sern iguales las sumas secuenciales y


ajustadas de los cuadrados?
Las sumas secuenciales y ajustadas de los cuadrados siempre son iguales
para el ltimo trmino del modelo. Por ejemplo, si el modelo contiene los
trminos A, B y C (en ese orden), entonces los dos sumas de los cuadrados
para C representan la reduccin en la suma de los cuadrados del error residual
que se produce cuando C se agrega a un modelo que contiene A y B.
Las sumas secuenciales y ajustadas de los cuadrados ser igual para todos los
trminos si la matriz de diseo es ortogonal. El caso ms comn en el que

ocurre esto es con los diseos factoriales y factoriales fraccionados (sin


covariables) cuando se analizan en unidades codificadas. En estos diseos, las
columnas de la matriz de diseo para todos los efectos principales y las
interacciones son ortogonales entre s. Los diseos de Plackett-Burman tienen
columnas ortogonales para los efectos principales (por lo general los nicos
trminos en el modelo), pero los trminos de interaccin, si existen, pueden
confundirse parcialmente con otros trminos (es decir, no ortogonales). En los
diseos de superficie de respuesta, las columnas para los trminos al
cuadrado no son ortogonales entre s.
Para cualquier diseo, si la matriz de diseo se encuentra en unidades no
codificadas, entonces puede haber columnas que no son ortogonales, a menos
que los niveles de los factores an estn centrados en cero.

Pueden las sumas ajustadas de los cuadrados ser


menores, iguales o mayores que las sumas
secuenciales de los cuadrados?
Las sumas ajustadas de los cuadrados pueden ser menores, iguales o mayores
que las sumas secuenciales de los cuadrados.
Supongamos que usted ajusta un modelo con los trminos A, B, C y A*B. Sea
SC (A, B, C, A*B) la suma de los cuadrados cuando A, B, C y A*B estn en el
modelo. Sea SC (A, B, C) la suma de los cuadrados cuando A, B y C estn
incluidos en el modelo. Entonces, la suma ajustada de los cuadrados para A*B
es:
SC(A, B, C, A*B) - SC(A, B, C)
Sin embargo, con los mismos trminos A, B, C, A*B en el modelo, la suma
secuencial de los cuadrados para A*B depende del orden en que los trminos
se especificaron en el modelo.
Utilizando una notacin similar, si el orden es A, B, A*B, C, entonces la suma
secuencial de los cuadrados para A*B es:
SC(A, B, A*B) - SC(A, B)
Dependiendo del conjunto de datos y del orden en el que se especifiquen los
trminos, todos los casos siguientes son posibles:

SC(A, B, C, A*B) - SC(A, B, C) < SC(A, B, A*B) - SC(A, B), o

SC(A, B, C, A*B) - SC(A, B, C) = SC(A, B, A*B) - SC(A, B), o

SC(A, B, C, A*B) - SC(A, B, C) > SC(A, B, A*B) - SC(A, B)

Qu es la suma de los cuadrados no corregida?


Eleva al cuadrado cada uno de los valores de la columna y calcula la suma de
esos valores elevados al cuadrado. Es decir, si la columna contiene x1, x2, ... ,
xn, entonces la suma de los cuadrados calcula (x1 2 + x22+ ... + xn 2). A
diferencia de la suma corregida de los cuadrados, la suma de los cuadrados no
corregida incluye el error. Los valores de los datos se elevan al cuadrado sin
antes restar la media.
En Minitab, usted puede utilizar los estadsticos descriptivos para mostrar la
suma de los cuadrados no corregida (elija Estadsticas > Estadsticas
bsicas > Mostrar estadsticos descriptivos). Tambin puede utilizar la
funcin de suma de los cuadrados (SSQ) en la Calculadora para calcular la
suma de los cuadrados no corregida de una columna o fila. Por ejemplo, usted
est calculando una frmula manualmente y desea obtener la suma de los
cuadrados para un conjunto de variables de respuesta (Y).
Elija Calc > Calculadora e ingrese la expresin: SSQ (C1)
Almacene los resultados en C2 para ver la suma de los cuadrados no
corregida. La siguiente hoja de trabajo muestra los resultados del uso de la
calculadora para calcular la suma de los cuadrados de la columna Y.

2.40

4.60

2.50

C1

C2

Suma de los cuadrados

41.5304

C1

C2

Suma de los cuadrados

1.60

2.20

0.98

4.5. Anlisis de las sumas de cuadrados: opcin


ANOVA
Las Tablas ANOVA o Tablas de Anlisis de la Varianza proporcionan la descomposicin de la variabilidad
de la variable dependiente en dos componentes, la informacin recibida de los regresores y la recibida
de los residuos. Dicha variabilidad puede considerarse respecto al origen o respecto a la media, dando
lugar a dos tipos de tablas ANOVA. En Shazam Professional la opcin ANOVA se ejecuta por defecto, es
decir, que si el usuario no desea que en la salida del comando OLS aparezcan dichas tablas ser
necesario que lo ejecute con la opcin NOANOVA. En la Tabla 4-3 se recoge la salida estndar de la
opcin ANOVA del comando OLS.
Teniendo en cuenta que los estadsticos de seleccin de modelos y los estadsticos F no forman
parte del objetivo de este captulo, se centrar la atencin en la primera columna de las tablas de
Anlisis de la Varianza.
4.5.1. Tabla ANOVA respecto a la media
En la tabla ANOVA respecto a la media aparece recogida la siguiente informacin:
(a) La Suma de Cuadrados de la Regresin (SCR), que es la suma de cuadrados de las
desviaciones de los valores estimados del regresando ( ) respecto a su media muestral ( ).
Por estar el modelo formulado con ordenada en el origen, la media del regresando coincide con la
media del regresando estimado ( ) y, por tanto, se puede calcular como .
(b) La Suma de Cuadrados de los Errores (SCE), que es la suma de cuadrados de las desviaciones
de los valores de los residuos ( ) respecto a su media muestral ( ), que en modelos formulados con
ordenada en el origen es nula, por lo que SCE no es ms que la suma de residuos al cuadrado.

(c) La Suma de Cuadrados Totales (SCT), que es la suma de cuadrados de las desviaciones de los
valores observados del regresando ( ) respecto a su media muestral ( ).
Por estar el modelo formulado con ordenada en el origen SCT es igual a SCE ms SCR, lo que
hace que el coeficiente de determinacin est acotado entre cero y uno.
4.5.2. Tabla ANOVA respecto al cero
Ntese que la nica diferencia con la tabla ANOVA respecto a la media es que en esta tabla, la
suma de cuadrados de las desviaciones no se calclan respecto a las medias sino respecto al cero.
Adems, puede observarse que la suma de cuadrados de las desviaciones de los errores respecto a su
media y respecto al cero coincden, puesto que en modelos formulados con ordenada en el origen, la
media de los residuos es cero.
En la tabla ANOVA respecto al cero aparece recogida la siguiente informacin:
(a) La suma de los cuadrados de los valores estimados del regresando ( .).
(b) La suma de los cuadrados de los errores ( ).
(c) La suma de cuadrados de los valores observados del regresando ( ).
La descomposicin se cumple tanto si el modelo est formulado con o sin ordenada en el origen.
Shazam proporciona la tabla ANOVA respecto al cero para modelos con sin ordenada en el origen,
mientras que la tabla ANOVA respecto a la media slo la proporciona si el modelo incluye regresor
ficticio. Obsrvese que la SCE se puede obtener en ambas tablas ANOVA.

edia cuadrtica o RMS (Root Mean Square) de un conjunto de


valores (X , X ,,X ) es una medida de posicin central. Esta se
1

define como la raz cuadrada del promedio de los elementos al cuadrado.

La media cuadrtica es muy til para calcular la media de


variables que toman valores negativos y positivos. Se suele utilizar
cuando el smbolo de la variable no es importante y lo que interesa es el
valor absoluto del elemento. Por ejemplo, para calcular la media de
errores de medida.
Una aplicacin clsica de la media cuadrtica es la
determinacin del valor

eficaz de

un

parmetro sinusoidal en

electricidad, en corriente alterna (tensin en voltios o intensidad en


amperios).

Ejemplo
Un profesor pide a sus alumnos que realicen un experimento en
el laboratorio. Espera que los alumnos obtengan 5 litros de
cido clorhdrico. Anota en una tabla una columna con las
cantidades de cido obtenidos por cada alumno y en la otra el error por
falta o exceso de la cantidad esperada, de la siguiente manera:

Se representa grficamente los errores de los seis alumnos.

Al profesor no le importa si el error se produjo por falta o por exceso,


sino la cantidad de cido de diferencia respecto a la esperada. Para ello,
utiliza la media cuadrtica:

La media cuadrtica es RMS=0,76.

Relacin entre medias


Existe una relacin de orden entre cuatro tipos de media. En
esta relacin se excluye la media ponderada porque depende de los
pesos. Sean:

H la media armnica

MG la media geomtrica

x la media aritmtica

RMS la media cuadrtica


Entonces:

S-ar putea să vă placă și