Sunteți pe pagina 1din 7

BALOTARIO DE TESIS

La estadstica es una ciencia formal y una herramienta que estudia el uso y los anlisis
provenientes de una muestra representativa de datos, busca explicar las correlaciones y
dependencias de un fenmeno fsico o natural, de ocurrencia en forma aleatoria o condicional
OBJETIVO
El objetivo bsico de la estadstica es hacer inferencia acerca de una poblacin con base a la
informacin contenida en una muestra.
PROPOSITO CENTRAL

El propsito de la estadstica es ensear a registrar, clasificar, redactar y describir a travs


de los nmeros los hechos relevantes, denotando los propios datos o nmeros derivados
de ellos, tales como los promedios. Analiza tambin los datos obtenidos, enunciando las
propiedades comunes a todas las observaciones.
La intencin de esta ciencia es agilizar el proceso de recoleccin y clasificacin de los
datos, para que, la bsqueda de la totalizacin sea ms eficaz y fcil de visualizar y
entender a travs de grficos y tablas representativas
La estadstica descriptiva, se dedica a la descripcin, visualizacin y resumen de datos
originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o
grficamente.
La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones
asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las
observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de
la poblacin bajo estudio
POBLACION Y MUESTRA
Simple: Poblacin es el todo, es el conjunto total de personas. Muestra es una parte de la
poblacin, tomada generalmente de manera aleatoria, para efectos de un estudio, normalmente
estadstico. Por ejemplo, para las encuestas de intencin de voto no se entrevista al 100% de los
votantes, sino que se toma una muestra, buscando equilibrio entre gneros, posicin
socioeconmica, rea geogrfica, etc. y de ah se sacan los porcentajes que nos presentan.
MUESTRA Y MUESTRA REPRESENTATIVA
Decimos que una muestra es representativa, cuando nos da una idea muy proxma y real de lo que
es toda la poblacin, es decir, es una muestra que refleja las caractersticas principales de toda la
poblacin.
MEDIDAS DE POSICION CENTRAL Y EJEMPLOS

a) Medidas de posicin central: informan sobre los valores medios de la serie de datos.

b) Medidas de posicin no centrales: informan de como se distribuye el resto de los


valores de la serie.
a) Medidas de posicin central
Las principales medidas de posicin central son las siguientes:
1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos
tipos de media, siendo las ms utilizadas:
a) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se
repite. La suma de todos estos productos se divide por el total de datos de la muestra:
(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
Xm -------------------------------------------------------------------------------------= n
b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se
multiplican todo estos resultados y al producto fiinal se le calcula la raz "n" (siendo "n" el
total de datos de la muestra).

MEDIDAS DE DISPERSION
Las medidas de dispersin nos informan sobre cunto se alejan del centro
los valores de la distribucin.
Las medidas de dispersin son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de losdatos de una
distribucin estadstica.
Desviacin media
La desviacin respecto a la media es la diferencia entre cada valor de la
variable estadstica y la media aritmtica.
Di = x - x
La desviacin media es la media aritmtica de los valores absolutos de
las desviaciones respecto a la media.

La desviacin media se representa por

Desviacin media para datos agrupados


Si los datos vienen agrupados en una tabla de frecuencias, la expresin de
la desviacin media es:

Varianza
La varianza es la media aritmtica del cuadrado de las desviaciones
respecto a la media de una distribucin estadstica.
La varianza se representa por

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes


expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Propiedades de la desviacin tpica


1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de
que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un nmero la desviacin
tpica no vara.
3 Si todos los valores de la variable se multiplican por
un nmero la desviacin tpica queda multiplicada por dichonmero.
4 Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones tpicas se puede calcular la desviacin tpica
total.
Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica


1 La desviacin tpica, al igual que la media y la varianza, es un ndice muy
sensible a las puntuaciones extremas.
2 En los casos que no se pueda hallar la media tampoco ser posible hallar
la desviacin tpica.
3 Cuanta ms pequea sea la desviacin tpica mayor ser
la concentracin de datos alrededor de la media.
Coeficiente de correlacin lineal

En una distribucin bidimensional puede ocurrir que las dos variables guarden algn tipo de
relacin entre si.
Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy posible que
exista relacin entre ambas variables: mientras ms alto sea el alumno, mayor ser su peso.
El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las
variables. Este coeficiente se aplica cuando la relacin que puede existir entre las varables es
lineal (es decir, si representaramos en un gfico los pares de valores de las dos variables la nube
de puntos se aproximara a una recta).

No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc. En
estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las
variables, por lo que convendra utilizar otro tipo de coeficiente ms apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es representar
los pares de valores en un grfico y ver que forma describen.
El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:

Es decir:
Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores
(x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el resultado obtenido
de todos los pares de valores y este resultado se divide por el tamao de la muestra.
Denominador se calcula el produto de las varianzas de "x" y de "y", y a este produto se le calcula
la raz cuadrada.
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La
correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la otra).
La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1.

Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de
correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere decir
obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que este
resultado podra haberse debido al puro azar.

Regresin lineal

Representamos en un grfico los pares de valores de una distribucin bidimensional: la variable "x"
en el eje horizontal o eje de abcisa, y la variable "y" en el eje vertical, o eje de ordenada. Vemos
que la nube de puntos sigue una tendencia lineal:

El coeficiente de correlacin lineal nos permite determinar si, efectivamente, existe relacin entre
las dos variables. Una vez que se concluye que s existe relacin, la regresin nos permite definir
la recta que mejor se ajusta a esta nube de puntos.

Una recta viene definida por la siguiente frmula:

y = a + bx
Donde "y" sera la variable dependiente, es decir, aquella que viene definida a partir de la otra
variable "x" (variable independiente). Para definir la recta hay que determinar los valores de los
parmetros "a" y "b":
El parmetro "a" es el valor que toma la variable dependiente "y", cuando la variable
independiente "x" vale 0, y es el punto donde la recta cruza el eje vertical.

El parmetro "b" determina la pendiente de la recta, su grado de inclinacin.


La regresin lineal nos permite calcular el valor de estos dos parmetros, definiendo la recta que
mejor se ajusta a esta nube de puntos.
El parmetro "b" viene determinado por la siguiente frmula:

Es la covarianza de las dos variables, dividida por la varianza de la variable "x".


El parmetro "a" viene determinado por:

a = ym - (b * xm)
Es la media de la variable "y", menos la media de la variable "x" multiplicada por el parmetro "b"
que hemos calculado.

S-ar putea să vă placă și