Documente Academic
Documente Profesional
Documente Cultură
1.
2.
3.
4.
5.
6.
7.
8.
9.
NDICE
Definicin de Estadstica
Conceptos generales
Tratamiento de la informacin
Representacin de los datos
Medidas de centralizacin
Medidas de dispersin
Estadstica bidimensional
Correlacin
Regresin
Definicin de Estadstica : la palabra estadstica procede del vocablo "estado" pues era
funcin principal de los gobiernos de los estados establecer registros de poblacin ,
nacimientos , defunciones , etc . Hoy en da la mayora de las personas entienden por
estadstica al conjunto de datos , tablas , grficos , que se suelen publicar en los
periodicos .
En la actualidad se entiende por estadstica como un mtodo para tomar decisiones , de
ah que se emplee en multitud de estudios cientficos .
La estadstica se puede dividir en dos partes :
- Estadstica descriptiva o deductiva , que trata del recuento , ordenacin y
clasificacin de los datos obtenidos por las observaciones . Se construyen tablas y
se representan grficos , se calculan parmetros estadsticos que caracterizan la
distribucin , etc.
- Estadstica inferencial o inductiva , que establece previsiones y conclusiones
sobre una poblacin a partir de los resultados obtenidos de una muestra . Se apoya
fuertemente en el clculo de probabilidades .
Poblacin : es el conjunto de todos los elementos que cumplen una determinada
caracterstica . Ejemplo : alumnos matriculados en COU en toda Espaa .
Muestra : cualquier subconjunto de la poblacin . Ejemplo : alumnos de COU del
Sotomayor .
Carcter estadstico : es la propiedad que permite clasificar a los individuos , puede
haber de dos tipos :
- Cuantitativos : son aquellos que se pueden medir . Ejemplo : n de hijos , altura ,
temperatura .
- Cualitativos : son aquellos que no se pueden medir . Ejemplo : profesin , color de
ojos , estado civil .
Variable estadstica : es el conjunto de valores que puede tomar el carcter estadstico
cuantitativo ( pues el cualitativo tiene "modalidades'' ) . Puede ser de dos tipos :
- Discreta : si puede tomar un nmero finito de valores . Ejemplo : n de hijos
- Continua : si puede tomar todos los valores posibles dentro de un intervalo .
Ejmplo : temperatura , altura .
Frecuencia absoluta fi : ( de un determinado valor xi ) al nmero de veces que se repite
dicho valor .
8
7
6
5
4
3
2
1
0
0
Notas
Polgono de frecuencias
frecuencias absolutas fi
8
7
6
5
4
3
2
1
0
0
notas
Diagrama de sectores
0
1
1
1
7
5
3
4
5
6
7
8
Cartogramas
Pirmides de poblacin
Diagramas lineales
Pictogramas
CLCULO DE PARMETROS :
Medidas de centralizacin :
Media aritmtica :
x + x 2 + ..... x i
x= 1
=
N
N
x 1f1 + x 2 f 2 + ..... x i f i
=
si son muchos valores pero se repiten mucho
f1 + f 2 + ......
N
En el caso de que los datos estn agrupados en clases , se tomar la marca de clase
como xi .
No siempre se puede calcular la media aritmtica como por ejemplo cuando los
datos son cualitativos o los datos estn agrupados en clases abiertas .
Ejemplo : hacer los clculos para el ejercicio de las notas
x=
La moda si sirve para datos cualitativos , pero no tiene por qu situarse en la zona
central del grfico .
Ejemplo : en el ejercicio de las notas la moda sera x=8
Medidas de dispersin :
Rango o recorrido : es la diferencia entre el mayor valor y el menor . Depende
mucho de los valores extremos por que se suele utilizar el rango intercuartlico =
Q3 - Q1 o el rango entre percentiles = P90 - P10
Ejemplo : Para el caso de las notas sera 9 - 0 = 9
2
2
f1 (x 1 x ) + f 2 (x 2 x ) + ....... f i (x i x )
s =
=
f 1 + f 2 + ....
N
Al igual que la media en el caso de que los datos estn agrupados en clases , se
tomar la marca de clase como xi .
Otra forma de calcular s2 es :
2
s =
f (x
i
x)
f (x
=
i
2
i
+ x 2 2x i x
) = f x
i
2
i
+ x 2x =
2
f x
i
2
i
x2
N
N
N
N
Se llama desviacin tpica s a la raz cuadrada de la varianza . Es ms til que la
varianza ya que tiene las mismas dimensiones que la media
Ejemplo : Hacer los clculos para el ejercicio de las notas
-
C.V. =
x
DISTRIBUCIONES BIDIMENSIONALES :
y1
y2
.....
ym
fi*
x1
f11
f12
.....
f1m
f1*
x2
f21
f22
......
f2m
f2*
......
......
......
......
......
......
xn
fn1
fn2
......
fnm
fn*
f*j
f*1
f*2
......
f*m
f**=N
Diagramas de dispersin :
Si hay pocos datos ( tabla de dos columnas ), se representan las variables en los ejes x e
y.
Si hay muchos datos pero muy agrupados ( tabla de tres columnas y tablas de doble
entrada ), se hace igual pero con los puntos ms gordos segn la fi ,o se pintan muchos
2
2
x=
y=
sx =
sy =
N
N
N
N
Aparece un parmetro nuevo que es la covarianza que es la media aritmtica de las
desviaciones de cada una de las variables respecto a sus medias respectivas .
f i (x i x )(y i y ) = f i x i y i x y
s xy =
N
N
- Cuando hay muchos datos ( tablas de doble entrada )
x i f ij
y j f ij
y jf * j =
x i f i* =
x=
y=
N
N
N
N
2
2
f ij (x i x )
f i* (x i x ) =
s 2x =
= f ij x i2 x 2
N
N
2
2
f ij (y j y )
(
)
f
y
*
j
j
s 2y =
=
= f ij y 2j y 2
N
N
f ij (x i x )(y j y) = f ij x i y j x y
s xy =
N
N
Correlacin o dependencia : es la teora que trata de estudiar la relacin o dependencia
entre las dos variables que intervienen en una distribucin bidimensional , segn sean
los diagramas de dispersin podemos establecer los siguientes casos :
- Independencia funcional o correlacin nula : cuando no existe ninguna relacin
entre las variables .( r = 0 )
- Dependencia funcional o correlacin funcional : cuando existe una funcin tal
que todos los valores de la variable la satisfacen ( a cada valor de x le corresponde
uno solo de y o a la inversa ) (r = 1)
- Dependencia aleatoria o correlacin curvilinea ( lineal ): cuando los puntos del
diagrama se ajustan a una linea recta o a una curva , puede ser positiva o directa , o
negativa o inversa ( -1<r<0 0<r<1)
Ejemplo : a 12 alumnos de COU se les toma las notas de los ltimos exmenes de
Matemticas , Fsica y Filosofa :
Matemticas
2
3
4
4
5
6
Fsica
1
3
2
4
4
4
Filosofa
2
5
7
8
5
3
6
7
7
8
10
10
6
4
6
7
9
10
4
6
7
5
5
9
Si representamos las variables matemticas- fsica en un diagrama y matemticasfilosofa en otro vemos que la correlacin es mucho ms fuerte en el primero que en el
segundo ya que los valores estn ms alineados .
Coeficiente de correlacin lineal : es una forma de cuantificar de forma ms precisa el
ttipo de correlacin que hay entre las dos variables .
s xy
r=
sxsy
Regresin : consiste en ajustar lo ms posible la nube de puntos de un diagrama de
dispersin a una curva . Cuando esta es una recta obtenemos la recta de regresin lineal
, cuando es una parbola , regresin parablica , cuando es una exponencial , regresin
exponencial , etc . ( logicamente r debe ser distinto de 0 en todos los casos ) .
s xy
La recta de regresin de y sobre x es : y y = 2 ( x x ) en la cual se hace mnima
sx
la distancia entre los valores yj obtenidos experimentalmente y los valores tericos de y.
s xy
A valor 2 se le llama coeficiente de regresin de y sobre x ( nos da la pendiente de
sx
la recta de regresin ).
s xy
La recta de regresin de x sobre y es : x x = 2 ( y y) en la cual se hace mnima
sy
la distancia entre los valores xi obtenidos experimentalmente y los valores teoricos de x.
s xy
A valor 2 se le llama coeficiente de regresin de x sobre y ( su inversa nos da la
sy
otra pendiente ) .