Documente Academic
Documente Profesional
Documente Cultură
CONCEPTOS
BSICOS,
PRESENTACIN
INFORMACIN,
MEDIDAS
TENDENCIA CENTRAL Y DISPERSIN.
DE
DE
DATOS
Caractersticas o nmeros que son recolectados
por observacin. No son otra cosa que el producto
de las observaciones efectuadas en las personas
y objetos en los cuales se produce el fenmeno
que queremos estudiar
Los datos estadsticos pueden ser clasificados en
cualitativos,
cuantitativos,
cronolgicos
y
geogrficos
Datos Cualitativos: cuando los datos son cuantitativos, la
diferencia entre ellos es de clase y no de cantidad.
Ejemplo: Si deseamos clasificar los estudiantes que
cursan la materia de estadstica I por su estado civil,
observamos que pueden existir solteros, casados,
divorciados, viudos.
Datos cuantitativos: cuando los valores de los datos
representan diferentes magnitudes, decimos que son
datos
cuantitativos.
Ejemplo: Se clasifican los estudiantes del Ncleo San
Carlos de la UNESR de acuerdo a sus notas, observamos
que los valores (nota) representan diferentes magnitudes.
Datos cronolgicos: cuando los valores de los datos
varan en diferentes instantes o perodos de tiempo, los
datos
son
reconocidos
como
cronolgicos.
Ejemplo: Al registrar los promedios de notas de los
Alumnos del Ncleo San Carlos de la UNESR en los
diferentes semestres.
Datos geogrficos: cuando los datos estn referidos a
una localidad geogrfica se dicen que son datos
geogrficos.
Ejemplo: El nmero de estudiantes de educacin superior
en las distintas regiones del pas
Estadstica Descriptiva:
Tienen por objeto fundamental describir y analizar
las caractersticas de un conjunto de datos,
obtenindose de esa manera conclusiones sobre las
caractersticas de dicho conjunto y sobre las
relaciones existentes con otras poblaciones, a fin de
compararlas. No obstante puede no solo referirse a
la observacin de todos los elementos de una
poblacin (observacin exhaustiva) sino tambin a la
descripcin de los elementos de una muestra
(observacin parcial).
En relacin a la estadstica descriptiva, Ernesto
Rivas Gonzles dice; "Para el estudio de estas
muestras, la estadstica descriptiva nos provee de
todos sus medidas; medidas que cuando quieran ser
perro
gato
perro
hamster
pjaro
hamster
gato
perro
hmster
gato
pjaro
gato
perro
perro
hmster
pjaro
perro
perro
pjaro
gato
A continuacin se
muestra
la
distribucin de frecuencias absolutas, relativas y porcentuales de las mascotas mas comunes de los
nios.
Mascota
Perro
Pajaro
Hamster
gato
Frecuencia absoluta
7
4
4
5
Frecuencia relativa
.35
.20
.20
.25
Frecuencia acumulada
35 %
20 %
20 %
25 %
Estos datos se pueden representar en una grfica de barras o en una grfica de pastel:
Grfica de barras
Grfica de pastel
CONSTRUCCION
ESTADSTICAS
DE
TABLAS
11
1
7
6
6
4
1
8
6
8
6
2
4
4
4
6
4
10
12
6
11
5
4
8
9
3
2
2
1
3
10
4
6
12
7
12
4
2
1
7
4
8
9
7
5
4
4
4
4
5
5
5
6
6
6
6
6
6
6
7
7
7
7
7
8
8
8
8
8
9
9
10
10
10
11
11
12
12
12
12
2) Ordenacin de datos
1
1
1
1
2
2
2
2
3
3
4
4
4
4
4
Rango = 12-1 = 11
3) Tamao de clase
No de clases = 1 + 3.332log (50) = 6
Tamao de clase = 11/6 = 2
4) Lmites de clase
5) Lmites reales de clase
6) Marca de clase
Clase
Intervalo
LRI
LRS
Frecuencia Relativa
LS
2.9
Frecuencia.
Porcentual
LI
1
Frecuencia
Absoluta
0.95
2.95
.16
16 %
1.95
4.9
2.95
4.95
11
.22
22 %
3.95
6.9
4.95
6.95
10
.20
20 %
5.95
8.9
6.95
8.95
10
.20
20 %
7.95
10.9
8.95
10.95
.10
10 %
9.95
11
12.9
10.95
12.95
.12
12 %
11.95
50
100 %
total
Polgono de frecuencias: Forma grfica que representa una distribucin de frecuncias en la forma de
una lnea continua que traza un histograma. Para su elaboracin, se consideran las marcas de clase en
el eje X y las frecuencias absolutas en el eje Y.
Grfica de barras: la grfica de barras es una forma de grfica que utiliza barras para indicar la
frecuencia de ocurrencia de las observaciones. Para construirla se constituye el eje y por las frecuencias
absolutas y el eje X por los lmites inferior y superior de cada clase, dejando un espacio entre barra y
barra.
La tendencia central se refiere al punto medio de una distribucin. Las medidas de tendencia
central se conocen como medidas de posicin.
Media
La media es el punto en una distribucin de medidas, alrededor del cual las desviaciones sumadas son
iguales a cero. Es el valor promedio de una muestra o poblacin. La media es muy sensible a
mediciones extremas que no estn balanceadas en ambos lados. Se pueden calcular diversos tipos de
media, siendo las ms utilizadas:
a)
Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media
geomtrica.
La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc.,
donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores. En todo caso,
la media aritmtica es la medida de posicin central ms utilizada.
Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no
se pierde ninguna informacin.
Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como
geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la
serie. Estos valores anmalos podran condicionar en gran medida el valor de la media, perdiendo sta
representatividad.
Mediana
Observacin u observacin potencial en un conjunto que divide el conjunto, de modo que el mismo
nmero de observaciones estn en cada uno de sus lados. Para un nmero impar de valores, es el
valor de en medio; para un nmero par es el promedio de los dos medios. Para un conjunto con un
nmero par de nmeros, la mediana ser el promedio aritmtico de los dos nmeros medios.
Ejemplo:
Calcule la mediana para los siguientes datos.
La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22.
Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25.
La mediana es 21.
La mediana de una muestra de datos organizados en una distribucin de frecuencias se calcula
mediante la siguiente frmula:
Mediana = LRI + [(n/2 - FA)/f] c
donde L es el lmite inferior de la clase que contiene a la mediana, FA es la frecuencia acumulada que
precede a la clase de la mediana, f es la frecuencia de clase de la mediana e i es el intervalo de clase de
la mediana.
MODA
Clase
Intervalo
LRI
LRS
fx
LI
LS
2.9
0.95
2.95
.16
16 %
1.95
15.60
4.9
2.95
4.95
11
.22
22 %
3.95
43.45
6.9
4.95
6.95
10
.20
20 %
5.95
59.50
8.9
6.95
8.95
10
.20
20 %
7.95
79.50
10.9
8.95
10.95
.10
10 %
9.95
49.75
11
12.9
10.95
12.95
.12
12 %
11.95
71.70
50
100 %
total
319.50
Ejemplo de clculo de media mediana y moda. Para ejemplificar, tomaremos el ejemplo de
autobuses forneos de la pagina 6.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn
los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms
dispersos estn.
Desviacin estndar: Se calcula como raz cuadrada de la varianza.
Continuando con el caso de los autobuses forneos, se realizar el ejemplo de medidas de dispersin.
Clase
Intervalo
LI
LS
LRI
LRS
2.9
0.95
2.95
Frecuencia.
Absoluta
8
Frecuencia
Relativa
.16
4.9
2.95
4.95
11
.22
6.9
4.95
6.95
10
.20
Frecuencia
Porcentual
16 %
fx
f(x-x)2
1.95
15.60
157.71
22 %
3.95
43.45
171.63
20 %
5.95
59.50
354.03
8.9
6.95
8.95
10
.20
20 %
7.95
79.50
632.03
10.9
8.95
10.95
.10
10 %
9.95
49.75
495.01
11
12.9
10.95
12.95
.12
12 %
11.95
71.70
856.82
50
100 %
319.50
2667.21
total
Frecuencia
Antes de tiempo
100
A tiempo
800
Demorado
75
Cancelado
25
Total
1000
10
Ejemplo
Si A es el evento de que un vuelo llegue antes de tiempo, entonces
P(A) = 100 /1000 = 0.1.
Si B es el evento de que un vuelo llegue demorado, entonces
P(B) = 75 /1000 = 0.075.
La probabilidad de que un vuelo llegue antes de tiempo o demorado es
P(A o B) = P(A) + P(B) = .1 + .075 = 0.175.
11
Probabilidad de xito.
Probabilidad de fracaso.
Nmero de xitos deseados.
Nmero de ensayos efectuados.
12
13
14
caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el
sexo, el estado civil, etc.).
Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters
estarn representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn parte
de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la poblacin.
(Tamao geogrfico, sexos, edades,...).
La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede
ser de diferentes tipos:
Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales.
Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en
cada estrato.
Afijacin Optima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se
considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la
desviacin.
o
15
16
17
Este supuesto indica que las perturbaciones no estn correlacionadas. Esto significa que los errores no
siguen patrones sistemticos. La implicancia del no cumplimiento de este supuesto (existencia de
autocorrelacin) implicara que Yt no depende tan slo de Xt sino tambin de _t1, puesto que _t1
determina en cierta forma a _t.
Supuesto 6
La covarianza entre _i y Xi es cero, formalmente:
Cov (_i/Xi ) = E (_i E(_i)) (Xi E(Xi))
= E (_i (Xi E(Xi)))
= E (_i Xi E(Xi) E(_i))
= E (_i Xi)
=0
Este supuesto indica que la variable X y las perturbaciones no estn correlacionadas. Si X y _ estuvieran
relacionadas, no podran realizarse inferencias sobre el comportamiento de la variable endgena ante
cambios en las variables explicativas.
Supuesto 7
El nmero de observaciones debe ser mayor que el nmero de parmetros a estimar.
Supuesto 8
Debe existir variabilidad en los valores de X. No todos los valores de una muestra dada deben ser
iguales.Tcnicamente la varianza de X debe ser un nmero finito positivo. Si todos los valores de X son
idnticos entonces se hace imposible la estimacin de los parmetros.
Supuesto 9
El modelo de regresin debe ser correctamente especificado, esto indica que no existe ningn en el
modelo a estimar. La especificacin incorrecta o la omisin de variables importantes, harn muy
cuestionable la validez de la interpretacin de la regresin estimada.
Supuesto 10
No hay relaciones perfectamente lineales entre las variables explicativas. No existe multicolinealidad
perfecta. Aunque todas las variables econmicas muestran algn grado de relacin entre s, ello no
produce excesivas dificultades, excepto cuando se llega a una situacin de dependencia total, que es lo
que se excluy al afirmar que las variables explicativas son 18inealmente dependientes.
BIBLIOGRAFA
http://www.monografias.com/trabajos15/estadistica/estadistica.shtml#MEDICION
http://www.aulafacil.com/CursoEstadistica/Lecc-3-est.htm
Carpeta Estadstica. Aprenda Fcil. Grupo Patria Cultural.
http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/44/distrinormal.htm
http://server2.southlink.com.ar/vap/MEDIDAS.htm
http://pdf.rincondelvago.com/metodo-de-minimos-cuadrados-ordinarios.html
LUZ CAROLINA ROMERO TURRUBIATES
carito_rt86@hotmail.com
TAMPICO TAMPS. NOVIEMBRE 2005
18
19