Sunteți pe pagina 1din 57

Estadística e Informática

Clase 1
La Estadística se ocupa de
los métodos y
procedimientos para:

Realizar inferencias a
Siempre y cuando la
Recoger, clasificar, partir de ellos, con la
variabilidad e
resumir, hallar finalidad de ayudar a la
incertidumbre sea una
regularidades y analizar toma de decisiones y en
causa intrínseca de los
los datos. su caso formular
mismos.
predicciones
“La Estadística estudia métodos científicos para
recoger, organizar, resumir y analizar datos,
así como para sacar conclusiones válidas y
tomar decisiones razonables basadas en tal
análisis”
• Murray R. Spiegel
FUNCIONES DE LA ESTADISTICA

La Estadística es una herramienta que ayuda a conocer la realidad.

Puede servir para distorsionar la verdad si no se tiene cuidado al usar los métodos
estadísticos adecuadamente .

La famosa la frase del ministro inglés Benjamin Disraeli : Hay tres clases de mentiras que
son: “Las simples, las malvadas y las de la Estadística”.

Utilizan la Estadística en estudios poco serios para darle mayor formalidad científica.

Hacer un análisis cuidadoso que n indique si el contenido y la interpretación son


Correctas o si se ha hecho un mal uso de la Estadística.

ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA Y SUS FUNCIONES Fascículo 1 de: Hugo García Mancilla
Juan Matus Parra (s/f) en http://www.conevyt.org.mx/bachillerato/material_bachilleres/cb6/5sempdf/edin1/edin1_f1.pdf
El objetivo de la Estadística como disciplina, es ayudar a:

c) A partir de la
b) Organizar y
a) Planear la búsqueda información
sistematizar la d) contrastación de
y obtención de la organizada, efectuar
información para su hipótesis.
información. inferencias a través de
descripción y análisis.
la estimación y
PLANEACIÓN.

1. ¿Qué problema me interesa


2. ¿Cómo lo voy a resolver? 3. ¿Para qué lo voy a resolver?
resolver?

La forma más usual para


recolectar datos es mediante Fijar con precisión las variables
Determinar la población o una encuesta, ésta debe que permitirán la resolución del
muestra y fijar las variables elaborarse de tal forma que se mismo y con ello estar en
para su estudio tenga toda la información posibilidad de tomar una
necesaria y evitar la decisión correcta.
innecesaria.
VARIABLES

Cualitativa Cuantitativa

Asociar variables: Relaciona variables

Cualitativa
Cualitativas con Cuantitativas
cuantitativa
Estudio Estadístico

El objetivo final es
inferir
Se realiza un estadísticamente
Se realizan Se recolectan datos
muestreo (se algo sobre la
observaciones de un de cada elemento
selecciona una población,
fenómeno que no se muestreado (por
muestra deseamos concluir
puede predecir con ejemplo a través de
representativa de la algo sobre alguna
anterioridad. un cuestionario).
población). característica de la
población en la que
se realiza el estudio
ESTUDIO ESTADISTICO

Población, Obtengo datos o Descripción e inferencia


representa Muestra información sobre la estadística
representativa variable aplicada o
a todos los es un grupo
sujetos medida
que representa Estadística Descriptiva Estadística Inferencial
posibles de a una población
estudio. Tienen un error
Describe y Infiere que los
Es mas sencillo presenta los resultados Estadísticament Una seguridad del
Precisar el recoger los datos obtenidos obtenidos en e significativo 95% lleva implícito
tamaño datos. Tienen una muestra. Se cuando no es una p < de 0.05. o
probabilidad aplica a una probable que Una seguridad del
que ocurra en la población. haya sido 99% lleva implícita
Tablas
Aplico el población debido al azar. una p < 0.01.
Costo instrumento

Gráficos. Ej. De 100 Ss


Obtengo datos. ocurre en 95
probabilidad de
0.95

Ej. De 100 Ss
puede ocurrir en
99 casos,
probabilidad de
0.99
VARIABLE CUANTITATIVA

DISCRETOS: CONTINUOS:

Si el número de
Si sus posibles Generalmente
posibles valores que Generalmente
valores están en el resultan de un
puede tomar es resultan de un
continuo (números proceso de
contable (número proceso de conteo .
reales). medición
naturales).
VARIABLE CUALITATIVA

Es cuando solamente se busca en ella


una cualidad o un atributo.

Variable cualitativa nominal Variable cualitativa ordinal

Es cuando las
Es aquella que agrupa
categorías en que se
los elementos en
agrupan los
categorías sin tener
elementos, pueden
un orden.
ser ordenados.
•Los resultados del análisis no pretenden ir más
allá del conjunto de datos.
Descriptiva, •Describe, analiza y representa un grupo de datos
utilizando métodos numéricos y gráficos

•Resumen y presentan la información contenida


en ellos.

•Cuando el objetivo del estudio es derivar las


conclusiones obtenidas a un conjunto de datos más
amplio.
Inferencial
•Apoya en el cálculo de probabilidades.

•A partir de datos muestrales, efectúa estimaciones,


decisiones, predicciones u otras generalizaciones
sobre un conjunto mayor de datos.
Estadística Descriptiva:

Tiene como objeto


que un conjunto
Emplea métodos Presentan los
de datos que sus
para: datos con:
características se
vuelvan evidentes.

Técnicas
Organizar. Sumarizar. Describir. Técnicas Gráficas.
Numéricas.

Gráfico de Barras Histogramas


ESTADISTICA INFERENCIAL

Para concluir La Estadística no habrá parámetros en estricto


diremos que existe paramétrica sentido.
La Estadística
otra gran división
de las técnicas Paramétrica
La inferencia
estadística estadísticas:
obtienen VENTAJAS, según
Es un conjunto de A los procedimientos Bradley (1968):
generalizaciones estadísticos que no la
técnicas diseñadas
o se toman a) Estadística para niveles de distribución original de
decisiones en Es un conjunto de la población se les
Paramétrica. técnicas medición menores, denomina
con una desarrolladas para por ejemplo, el procedimientos no 1) Tiene un mínimo conjunto
nominal y ordinal, de suposiciones y esto tiende
información niveles altos de paramétricos o libres a reducir la posibilidad de
parcial o medición como el para efectuar de distribución. utilizarlos inadecuadamente.
b) Estadística No de intervalos. estimaciones no
completa
obtenida Paramétrica.
2) Los cálculos aritméticos
mediante necesarios para la aplicación
son cortos y fáciles, con su
técnicas empleo se puede ahorrar
Los métodos tiempo.
descriptivas paramétricos permiten
hacer inferencias acerca
de parámetros 3. Son fácilmente
comprensibles para personas
poblacionales de las no muy formadas
distribuciones. Estos matemática o
estadísticamente.
métodos fueron los
primeros en ser
desarrollados por los
investigadores de la 4. Cuando los datos que se
van a analizar lson
Estadística. Categóricos u ordinales
CONCEPTOS BÁSICOS

Población: Muestra:

Tipos de
Es un conjunto se clasifican Una muestra muestra
se toman Los
que se quiere en: es un
saber algo. Es el promedios y
conjunto de proporciones
conjunto de medidas u Muestra Muestra
todas las muestrales
a) Población observaciones representativa aleatoria
mediciones de son
finita. tomadas a características
interés al partir de una No es factible
experimentador económicamente medibles de
población las muestras
. Su tamaño se usar a toda la Es un
b) Población respectivas y
denota con la población. subconjunto
infinita Es aquella que se les llama
letra N. de la
se obtiene y estadísticas o
población
cada uno , estadígrafos.
determinar el
tiene la
parámetro
Es imposible misma
que describe
recolectar todas probabilidad
la
las posibles de ser
característica
observaciones en seleccionada.
deseada de la
la población misma.
IMPORTANCIA DEL ESTUDIO ESTADÍSTICO

Lo más importante Finalmente mide la


Después busca el bondad de la
no está en lo que la Un estadístico
mejor método para inferencia.
muestra dice sobre primero diseña la
realizar la inferencia
sus miembros muestra y el
según el muestreo
específicos, sino en experimento para
dado.
cómo hacer minimizar los
inferencias sobre costos de obtener
los miembros de la la información.
población que no
fueron incluidos en
la muestra.
E
S I

T N Procesar •Agrupar
los datos •Clasificar
F
A •Graficar
O •Probar
D
R Hipótesis
I Epi Info •Asociar
M
S SPSS Variables
A
Minitab
T T Stata
I I
C C •Interpretar
•Tomar Decisiones
A A
Estadística Descriptiva
Estadística Descriptiva

La tabla estadística
El conjunto de clases
sirve para presentar
Distribución de junto a las frecuencias
de forma ordenada Gráficos:
Frecuencias: correspondientes a
las distribuciones de
cada una de ellas.
frecuencias.

Variables Discretas:
Variables Continuas:
Barras, sectores,
Histogramas
pictogramas
Estadística Descriptiva

Permite

Describir y agrupar datos

Medidas de Medidas de
Frecuencias. Gráficos:
Tendencia Central Tendencia:

Media
Absolutas (F) Mediana Barras.
Aritmética

Desviación
Relativas (%) Moda. Histogramas
Estándar.

Acumuladas. Cajas y Bigotes

Sectores o pyes
Presentación de Datos Distribución de Frecuencias

Una vez que se han obtenido los datos y que se ha Los datos agrupados en tablas, permiten ver
hecho el estudio de los valores que pueden tomar con facilidad el número de observaciones
las variables, iguales o comprendidos en un intervalo, a
La tarea de la Estadística es la de ordenar y este número de repeticiones iguales de la
presentar los datos en tablas que permitan ver la variable se llama frecuencia y se denota por
tendencia de los mismos. fi.

Ordenados los datos se facilita su representación


en diagramas y gráficas de diferentes tipos.

En esta unidad se verá la forma de describir,


presentar, ordenar, resumir la información en
tablas y su presentación en diferentes tipos de
gráficas.
Tablas de Frecuencia

Los datos recopilados


en la muestra se
Estas tablas muestran:
pueden organizar en
Tablas de Frecuencias.

las clases o categorías


de respuesta de donde El número o proporción
se obtuvieron los datos de veces que la clase se
(o los intervalos de clase encontró en los datos
si los datos son recopilados.
cuantitativos)
Estado Civil Número de ocurrencias Porcentaje
(clase) (frecuencia) (frecuencia relativa)

Soltero 22 22 %

Casado 45 45 %

Divorciado 20 20 %

Viudo 8 8%

Otro 5 5%

Total 100 personas 100 %


Técnicas Gráficas

Graficamos el
Las más
contenido de la
importantes
tabla de
gráficas:
frecuencia.

Pie Barras Histograma Polígono


2%
5% 2%
2% 8%

17% clase 1
clase 2
clase 3
25%
clase 4
clase 5
clase 6
clase 7
clase 8

39%
Gráficas de Columnas o Barras

Se grafican rectángulos
Se puede hacer con la sobre un eje cartesiano en
Se usa con datos
frecuencia o con la donde cada rectángulo
cualitativos o cuantitativos.
frecuencia relativa. representa a cada clase en
la tabla de frecuencia.
25
23

20

15
15

10
10

5
5
3
1 1 1
0
clase 1 clase 2 clase 3 clase 4 clase 5 clase 6 clase 7 clase 8
Histograma

Es exclusiva para datos cuantitativos. De tipo


continua

Se puede hacer con la frecuencia o con la


frecuencia relativa.

Se grafican rectángulos sobre un eje cartesiano en


donde el área de cada rectángulo representa a
cada intervalo de clase en la tabla de frecuencia.

Sirve para comparar las magnitudes representadas


en cada intervalo de clase.
25
23

20

15
15

10
10

5
5
3
1 1 1
0
clase 1 clase 2 clase 3 clase 4 clase 5 clase 6 clase 7 clase 8
Polígono

Se puede hacer Es una gráfica de Sirve para


Es exclusiva para
con la frecuencia punto y línea observar la forma
datos
o con la sobre el eje de la distribución
cuantitativos.
frecuencia cartesiano. de frecuencias.
relativa.
25

23

20

15 15

10 10

5 5
3
1 1 1
0 0 0
0 2 4 6 8 10 12
Grafico de los datos
Sectores
Diagrama de Barras

Pictograma
Histogramas
TÉCNICAS NUMÉRICAS

valores que “resumen” las


Estos son los estadísticos muestrales. características de los datos en la
muestra:

Tendencia Central

Dispersión

Cociente de Variaciòn

Medidas de Posición
LAS MEDIDAS DE POSICIÓN :

Cuartiles: Deciles: Percentiles: Eneatipos:

Son nueve y delimitan Son noventa y nueve


Son tres y delimitan al
al 10%, 20%, ... , 90% y delimitan al 1%, 2%, La distribución
25%, 50% y 75% de
de los datos ... , 99% de los datos dividido en 9 partes
los datos acumulados.
acumulados. acumulados.
Muestra: Probabilística o no probabilística
Se analiza los Resultados y se infiere estos resultados
Parte a la población, pero debe considerarse un error y
una probabilidad

Paramétricos:
Diferencia de medias
Distribución de datos. Correlaciones
Tratamientos Tipo de muestra
se considera Tipo de variable No paraméticos:
Cociente de Variación Asociaciones
Krustal Wallys
Muestra o Distribución de datos
Probabilística:
X ue
•Curva Normal
•Aleatoria Estadístico
e xu •Independencia Paramétrico
Xu
e X e e
u u Estadística
Inferencial

No Probabilística:
•No aleatoria. Estadístico
•No tiene normalidad no
Paramétrico
La probabilidad provee los fundamentos
para la inferencia estadística
Resultados de la
Muestra

ESTADÍSTICA INFERENCIAL
Infiere los resultados
Probabilidad

Extrae conclusiones acerca de toda la población


de la información obtenida Población
de una muestra de esa población.
MUESTREO ESTADISTICO:

Procedimiento para seleccionar una o más


muestras estadísticamente representativas
de la población o poblaciones.

EJEMPLOS DE USO DEL MUESTREO:

Diseño y análisis de
Encuestas. Control de calidad
experimentos.
TIPOS DE MUESTREO

Dos grandes grupos:

Métodos de muestreo no
Métodos de muestreo probabilístico:
probabilísticos No permite para realizar generalizaciones (estimaciones inferenciales sobre
la población), pues no se tiene certeza de que la muestra extraída sea
representativa, ya que no todos los sujetos de la población tienen la misma
probabilidad de se elegidos
UNIDAD • Es la unidad mas simple, de donde se obtendrá la información
DE ANALISIS

MARCO • Es la fuente de donde se obtiene la unidad de análisis


REFERENCIAL

CRITERIO • Son los criterios que se establece para la unidad de análisis para que
DE integre la muestra
INCLUSIÓN

CRITERIO • Son los criterios adicionales que tiene la unidad de análisis que podrían
DE Influir en los resultados
ELIMINACION
Se desea realizar la investigación sobre las características los
de agresores del aula (bullying) de secundaria en el
colegio 448 de Cajamarca

Alumnos agresores del nivel secundaria


1. Unidad de Análisis del colegio 448 de Cajamarca

Padrón de alumnos matriculados en el 2009


2. Marco referencial En el colegio 448 de Cajamarca

Reportado a Dirección Psicoeducativa por agresión


3, Criterio de Inclusión al compañero mínimo 4 veces al mes. Últimos 2 meses
,secundario colegio 448 de Cajamarca

4. Criterio de Exclusión Tenga un problema orgánico o psiquiátrico


Se desea realizar la investigación sobre las características los
de agredidos en el aula (bullying) de secundaria en el
colegio 448 de Cajamarca, año 2000-2007

1. Unidad de Análisis

2. Marco referencial

3, Criterio de Inclusión

4. Criterio de Exclusión
TIPOS DE MUESTREO

•Intencional
No probabilísticas •Sin norma
(prácticos y •Accidental (casos)
Económicos) •Voluntarios

TIPOS

•MAS
Probabilísticas •MS
•ME
•M de C
Tipo de Muestra Característica Conformación

Intencional o Tiene los criterios de inclusión El grupo esta formado


Tienen intención de participar el investigador seleccione
conveniencia directa e intencionadamente los individuos de la población.

Accidental o cuotas Tiene los criterios de inclusión Llegan por “accidente” a la muestra
No tienen la intención de participar inicial.
Mantiene, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad

Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, No tiene un criterio determinado de la
y estos a otros, y así hasta conseguir una muestra suficiente. muestra
Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.

Muestreo Discrecional A criterio del investigador los elementos son elegidos sobre lo El criterio queda a consideración del
que él cree que pueden aportar al estudio investigador
Tipo de Característica Uso Ejemplo
Muestra

Aleatorio simple Todos pueden ser parte Grupo es Sorteo, número


(MAS) de la muestra, no disponible aleatorio, etc.
interesa la distribución
Elijo al azar
Aleatorio Todos pueden ser parte Equilibrar la N:1 000 n: 100
Sistemático de la muestra, me distribución de la i: 1000/100 = 10
interesa la distribución de muestra Mas: 1 al 10 pe: 4
los muestreados Selecciono 4-14-24-34-
…990

Estratificado Se selecciona estratos de Tiene una N: 100 n 20


la población y se característica pero Mujeres 60 Hombre 40
selección proporcional con subgrupos en la Muj: 12 Hom 08
población

Conglomerado Tienen sub.-poblaciones Se agrupan las Rural Urbano


con características sub. poblaciones y
propias se seleccionan
Muestreo Estadístico

Se requiere conocer
Permite determinar Indica el número Se debe de
la media poblacional,
el tamaño de la mínimo de sujetos a considerar el tamaño
se tiene en base a las
muestra a ser participar en la del error y el nivel de
proporciones o por
seleccionado. muestra. probabilidad. A
datos previos
mayor error menor
número de sujetos.
b. Tamaño de muestra:
(Estudios con una sola población)
a. Para estimar una media poblacional

2 2
z  se
n 2
2
Si se conoce N: Z /2 = Coeficiente de confianza = 1,96,
E para un nivel de confianza = 95%

Se = Desviación estándar poblacional


esperada, obtenida de:
n
nf  •Revisión bibliográfica
n •Estudio piloto
1 E = Error absoluto de muestreo
N o precisión (x - ),
asumido por el investigador
N = Tamaño de la población
nf = Tamaño final
(sólo si se conoce N)
Ejemplo:
En cierta población de 1200 escolares se desea estimar el nivel promedio de Hb
con 95% de confianza. En el estudio piloto se encontró: x= 12,3 s = 1,6. Los
investigadores están dispuestos a asumir un E =  0,5 , calcular n.
Solución:
Z /2 = 1,96
Datos: N = 1200 n= (1,96)2 (1,6)2 = 39,33
Se = 1,6
E =  0,5 (0,5)2

nf = 39,33 = 38,05

1 + 39,33/1200

nf  39
Interpretación:
El número mínimo necesario de escolares para realizar el estudio es de 39, si se desea estimar el nivel promedio de Hb en la
población con una precisión de  0,5

Es conveniente sumar el 10% 39 + 4 = 43


b. Para estimar una proporción poblacional

2
z  p q
n 2
2
e e
Si se conoce N:
E

n
nf 
n
1
N
Donde:
 pe = Proporción esperada de sujetos con la característica de interés en la
población de estudio. Se puede obtener de:
• Revisión bibliográfica
• Estudio piloto
• pe = qe = 50% = 0,5

 qe = 1 - pe = proporción esperada de sujetos sin la característica de interés.

 E = Error absoluto de muestreo o precisión


= (p-  ), debe ser asumido por el investigador y es más o menos igual a
5% (0,05)
Ejemplo:
En una población grande se desea estimar la prevalencia de DM. En la revisión
bibliográfica se encontró una p =10%, si se asume un error absoluto de muestreo
de 5%, calcular n.
Solución:
Datos:
Z /2 =1,96
pe =0,1

qe =0,9

E =  0,05
n= (1,96)2 (0,1)(0,9) = 138,3
(0,05)2
n  139

Interpretación:
Si se desea estimar la prevalencia poblacional con 95% de confianza y un error de 5%, se
debe evaluar 139 sujetos.

S-ar putea să vă placă și