Sunteți pe pagina 1din 15

ESTADÍSTICAS

DESCRIPTIVA
EN EDUCACIÒN

Mayra Kenia Ceseña Collins


UNIVERSIDAD PEDAGÓGICA NACIONAL, SUBSEDE 03A C.S.L., B.C.S.
“ESTADÍSTICA DESCRIPTIVA”

MAYRA KENIA CESEÑA COLLINS

DOCENTE

César BERNAL SÁNCHEZ

UNIVERSIDAD PEDAGÓGICA NACIONAL


Subsede 03 A

LIC. EN PEDAGOGÍA
III SEMESTRE

MATERIA

ESADÍSTICA DESCRIPTIVA EN EDUCACIÓN


CABO SAN LUCAS, B.C.S. DICIEMBRE,2018.

INTRODUCCIÒN
La necesidad de análisis de datos, así como reunir información cuantitativa,
relacionado con personas, grupos, series de hechos o algunos temas importantes
de nuestro estado o nuestro país, hubo la importancia de implementar la estadística,
que nos permite deducir, cuantificar y analizar, con una serie de etapas de
recopilación de datos, que nos permite hacer estudios donde nos arrojan
significados y conceptos precisos.

En el siguiente trabajo daremos a conocer una investigación acerca “estadística


descriptiva”, cuyo objetivos son las necesidades reales del hombre. La variada y
cuantiosa información relacionada con éste y que es necesaria para la toma de
decisiones, hace que la estadística sea hoy, una importante herramienta de trabajo.

La intención de la información es con el propósito de desarrollar la estadística,


empleando conceptos básicos para su fácil interpretación, análisis y la plantación
de un ejercicio que nos arrojan la información verídica mediante la comprobación
de gráficas.

ESTADÍSTICA DESCRIPTIVA

Objetivo: El estudiante conocerá fundamentos y técnicas básicas de


estadística, para organizar, representar y analizar datos obtenidos de
una situación simulada o real.
CONCEPTOS BÁSICOS DE ESTADÍTICA.

Definición de estadística.

“La palabra estadística procede del vocablo “estado” pues era función principal de
los gobiernos de los estados establecer registros de población, nacimientos,
defunciones, etcétera. Hoy en día la mayoría de las personas entienden por
estadística al conjunto de datos, tablas, gráficos, que se suelen publicar en los
periódicos.
Definición:
Estadística, rama de las matemáticas que se ocupa de reunir, organizar y analizar
datos numéricos y que ayuda a resolver problemas como el diseño y la toma de
decisiones.
Estadística es un conjunto de métodos científicos para la recopilación,
representación y análisis extraídos de un sistema de estudio, con el objetivo de
poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.”
(Jímenez, 2008)
La estadística se aplica en la selección de datos y el objetivo que quieras conocer,
tomando en cuenta la aplicando test, hipótesis de trabajo y así poder saber, analizar,
o comparar la información obtenida de una situación existente o empírica.
Por ejemplo, los datos obtenidos por el Instituto Nacional de Estadística y Geografía
(INEGI), ahí podemos saber la cantidad de personas que viven en cierta región o
en todo el país, así como cuantas personas van a la escuela, cuantas personas
trabajan etcétera.
Existen dos tipos de estadísticas:
 Estadística descriptiva o deductiva: Es la parte de la estadística que se
ocupa de recopilar, representar y condensar los datos obtenidos del sistema
en estudio, utilizando representaciones gráficas de los datos tabulados.

 Estadística inferencial o inferencia estadística: Utiliza datos de muestra


para hacer inferencias (característica) acerca de un conjunto de datos
grandes de una población de cual se seleccionó la muestra.

Población.
Es el conjunto de todas las muestras posibles que puedan obtenerse del sistema en
estudio de acuerdo al método de selección empleado. Es el total hipotético de los
datos que se estudian o recopilan.

Muestra.

Es un conjunto de datos obtenidos de una población cualquiera, con el método de


recopilación elegido.

Parámetros.

Es toda la magnitud que tiene el mismo valor dentro de una población, no permite
diferenciar entre sí a sus elementos componentes.

Es el conjunto de todas las muestras posibles que puedan obtenerse del sistema en
estudio de acuerdo al método de selección

MEDIDAS DE TENDENCIA CENTRAL

MEDIDAS ARITMÉTICA, GEOMÉTRICA Y PONDERADA

Medida aritmética

En ésta expresión, puede verse que el promedio de un conjunto de números se


calcula sumándolos y luego dividiendo la suma por el número de sumandos. La
estadística promedio representa muy bien el “centro” de la distribución de los datos
cuando se trata de casos “normales”. Entendemos aquí por casos “normales”
aquellos conjuntos de datos que no contienen valores muy extremos, valores muy
alejados de los demás. Debido a que muchas situaciones experimentales, el
comportamiento de los datos es relativamente “normal”, el promedio es muy usado,
convirtiéndose en la primera estadística calculada para representar el “centro” de la
población en estudio.

La Media geométrica G

La media geométrica es el resultado de multiplicar todos los elementos y extraer la


raíz n ésima del producto.

Promedio Ponderado
En muchas ocasiones, las observaciones no tienen la misma importancia relativa.
Para hacer presente este hecho en la búsqueda de un “centro” que represente a los
datos, es necesario signar a cada uno de éstos, una ponderación (peso o
coeficiente) que represente su importancia dentro de la muestra.

MEDIANA

La mediana es un conjunto de números ordenados en magnitud es el valor o la


media de los dos valores centrales

MODA

La moda de un conjunto de números es el valor que ocurre con mayor frecuencia;


es decir, el valor más frecuente. La moda puede no existir e incluso no ser única.
Esta estadística debe usarse con cuidado. Su objetivo es identificar zonas donde se
producen aglomeraciones de datos, sin embargo, podría ser que por el solo hecho
de haber una observación extra en un punto aislado, éste pudiese aparecer como
una moda.

Medidas de posición relativa (cuartiles, deciles y percentiles)

Las calificaciones de los exámenes y ciertos tipos de datos sociológicos con


frecuencia se presentan en una forma que describe la posición de una observación
relativa a las demás observaciones de la distribución.
Si un conjunto de datos está ordenado por magnitud, el valor central (o la media de
los dos centrales) que divide al conjunto en dos mitades iguales en la mediana.
Extendiendo esa idea, podemos pensar en aquellos valores que dividen al conjunto
en cuatro partes iguales.

MEDIDAS DE DISPERSION

MEDIDAS DE POSICIÓN

La descripción de un conjunto de datos, incluye como un elemento de importancia


la ubicación de éstos dentro de un contexto de valores posibles.

Varianza

Cuadrada para poder compararla con la media y otras medidas análogas. Esta es
la idea del desvío estándar o desviación típica. También es la fórmula planteada
por Gauss tiene dos puntos de inflexión simétricos ubicados a una distancia del
centro igual al desvío estándar.

La varianza es el promedio de los cuadrados de las desviaciones de cada elemento


x i, respecto a la media.

La varianza de un conjunto de datos se define como el cuadrado de la desviación


típica y viene dada en consecuencia por S2. Varianza poblacional (s2)

Desviación estándar.

El desvío estándar poblacional y el muestral, se obtiene con la raíz cuadrada de


las respectivas varianzas y Representa el alejamiento de una serie de números de
su valor medio. Se calcula a partir de todas las desviaciones individuales con
respecto a la media.
Para poder conocer o calcular tanto la media como la varianza poblacional, se
necesita conocer la población completa. Esto es imposible en el caso de mediciones
repetidas porque estas son infinitas desde el punto de vista teórico. Analógicamente,
la cantidad total de muestra que se le puede extraer a un paciente, para hacerle una
determinación en el laboratorio, es tan grande que puede ser considerada infinita.

El uso de esta estadística es remendado en aquellos conjuntos de datos que ofrecen


cierto grado de simetría respecto de su centro. En estos casos, habitualmente tiene
sentido medir discrepancias de un valor con el centro de los datos usando múltiplos
de la desviación estándar.

Desviación media.

La desviación media o desviación promedio de un conjunto de N números x1, x 2,…,


x N es abreviada por MD.

Desviación mediana.

Es la media aritmética de los valores absolutos de las desviaciones de los valores


de variable con respecto a la mediana.

Rango

Definido como la diferencia entre el valor máximo y mínimo del grupo de datos. De
fácil calculo y comprensión, tiene desventaja de ser la medida más grosera de la
dispersión.
Dos grupos de datos, con muy distinta dispersión pueden llegar a tener rangos
similares. Uno de ellos puede tener el 99% de los valores junto al mínimo y el otro
99% junto al máximo, pero al tener extremos iguales, sus rangos resultarían a pesar
de ser tan disímiles intrínsecamente.

REGRESION Y CORRELACIONO

OBJETIVO

comprenderá el concepto de correlación y regresión, los expresará


matemáticamente y los usará para tomar decisiones.

Gráfica de los datos.

En la gráfica de los datos es la interpretación que se ha recopilado a través de un


experimento en el cual consiste en la comparación por pares de datos y solo marca
cada dato a través de puntos.

Variables de regresión independientes.

Una de las aplicaciones más importantes de la estadística implica la estimación del


valor medio de una variable de respuesta y o la predicción de algún valor futuro de
y con base en el conocimiento de variables independientes relacionadas x i, x 2,…,
x k.
Definición

La variable por predecir (o por modelar), y, es la variable dependiente (o de


respuesta)

Definición

Las variables que se utilizan para predecir (o modelar), y se denominan variables


Independiente y se denotan con los símbolos x 1, x 2, x 3, etcétera.

Regresión lineal simple.


En el caso de la regresión lineal simple donde hay una sola variable de regresión
independiente x y una sola variable y, los datos se pueden representar mediante
los pares de observaciones {(x 1, y 1); i = 1,2,…n}.

El ejemplo más simple de una aproximación por mínimos cuadrados es el ajuste de


una línea recta a un conjunto de parejas de datos observados.

La expresión matemática de una línea recta es: y = a o+ a1 x + E

Línea de regresión ajustada.

Supuesto I: La medida de la distribución de probabilidad E es 0. Es decir, la media


de los errores a lo largo de una serie infinitamente larga de experimentos es 0 para
cada valor de la variable independiente x. este supuesto implica que el valor medio
de y, E (y), para un valor dado de x es: E (y) = a o + a 1x .

Supuesto II: La varianza de la distribución de probabilidad de E es constante para


todos los valores independiente x.

Supuesto III: La distribución de probabilidad de E es normal.

Supuesto IV: Los errores asociados a cualesquier dos observaciones distintas son
independientes. Es decir, asociado a un valor de y en particular no tiene efecto
alguno sobre los errores asociados de otros valores de y.

Las implicaciones de los tres primeros supuestos pueden apreciarse en la figura


siguiente, que muestra las distribuciones de errores para tres valores específicos de
x, a saber x 1,x 2 y x 3.

ESTIMACIÓN MEDIANTE LA LÍNEA DE REGRESIÓN.

Ecuación de la recta como ajuste de datos.

Se utiliza cuando se requiere hacer estimaciones rápidas y trazar los puntos y


unirlos con una línea recta.

Modelos.

Algoritmo de la ecuación.

MÉTODOS MÍNIMOS CUADRADOS


El significado de mínimos cuadrados consiste en obtener que ajuste a una serie de
datos numéricos, con la condición que la suma de los cuadrados de los residuos
sea mínima posible.

ETAPAS DE LA RECOPILACIÓN DE DATOS.

Etapa 1. Objetos de Consiste en determinar con claridad que es lo que


recopilación quiere lograr con la recopilación y se debe definir
primero los objetos generales del trabajo estadísticos.
Etapa 2. Relevamientos Se trata de listar los bienes necesarios para poder
hacer el trabajo, conviene tener en cuenta los bienes
TANGIBLES e INTANGIBLES.
Etapa 3. Creación de Se habla de fuente propia cuando se extrae lo datos
alternativas mediante mediciones, fuente primaria cuando se
toma datos de otros investigadores y fuentes
secundarias cuando los datos se extraen de
publicaciones.
Etapa 4. Selección de Consiste en determinar cual es el mejor entre n
Etapas de la alternativa alternativas planteadas en la etapa anterior, se
recopilación necesita un método para la adopción de un criterio de
de datos selección.
Etapa 5. Prueba piloto Se sacan unos pocos datos y se analizan las
dificultades no previas, junto con los resultados,
comparando los valores obtenidos con los que se
esperaba tener, se hace una especie de control previo
del sistema.
Etapa 6. Ajustes Se corrigen los principales defectos, como ser:
mejorar el entendimiento y conocimiento del personal,
rediseñar formularios, calibrar equipos de medición,
estimación de la magnitud del error de la medición.
Técnicas de optimización especiales como son los
distintos modelos de la investigación operativa.
Etapa 7. Puesta en Una vez optimizado y ajustado el método de obtención
marcha de datos solo resta en ponerlos en marcha. El
resultado de información que debe de ser presentada
en forma más resumida y comprensible usando tablas.

EJERCICIO
El dueño de una empresa quiere saber las ventas producidas en las diferentes
sucursales del país. Para obtener información se ajusta una línea recta a los
valores de x y y de la siguiente tabla:

Sucursal x y xy x2 y2
1 2 58 116 4 3,364
2 6 105 630 36 11,025
3 8 88 704 64 7,744
4 8 118 944 64 13,924
5 12 117 1,404 144 13,689
6 16 137 2,192 256 18,769
7 20 157 3,140 400 24,649
8 20 168 3,360 400 28,224
9 22 149 3,278 484 22,201
10 26 202 5,252 676 40,804
140 1,299 21,020 2,528 184,393

Fórmula: y = a + bx 2,528x1,299=3,283,872140x21,020=2,942,800
(∑𝓍2)(∑𝑦)−(∑𝑥)(∑𝑥𝑦)
𝑎= 3,283,872-2942,800=341,072
n (∑x2)−(∑𝑥)2

10x2,528=25,28025,280-19,600=5,680
341,072÷5,680=60.0

a = 60.04

(n)/∑𝑥𝑦)−(∑𝑥) (∑𝑦)
𝑏= [10x21,020=210,200]-[140x1,299=181,860]
n (∑x2)−(∑𝑥)2
[210,200-181,860=28,340]
n (∑x 2 ) - (∑y)2 [10x2,528=25,289]-[25,280-19,600=5,680]
28,340÷5,680=4.98

b = 4.98

y = 60.04 + 4.98 (30) = 209.44


y = 60.04 + 4.98 (34) = 229.36
y = 60.04 + 4.98 (39) = 254.26
y = 60.04 + 4.98 (45) = 284.14

Media: x= ∑x= 140÷10=14


y= ∑y= 1,299÷10=129.90
Se calcula la pendiente (línea recta)
∑xy−n xy 2834÷568 = 4.99
𝑏 = ∑x2−n (x)2 = 21,020-(10)(14)(129.90) =

2,528-(10) (14)2

Se calcula la ordenada al origen

a = y - [b x] = 129.99 - [(4.98)(14)]=69.72 129.99 - 69.72= 60.27

Se obtiene la evaluación que mejor se ajusta a la información obtenida.

y = a + [bx ]= 60.27+[4.98(2)=9.96] [60.27+9.96=70.23]


60.27+[4.98(6)=29.88] [60.27+29.88=90.15]
60.27+[4.98(8)=39.84] [60.27+39.84=100.11]
60.27+[4.98(8)=39.84] [60.27+39.84=100.11]
60.27+[4.98(12)=59.76] [60.27+59.76=120.03]
60.27+[4.98(16)=79.68] [60.27+79.68=139.95]
60.27+[4.98(20)=99.60] [60.27+99.60=159.87]
60.27+[4.98(20)=99.60] [60.27+99.60=159.87]
60.27+[4.98(22)=109.56] [60.27+109.56=169.83]
60.27+[4.98(26)=129.48] [60.27+129.48=189.75]
Número x y
1 2 70.73
2 6 90.15
3 8 100.11
4 8 100.11
5 12 120.03
6 16 139.95
7 20 159.87
8 20 159.87
9 22 169.83
10 26 189.75
GRAFICA DE DISPERSÓN

DISPERSIÒN
200
26, 189.75
180
22, 169.83
160 20, 159.87
140 16, 139.95
120 12, 120.03
ventas (y)

100 8, 100.11
6, 90.15
80
2, 70.73
60
40
20
0
0 5 10 15 20 25 30
Nùmero de personas (x)

Se calcula la división estándar de la estimación

𝑺𝒆=√∑𝒚𝟐 −(𝒂.∑𝒚)−(𝒃.∑𝒙𝒚
𝒏−𝟐
184,393-78,290.73-104,889.80= 1,212.43
10-2=8
1,212.43÷8=151.55
√151.55 = 12.31

CONCLUSIÓN

El propósito de la “estadística” es la importancia de la recopilación de datos


obtenidos de la muestra de una población, a lo que significa simplemente entender
mediante cifras, esquemas, graficas la situación de un conjunto de personas en la
sociedad, en un determinado periodo de tiempo para poder tomar alguna decisión
al respecto, obtener información del interés de cada persona o para su evaluación,
y con esto podemos ver la importancia de la estadística para ser aplicada en
diferentes campos.

Existe mucha diversidad donde se aplica la estadística y gracias a ella nos podemos
dar cuenta de las carencias o abundancias, así como los egresos e ingresos, por
mencionar algunos, y con los datos arrojados junto con una serie de fórmulas nos
revela la información más asertiva.

BIBLIOGRAFÍA

Jímenez, U. G. (2008). Probabilidad y Estadística. Antología, Acayucan, Veracruz.

S-ar putea să vă placă și