Sunteți pe pagina 1din 37

CLASE 01: Conceptos básicos

gpomachagua@hotmail.com
Material de Clases © German Pomachagua Perez 7/10/2019
INTRODUCCION

El objetivo fundamental de la estadística es analizar datos y transformarlos


en información para la toma de decisiones

Dato Procesamiento Información

Material de Clases © German Pomachagua Perez 7/10/2019


Mapa conceptual

Material de Clases © German Pomachagua Perez 7/10/2019


Actualmente con el boom de la Big Data, tener nociones
de probabilidad y estadística se ha hecho fundamental. En los
últimos años ha habido un resurgimiento de todo lo
relacionado con estadística , data mining y machine
learning empujados principalmente por la explosión de datos
con que contamos, estos conceptos combinados forman la
base de lo que actualmente se conoce como la Ciencia de
Datos

Material de Clases © German Pomachagua Perez 7/10/2019


¿Cuál es la relación entre Big Data, minería de datos
y Estadística?

Material de Clases © German Pomachagua Perez 7/10/2019


Material de Clases © German Pomachagua Perez 7/10/2019
¿QUÉ ES EL ANÁLISIS MULTIVARIANTE?

Es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente


conjuntos de datos multivariantes en el sentido de que hay varias variables medidas
para cada individuo ú objeto estudiado.
Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio
obteniendo información que los métodos estadísticos univariantes y bivariantes son
incapaces de conseguir.

Material de Clases © German Pomachagua Perez 7/10/2019


¿Qué es Estadística ?

 Es la ciencia que proporciona un


conjunto de métodos, técnicas y
procedimientos para recopilar,
RECOLECTAR
organizar, presentar y analizar datos
con el fin de describirlos o realizar
generalizaciones válidas. ORGANIZAR

 Es una ciencia que constantemente


ANALIZAR
proporciona métodos y técnicas para
mejorar la calidad de las observaciones
científicas, y ayuda a la toma de INTERPRETAR
decisiones en condiciones de
incertidumbre.
DATOS
Material de Clases © German Pomachagua Perez 7/10/2019
¿Qué son DATOS ?
Es el valor de la variable.
Ejemplo :

Datos Unidad de
Variable medida
Edad del paciente 27 años
Peso 70 Kg.
Tiempo permanencia 5 días
Temperatura corporal 37,5 °C
Profesión Contador ---

Si un DATO es útil para tomar decisiones se convierte en INFORMACIÓN.

Material de Clases © German Pomachagua Perez 7/10/2019


Tipos de datos:

1) Datos univariantes se compone de observaciones realizadas en


una sola variable.
Por ejemplo, el tipo de transmisión automática (A) o manual
(M) en cada uno de diez automóviles: M A A A M A A M A A
La siguiente muestra de duraciones en horas de un grupo de
baterías: 5.6, 5.1, 6.2, 6.0, 5.8, 6.5, 5.8, 5.5

2) Datos bivariantes cuando se realizan observaciones en cada


una de dos variables.
El conjunto de datos podría consistir en un par (altura,
peso).

3) Datos multivariantes surgen cuando se realizan observaciones


en más de una variable. El tiempo de procesamiento esta
relacionado al tipo de procesador, disco duro, memoria RAM,
número de núcleos, velocidad del reloj, etc.

Material de Clases © German Pomachagua Perez 7/10/2019


DIVISION DE LA ESTADISTICA

ESTADÍSTICA DESCRIPTIVA-EXPLORATORIA-(Data Analysis)


Tiene como objetivo presentar los datos obtenidos en forma resumida, clara y
comprensible
Ejemplo 1: La cantidad de robos ocurridos el último mes en el distrito de Surco.
Ejemplo 2: La nota promedio del curso de REDES del grupo 1
Ejemplo 3: Electores según ONPE 2018
Número de electores Total
Nacional 23,374,975
Lima 8,019,611
Primera vez 525,790

Mencionamos algunos procedimientos:


Tablas de distribuciones de frecuencia
Gráficos de distribución de frecuencias
Diagramas de cajas
Diagramas de tallos y hojas
Estadísticos de tendencia central, dispersión y de forma

Material de Clases © German Pomachagua Perez 7/10/2019


ESTADÍSTICA DESCRIPTIVA: Algunos procedimientos
Tabla de Frecuencias Grafico de Cajas y Bigotes
<Xi-1 - Xi] fi hi Fi Hi 25

24 46

<38 - - 45] 3 0.14 3 0.14 23 52

<45 - - 52] 2 0.10 5 0.24 22 41


71
47
62

21 43
93
65
28
94

<52 - - 59] 7 0.33 12 0.57


20

<59 - - 66] 3 0.14 15 0.71 19

<66 - -73] 6 0.29 21 1.00

EDAD
18

17

21 1.00 N= 80

HOMBRE
20

MUJER

SEXO

Diagrama de Tallos y hojas Gráficos de distribución de


EDAD Stem-and-Leaf Plot CLUSTER
frecuencias
Frequency Stem & Leaf

1,00 3. 9
3,00 4. 029
8,00 5. 14678889
5,00 6. 34689
4,00 7. 0012

Material de Clases © German Pomachagua Perez 7/10/2019


Material de Clases © German Pomachagua Perez 7/10/2019
DIVISION DE LA ESTADISTICA

Estadística Inferencial ( Data modelling)


Es un conjunto de métodos que permiten efectuar una estimación, predicción o
generalización sobre una población, basado en el análisis de datos de una
muestra.
Inferencia
Muestra POBLACIÓN

Estimador Parámetro

Ejemplo: Real Kola tiene interés en conocer si su nuevo tipo de


bebida energética tendrá aceptación en el mercado limeño

Material de Clases © German Pomachagua Perez 7/10/2019


2016

Material de Clases © German Pomachagua Perez 7/10/2019


DEFINICIONES BASICAS
Unidad Estadística: (Unidad de análisis) el elemento fundamental e
indivisible de la población (persona, animal o cosa), sobre las
cuales se va obtener datos, en otras palabras es el que proporciona
el dato.

Ejemplos: un alumno de la
universidad, un turista nacional,
un turista internacional, una
ama de casa, un supermercado,
una empresa de calzado, un
mozo, un lugar turístico, un
grifo, una persona, una familia
etc.

Material de Clases © German Pomachagua Perez 7/10/2019


Población y muestra

Población Muestra
 TODOS los posibles  PARTE “representativa”
 Individuos, objetos, de la población.
mediciones y conteos  Un ESTADÍSTICO describe
 Un PARÁMETRO describe a una muestra.
a una población.
Diapositiva 17
Material de Clases © German Pomachagua Perez 7/10/2019
POBLACION
Parámetro: Es una medición numérica que describe algunas
características de una población; para determinar su valor es
necesario utilizar toda la información de la población (censo).
Sólo hay un parámetro en cada población.
Generalmente es desconocido y por lo tanto debe ser estimado
Los más usados son:
 : Media poblacional (mu)
2 : Varianza poblacional (sigma cuadrado)
π : Proporción poblacional

Censo: Estudio realizado a todos y a cada


uno de los individuos que forman parte de
la población
Material de Clases © German Pomachagua Perez 7/10/2019
Año 2010 = 35 públicas y 65 privadas =100
Año 2016-2018 = 51 públicas y 92 privadas =143
Año 2018 = Nº de U. Licenciadas 60 al 27/12/18
Material de Clases © German Pomachagua Perez 7/10/2019
Material de Clases © German Pomachagua Perez 7/10/2019
SUELDOS POR CARRERA (ACTUALIZADO 2016

Material de Clases © German Pomachagua Perez 7/10/2019


SUELDOS POR CARRERA (ACTUALIZADO 2016)

Material de Clases © German Pomachagua Perez 7/10/2019


SUELDOS POR CARRERA (ACTUALIZADO 2016)

Material de Clases © German Pomachagua Perez 7/10/2019


Material de Clases © German Pomachagua Perez 7/10/2019
https://www.pqs.pe/actualidad/noticias/cuanto-cuestan-las-universidades-en-peru
Material de Clases © German Pomachagua Perez 7/10/2019
Estas son las universidades privadas con las
pensiones más caras para el 2019

Material de Clases © German Pomachagua Perez 7/10/2019


MUESTRA: Parte o subconjunto representativo de una población, sus
elementos son seleccionados aleatoriamente o no con el objeto de
investigar las características de la población de la cual proceden.

Muestreo: Es un procedimiento de selección de los elementos a ser


estudiados o encuestados
Si
No

Material de Clases © German Pomachagua Perez 7/10/2019


Estimador (estadígrafo): Es una medición numérica que
describe algunas características de una muestra.
Su valor es usado con propósitos de estimación de los
parámetros de una población, de la cual se extrajo la
muestra.
Los más usados son:

: media muestral
varianza muestral
proporción muestral

Ejemplo - De los 100 estudiantes entrevistados, el 70% apoya


la resolución sobre la vacancia del Director

Material de Clases © German Pomachagua Perez 7/10/2019


Ejemplo: El siguiente gráfico muestra la evolución de la inflación desde el año
1980 al 2010. ¿El índice de precios al consumidor IPC que obtiene el INEI, es un
parámetro o un estadígrafo?

Material de Clases © German Pomachagua Perez 7/10/2019


RESUMEN

Población (N) MUESTRA (n)


P E
A S
µ x
R MUESTREO T
A S2 I
M σ2 M
E p A
T INFERENCIA
π D
R O
O R

Material de Clases © German Pomachagua Perez 7/10/2019


Material de Clases © German Pomachagua Perez 7/10/2019
Simbología a utilizar

MEDIDAS POBLACION MUESTRA


(parámetro) (estadístico)
Media aritmética
Varianza
Desviación estándar
Proporción
Tamaño

Material de Clases © German Pomachagua Perez 7/10/2019


Ejemplo 1: Se ha hecho un estudio en el distrito de SJL para
determinar la preferencia de una marca especial de detergente por
parte de las amas de casa. Entre las 50 amas de casa
entrevistadas, 30 dijeron que preferían esta marca.
a) ¿Cual es la unidad de análisis?
b) ¿Cuál es la población?
c) ¿Cuál es la muestra?
d) ¿Cuál es el parámetro?
e) ¿Cuál es el estimador ?
Solución:
a) Una ama de casa del distrito de SJL
b) Todas las amas de casa del distrito de SJL.
c) Las 50 amas de casa
d) Proporción poblacional de mas de casa que prefieren tal
detergente
e) El estimador proporcional

x 30
p    0.6
n 50
Material de Clases © German Pomachagua Perez 7/10/2019
C VARIABLES
u
V
a
a una característica de los elementos que se va investigar y que
Es
l
r
toma diferentes valores o categorías.
i
i
t
a
a
b
t
l
i
e
v
a

Material de Clases © German Pomachagua Perez 7/10/2019


Tipos de variables: Según su naturaleza
 Cualitativas o Categóricas
Son aquellas características que se pueden clasificar, pero no medirse
 Nominales: Si sus valores no se pueden ordenar

 Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

 Ordinales: Si sus valores se pueden ordenar


 Calificaciones, Grado de satisfacción, Intensidad del dolor, la escala de
Mohs (dureza de los minerales comienza de 1 talco hasta 10 diamante)
 Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con
ellos)

 Discretas: Toma valores enteros y no puede tomar una fracción entre dos
valores consecutivos
 Número de hijos, Número de cigarrillos, Numero de accidentes

 Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


 Altura, Presión intraocular, talla, peso

Material de Clases © German Pomachagua Perez 7/10/2019


TIPOS DE VARIABLES:
Según su relación

 Independiente (X): Causal o determinante de los cambios en la v.


dependiente, es manipulada por el investigador.

 Dependiente (Y): Efecto como resultado de la manipulación de


la v. independiente, llamada también como variable resultado.

 Interviniente: Puede mediar en la relación entre las variables


independiente y dependiente
Ejemplo 1: ¿Cuál es la incidencia del nivel de cariño que reciben los
estudiantes de la ciudad de Lima en su rendimiento escolar?

Material de Clases © German Pomachagua Perez 7/10/2019


Titulo: “SISTEMA DE INFORMACIÓN CLIENTE/SERVIDOR CON TECNOLOGÍA WEB
PARA LOS PROCESOS DE MATRÍCULAS Y TRÁMITES DE CERTIFICACIÓN DE LA
ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA DEL INEI -TACNA - 2013”

a) ¿Cuáles son las variables independientes y dependientes?


b) ¿Cual es la unidad de análisis?
c) ¿Cuál es la población?
d) ¿Cuál es la muestra?
e) ¿Cuál es el parámetro?
f) ¿Cuál es el estimador ?
g) ¿Técnicas e instrumentos para la recolección de datos?
h) ¿Tipo de muestreo?

Material de Clases © German Pomachagua Perez 7/10/2019

S-ar putea să vă placă și