Documente Academic
Documente Profesional
Documente Cultură
Ingeniería
Estadística
Consideraciones Generales
El término estadística se deriva del latín status, que significa estado o situación.
Ciencia de las matemáticas encargada de analizar el comportamiento de unapoblación
………
……..mediante un estudio cuyo propósito es hacerinferencias ( predicciones sobre un
comportamiento de dicha población) a partir de un subconjunto de datos, llamadomuestra ,
tomados de la mencionada población.
La estadística descriptiva se encarga a su vez de reunir, organizar y analizar datos numéricos,
así como ayudar a diseñar experimentos
Consideraciones Generales
Datos son valores de medidas hechas sobre un o más fenómenos. Cada fenómeno medido es
una variable
la cual puede ser cualitativa o cuantitativa y ésta ultima puede ser discreta o continua.
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden
realizar operaciones aritméticas con ella.
Una variable cualitativa es aquella que representa una característica de calidad del
fenómeno medido. Ejemplo: candidatos en una elección, color, sabor, etc.
Las formas más comunes de resumir datos son tablas y gráficos. En ambos casos, se
muestra la frecuencia con la que un valor de una variable ha ocurrido en un
experimento dado. En otras palabras, muestran la frecuencia de los resultados.
Métodos Gráficos
Ejemplo: los resultados del experimento anterior se pueden registrar en una tabla y en
una gráfico. La variable es : número de partículas de oro; los valores de la variable son 0,
1, 2, 3 y 4:
Número de Frecuencia
partículas
0 10
1 6
2 5
3 2
4 1
total 24
Permeabilidad Número de
(mili darcy) muestras
20 - 22 6
22 - 24 15
24 - 26 40
26 - 28 30
28 - 30 9
total 100
4/2/2018 Jaime Ortega 12
Estadística
2 Formas Simples de Resumir datos
Curva de Frecuencias
Si hay muchas observaciones, el histograma se puede reemplazar por una curva suave
que pasa por las intersecciones de los valores de frecuencia con los representantes de
clase.
Consiste en agrupar datos sumando las observaciones de una clase con las de la
anterior. Ejemplo: de la tabla anterior se tiene:
P er m eab i l i d ad N ú m er o d e F r ecu en ci a
( m i l i D ar cy ) m u estr as A cu m u l ad a
20 - 22 6 6
22 - 24 15 21
24 - 26 40 61
26 - 28 30 91
28 - 30 9 100
Los más simples son de dos tipos: medidas de locación o tendencia central y medidas de
dispersión.
Medidas de Posición Central
Son lamedia ,mediana ymoda .
Estas medidas asumen la representatividad del conjunto de datos.
La Media
La Media
Si los datos están tabulados en frecuencias la formula de cálculo es:
N
_ f i yi
i 1
y = N
fi
i 1
La Media Ponderada
También conocida como promedio ponderado, es una media aritmética en donde cada
uno de los valores se pondera de acuerdo con su importancia en el grupo en general.
yis
Esto es, que a cada valor e mu l
tipl
icap orel f
ac to
rde pon de r
a ci
ó n correspondient ew
,
i,
tras de locua llosp r
o du ct
osse sum an para poste r
io
rm ente dividir
s e entrela suma d e
l
a sp ond eraciones.
La fórmula de cálculo es:
n
_ wi yi
i 1
y = n
wii 1
La Media Ponderada
Ejemplo: Se tiene cuatro de líneas de productos: A B, C, D y cada línea deja un margen de
utilidad y tiene un cierto nivel de ventas, según se muestra en la tabla abajo. Cual es la
media del margen de utilidades?
Producto en % (w) y w
i 1
i i
s (y)
A 4.2 30,000 126,000
B 5.5 20,000 110,000
C 7.4 5,000 37,000
D 10.1 3,000 30,300
Total 58,000 303,300
La Media Aritmética
_
4 .2 5 . 5 7 . 4 10 . 1
y (arit) = 6 .8 %
4
_
303 , 300
La Media Ponderada y = 5 , 23 %
58 , 000
Utilizar la media aritmética de 6.8 % es asumir –erróneamente- que todos los productos
tienen el mismo volumen de ventas y que se puede esperar un margen de utilidad de 6.8%
para todos.
Ejercicio: calcular la media ponderada de los habitantes de La Paz, Oruro y Cochabamba.
La Mediana
Siy1
,
y
2,
y,
…
3.
y
ns
o
nl
o
sd
at
o
sd
e
un
a
m
ue
s
t
r
a
or
d
en
a
d
a,
en
t
on
c
e
s
:
Ejemplo: un estudio de gente afectada por una enfermedad reveló que la mayoría de las
personas afectadas estaban por debajo de los dos años y por encima de los setenta;
seria por tanto engañoso concluir simplemente que el "promedio de edad de la gente
afectada es 36 años" sabiendo que los datos están dispersos sobre casi todo el rango de
la vida humana.
Es importante saber cuan dispersos están los datos pues:
Toda medida de posición central, para tener una adecuada interpretación, debe estar
acompañada de una de dispersión. Las más comunes son: elrango , ladesviación media
absoluta , la
varianza , la
desviación estándar y elcoeficiente de variación .
El Rango
n
y y
i
M .A .D =
i =1 n
Ambas dan una medida de la dispersión de los datos alrededor de la media. Cuando los
valores estén más alejados los unos de los otros, mayor será el valor de la Varianza y de
la desviación estándar.
La desviación estándar tiene las mismas unidades que las medidas originales y por esta
razón se la prefiere como un estadígrafo de dispersión; sin embargo, para propósitos de
análisis teórico y de cálculo, se trabaja generalmente con varianzas.
4/2/2018 Jaime Ortega 28
Estadística
La Varianza Muestral y la Desviación Estándar
Aproximadamente 95% de
los valores estará dentro de
±2 desviaciones estándar a
partir de la media
Estadística y Probabilidad
Estadística y Probabilidad
Una situación real implica el conocer varios parámetros o variables (en el ejemplo anterior el
parámetro esp ).
Si éstos no se conocen y tienen que ser estimados a partir de datos experimentales, se está
en presencia de unproblema estadístico .
Una ves que dichos parámetros han sido estimados, ellos pueden ser utilizados para deducir
el comportamiento de una población mediante la solución a unproblema probabilístico
Estadística y Probabilidad
En resumen:
Cuando se pueda asegurar que se cumple elpostulado de indiferencia , es decir que todos los
sucesos elementales o posibles resultados de un experimento son igualmente posibles y
mutuamente excluyentes (no pueden ocurrir dos al mismo tiempo) entonces se define que la
probalidad de ocurrencia de un evento cualquiera (a) se la puede estimar mediante:
Definiciones y Conceptos
Probabilidad de La Place
Se observó que en 9 de cada 50 vehículos que pasan por una cierta esquina, los
conductores no tienen cinturón de seguridad. Si un vigilante de tránsito se para en esa
misma esquina en un día cualquiera ¿Cuál será la probabilidad que detenga un vehículo
sin cinturón de seguridad?
frecuencia observada de casos favorables 9
P (a) 0 . 18
frecuencia observada de casos posibles 50
Tanto el enfoque clásico (teórico) como el enfoque empírico conducen a valores objetivos
de probabilidad, en el sentido de que los valores de probabilidad indican en el largo plazo
la tasa relativa de ocurrencia del evento.
Definiciones y Conceptos
del Punto Muestral
Probabilidad Puntual o Probabilidad
Ejemplos:
1.- Se lanza una moneda regular (experimento), el Espacio Muestral es Cara yCruz , es decir Ca
y Cr. La probabilidad de ocurrencia deCara es igual a la deCruz y se denota por:P(Ca) = P(Cr) =
1/2 .
Definiciones y Conceptos
Probabilidad del Punto Muestral
2.- Se lanzan dos dados. El Espacio Muestral consiste de 36 combinaciones que se muestran
abajo.
1,1 1,2 1,3 1,4 1,5 1,6
2,1 2,2 2,3 2,4 2,5, 2,6
3,1 3,2 3,3 3,4 3,5 3,6 Cada uno de los 36 puntos
4,1 4,2 4,3 4,4 4,5 4,6 muestrales tiene la misma
probabilidad de ocurrencia.
5,1 5,2 5,3 5,4 5,5 5,6
Por la simple inspección de la
6,1 6,2 6,3 6,4 6,5 6,6 tabla anterior se tiene que:
6/36
P(suma de dos dados sea siete u once) = + 2/36 = 2/9 Retur
4/2/2018 Jaime Ortega n 41
Teoría de Probabilidades
Dos eventosE1
E
ys
o
2n
mu
t
ua
m
e
nt
e
ex
c
l
uy
e
n
te
s
s
ia
mb
o
s
n
op
u
e
d
en
o
c
u
r
ri
r
al
mi
s
mot
i
e
mp
o.
Enté r
m i
n osde
p
ro
b
a
bi
l
i
da
de
s
t
o
se
e
xp
r
es
a
po
r
:
P(E1
óE
=
)
2P
(
E
1)
+
P(
E
2)
Dos eventosE1
E
yn
2o
s
o
nm
u
t
ua
m
en
t
e
ex
c
l
uy
e
n
te
s
s
i
am
bo
sp
u
e
d
e
no
c
u
r
ri
r
al
mi
s
mo
ti
em po.En tér
m
i
no
s
de
p
ro
b
a
b
i
l
id
a
de
s
t
o
se
ex
p
r
es
a
p
o
r:
P(E1
óE
)
=
2P
E
(
1+
P
)(
E
)
2-
PE
y
(
1E
)
2
Donde P(E1
y
E)
e
2s
l
ap
r
ob
a
b
i
l
i
da
dq
u
e
a
mb
o
s
ev
e
n
t
os
o
c
ur
r
a
n.
4/2/2018 Jaime Ortega 42
Teoría de Probabilidades
Posibles resultados de E1
(1,6), (2,5), (3,4), (4,3) (5,2), (6,1) P (E1
=
)6
/
3
6
Posibles resultados de E1
E
y(3,4), (4,3)
2 P (E1
yE
)
2=
2
/
3
6
ComoE1
E
ys
o
2n
e
ve
n
t
o
sm
u
tu
a
m
e
nt
e
ex
c
l
uPe
y
e
n
ts ∩
(E:
1E=
)
20
P(E1
/
E
2)
=
P(
E
1∩
E
2)
/
P
(E
)
2
Ejemplo: Se lanzan dos dados, dado que al menos un dado es 3, cual es la probabilidad que la suma
sea 7?
E2 =alm eno su ndado e s3=1 1/36E1 = l
a s umaes 7 =2/36 por tanto:
P(E1
/
E
2)
=
P(
E
1∩
E
)
2/
P
(
E
2)
=
(
2/
3
6)
/
(
11
/
36
)
=
2/
1
1
E2
=
la
c
om
p
u
t
a
d
or
a
es
n
ue
v
a
=7
0
/
1
0
0E1
=l
a
co
mp
u
t
a
d
or
a
es
C
a6
n
o
n
=0
/
1
0
0
Nota .- Existe una creencia popular llamada "ley del promedio". Según esto, si en el primer
lanzamiento la suma fue 7, la probabilidad que la suma sea 7 en el segundo lanzamiento es
menor. Esto implicaría que los dados tienen algún tipo de memoria !
El número de maneras en las cuales se puede seleccionarr objetos de n distintos, sin tomar
en cuenta el orden de selección
n n!
C r r
n
La formula de cálculo es:
(n r )! r !
5 (100 5 )! 5!
La definición formal menciona que una variable aleatoria o variable estocástica es una función
que asigna un valor, usualmente numérico, al Espacio Muestral de un experimento aleatorio
Ejemplo 1:
Ejemplo 2:
Distribuciones de Probabilidad
La distribución de probabilidad de una variable aleatoria, es una función que asigna a cada
valor posible de dicha variable aleatoria, una probabilidad de ocurrencia del mencionado
valor.
Distribución de Probabilidades Discreta
En términos matemáticos:
Ejemplo: Se desea realizar un estudio sobre el número de crías en una camada de algún
mamífero. Se sabe que el número máximo de crías es 3.
P(Y=0) = 0.2
P(Y=1) = 0.3
P(Y=2) = 0.3
P(Y=3) = 0.2
Ejemplo: Se desea realizar un estudio sobre el número de crías en una camada de algún
mamífero. Se sabe que el número máximo de crías es 3.
P(Y=0) = 0.2
P(Y=1) = 0.3
P(Y=2) = 0.3
P(Y=3) = 0.2
Ejemplo: Se desea realizar un estudio sobre el número de crías en una camada de algún
mamífero. Se sabe que el número máximo de crías es 3.
Supóngase que se repiten n veces un experimento el cual puede ser un éxito, con
probabilidadp , o un fracaso con probabilidad(1-p) .
Como hay que considerar todas las maneras posibles de obtener r -éxitos y (n-r ) fracasos, el
total de posible combinaciones de éxitos y fracasos es:
n
C r
Media
n r
n
p (1 p ) np
r
E (Y ) C r r
r 0
Media
Es importante notar que si una población puede ser descrita por una distribución Binomial,
entonces el valor esperado de la distribución es igual al valor teórico de la media poblacional,
es decir:
E (Y ) np
Varianza
Varianza
Al igual que en el caso de la media, si una población puede ser descrita por una distribución de
probabilidades, entonces el entonces la Varianza de la distribución es igual a la Varianza
poblacional. Es decir:
i
2 2
( y ) pi
i 1
Distribuciones Continuas
Observaciones
Observaciones
3.- Cuando la variable aleatoria es
continua, sólo se puede encontrar
la probabilidad de observar un
valor en un cierto rango lo que
implica que el valor fde (Y) NO ES
LA PROBABILIDAD de observar Y.
Esto último se debe al hecho que
Y de no son
los valores posibles
contables, no se puede hablar del
Y de y por lo tanto
i-ésimo valor
p Yi ( ) no tiene significado alguno.
xo
F (Y ) f ( y ) dy
Valor Esperado (Media) El valor esperado de una variable aleatoria continua esta dado por:
E (Y )
y f ( y ) dy
Varianza La Varianza de una variable aleatoria continua esta dada por:
E [ (Y ) ) 2 E (Y )
2
V ar i an z a ( Y ) ] (Y f ( y )dy d on d e
( y )
2
1
f ( y) e 2
2
co n y
( 2 )
E (Y ) y V ar i an za ( Y )
Lo anterior indica que los parámetros que caracterizan a la distribución normal,μ y
σ2 , son la esperanza y Varianza deY , respectivamente.
En el intervalo[ μ − σ , μ + σ ] se encuentra
comprendida aproximadamente, el 68,26% de la
distribución
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
Para saber el área debajo de la curva entre 0 y 0.45, se ubica la intersección de fila de 0.4 y la
columna 0.05, que corresponde al valor 0.1736. Como la curva es simétrica, la tabla también
es válida para -0.45y 0, que también tiene un área de 0.1736.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
Tablas de la
Distribución
Normal
Estándar
Retorno
Tablas de la
Distribución
Normal
Estándar
Se sabe que los pesos individuales de tornillos de un cierto lote se distribuyen normalmente
con media μ = 2.10 gramos y desviación estándarσ = 0.15 gramos. Qué proporción
(probabilidad) de tornillos pesará más de 2.55 gramos?
Se concluye que solo 91 % de las barras tiene una resistencia mayor a 20 y por tanto el
lote no cumple con las especificaciones del cliente.