Sunteți pe pagina 1din 31

APUNTES DE PROBABILIDAD Y

ESTADÍSTICA

Darwin Leguisamo
CURSO 2017 LICEO TOMÁS BERRETA
Capítulo 1-Introducción a Estadística Descriptiva

Capítulo1: Estadística Descriptiva


Ejemplos de posibles fenómenos a estudiar
 Producción lechera anual (vacuna) en departamento de Canelones.
 Ingresos de los núcleos familiares de la localidad de Progreso.
 Índice de repetición en los liceos del departamento de Canelones.

Individuo o Elemento: Individuo se considera a toda persona,


objeto o dato que es poseedor de la información buscada.
Población: es el conjunto completo de individuos, objetos o datos que el
investigador está interesado en estudiar.

Si es interés del gobierno obtener datos sobre la desocupación y los


niveles de ingresos, mes a mes. ¿Les parece razonable encuestar a todos
los habitantes del país cada mes? Sabemos que estos datos están
presentes y actualizados regularmente, ¿Cómo crees que se obtienen?
Muestra:
El muestreo es una herramienta de la Investigación científica, cuya función
básica es determinar qué parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población.
La muestra, que es un subconjunto de la población, debe lograr una
representación adecuada de la población, en la que se reproduzca de la
mejor manera los rasgos esenciales de dicha población que son
importantes para la investigación. Para que una muestra sea
representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, es decir ejemplificar las
características de ésta.

1
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

 Conveniencia de la
muestra: económica,
temporal, practicidad.
 Características: La
muestra tiene que ser
representativa de la
Población, para ello debe
ser proporcional y
conservar las
características de la
población. (dar ejemplos)
 Obtención: Obtener la muestra es quizá una de las etapas más
importantes del estudio. En ella radica la precisión y efectividad de
los resultados obtenidos, recordemos que a partir de la muestra
intentamos describir a la Población.

Técnicas habituales de muestreo:


Haremos referencia a los muestreos probabilísticos, que son aquellos que
se obtienen a partir de un procedimiento aleatorio y no están
condicionados por la subjetividad. Estos procedimientos permiten hacer
inferencias estadísticas sobre la población.
Muestro aleatorio simple:

Con reposición: Sin reposición:


Se enumeran los elementos de la Se enumeran los elementos de la
población y se seleccionan población y se seleccionan
mediante un procedimiento mediante un procedimiento
aleatorio. En este caso el aleatorio. En este caso el
elemento seleccionado se vuelve elemento seleccionado no vuelve
a tener en cuenta para la nueva a ser tenido en cuenta para la
elección. nueva elección.

2
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

Muestreo aleatorio sistemático:


Se enumeran los elementos de la población, se elige por sorteo un
𝑁
elemento (N0). Luego se determina el coeficiente 𝑘 = (si no resulta ser
𝑛
entero, tomamos el entero más cercano), donde N es el número de
elementos de la población y n es el número de elementos de la muestra.
Una vez obtenido k se lo utiliza para seleccionar los demás elementos,
tomándolos de k en k a partir de N0.
Ejemplo:
Supongamos una población de 22 elementos,
1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22
En el sorteo N0 se corresponde con el elemento en la posición 5. El
22
tamaño deseado de la muestra es de 6 elementos. Entonces 𝑘 = = 3. 6̂
6
o sea que k=4. Entonces los elementos de la muestra serán 5,9,13,17,21,3.
Observen que la diferencia entre ellos es 4, en el caso de 3 al llegar a 21, le
sigue el elemento 22 y reinicio la cuenta en 1 hasta llegar a 3.

Muestreo aleatorio estratificado proporcional sistemático:


Consiste en considerar categorías típicas
diferentes entre sí (estratos) que poseen gran
homogeneidad respecto a alguna
característica (se puede estratificar, por
ejemplo, según la profesión, el barrio de
residencia, el sexo, el estado civil, etc.). Lo que
se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de
interés estarán representados

3
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

adecuadamente en la muestra. Cada estrato funciona


independientemente, pudiendo aplicarse dentro de ellos el muestreo
aleatorio simple o el estratificado para elegir los elementos concretos que
formarán parte de la muestra.
Ejemplo:
La población está dividida en dos grupos diferenciados: 21 chicas y 15
chicos. Queremos obtener una muestra de 5 individuos, obtenemos el
tamaño de cada submuestra , las chicas en la muestra serán:
21 15
5   2,92  3 , y los chicos serán: 5   2,08  2 . Luego seleccionamos
36 36
las 3 chicas y los 2 chicos con alguno de los procedimientos anteriores.
Muestro aleatorio en conglomerados.
Los conglomerados son subconjuntos en los que se divide la población,
estos subconjuntos poseen características similares, de manera que
resulten homogéneos entre ellos. Sin embargo los elementos que
componen a estos conglomerados mantienen la diversidad de la
población. Los conglomerados pueden ser áreas geográficas (país,
departamento, ciudad) o instituciones (liceos, escuelas, etc.)
Una vez dividida la población en conglomerados se obtiene la muestra
haciendo un sorteo aleatorio de los conglomerados, y todos los
elementos de los conglomerados seleccionados forman la muestra.

Imagen 4

4
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

Muestro polietápico en conglomerados.


Al igual que la caso anterior se sortean alguno conglomerados, pero la
muestra no se forma con todos los elementos de éstos, sino que de los
conglomerados obtenidos se procede a realizar una nueva selección de
algunos de sus elementos para conformar la muestra. Este procedimiento
se puede dar en dos o más etapas.

5
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

Variables estadísticas
Una variable es una característica que toma distintos valores en los
individuos de una población o una muestra. Son ejemplos de esto:
cantidad de hermanos de un estudiante, nivel educativo, estatura, color
de pelo, etc. Vemos que estos valores hablan de cantidades y de
cualidades. Clasificamos las variables según los valores que toman en dos
grandes grupos:
Variables cualitativas:
Hablan de una cualidad o un atributo. En los ejemplos anteriores tenemos
el color de pelo y el nivel educativo.
Se dividen en dos tipos:
Cualitativas Ordinales: Son aquellas donde existe un orden de
precedencia.
Ejemplo: Si hago un relevamiento del nivel educativo de las personas,
podría clasificarlo en: primaria incompleta, primaria completa, secundaria
incompleta, secundaria completa, terciaria incompleta, terciaria completa.
Es claro que se trata de una variable cualitativa donde existe un orden
establecido.
Cualitativas Nominales: Son aquellas donde no existe un orden
preestablecido.
Ejemplo: Preferencia de comidas de una persona, en este caso es un dato
cualitativo donde no es posibles establecer un orden.
Variables cuantitativas:
Se cuantifican, es decir, se mide la cantidad de la propiedad que se está
estudiando, por ejemplo la estatura.
Se dividen en dos tipos:
Cuantitativas Discretas: Son aquellas en las cuales entre dos valores
consecutivos posibles no existen valores intermedios. En general se
asocian con números enteros. Ejemplo: la cantidad de hermanos
Cuantitativas continuas: Son aquellas en las cuales entre dos valores que
toma la variable siempre es posible encontrar valores intermedios. Se
corresponden con los números reales, ejemplo: estatura.
6
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

Análisis y tratamiento de datos.


En todo estudio estadístico el ordenamiento, análisis y presentación de
datos es parte esencial. Para ello veremos algunas técnicas y definiremos
algunos conceptos que serán usados para un correcto tratamiento de los
datos relevados.

Frecuencia absoluta: Se denomina frecuencia absoluta del suceso S al


número de veces que es observado S en la muestra. Lo escribiremos como
𝑓𝑎𝑆 o simplemente 𝑓𝑎 .

Aclaración: Suceso S puede ser cualquier observación realizada en un


estudio estadístico. Por ejemplo si hacemos un relevamiento de edades en
los 30 alumnos de un grupo, resulta que hay 10 alumnos que tienen 17
años, entonces el suceso S seria la edad 17, y la frecuencia absoluta de ese
suceso será 10, es decir la cantidad de alumnos con 17 años.

Frecuencia relativa: Se llama frecuencia relativa de un suceso en una


f aA
muestra de tamaño n, al cociente f rA  .
n

En el ejemplo anterior la frecuencia relativa del suceso tener 17 años es


10
fr   0,3ˆ
30
Tabla distribución de frecuencias
Variables Cualitativas Nominales
Ejemplo: Supongamos que se realiza un estudio investigando las
preferencias musicales de los adolescentes. En ese caso nuestra variables
estadística X = tipo de música que prefiere. Las posibles respuestas,
recorrido, se agrupa siguiendo la elección del investigador en las
categorías siguientes {rock (incluye pop, heavy), salsa (incluye ritmos
latinoamericanos), new age, folklore, melódico (incluye boleros), tango,
clásica, otros}. Obsérvese que en la elección de recorrido que hace el

7
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

investigador, cualquier respuesta debe estar contemplada. Estos datos


serán tratados y analizados utilizando una tabla de distribución.

X fa fr
Rock 4 0,4
Salsa 1 0,1
new age 1 0,1
folklore 2 0,2
melódico 1 0,1
Tango 0 0
Clásica 1 0,1
Otros 0 0
TOTAL 10 1

Algunas aclaraciones respecto a la tabla:


 0  f a  n la frecuencia absoluta de cualquier categoría siempre
es un valor comprendido entre 0 y n, donde n el número de
elementos en la muestra considerada. Para el caso anterior
tendríamos que la frecuencia absoluta de cada categoría es un
número entre 0 y 10.
 La suma de las frecuencias absolutas tiene que ser igual al tamaño
de la muestra. En el caso anterior si sumamos las frecuencias
absolutas 4+1+1+2+1+0+1+0=10
 La suma de todas las frecuencias relativas es 1.
 Si multiplicamos la frecuencia relativa por 100 obtenemos el
porcentaje de la muestra que abarca la categoría. En nuestro
ejemplo rock cuya frecuencia relativa es 0,4 equivale al 40% de la
muestra.

8
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

Representación gráfica
Para representar
Preferencia musical
las variables
cualitativas
utilizaremos dos
tipos de gráfico,
circular o
pictograma y
gráficos de barras.
rock salsa new age folklore melódico tango clásica otros

A modo de ejemplo graficamos el caso anterior mediante estos dos


modelos gráficos. Para hacer cualquiera de estos dos tipos de gráficos
podemos utilizar tanto la frecuencia relativa (fr) como la frecuencia
absoluta (ni).

Preferencia musical
0,45

0,4

0,35

0,3

0,25

0,2

0,15

0,1

0,05

0
rock salsa new age folklore melódico tango clásica otros

Ventas

Cualitativa Ordinal
Las variables cualitativas ordinales dan lugar a la definición de una nueva
frecuencia.

9
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

Frecuencia Relativa Acumulada (Fr): La frecuencia relativa acumulada de


una categoría, es la suma de las frecuencias relativas de todas las
categorías anteriores inclusive la considerada.
Ejemplo: Estudiamos el nivel educativo máximo alcanzado por un grupo
de individuos, las categorías elegidas son {primaria incompleta, primaria
completa, secundaria incompleta, secundaria completa, terciaria
incompleta, terciaria completa}
X ni fr Fr
Primaria Inc 2 0,1 0,1
Primaria Com 4 0,2 0,3
Secundaria Inc 7 0,35 0,65
Secundaria Com 5 0,25 0,9
Terciaria Inc 1 0,05 0,95
Terciaria Com 1 0,05 1
TOTAL 20 1

Para el caso de las variables cualitativas ordinales valen las mismas


representaciones gráficas vistas anteriormente.
Variables Cuantitativas
Las variables cuantitativas tienen dos formas de ser tratadas, se las puede
tratar de forma separada o trabajar con ellas en intervalos de clase. En
general, las únicas que pueden ser tratadas en forma separada son las
discretas, las variables continuas y las discretas con muestras numerosas
serán siempre tratadas en intervalos de clase.
Ejemplo de tabla de frecuencia y gráfico de variables discreta.
La siguiente tabla corresponde a un estudio de número de consultas
previas en pacientes diagnosticados con anemia.
N° Consultas n fr Fr
0 8 0,27 0,27
1 10 0,33 0,60
2 6 0,20 0,80
3 4 0,13 0,93
4 2 0,07 1
Totales 30 1
Tabla 1

10
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

Histograma de frecuencia relativa

Ojiva de frecuencia acumulada

11
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
Capítulo 1-Introducción a Estadística Descriptiva

Ejemplo de tabla de frecuencia y gráfico de variables continuas.


Los siguientes datos corresponden al peso en Kg de 20 niños de 9 años de
edad.
40.0 36.0 36.6 32.4 29.8 32.5 24.5 29.9 30.0 31.0
35.2 39.0 25.2 29.0 35.3 26.7 29.7 35.0 32.0 30.0
Es claro que se trata de una variable continua, entonces para su
tratamiento dispondremos los datos agrupándolos por intervalos de clase.
Primero determinaremos el rango: Rango: Es la diferencia
𝑹 = 𝟒𝟎. 𝟎 − 𝟐𝟒. 𝟓 = 𝟏𝟓. 𝟓 entre el mayor y el menor
valor que toma la variable.

Luego definimos la cantidad de intervalos a usar, en general el número de


intervalos está predefinido, en caso contrario utilizaremos la siguiente
fórmula
La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla
práctica acerca del número de clases. Este número viene dado por la
siguiente expresión: 𝒌 = 𝟏 + 𝒍𝒐𝒈𝑵 𝟐 siendo N la cantidad de datos. Que
puede pasarse a logaritmo base 10 de la siguiente forma
𝑘 = 1 + 3,32. log(20)

𝒌 = 𝟏 + 𝟑, 𝟑𝟐. 𝒍𝒐𝒈(𝟐𝟎) ≈ 𝟓 , tomando el valor entero aproximado.


Determinaremos la amplitud de cada intervalo, para esto tomaremos el
cociente entre el rango y el número de intervalos.
𝟏𝟓,𝟓
𝐀= = 𝟑, 𝟏
𝟓

Construimos la tabla
Intervalos N fr Fr mc Marca de clase (mc): es el punto
[24.5,27.6) 3 0,15 0,15 26,05 medio de cada intervalo, es un
valor que representa a la clase y
[27.6,30.7) 6 0,30 0,45 29,15
será utilizado para diversos
[30.7,33.8) 4 0,2 0,65 32,25 cálculos.
[33.8,36.9) 5 0,25 0,9 35,35
[36.9,40] 2 0,1 1 38,45
Totales 20 1
Tabla 2

12
Darwin Leguisamo -Curso 2017
Capítulo 1-Introducción a Estadística Descriptiva

Gráficos para variables continuas


Histograma Polígono
fr fr

Ojiva

Fr

Descripciones numéricas:
Los métodos gráficos vistos son un buen elemento de análisis de las
características observadas en una población. Sin embargo no siempre
resultan suficientes o claros para realizar un análisis adecuado, por lo que
13
Darwin Leguisamo -Curso 2017
Capítulo 1-Introducción a Estadística Descriptiva

surge la necesidad de introducir el cálculo de determinadas medidas


numéricas que nos darán un significado preciso de las características de la
variable estudiada.

Medidas de tendencia central


Las medidas de tendencia central describen la disposición de la
distribución de frecuencias entorno a un valor central.
Estudiaremos tres de estas medidas, la moda, la media y la mediana.

Moda: Para variables discretas disgregadas la moda es el valor con mayor


frecuencia, y para variables agrupadas en intervalo consideramos una
clase modal, que se corresponde con el intervalo de mayor frecuencia.
Ejemplo: En la tabla 1 la moda es 1 y en la tabla 2 tenemos un intervalo
modal que es [27.6, 30.7).

Puede ocurrir que exista más de una moda (eso ocurre cuando hay dos
valores que tienen la misma frecuencia y es la mayor), o más de un
intervalo modal, en ese caso la muestra es polimodal.

Media: La media es el promedio aritmético de los valores que toma la


variable.
1 𝑥1 +𝑥2 +⋯+𝑥𝑁
𝜇 = ∑𝑖=𝑁
𝑖=1 𝑥𝑖 = es la media poblacional (parámetro), solo es
𝑁 𝑁
posible calcularla cuando se conocen datos de toda la población.
1 𝑥1 +𝑥2 +⋯+𝑥𝑛
𝑥̅ = ∑𝑖=𝑛
𝑖=1 𝑥𝑖 = es la media muestral (estadístico), se calcula
𝑛 𝑛
cuando tengo una muestra y no toda la población.

14
Darwin Leguisamo -Curso 2017
Capítulo 1-Introducción a Estadística Descriptiva

Media para datos agrupados

1 𝑚𝑐1 .𝑛1 +𝑚𝑐2 .𝑛2 +⋯+𝑚𝑐𝑘 .𝑛𝑘


𝑥̅ = ∑𝑖=𝑘
𝑖=1 𝑚𝑐𝑖 𝑛𝑖 = , donde k se corresponde con
𝑛 𝑛
el número de intervalos de clase y 𝑚𝑐𝑖 se refiere a la marca de clase. Esta
forma de cálculo no es exacta con el verdadero valor de la media, pero es
una aproximación muy buena que nos ahorra trabajo.
Para ejemplificar sería recomendable hacer el cálculo de la media para los
datos de la tabla 2, utilizando los datos disgregados que se dan y luego los
datos agrupados.

Mediana: En el caso de una serie de datos de tamaño n, ordenados de


menor a mayor, no agrupados, la mediana es el valor que divide a la
distribución en dos partes iguales, es decir que es valor tal que existen
igual número de observaciones superiores a él como inferiores.
Si n es impar:𝑀𝑑 = 𝑥𝑛+1
2

𝑥𝑛 𝑥𝑛
+ +1
2 2
Si n es par: 𝑀𝑑 =
2

Ejemplos:
2, 4, 8, 9, 10, 12,15 como n es 7 tenemos 𝑀𝑑 = 𝑥7+1 = 𝑥4 = 9.
2

𝑥4 +𝑥5 9+10
2, 4, 8, 9, 10, 12,15 ,17 como n es 8 tenemos 𝑀𝑑 = = = 9,5.
2 2

Mediana para datos agrupados: La mediana en datos agrupados será la


preimagen de 0,5 en la ojiva de frecuencia.

A continuación se muestra el procedimiento de cálculo por interpolación


lineal en el gráfico.

15
Darwin Leguisamo -Curso 2017
Capítulo 1-Introducción a Estadística Descriptiva

Fr

Para calcular la preimagen de la mediana


haremos uso de la semejanza de
triángulos, si observamos tenemos dos
triángulos rectángulos semejantes. Uno
con base b y altura a, el otro con base b´
y altura a´. Al ser estos triángulos
semejantes se cumple la igualdad:
a´ b´
 , observando el gráfico vemos
a a b
que:
a´ a  0.65  0.45  0.2
b  33.8  30.7  3.1
b´ a´ 0.5  0.45  0.05
b´ M e  30.7
b
0.05 M e  30.7
 
0.2 3.1
0.05
M e  30.7  3.1  31.475
0.2

16
Darwin Leguisamo -Curso 2017
Capítulo 1-Introducción a Estadística Descriptiva

Medidas de dispersión
Las medidas de dispersión dan una idea del alejamiento de los datos
respeto de las medidas de centralización. Veamos un ejemplo de la
necesidad de introducir estas medidas.
Supongamos que conocemos el ingreso de dos grupos de 6 personas:

Grupo 1 5000 55000 10000 50000 6000 54000.


Grupo 2 35000 25000 33000 27000 29000 31000
 La distribución de ingresos en estos grupos, ¿tiene la misma
característica?
 ¿Cuáles son los ingresos promedios de ambos grupos?

Este es un ejemplo donde queda claro que no basta con las medidas de
tendencia central para describir una muestra o población.

Varianza: Es la media aritmética de las diferencias al cuadrado de cada


dato respecto a la media.
Varianza Poblacional:

2
(𝑥1 − 𝜇)2 + (𝑥2 − 𝜇)2 + ⋯ + (𝑥𝑁 − 𝜇)2 ∑𝑖=𝑁
𝑖=1 (𝑥𝑖 − 𝜇)
2
𝜎 = =
𝑁 𝑁
En el caso de tener una muestra de tamaño n, se usará el estimador
insesgado:

2
(𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2 ∑𝑖=𝑛
𝑖=1 (𝑥𝑖 − 𝑥̅ )
2
𝑆 = =
𝑛−1 𝑛−1
Desviación estándar o desviación típica: La desviación estándar es la raíz
cuadrada de la varianza, de acuerdo con lo anterior tenemos:

Desviación poblacional 𝜎 = √𝜎 2

Desviación maestral 𝑆 = √𝑆 2

17
Darwin Leguisamo -Curso 2017
Capítulo 1-Introducción a Estadística Descriptiva

Observemos que sucede cuando aplicamos estas ideas al ejemplo


anterior.
Grupo 1 𝜇 = 30000
(5000−30000)2 +(55000−30000)2 +(10000 −30000)2 +(50000 −30000)2 +(6000 −30000)2 +(54000 −30000)2
𝜎=√ =23101,2
6

Grupo 2 𝜇 = 30000
(35000−30000)2 +(25000−30000)2 +(33000 −30000)2 +(27000 −30000)2 +(29000 −30000)2 +(31000 −30000)2
𝜎= √ =3415,7
6

Al igual que en el cálculo de la media, para calcular la varianza y la


desviación típica en variables organizadas por intervalos de clase tenemos
una fórmula alternativa.
2
(𝑚𝑐1 −𝜇)2 .𝑛1 +(𝑚𝑐2 −𝜇)2 .𝑛2 +⋯+(𝑚𝑐𝑘 −𝜇) .𝑛𝑘
2
𝜎 = , para datos poblacionales.
𝑁
2
(𝑚𝑐1 −𝑥̅ )2 .𝑛1 +(𝑚𝑐2 −𝑥̅ )2 .𝑛2 +⋯+(𝑚𝑐𝑘 −𝑥̅ ) .𝑛𝑘
2
𝑆 = , para datos muestrales.
𝑛−1

Coeficiente de variación (CV): El coeficiente de variación relaciona la


desviación típica con la media, y expresa esta relación como una
proporción brindando una medida para la dispersión de los elementos de
un conjunto de datos en torno a la media.
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎
CV=
𝑚𝑒𝑑𝑖𝑎

Ejemplo: Se hace un estudio de ingresos en hogares de dos ciudades, A y


B. El estudio determina que en la ciudad A el promedio de ingresos es de
$U40000 con un CV=0,50 y en la ciudad B el ingreso promedio es
$U35000 con un CV=0,05. ¿Qué conclusiones se puede sacar de este
estudio?

Cuartiles: Los cuartiles son tres valores que dividen al conjunto de datos
en 4 partes iguales, el primer cuartil (𝑄1 ) deja al conjunto divido en dos
partes, de manera que el 25% está por debajo de 𝑄1 , el segundo cuartil
coincide con la mediana (𝑄2 ), el tercer cuartil (𝑄3 ) deja al 75% de los

18
Darwin Leguisamo -Curso 2017
Capítulo 1-Introducción a Estadística Descriptiva

datos por debajo. De esta forma los cuartiles dividen al conjunto de datos
en 4 subconjuntos que contienen al 25% de la población.

Supongamos que contamos con datos sobre la estatura de los alumnos del
liceo, si queremos saber qué estatura mínima debe tener un estudiante
para pertenecer al 25% de los estudiantes con mayor altura, la respuesta
es 𝑄3 .
Observaciones:
 Para determinar los cuartiles se procede igual que en el caso de la
mediana, determinado preimágenes en la Ojiva.
 Existen otras medidas de posición similares, quintiles, deciles,
percentiles. Estas medidas dividen a la población en 5, 10 y 100
partes iguales (20% , 10%, 1%). La forma de calcularlas es análoga.
 La denominación general para ellos es cuantiles.

19
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Capítulo 2: Probabilidad
Consideraciones previas:
 EXPERIMENTO ALEATORIO: Es cualquier acto o proceso en el que se
realizan observaciones que no pueden ser predichas con certeza.
 EVENTO SIMPLE: Es el resultado más básico de un experimento. Es
un punto en el espacio muestral.
 SUCESO: Es una colección específica de eventos simples.
 ESPACIO MUESTRAL E: En un experimento es el conjunto que
consta de la totalidad de puntos muestrales (eventos simples),
mutuamente excluyentes, que resultan de la ejecución del
experimento.
Ejemplo:
Experimento aleatorio: Lanzar un dado y observar el número de la cara
superior.
Eventos Simples: {1}, {2}, {3}, {4}, {5}, {6}. Cada uno de estos son los
resultados que se pueden obtener en el experimento, se denominan
eventos simples.
Suceso: A= {4, 5,6} B= “Obtener un número par”. En este caso el Suceso
A, refiere a obtener en el lanzamiento un número mayor a 3. En el caso B
el suceso equivale a B= {2, 4,6}, obtener en el lanzamiento alguno de esos
tres resultados.
Completa P(A)=…….. y P(B)=………
Espacio Muestral: E= {1, 2, 3, 4, 5, 6}.

Principios básicos que rigen la probabilidad:


La probabilidad es una función que asigna un valor numérico a cada
elemento de un conjunto de sucesos asociados a un experimento
aleatorio.
La probabilidad de cualquier suceso es un número comprendido entre
0 y 1:
0 ≤ 𝑃(𝐴) ≤ 1

20
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

La probabilidad del suceso imposible es 0:


𝑃(∅) = 0.
La probabilidad del espacio muestral es 1:
𝑃(𝐸) = 1.
La probabilidad de la unión de dos sucesos disjuntos es igual a la suma de
las probabilidades de cada suceso:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) si 𝐴 ∩ 𝐵 = ∅.

Si los sucesos no son disjuntos, entonces tendremos:


𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵).

Ejemplo: Considerando el experimento de lanzar un dado, sean los


sucesos A={4,5,6} , B={2,4,6} , C={1,2,3} entonces:
3 3 2 4 2
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = + − = = . Debido a que
6 6 6 6 3
𝐴 ∩ 𝐵 = {4,6}.
3 3
𝑃(𝐴 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐶) = + = 1 .Dado que los sucesos son
6 6
disjuntos, además en este caso se denominan complementarios ya que
𝐴 ∪ 𝐶 = 𝐸.

21
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Cálculo de Probabilidad
Regla de Laplace
La probabilidad de un suceso se calcula, siempre que los sucesos
elementales sean equiprobables, mediante la llamada regla de Laplace:
𝑛° 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝐴
𝑃(𝐴) =
𝑛° 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

Enfoque frecuencista
Dejamos caer 1 chinche y nos preguntamos cuál es la probabilidad de que
caiga con la punta hacia arriba. En este caso, ¿te parece correcto aplicar la
regla de Laplace? ¿Cuál sería la probabilidad?
 Realiza el experimento varias veces y saca conclusiones
Conclusión:
 Existen experimentos donde no es posible aplicar la regla de
Laplace.
 En este caso es necesario conocer otro enfoque para determinar la
probabilidad.
El enfoque clásico está limitado a los casos donde existe igual probabilidad
entre los sucesos elementales. Esto nos limita y no nos permite trabajar
casos como el anterior.
Por esta razón introducimos una definición alternativa de probabilidad,
donde la probabilidad está asociada a la frecuencia relativa de la aparición
u ocurrencia del suceso, cuando el número de observaciones es muy
grande.
La probabilidad es límite de la frecuencia relativa cuando el número de
observaciones crece indefinidamente (Ley de los grandes números)
𝐥𝐢𝐦 𝒇𝒓 (𝑨) = 𝒑(𝑨)
𝒏→∞
𝑛𝐴
𝑓𝑟 (𝐴) = , es la frecuencia relativa del suceso A, o sea las veces que
𝑛
aparece A en n ensayos.

22
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Probabilidad condicionada
La probabilidad de un suceso A puede verse modificada si ha ocurrido
previamente otro suceso B. Para recoger esta influencia entre los sucesos,
se define la probabilidad de A condicionada por B y se escribe P(A/B).

Ejemplo: En una urna hay 6 bolas numeradas del 1 al 6. Sean los sucesos
A= “extraer un bola con número par” y B= “extraer una bola con un
número mayor a 3”.
a. Calcular p(A) y p(B).
b. Sabiendo que ya se extrajo una bola par, ¿cuál es la probabilidad de
que su número sea mayor a 3?

a. p(A)=3/6 p(B)=3/6.
b. p(B/A)=2/3.
2/6 𝑝(𝐴∩𝐵) 𝒑(𝑨∩𝑩)
Observemos que: 𝑝(B/A) = = , en general 𝒑(B/A) =
3/6 𝑝(𝐴) 𝒑(𝑨)

Sucesos dependientes e independientes.


Vamos a distinguir con dos ejemplos a estos dos tipos de sucesos:
Supongamos que de un mazo de barajas españolas, sin comodines,
extraemos dos cartas:
a. Si la extracción se hace de forma consecutiva y sin reposición ¿cuál
es la probabilidad de que las dos cartas sean de oro?
Considerando que hay 12 cartas de oro en un total de 48, la
probabilidad de que la primera carta extraída sea de oro es 12/48,
luego de hacer esta extracción quedan en el mazo 11 cartas de oro
de un total de 47, entonces la probabilidad de que la segunda carta
sea de oro es 11/47. Estos sucesos se denominan dependientes,
porque lo que ocurre en la primera extracción afecta la probabilidad
de la segunda extracción.

23
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Llamemos a los sucesos A =“la primera carta es de oro” y B=“a


segunda carta es de oro”. Entonces la probabilidad de que las dos
𝟏𝟐 𝟏𝟏
cartas sean de oro es :𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩/𝑨)= ( ). ( ).
𝟒𝟖 𝟒𝟕
b. Considerando ahora una extracción con reposición, tendremos
ahora que la sustracción de la segunda carta no se ve condicionada
por lo que sucedió en la primera, entonces estos sucesos se
𝟏𝟐 𝟏𝟐
denominan independientes: 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩) = ( ) . ( ).
𝟒𝟖 𝟒𝟖

En general:

 Sucesos dependientes: 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩/𝑨).


 Sucesos independientes: 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩).
Observación: La independencia no implica que los dos sucesos tengan
igual probabilidad, independencia significa que la ocurrencia o no de uno
de ellos no afecta a la probabilidad del otro.

Distribución de Probabilidad Discreta.


Si una variable 𝑋 puede tomar una serie de valores discretos 𝑋1 , 𝑋2 , . . . , 𝑋𝑛
con probabilidades respectivas 𝑝1 , 𝑝2 , … , 𝑝𝑛 , donde 𝑝1 + 𝑝2 +. . +𝑝𝑛 = 1
(∑𝑛𝑖=1 𝑝𝑖 = 1), se dice que ha sido definida para 𝑋 una distribución de
probabilidad discreta. La función 𝑝(𝑋) que toma los valores respetivos
𝑝1 , 𝑝2 , … , 𝑝𝑛 para 𝑋 = 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 se llama función de probabilidad de
𝑋.
Como 𝑋 puede tomar una serie de valores que se pueden poner en
correspondencia con los números enteros, se le llama a 𝑋 variable
aleatoria discreta.
Sea 𝑋 la variable que denota la suma de puntos obtenidos al lanzar un par
de dados. Entonces la distribución de probabilidad viene dada por la
siguiente tabla:
𝑋 2 3 4 5 6 7 8 9 10 11 12
𝑝(𝑋) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

24
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Adviértase que esto es análogo a la distribución de frecuencia relativa en


la que las frecuencias relativas han sido sustituidas por probabilidades. Así
se puede pensar que las distribuciones de probabilidad son teóricamente
las distribuciones de frecuencia relativa llevadas al límite, es decir, cuando
el número de observaciones hechas es muy grande.

Esperanza Matemática
Si 𝒑 es la probabilidad de que una persona reciba una suma de dinero S, la
esperanza matemática, o simplemente la esperanza se define como 𝒑. 𝑺.
Ejemplo: Si la probabilidad de que un hombre gane un premio de $10 es
1/5, su esperanza es (1/5).(10)=2.
El concepto de esperanza es fácilmente generalizado. Si 𝑋representa una
variable aleatoria discreta que puede tomar los valores 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 con
probabilidades respectivas 𝑝1 , 𝑝2 , … , 𝑝𝑛 , donde 𝑝1 + 𝑝2 +. . +𝑝𝑛 = 1, la
esperanza matemática de 𝑋 (simbolizada 𝐸(𝑋)), se define como:
𝑖=𝑛

𝐸(𝑋) = 𝑝1 𝑋1 +𝑝2 𝑋2 + ⋯ + 𝑝𝑛 𝑋𝑛 = ∑ 𝑝𝑖 𝑋𝑖
𝑖=1

Por ejemplo, la esperanza para la suma de los dos dados es:


1 2 3 4 5 6 5 4 3 2 1
𝐸(𝑋) = 2+ 3+ 4+ 5+ 6+ 7+ 8+ 9+ 10 + 11 + 12 = 7.
36 36 36 36 36 36 36 36 36 36 36

Experimentos de Bernoulli
Un experimento de Bernoulli, es un experimento donde la variable
aleatoria X involucrada solamente puede tomar dos valores, 0 y 1.
Consideremos por ejemplo el caso de contestar una pregunta en un
cuestionario múltiple opción. En este experimento se pueden dar dos
resultados, contesto de forma correcta o no. Si asignamos 1 al suceso
contestar de forma correcta y 0 al otro, estamos ante un experimento de
Bernoulli. Donde 1 se da con probabilidad p y 0 con probabilidad (1-p).
Entonces un experimento de Bernoulli será aquel donde se puedan dar
solamente dos resultados, el resultado favorable (éxito) 1 o un resultado
no favorable (fracaso) 0, estos dos resultados son complementarios y sus
probabilidades deben sumar 1.

25
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Ejemplo:
Siguiendo con el caso mencionado anteriormente donde se responde a un
cuestionario múltiple opción, supongamos que cada pregunta tiene tres
posibles respuestas, donde solamente una es correcta, la probabilidad de
que un estudiante que no posee conocimiento alguno acierte, es 1/3.
Ahora ¿Cuál será la probabilidad de que al responder 4 preguntas acierte
en 3?
Queda claro que responder cada pregunta se ajusta a un experimento de
Bernoulli, pero acá estamos analizando 4 experimentos de Bernoulli al
mismo tiempo, transformando esta situación en un experimento Binomial.
Como cada experimento de Bernoulli toma valores 0 o 1, este
experimento que consiste en analizar lo ocurrido en 4 aplicaciones tomará
valores ,0 ,1 ,2 ,3 y 4, donde 0 significa no acertó a ninguna de las 4
preguntas y 4 significa que acertó a las cuatro respuestas.
Pensemos la solución en un diagrama de árbol, donde A es éxito con
probabilidad 1/3 y B es fracaso con probabilidad 2/3.
Observemos que los
caminos que nos conducen
a responder la pregunta
planteada son 4, entonces
la probabilidad de acertar
tres veces es:

P( X  3)  4(1/ 3)3 (2 / 3)1


Averiguar la probabilidad
para 0,1,2 y 4 aciertos.
Este experimento es binomial
con p=1/3 , (1-p)=2/3 , n=4, se
anotara B(4 , 1/3).

Observemos que la forma


general para la asignación de
probabilidad en este ejercicio es P ( X  k )  C k (1 / 3) k (2 / 3) (4k ) .
4

26
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Distribución de probabilidad binomial:


Si p es la probabilidad de éxito en un ensayo de Bernoulli y (1-p) la
probabilidad de fracaso, entonces la probabilidad de que el suceso se
presente exactamente k veces en n ensayos es:

B (n, p )  P ( x  k )  C k. p k .(1  p ) ( nk )


n

Observaciones:
 La media en la distribución binomial es E ( X )    n. p .
 La desviación típica será   n. p.(1  p) .
 Aplicaremos la probabilidad Binomial cuando haya una serie de n
ensayos de Bernoulli.

Función de distribución de probabilidad para una variable aleatoria


discreta:
La función de distribución de probabilidad para una variable aleatoria
discreta X puede obtenerse a partir de su función de probabilidad, de
manera que para todo x real:

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∑ 𝑓(𝑢)


𝑢≤𝑥

Ejemplo: Dada una variable aleatoria 𝑋 = {0,1,2} con función de


1 1 1
probabilidad p(x) tal que: 𝑝(0) = , 𝑝(1) = 𝑦 𝑝(2) = . Entonces la
4 2 4
función de distribución quedara definida de la siguiente manera:

0, 𝑠𝑖 𝑥 < 0
1
, 𝑠𝑖 0 ≤ 𝑥 < 1
4
𝐹(𝑥) 3
, 𝑠𝑖 1 ≤ 𝑥 < 2
4
1, 𝑠𝑖 𝑥 ≥ 2
{

27
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Distribuciones Continuas
En este caso nos encargaremos de la asignación de probabilidad a
variables aleatorias del tipo continua (recordar la definición de variables
continuas ya trabajada). En el caso de las variables aleatorias continuas la
asignación de probabilidad se hará analizando áreas, veamos un ejemplo:

Considerando que la frecuencia de la línea 8 de estación Balard a Créteil,


en Paris, es de 5 minutos. Determina la probabilidad de que una persona
que acaba de llegar a la estación tenga que esperar el metro por más de 4
minutos.
Consideremos que la persona no sabe cuándo pasó el tren anterior y
tampoco sabe el horario del siguiente, solamente se conoce la frecuencia.

La probabilidad de que el metro pase en cualquier instante es constante.


La función
f :  0;5  / f ( x)  0, 2

Se denomina función de
densidad y es la función que
nos permitirá el cálculo de
probabilidad. Obsérvese que
el área bajo la curva es 1.

Para determinar la probabilidad pedida,


debemos calcular
5
P( X  4)   f  0, 2(5  4)  0, 2 con este
4

procedimiento determinamos el área entre


4 y 5, que es la probabilidad buscada.

28
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Características de la función de densidad de una distribución continua


Para que f(x) sea una función de densidad debe cumplir:
 f(x) 0 para todo valor x del intervalo [a,b] , donde la variable
aleatoria está definida.
 El área limitada por la curva del gráfico de f(x) entre los extremos a
y b y el eje Ox, es 1.

Observemos otras ilustraciones:

29
Darwin Leguisamo -Curso 2017
Capítulo 2-Probabilidad

Referencias:

 “Apuntes de Probabilidad y Estadística” Darwin Leguisamo-José


Rebbellato.2015.
 http://www.universoformulas.com/
 “Apuntes de Estadística para profesorado” Federico de Olivera. 2010.
 “Estadística Médica” Carlos Ketzoian (coordinador). Facultad de Medicina.
Montevideo 2004.
 “Matemáticas II. Aplicadas a las ciencias sociales.” Grupo EDEBÉ. Barcelona
2009.
 “MATERIAL DE APOYO AL CICLO DE METODOLOGÍA I.” Mariela Garau, Cecilia
Kadessian, Anaulina Silveira.
 “Estadística para administración y economía” Mendenhall-Reunmuth.

30
Darwin Leguisamo -Curso 2017

S-ar putea să vă placă și