Variables Estadísticas y Tratamiento de Datos

APUNTES DE PROBABILIDAD Y
ESTADÍSTICA
Darwin Leguisamo
CURSO 2017 LICEO TOMÁS BERRETA
Capítulo 1-Introducción a Estadística Descriptiva
Capítulo1: Estadística Descriptiva

Ejemplos de posibles fenómenos a estudiar
 Producción lechera anual (vacuna) en departamento de Canelones.
 Ingresos de los núcleos familiares de la localidad de Progreso.
 Índice de repetición en los liceos del departamento de Canelones.
Individuo o Elemento: Individuo se considera a toda persona,

objeto o dato que es poseedor de la información buscada.
Población: es el conjunto completo de individuos, objetos o datos que el
investigador está interesado en estudiar.
Si es interés del gobierno obtener datos sobre la desocupación y los

niveles de ingresos, mes a mes. ¿Les parece razonable encuestar a todos
los habitantes del país cada mes? Sabemos que estos datos están
presentes y actualizados regularmente, ¿Cómo crees que se obtienen?
Muestra:
El muestreo es una herramienta de la Investigación científica, cuya función
básica es determinar qué parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población.
La muestra, que es un subconjunto de la población, debe lograr una
representación adecuada de la población, en la que se reproduzca de la
mejor manera los rasgos esenciales de dicha población que son
importantes para la investigación. Para que una muestra sea
representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, es decir ejemplificar las
características de ésta.
1
Darwin Leguisamo-José Rebellato Curso 2015 (revisión 2016)
 Conveniencia de la
muestra: económica,
temporal, practicidad.
 Características: La
muestra tiene que ser
representativa de la
Población, para ello debe
ser proporcional y
conservar las
características de la
población. (dar ejemplos)
 Obtención: Obtener la muestra es quizá una de las etapas más
importantes del estudio. En ella radica la precisión y efectividad de
los resultados obtenidos, recordemos que a partir de la muestra
intentamos describir a la Población.
Técnicas habituales de muestreo:

Haremos referencia a los muestreos probabilísticos, que son aquellos que
se obtienen a partir de un procedimiento aleatorio y no están
condicionados por la subjetividad. Estos procedimientos permiten hacer
inferencias estadísticas sobre la población.
Muestro aleatorio simple:
Con reposición: Sin reposición:

Se enumeran los elementos de la Se enumeran los elementos de la
población y se seleccionan población y se seleccionan
mediante un procedimiento mediante un procedimiento
aleatorio. En este caso el aleatorio. En este caso el
elemento seleccionado se vuelve elemento seleccionado no vuelve
a tener en cuenta para la nueva a ser tenido en cuenta para la
elección. nueva elección.
2
Muestreo aleatorio sistemático:

Se enumeran los elementos de la población, se elige por sorteo un
𝑁
elemento (N0). Luego se determina el coeficiente 𝑘 = (si no resulta ser
𝑛
entero, tomamos el entero más cercano), donde N es el número de
elementos de la población y n es el número de elementos de la muestra.
Una vez obtenido k se lo utiliza para seleccionar los demás elementos,
tomándolos de k en k a partir de N0.
Ejemplo:
Supongamos una población de 22 elementos,
1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22
En el sorteo N0 se corresponde con el elemento en la posición 5. El
22
tamaño deseado de la muestra es de 6 elementos. Entonces 𝑘 = = 3. 6̂
6
o sea que k=4. Entonces los elementos de la muestra serán 5,9,13,17,21,3.
Observen que la diferencia entre ellos es 4, en el caso de 3 al llegar a 21, le
sigue el elemento 22 y reinicio la cuenta en 1 hasta llegar a 3.
Muestreo aleatorio estratificado proporcional sistemático:

Consiste en considerar categorías típicas
diferentes entre sí (estratos) que poseen gran
homogeneidad respecto a alguna
característica (se puede estratificar, por
ejemplo, según la profesión, el barrio de
residencia, el sexo, el estado civil, etc.). Lo que
se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de
interés estarán representados
3
adecuadamente en la muestra. Cada estrato funciona

independientemente, pudiendo aplicarse dentro de ellos el muestreo
aleatorio simple o el estratificado para elegir los elementos concretos que
formarán parte de la muestra.
Ejemplo:
La población está dividida en dos grupos diferenciados: 21 chicas y 15
chicos. Queremos obtener una muestra de 5 individuos, obtenemos el
tamaño de cada submuestra , las chicas en la muestra serán:
21 15
5   2,92  3 , y los chicos serán: 5   2,08  2 . Luego seleccionamos
36 36
las 3 chicas y los 2 chicos con alguno de los procedimientos anteriores.
Muestro aleatorio en conglomerados.
Los conglomerados son subconjuntos en los que se divide la población,
estos subconjuntos poseen características similares, de manera que
resulten homogéneos entre ellos. Sin embargo los elementos que
componen a estos conglomerados mantienen la diversidad de la
población. Los conglomerados pueden ser áreas geográficas (país,
departamento, ciudad) o instituciones (liceos, escuelas, etc.)
Una vez dividida la población en conglomerados se obtiene la muestra
haciendo un sorteo aleatorio de los conglomerados, y todos los
elementos de los conglomerados seleccionados forman la muestra.
Imagen 4
4
Muestro polietápico en conglomerados.

Al igual que la caso anterior se sortean alguno conglomerados, pero la
muestra no se forma con todos los elementos de éstos, sino que de los
conglomerados obtenidos se procede a realizar una nueva selección de
algunos de sus elementos para conformar la muestra. Este procedimiento
se puede dar en dos o más etapas.
5
Variables estadísticas
Una variable es una característica que toma distintos valores en los
individuos de una población o una muestra. Son ejemplos de esto:
cantidad de hermanos de un estudiante, nivel educativo, estatura, color
de pelo, etc. Vemos que estos valores hablan de cantidades y de
cualidades. Clasificamos las variables según los valores que toman en dos
grandes grupos:
Variables cualitativas:
Hablan de una cualidad o un atributo. En los ejemplos anteriores tenemos
el color de pelo y el nivel educativo.
Se dividen en dos tipos:
Cualitativas Ordinales: Son aquellas donde existe un orden de
precedencia.
Ejemplo: Si hago un relevamiento del nivel educativo de las personas,
podría clasificarlo en: primaria incompleta, primaria completa, secundaria
incompleta, secundaria completa, terciaria incompleta, terciaria completa.
Es claro que se trata de una variable cualitativa donde existe un orden
establecido.
Cualitativas Nominales: Son aquellas donde no existe un orden
preestablecido.
Ejemplo: Preferencia de comidas de una persona, en este caso es un dato
cualitativo donde no es posibles establecer un orden.
Variables cuantitativas:
Se cuantifican, es decir, se mide la cantidad de la propiedad que se está
estudiando, por ejemplo la estatura.
Se dividen en dos tipos:
Cuantitativas Discretas: Son aquellas en las cuales entre dos valores
consecutivos posibles no existen valores intermedios. En general se
asocian con números enteros. Ejemplo: la cantidad de hermanos
Cuantitativas continuas: Son aquellas en las cuales entre dos valores que
toma la variable siempre es posible encontrar valores intermedios. Se
corresponden con los números reales, ejemplo: estatura.
6
Análisis y tratamiento de datos.

En todo estudio estadístico el ordenamiento, análisis y presentación de
datos es parte esencial. Para ello veremos algunas técnicas y definiremos
algunos conceptos que serán usados para un correcto tratamiento de los
datos relevados.
Frecuencia absoluta: Se denomina frecuencia absoluta del suceso S al

número de veces que es observado S en la muestra. Lo escribiremos como
𝑓𝑎𝑆 o simplemente 𝑓𝑎 .
Aclaración: Suceso S puede ser cualquier observación realizada en un

estudio estadístico. Por ejemplo si hacemos un relevamiento de edades en
los 30 alumnos de un grupo, resulta que hay 10 alumnos que tienen 17
años, entonces el suceso S seria la edad 17, y la frecuencia absoluta de ese
suceso será 10, es decir la cantidad de alumnos con 17 años.
Frecuencia relativa: Se llama frecuencia relativa de un suceso en una

f aA
muestra de tamaño n, al cociente f rA  .
n
En el ejemplo anterior la frecuencia relativa del suceso tener 17 años es

10
fr   0,3ˆ
30
Tabla distribución de frecuencias
Variables Cualitativas Nominales
Ejemplo: Supongamos que se realiza un estudio investigando las
preferencias musicales de los adolescentes. En ese caso nuestra variables
estadística X = tipo de música que prefiere. Las posibles respuestas,
recorrido, se agrupa siguiendo la elección del investigador en las
categorías siguientes {rock (incluye pop, heavy), salsa (incluye ritmos
latinoamericanos), new age, folklore, melódico (incluye boleros), tango,
clásica, otros}. Obsérvese que en la elección de recorrido que hace el
7
investigador, cualquier respuesta debe estar contemplada. Estos datos

serán tratados y analizados utilizando una tabla de distribución.
X fa fr
Rock 4 0,4
Salsa 1 0,1
new age 1 0,1
folklore 2 0,2
melódico 1 0,1
Tango 0 0
Clásica 1 0,1
Otros 0 0
TOTAL 10 1
Algunas aclaraciones respecto a la tabla:

 0  f a  n la frecuencia absoluta de cualquier categoría siempre
es un valor comprendido entre 0 y n, donde n el número de
elementos en la muestra considerada. Para el caso anterior
tendríamos que la frecuencia absoluta de cada categoría es un
número entre 0 y 10.
 La suma de las frecuencias absolutas tiene que ser igual al tamaño
de la muestra. En el caso anterior si sumamos las frecuencias
absolutas 4+1+1+2+1+0+1+0=10
 La suma de todas las frecuencias relativas es 1.
 Si multiplicamos la frecuencia relativa por 100 obtenemos el
porcentaje de la muestra que abarca la categoría. En nuestro
ejemplo rock cuya frecuencia relativa es 0,4 equivale al 40% de la
muestra.
8
Representación gráfica
Para representar
Preferencia musical
las variables
cualitativas
utilizaremos dos
tipos de gráfico,
circular o
pictograma y
gráficos de barras.
rock salsa new age folklore melódico tango clásica otros
A modo de ejemplo graficamos el caso anterior mediante estos dos

modelos gráficos. Para hacer cualquiera de estos dos tipos de gráficos
podemos utilizar tanto la frecuencia relativa (fr) como la frecuencia
absoluta (ni).
Preferencia musical
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
rock salsa new age folklore melódico tango clásica otros
Ventas
Cualitativa Ordinal
Las variables cualitativas ordinales dan lugar a la definición de una nueva
frecuencia.
9
Frecuencia Relativa Acumulada (Fr): La frecuencia relativa acumulada de

una categoría, es la suma de las frecuencias relativas de todas las
categorías anteriores inclusive la considerada.
Ejemplo: Estudiamos el nivel educativo máximo alcanzado por un grupo
de individuos, las categorías elegidas son {primaria incompleta, primaria
completa, secundaria incompleta, secundaria completa, terciaria
incompleta, terciaria completa}
X ni fr Fr
Primaria Inc 2 0,1 0,1
Primaria Com 4 0,2 0,3
Secundaria Inc 7 0,35 0,65
Secundaria Com 5 0,25 0,9
Terciaria Inc 1 0,05 0,95
Terciaria Com 1 0,05 1
TOTAL 20 1
Para el caso de las variables cualitativas ordinales valen las mismas

representaciones gráficas vistas anteriormente.
Variables Cuantitativas
Las variables cuantitativas tienen dos formas de ser tratadas, se las puede
tratar de forma separada o trabajar con ellas en intervalos de clase. En
general, las únicas que pueden ser tratadas en forma separada son las
discretas, las variables continuas y las discretas con muestras numerosas
serán siempre tratadas en intervalos de clase.
Ejemplo de tabla de frecuencia y gráfico de variables discreta.
La siguiente tabla corresponde a un estudio de número de consultas
previas en pacientes diagnosticados con anemia.
N° Consultas n fr Fr
0 8 0,27 0,27
1 10 0,33 0,60
2 6 0,20 0,80
3 4 0,13 0,93
4 2 0,07 1
Totales 30 1
Tabla 1
10
Histograma de frecuencia relativa
Ojiva de frecuencia acumulada
11
Ejemplo de tabla de frecuencia y gráfico de variables continuas.

Los siguientes datos corresponden al peso en Kg de 20 niños de 9 años de
edad.
40.0 36.0 36.6 32.4 29.8 32.5 24.5 29.9 30.0 31.0
35.2 39.0 25.2 29.0 35.3 26.7 29.7 35.0 32.0 30.0
Es claro que se trata de una variable continua, entonces para su
tratamiento dispondremos los datos agrupándolos por intervalos de clase.
Primero determinaremos el rango: Rango: Es la diferencia
𝑹 = 𝟒𝟎. 𝟎 − 𝟐𝟒. 𝟓 = 𝟏𝟓. 𝟓 entre el mayor y el menor
valor que toma la variable.
Luego definimos la cantidad de intervalos a usar, en general el número de

intervalos está predefinido, en caso contrario utilizaremos la siguiente
fórmula
La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla
práctica acerca del número de clases. Este número viene dado por la
siguiente expresión: 𝒌 = 𝟏 + 𝒍𝒐𝒈𝑵 𝟐 siendo N la cantidad de datos. Que
puede pasarse a logaritmo base 10 de la siguiente forma
𝑘 = 1 + 3,32. log(20)
𝒌 = 𝟏 + 𝟑, 𝟑𝟐. 𝒍𝒐𝒈(𝟐𝟎) ≈ 𝟓 , tomando el valor entero aproximado.

Determinaremos la amplitud de cada intervalo, para esto tomaremos el
cociente entre el rango y el número de intervalos.
𝟏𝟓,𝟓
𝐀= = 𝟑, 𝟏
𝟓
Construimos la tabla
Intervalos N fr Fr mc Marca de clase (mc): es el punto
[24.5,27.6) 3 0,15 0,15 26,05 medio de cada intervalo, es un
valor que representa a la clase y
[27.6,30.7) 6 0,30 0,45 29,15
será utilizado para diversos
[30.7,33.8) 4 0,2 0,65 32,25 cálculos.
[33.8,36.9) 5 0,25 0,9 35,35
[36.9,40] 2 0,1 1 38,45
Totales 20 1
Tabla 2
12
Darwin Leguisamo -Curso 2017
Gráficos para variables continuas

Histograma Polígono
fr fr
Ojiva
Fr
Descripciones numéricas:
Los métodos gráficos vistos son un buen elemento de análisis de las
características observadas en una población. Sin embargo no siempre
resultan suficientes o claros para realizar un análisis adecuado, por lo que
13
surge la necesidad de introducir el cálculo de determinadas medidas

numéricas que nos darán un significado preciso de las características de la
variable estudiada.
Medidas de tendencia central

Las medidas de tendencia central describen la disposición de la
distribución de frecuencias entorno a un valor central.
Estudiaremos tres de estas medidas, la moda, la media y la mediana.
Moda: Para variables discretas disgregadas la moda es el valor con mayor

frecuencia, y para variables agrupadas en intervalo consideramos una
clase modal, que se corresponde con el intervalo de mayor frecuencia.
Ejemplo: En la tabla 1 la moda es 1 y en la tabla 2 tenemos un intervalo
modal que es [27.6, 30.7).
Puede ocurrir que exista más de una moda (eso ocurre cuando hay dos
valores que tienen la misma frecuencia y es la mayor), o más de un
intervalo modal, en ese caso la muestra es polimodal.
Media: La media es el promedio aritmético de los valores que toma la

variable.
1 𝑥1 +𝑥2 +⋯+𝑥𝑁
𝜇 = ∑𝑖=𝑁
𝑖=1 𝑥𝑖 = es la media poblacional (parámetro), solo es
𝑁 𝑁
posible calcularla cuando se conocen datos de toda la población.
1 𝑥1 +𝑥2 +⋯+𝑥𝑛
𝑥̅ = ∑𝑖=𝑛
𝑖=1 𝑥𝑖 = es la media muestral (estadístico), se calcula
𝑛 𝑛
cuando tengo una muestra y no toda la población.
14
Media para datos agrupados
1 𝑚𝑐1 .𝑛1 +𝑚𝑐2 .𝑛2 +⋯+𝑚𝑐𝑘 .𝑛𝑘

𝑥̅ = ∑𝑖=𝑘
𝑖=1 𝑚𝑐𝑖 𝑛𝑖 = , donde k se corresponde con
𝑛 𝑛
el número de intervalos de clase y 𝑚𝑐𝑖 se refiere a la marca de clase. Esta
forma de cálculo no es exacta con el verdadero valor de la media, pero es
una aproximación muy buena que nos ahorra trabajo.
Para ejemplificar sería recomendable hacer el cálculo de la media para los
datos de la tabla 2, utilizando los datos disgregados que se dan y luego los
datos agrupados.
Mediana: En el caso de una serie de datos de tamaño n, ordenados de

menor a mayor, no agrupados, la mediana es el valor que divide a la
distribución en dos partes iguales, es decir que es valor tal que existen
igual número de observaciones superiores a él como inferiores.
Si n es impar:𝑀𝑑 = 𝑥𝑛+1
2
𝑥𝑛 𝑥𝑛
+ +1
2 2
Si n es par: 𝑀𝑑 =
2
Ejemplos:
2, 4, 8, 9, 10, 12,15 como n es 7 tenemos 𝑀𝑑 = 𝑥7+1 = 𝑥4 = 9.
2
𝑥4 +𝑥5 9+10
2, 4, 8, 9, 10, 12,15 ,17 como n es 8 tenemos 𝑀𝑑 = = = 9,5.
2 2
Mediana para datos agrupados: La mediana en datos agrupados será la

preimagen de 0,5 en la ojiva de frecuencia.
A continuación se muestra el procedimiento de cálculo por interpolación

lineal en el gráfico.
15
Fr
Para calcular la preimagen de la mediana

haremos uso de la semejanza de
triángulos, si observamos tenemos dos
triángulos rectángulos semejantes. Uno
con base b y altura a, el otro con base b´
y altura a´. Al ser estos triángulos
semejantes se cumple la igualdad:
a´ b´
 , observando el gráfico vemos
a a b
que:
a´ a  0.65  0.45  0.2
b  33.8  30.7  3.1
b´ a´ 0.5  0.45  0.05
b´ M e  30.7
b
0.05 M e  30.7
 
0.2 3.1
0.05
M e  30.7  3.1  31.475
0.2
16
Medidas de dispersión
Las medidas de dispersión dan una idea del alejamiento de los datos
respeto de las medidas de centralización. Veamos un ejemplo de la
necesidad de introducir estas medidas.
Supongamos que conocemos el ingreso de dos grupos de 6 personas:
Grupo 1 5000 55000 10000 50000 6000 54000.

Grupo 2 35000 25000 33000 27000 29000 31000
 La distribución de ingresos en estos grupos, ¿tiene la misma
característica?
 ¿Cuáles son los ingresos promedios de ambos grupos?
Este es un ejemplo donde queda claro que no basta con las medidas de
tendencia central para describir una muestra o población.
Varianza: Es la media aritmética de las diferencias al cuadrado de cada

dato respecto a la media.
Varianza Poblacional:
2
(𝑥1 − 𝜇)2 + (𝑥2 − 𝜇)2 + ⋯ + (𝑥𝑁 − 𝜇)2 ∑𝑖=𝑁
𝑖=1 (𝑥𝑖 − 𝜇)
2
𝜎 = =
𝑁 𝑁
En el caso de tener una muestra de tamaño n, se usará el estimador
insesgado:
2
(𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2 ∑𝑖=𝑛
𝑖=1 (𝑥𝑖 − 𝑥̅ )
2
𝑆 = =
𝑛−1 𝑛−1
Desviación estándar o desviación típica: La desviación estándar es la raíz
cuadrada de la varianza, de acuerdo con lo anterior tenemos:
Desviación poblacional 𝜎 = √𝜎 2
Desviación maestral 𝑆 = √𝑆 2
17
Observemos que sucede cuando aplicamos estas ideas al ejemplo

anterior.
Grupo 1 𝜇 = 30000
(5000−30000)2 +(55000−30000)2 +(10000 −30000)2 +(50000 −30000)2 +(6000 −30000)2 +(54000 −30000)2
𝜎=√ =23101,2
6
Grupo 2 𝜇 = 30000
(35000−30000)2 +(25000−30000)2 +(33000 −30000)2 +(27000 −30000)2 +(29000 −30000)2 +(31000 −30000)2
𝜎= √ =3415,7
6
Al igual que en el cálculo de la media, para calcular la varianza y la

desviación típica en variables organizadas por intervalos de clase tenemos
una fórmula alternativa.
2
(𝑚𝑐1 −𝜇)2 .𝑛1 +(𝑚𝑐2 −𝜇)2 .𝑛2 +⋯+(𝑚𝑐𝑘 −𝜇) .𝑛𝑘
2
𝜎 = , para datos poblacionales.
𝑁
2
(𝑚𝑐1 −𝑥̅ )2 .𝑛1 +(𝑚𝑐2 −𝑥̅ )2 .𝑛2 +⋯+(𝑚𝑐𝑘 −𝑥̅ ) .𝑛𝑘
2
𝑆 = , para datos muestrales.
𝑛−1
Coeficiente de variación (CV): El coeficiente de variación relaciona la

desviación típica con la media, y expresa esta relación como una
proporción brindando una medida para la dispersión de los elementos de
un conjunto de datos en torno a la media.
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎
CV=
𝑚𝑒𝑑𝑖𝑎
Ejemplo: Se hace un estudio de ingresos en hogares de dos ciudades, A y

B. El estudio determina que en la ciudad A el promedio de ingresos es de
$U40000 con un CV=0,50 y en la ciudad B el ingreso promedio es
$U35000 con un CV=0,05. ¿Qué conclusiones se puede sacar de este
estudio?
Cuartiles: Los cuartiles son tres valores que dividen al conjunto de datos
en 4 partes iguales, el primer cuartil (𝑄1 ) deja al conjunto divido en dos
partes, de manera que el 25% está por debajo de 𝑄1 , el segundo cuartil
coincide con la mediana (𝑄2 ), el tercer cuartil (𝑄3 ) deja al 75% de los
18
datos por debajo. De esta forma los cuartiles dividen al conjunto de datos
en 4 subconjuntos que contienen al 25% de la población.
Supongamos que contamos con datos sobre la estatura de los alumnos del
liceo, si queremos saber qué estatura mínima debe tener un estudiante
para pertenecer al 25% de los estudiantes con mayor altura, la respuesta
es 𝑄3 .
Observaciones:
 Para determinar los cuartiles se procede igual que en el caso de la
mediana, determinado preimágenes en la Ojiva.
 Existen otras medidas de posición similares, quintiles, deciles,
percentiles. Estas medidas dividen a la población en 5, 10 y 100
partes iguales (20% , 10%, 1%). La forma de calcularlas es análoga.
 La denominación general para ellos es cuantiles.
19
Capítulo 2-Probabilidad
Capítulo 2: Probabilidad
Consideraciones previas:
 EXPERIMENTO ALEATORIO: Es cualquier acto o proceso en el que se
realizan observaciones que no pueden ser predichas con certeza.
 EVENTO SIMPLE: Es el resultado más básico de un experimento. Es
un punto en el espacio muestral.
 SUCESO: Es una colección específica de eventos simples.
 ESPACIO MUESTRAL E: En un experimento es el conjunto que
consta de la totalidad de puntos muestrales (eventos simples),
mutuamente excluyentes, que resultan de la ejecución del
experimento.
Ejemplo:
Experimento aleatorio: Lanzar un dado y observar el número de la cara
superior.
Eventos Simples: {1}, {2}, {3}, {4}, {5}, {6}. Cada uno de estos son los
resultados que se pueden obtener en el experimento, se denominan
eventos simples.
Suceso: A= {4, 5,6} B= “Obtener un número par”. En este caso el Suceso
A, refiere a obtener en el lanzamiento un número mayor a 3. En el caso B
el suceso equivale a B= {2, 4,6}, obtener en el lanzamiento alguno de esos
tres resultados.
Completa P(A)=…….. y P(B)=………
Espacio Muestral: E= {1, 2, 3, 4, 5, 6}.
Principios básicos que rigen la probabilidad:

La probabilidad es una función que asigna un valor numérico a cada
elemento de un conjunto de sucesos asociados a un experimento
aleatorio.
La probabilidad de cualquier suceso es un número comprendido entre
0 y 1:
0 ≤ 𝑃(𝐴) ≤ 1
20
La probabilidad del suceso imposible es 0:

𝑃(∅) = 0.
La probabilidad del espacio muestral es 1:
𝑃(𝐸) = 1.
La probabilidad de la unión de dos sucesos disjuntos es igual a la suma de
las probabilidades de cada suceso:
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) si 𝐴 ∩ 𝐵 = ∅.
Si los sucesos no son disjuntos, entonces tendremos:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵).
Ejemplo: Considerando el experimento de lanzar un dado, sean los

sucesos A={4,5,6} , B={2,4,6} , C={1,2,3} entonces:
3 3 2 4 2
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = + − = = . Debido a que
6 6 6 6 3
𝐴 ∩ 𝐵 = {4,6}.
3 3
𝑃(𝐴 ∪ 𝐶) = 𝑃(𝐴) + 𝑃(𝐶) = + = 1 .Dado que los sucesos son
6 6
disjuntos, además en este caso se denominan complementarios ya que
𝐴 ∪ 𝐶 = 𝐸.
21
Cálculo de Probabilidad
Regla de Laplace
La probabilidad de un suceso se calcula, siempre que los sucesos
elementales sean equiprobables, mediante la llamada regla de Laplace:
𝑛° 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎 𝐴
𝑃(𝐴) =
𝑛° 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Enfoque frecuencista
Dejamos caer 1 chinche y nos preguntamos cuál es la probabilidad de que
caiga con la punta hacia arriba. En este caso, ¿te parece correcto aplicar la
regla de Laplace? ¿Cuál sería la probabilidad?
 Realiza el experimento varias veces y saca conclusiones
Conclusión:
 Existen experimentos donde no es posible aplicar la regla de
Laplace.
 En este caso es necesario conocer otro enfoque para determinar la
probabilidad.
El enfoque clásico está limitado a los casos donde existe igual probabilidad
entre los sucesos elementales. Esto nos limita y no nos permite trabajar
casos como el anterior.
Por esta razón introducimos una definición alternativa de probabilidad,
donde la probabilidad está asociada a la frecuencia relativa de la aparición
u ocurrencia del suceso, cuando el número de observaciones es muy
grande.
La probabilidad es límite de la frecuencia relativa cuando el número de
observaciones crece indefinidamente (Ley de los grandes números)
𝐥𝐢𝐦 𝒇𝒓 (𝑨) = 𝒑(𝑨)
𝒏→∞
𝑛𝐴
𝑓𝑟 (𝐴) = , es la frecuencia relativa del suceso A, o sea las veces que
𝑛
aparece A en n ensayos.
22
Probabilidad condicionada
La probabilidad de un suceso A puede verse modificada si ha ocurrido
previamente otro suceso B. Para recoger esta influencia entre los sucesos,
se define la probabilidad de A condicionada por B y se escribe P(A/B).
Ejemplo: En una urna hay 6 bolas numeradas del 1 al 6. Sean los sucesos
A= “extraer un bola con número par” y B= “extraer una bola con un
número mayor a 3”.
a. Calcular p(A) y p(B).
b. Sabiendo que ya se extrajo una bola par, ¿cuál es la probabilidad de
que su número sea mayor a 3?
a. p(A)=3/6 p(B)=3/6.
b. p(B/A)=2/3.
2/6 𝑝(𝐴∩𝐵) 𝒑(𝑨∩𝑩)
Observemos que: 𝑝(B/A) = = , en general 𝒑(B/A) =
3/6 𝑝(𝐴) 𝒑(𝑨)
Sucesos dependientes e independientes.

Vamos a distinguir con dos ejemplos a estos dos tipos de sucesos:
Supongamos que de un mazo de barajas españolas, sin comodines,
extraemos dos cartas:
a. Si la extracción se hace de forma consecutiva y sin reposición ¿cuál
es la probabilidad de que las dos cartas sean de oro?
Considerando que hay 12 cartas de oro en un total de 48, la
probabilidad de que la primera carta extraída sea de oro es 12/48,
luego de hacer esta extracción quedan en el mazo 11 cartas de oro
de un total de 47, entonces la probabilidad de que la segunda carta
sea de oro es 11/47. Estos sucesos se denominan dependientes,
porque lo que ocurre en la primera extracción afecta la probabilidad
de la segunda extracción.
23
Llamemos a los sucesos A =“la primera carta es de oro” y B=“a

segunda carta es de oro”. Entonces la probabilidad de que las dos
𝟏𝟐 𝟏𝟏
cartas sean de oro es :𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩/𝑨)= ( ). ( ).
𝟒𝟖 𝟒𝟕
b. Considerando ahora una extracción con reposición, tendremos
ahora que la sustracción de la segunda carta no se ve condicionada
por lo que sucedió en la primera, entonces estos sucesos se
𝟏𝟐 𝟏𝟐
denominan independientes: 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩) = ( ) . ( ).
𝟒𝟖 𝟒𝟖
En general:
 Sucesos dependientes: 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩/𝑨).

 Sucesos independientes: 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩).
Observación: La independencia no implica que los dos sucesos tengan
igual probabilidad, independencia significa que la ocurrencia o no de uno
de ellos no afecta a la probabilidad del otro.
Distribución de Probabilidad Discreta.

Si una variable 𝑋 puede tomar una serie de valores discretos 𝑋1 , 𝑋2 , . . . , 𝑋𝑛
con probabilidades respectivas 𝑝1 , 𝑝2 , … , 𝑝𝑛 , donde 𝑝1 + 𝑝2 +. . +𝑝𝑛 = 1
(∑𝑛𝑖=1 𝑝𝑖 = 1), se dice que ha sido definida para 𝑋 una distribución de
probabilidad discreta. La función 𝑝(𝑋) que toma los valores respetivos
𝑝1 , 𝑝2 , … , 𝑝𝑛 para 𝑋 = 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 se llama función de probabilidad de
𝑋.
Como 𝑋 puede tomar una serie de valores que se pueden poner en
correspondencia con los números enteros, se le llama a 𝑋 variable
aleatoria discreta.
Sea 𝑋 la variable que denota la suma de puntos obtenidos al lanzar un par
de dados. Entonces la distribución de probabilidad viene dada por la
siguiente tabla:
𝑋 2 3 4 5 6 7 8 9 10 11 12
𝑝(𝑋) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
24
Adviértase que esto es análogo a la distribución de frecuencia relativa en

la que las frecuencias relativas han sido sustituidas por probabilidades. Así
se puede pensar que las distribuciones de probabilidad son teóricamente
las distribuciones de frecuencia relativa llevadas al límite, es decir, cuando
el número de observaciones hechas es muy grande.
Esperanza Matemática
Si 𝒑 es la probabilidad de que una persona reciba una suma de dinero S, la
esperanza matemática, o simplemente la esperanza se define como 𝒑. 𝑺.
Ejemplo: Si la probabilidad de que un hombre gane un premio de $10 es
1/5, su esperanza es (1/5).(10)=2.
El concepto de esperanza es fácilmente generalizado. Si 𝑋representa una
variable aleatoria discreta que puede tomar los valores 𝑋1 , 𝑋2 , . . . , 𝑋𝑛 con
probabilidades respectivas 𝑝1 , 𝑝2 , … , 𝑝𝑛 , donde 𝑝1 + 𝑝2 +. . +𝑝𝑛 = 1, la
esperanza matemática de 𝑋 (simbolizada 𝐸(𝑋)), se define como:
𝑖=𝑛
𝐸(𝑋) = 𝑝1 𝑋1 +𝑝2 𝑋2 + ⋯ + 𝑝𝑛 𝑋𝑛 = ∑ 𝑝𝑖 𝑋𝑖
𝑖=1
Por ejemplo, la esperanza para la suma de los dos dados es:

1 2 3 4 5 6 5 4 3 2 1
𝐸(𝑋) = 2+ 3+ 4+ 5+ 6+ 7+ 8+ 9+ 10 + 11 + 12 = 7.
36 36 36 36 36 36 36 36 36 36 36
Experimentos de Bernoulli
Un experimento de Bernoulli, es un experimento donde la variable
aleatoria X involucrada solamente puede tomar dos valores, 0 y 1.
Consideremos por ejemplo el caso de contestar una pregunta en un
cuestionario múltiple opción. En este experimento se pueden dar dos
resultados, contesto de forma correcta o no. Si asignamos 1 al suceso
contestar de forma correcta y 0 al otro, estamos ante un experimento de
Bernoulli. Donde 1 se da con probabilidad p y 0 con probabilidad (1-p).
Entonces un experimento de Bernoulli será aquel donde se puedan dar
solamente dos resultados, el resultado favorable (éxito) 1 o un resultado
no favorable (fracaso) 0, estos dos resultados son complementarios y sus
probabilidades deben sumar 1.
25
Ejemplo:
Siguiendo con el caso mencionado anteriormente donde se responde a un
cuestionario múltiple opción, supongamos que cada pregunta tiene tres
posibles respuestas, donde solamente una es correcta, la probabilidad de
que un estudiante que no posee conocimiento alguno acierte, es 1/3.
Ahora ¿Cuál será la probabilidad de que al responder 4 preguntas acierte
en 3?
Queda claro que responder cada pregunta se ajusta a un experimento de
Bernoulli, pero acá estamos analizando 4 experimentos de Bernoulli al
mismo tiempo, transformando esta situación en un experimento Binomial.
Como cada experimento de Bernoulli toma valores 0 o 1, este
experimento que consiste en analizar lo ocurrido en 4 aplicaciones tomará
valores ,0 ,1 ,2 ,3 y 4, donde 0 significa no acertó a ninguna de las 4
preguntas y 4 significa que acertó a las cuatro respuestas.
Pensemos la solución en un diagrama de árbol, donde A es éxito con
probabilidad 1/3 y B es fracaso con probabilidad 2/3.
Observemos que los
caminos que nos conducen
a responder la pregunta
planteada son 4, entonces
la probabilidad de acertar
tres veces es:
P( X  3)  4(1/ 3)3 (2 / 3)1

Averiguar la probabilidad
para 0,1,2 y 4 aciertos.
Este experimento es binomial
con p=1/3 , (1-p)=2/3 , n=4, se
anotara B(4 , 1/3).
Observemos que la forma

general para la asignación de
probabilidad en este ejercicio es P ( X  k )  C k (1 / 3) k (2 / 3) (4k ) .
4
26
Distribución de probabilidad binomial:

Si p es la probabilidad de éxito en un ensayo de Bernoulli y (1-p) la
probabilidad de fracaso, entonces la probabilidad de que el suceso se
presente exactamente k veces en n ensayos es:
B (n, p )  P ( x  k )  C k. p k .(1  p ) ( nk )

n
Observaciones:
 La media en la distribución binomial es E ( X )    n. p .
 La desviación típica será   n. p.(1  p) .
 Aplicaremos la probabilidad Binomial cuando haya una serie de n
ensayos de Bernoulli.
Función de distribución de probabilidad para una variable aleatoria

discreta:
La función de distribución de probabilidad para una variable aleatoria
discreta X puede obtenerse a partir de su función de probabilidad, de
manera que para todo x real:
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∑ 𝑓(𝑢)

𝑢≤𝑥
Ejemplo: Dada una variable aleatoria 𝑋 = {0,1,2} con función de

1 1 1
probabilidad p(x) tal que: 𝑝(0) = , 𝑝(1) = 𝑦 𝑝(2) = . Entonces la
4 2 4
función de distribución quedara definida de la siguiente manera:
0, 𝑠𝑖 𝑥 < 0
1
, 𝑠𝑖 0 ≤ 𝑥 < 1
4
𝐹(𝑥) 3
, 𝑠𝑖 1 ≤ 𝑥 < 2
4
1, 𝑠𝑖 𝑥 ≥ 2
{
27
Distribuciones Continuas
En este caso nos encargaremos de la asignación de probabilidad a
variables aleatorias del tipo continua (recordar la definición de variables
continuas ya trabajada). En el caso de las variables aleatorias continuas la
asignación de probabilidad se hará analizando áreas, veamos un ejemplo:
Considerando que la frecuencia de la línea 8 de estación Balard a Créteil,

en Paris, es de 5 minutos. Determina la probabilidad de que una persona
que acaba de llegar a la estación tenga que esperar el metro por más de 4
minutos.
Consideremos que la persona no sabe cuándo pasó el tren anterior y
tampoco sabe el horario del siguiente, solamente se conoce la frecuencia.
La probabilidad de que el metro pase en cualquier instante es constante.

La función
f :  0;5  / f ( x)  0, 2
Se denomina función de
densidad y es la función que
nos permitirá el cálculo de
probabilidad. Obsérvese que
el área bajo la curva es 1.
Para determinar la probabilidad pedida,

debemos calcular
5
P( X  4)   f  0, 2(5  4)  0, 2 con este
4
procedimiento determinamos el área entre

4 y 5, que es la probabilidad buscada.
28
Características de la función de densidad de una distribución continua

Para que f(x) sea una función de densidad debe cumplir:
 f(x) 0 para todo valor x del intervalo [a,b] , donde la variable
aleatoria está definida.
 El área limitada por la curva del gráfico de f(x) entre los extremos a
y b y el eje Ox, es 1.
Observemos otras ilustraciones:
29
Referencias:
 “Apuntes de Probabilidad y Estadística” Darwin Leguisamo-José

Rebbellato.2015.
 http://www.universoformulas.com/
 “Apuntes de Estadística para profesorado” Federico de Olivera. 2010.
 “Estadística Médica” Carlos Ketzoian (coordinador). Facultad de Medicina.
Montevideo 2004.
 “Matemáticas II. Aplicadas a las ciencias sociales.” Grupo EDEBÉ. Barcelona
2009.
 “MATERIAL DE APOYO AL CICLO DE METODOLOGÍA I.” Mariela Garau, Cecilia
Kadessian, Anaulina Silveira.
 “Estadística para administración y economía” Mendenhall-Reunmuth.
30

Variables Estadísticas y Tratamiento de Datos

Încărcat de

Informații document

Descriere originală:

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Variables Estadísticas y Tratamiento de Datos

Încărcat de

Drepturi de autor:

Formate disponibile

APUNTES DE PROBABILIDAD Y

Capítulo1: Estadística Descriptiva

Individuo o Elemento: Individuo se considera a toda persona,

Si es interés del gobierno obtener datos sobre la desocupación y los

Técnicas habituales de muestreo:

Con reposición: Sin reposición:

Muestreo aleatorio sistemático:

Muestreo aleatorio estratificado proporcional sistemático:

adecuadamente en la muestra. Cada estrato funciona

Muestro polietápico en conglomerados.

Análisis y tratamiento de datos.

Frecuencia absoluta: Se denomina frecuencia absoluta del suceso S al

Aclaración: Suceso S puede ser cualquier observación realizada en un

Frecuencia relativa: Se llama frecuencia relativa de un suceso en una

En el ejemplo anterior la frecuencia relativa del suceso tener 17 años es

investigador, cualquier respuesta debe estar contemplada. Estos datos

Algunas aclaraciones respecto a la tabla:

A modo de ejemplo graficamos el caso anterior mediante estos dos

Frecuencia Relativa Acumulada (Fr): La frecuencia relativa acumulada de

Para el caso de las variables cualitativas ordinales valen las mismas

Histograma de frecuencia relativa

Ojiva de frecuencia acumulada

Ejemplo de tabla de frecuencia y gráfico de variables continuas.

Luego definimos la cantidad de intervalos a usar, en general el número de

𝒌 = 𝟏 + 𝟑, 𝟑𝟐. 𝒍𝒐𝒈(𝟐𝟎) ≈ 𝟓 , tomando el valor entero aproximado.

Gráficos para variables continuas

surge la necesidad de introducir el cálculo de determinadas medidas

Medidas de tendencia central

Moda: Para variables discretas disgregadas la moda es el valor con mayor

Media: La media es el promedio aritmético de los valores que toma la

Media para datos agrupados

1 𝑚𝑐1 .𝑛1 +𝑚𝑐2 .𝑛2 +⋯+𝑚𝑐𝑘 .𝑛𝑘

Mediana: En el caso de una serie de datos de tamaño n, ordenados de

Mediana para datos agrupados: La mediana en datos agrupados será la

A continuación se muestra el procedimiento de cálculo por interpolación

Para calcular la preimagen de la mediana

Grupo 1 5000 55000 10000 50000 6000 54000.

Varianza: Es la media aritmética de las diferencias al cuadrado de cada

Observemos que sucede cuando aplicamos estas ideas al ejemplo

Al igual que en el cálculo de la media, para calcular la varianza y la

Coeficiente de variación (CV): El coeficiente de variación relaciona la

Ejemplo: Se hace un estudio de ingresos en hogares de dos ciudades, A y

Principios básicos que rigen la probabilidad:

La probabilidad del suceso imposible es 0:

Si los sucesos no son disjuntos, entonces tendremos:

Ejemplo: Considerando el experimento de lanzar un dado, sean los

Sucesos dependientes e independientes.

Llamemos a los sucesos A =“la primera carta es de oro” y B=“a

 Sucesos dependientes: 𝒑(𝑨 ∩ 𝑩) = 𝒑(𝑨). 𝒑(𝑩/𝑨).

Distribución de Probabilidad Discreta.

Adviértase que esto es análogo a la distribución de frecuencia relativa en

Por ejemplo, la esperanza para la suma de los dos dados es:

P( X  3)  4(1/ 3)3 (2 / 3)1

Observemos que la forma

Distribución de probabilidad binomial:

B (n, p )  P ( x  k )  C k. p k .(1  p ) ( nk )

Función de distribución de probabilidad para una variable aleatoria

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∑ 𝑓(𝑢)

Ejemplo: Dada una variable aleatoria 𝑋 = {0,1,2} con función de

Considerando que la frecuencia de la línea 8 de estación Balard a Créteil,

La probabilidad de que el metro pase en cualquier instante es constante.

Para determinar la probabilidad pedida,