Sunteți pe pagina 1din 38

Estadística

ÍNDICE

Estadística descriptiva ................................................................................................................................... 3

Noción y utilidad de la estadística descriptiva: su ámbito de aplicación ...................................................... 3

Definición de población y muestra .......................................................................................................... 3

Estadística descriptiva e inferencial ........................................................................................................... 3

Variables y tipos de datos .......................................................................................................................... 4

Estadística descriptiva ................................................................................................................................... 5

Distribución de frecuencias ........................................................................................................................... 5

Conceptos básicos ................................................................................................................................. 5

Medidas de tendencia central para datos no agrupados ............................................................................ 9

Cómo calcular cuartiles para datos no agrupados ................................................................................... 11

Calculo de la media, mediana y moda para datos agrupados ...................................................................... 12

Media ....................................................................................................................................................... 12

Moda ........................................................................................................................................................ 12

Mediana ................................................................................................................................................... 13

Varianza y desviación estándar datos no agrupados ................................................................................... 16

Varianza y desviación estándar datos agrupados ....................................................................................... 17

Representaciones graficas .......................................................................................................................... 20

Gráfica de barras ..................................................................................................................................... 20

Histograma .............................................................................................................................................. 20

Gráfica poligonal ...................................................................................................................................... 20

Gráfica circular ......................................................................................................................................... 21

Teoría de conjuntos ..................................................................................................................................... 21

Conjuntos con nombres específicos ........................................................................................................ 23

Operaciones con conjuntos ..................................................................................................................... 25

Unión ................................................................................................................................................... 25

Intersección ........................................................................................................................................ 25

1
Ajenos o disjuntos ..................................................................................................................................... 26

Complemento ..................................................................................................................................... 26

Probabilidad ................................................................................................................................................ 26

Teoría de la probabilidad ......................................................................................................................... 26

Calculo de la probabilidad ........................................................................................................................ 27

Métodos de medición de probabilidad .................................................................................................. 28

Estadística inferencial .............................................................................................................................. 28

Experimentos deterministas .................................................................................................................... 29

Experimentos aleatorios .......................................................................................................................... 29

Espacio muestral ..................................................................................................................................... 30

Suceso aleatorio .................................................................................................................................. 30

Regla de conteo ....................................................................................................................................... 30

Diagrama de arbol ................................................................................................................................... 31

REGLA DE CONTEO PARA EXPERIMENTOS DE ETAPAS MÚLTIPLES .............................................................. 32

Regla de conteo para combinaciones .................................................................................................. 32

PERMUTACIONES ..................................................................................................................................... 33

Distribuciones de probabilidad ................................................................................................................. 34

Distribución de Bernoulli....................................................................................................................... 34

Distribución binomial ............................................................................................................................ 35

Enfoques de la probabilidad ........................................................................................................................ 36

Enfoque subjetivo .................................................................................................................................... 36

Enfoque clásico ....................................................................................................................................... 36

De frecuencias relativa ............................................................................................................................ 37

2
ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA

NOCIÓN Y UTILIDAD DE LA ESTADÍSTICA DESCR IPTIVA: SU ÁMBITO DE APLICACIÓN

Supondremos que tenemos una población de interés, esto es, un conjunto arbitrario de personas, mediciones u
objetos cualesquiera. Y deseamos conocer cierta información de esta población. Debido a la imposibilidad o no
conveniencia de tener información de cada elemento de la población, tomamos entonces un pequeño subconjunto
de la población que llamaremos muestra.

Si quisiéramos saber el estado de salud de los niños en México sería necesario tomar una muestra del total de la
población, es decir que nuestra población son todos los niños en México y nuestra muestra pudieran ser unos 1000
niños.

ESTADÍSTICA DESCRIPTIVA E INFERENCIAL

La estadística es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para después obtener
conclusiones a partir de ellos. De manera general, la estadística puede ser dividida en dos grandes áreas.

3
 La estadística descriptiva es una colección de métodos para la organización, resumen y presentación de
datos.
 La estadística inferencial consiste entonces de algunas técnicas que nos ayudan a conocer, con
determinado grado de confianza, cierta información de la población con base en la información de la
muestra obtenida.

VARIABLES Y TIPOS DE DATOS

Una variable es una característica que varía de elemento a elemento en una población en estudio. Por ejemplo,
si nuestra población consta de personas entonces las siguientes son ejemplos de variables que podrían
interesarnos: edad, peso, sexo, estatura, etc. Las variables pueden ser cuantitativas, cuando se realiza una
medición, o pueden ser cualitativas, cuando solamente presentan una cualidad. La edad, el peso y la estatura son
ejemplos de variables cuantitativas en una población de personas, mientras que el sexo y el estado civil son
variables cualitativas.

 Variables cualitativas: Cuando solamente presentan una cualidad


 Variables cuantitativas: Cuando se realiza una medición
o Continuas: Cuando la medición puede adoptar cualquier valor
o Discretas: Que están separados entre sí, dicho de otro modo no existen valores entre ellos, por
ejemplo cuando contamos personas, no podríamos usar el término media persona para contar a
los individuos de la muestra o población

Tenemos cuatro escalas de medición para las variables, sean éstas cuantitativas o cualitativas: escala nominal,
escala ordinal, escala de intervalo y escala de razón.

Escala nominal. La escala nominal está asociada a variables cualitativas y será denominada de este modo si no se
pueden hacer operaciones aritméticas entre sus valores, son únicamente etiquetas. Por ejemplo, si estamos
estudiando una población humana, a la variable sexo podemos asignarle dos posibles valores: F para femenino, y
M para masculino, ésta es entonces una escala nominal pues los símbolos F y M son etiquetas arbitrarias, no existe
orden en ellos ni podemos realizar operaciones aritméticas.

Escala ordinal. En la escala ordinal los valores de la variable tienen un orden pero no se pueden hacer operaciones
aritméticas entre estos valores. Por ejemplo, para calificar las características de un objeto podemos suponer los
siguientes valores:

0 = Pésimo

1 = Malo

2 = Regular

3 = Bueno

4 = Excelente

En este caso la escala de medición de la variable en cuestión es ordinal pues existe un orden entre sus valores pero
no podemos decir por ejemplo que dos valores regulares hacen un valor excelente.

4
Escala de intervalo. En una escala de intervalo, existe un orden entre los valores de la variable y existe además una
noción de distancia aunque no se pueden realizar operaciones.

Escala de razón. En una escala de razón, la magnitud tiene un sentido físico y existe el cero absoluto. Por ejemplo,
la variable edad en años estudiada en una población humana.

ESTADÍSTICA DESCRIPTIVA

Supongamos que tenemos un conjunto de datos numéricos x1, x2, . . . , xn, que representan mediciones de alguna
variable de interés. Para conocer algunas características globales de esta variable se pueden calcular ciertas
medidas de tendencia central como la media, moda y mediana; y también otras medidas llamadas de dispersión
como la varianza y la desviación estándar.

DISTRIBUCIÓN DE FRECUENCIAS

La mayoría de los análisis estadísticos incluyen un gran número de datos, los cuales sería casi imposible utilizar sino
se les compactara mediante un sencillo procedimiento conocido como Tabla de Distribución de Frecuencias siendo
ésta la forma más común de organizar un gran número de datos.

Definición: Es una tabla que representa el número de elementos que pertenecen a cada una de las clases o
categorías en las que se haya dividido el conjunto de datos para su estudio.

Nota: El proceso es mucho más práctico que teórico por lo que lo explicaremos de forma práctica a través de un
ejemplo.

Clase: Es el número de subconjuntos en que se han agrupado los datos. Cada clase se puede denominar mediante
una letra, un número o alguna característica del subconjunto.

Intervalo de clase: Es un conjunto de elementos que forman a una clase, conteniendo un límite inferior y un límite
superior.

Tamaño de clase: Es la diferencia entre dos límites inferiores o superiores de clases sucesivas.

Frecuencia: Es el número de datos que pertenecen a cada clase.

Para llevar realizar la distribución de frecuencias dividiremos el proceso en 6 pasos:

1. Recopilación de datos.
2. Ordenamiento de los datos.
3. Determinación del número de clases.
4. Cálculo del tamaño de clase.
5. Elaboración de intervalos.
6. Obtención de frecuencias.
7. Cálculo de la marca de clase

5
Paso #1: Recopilación de datos

 Consiste en escribir los datos de la muestra que nos interesa conocer, sin importar el orden.

A continuación se presentan los datos obtenidos de una muestra de 31 estudiantes, a quienes se les preguntó su
estatura, las cuales se utilizarán para la elaboración de la Distribución de Frecuencias.

Paso #2: Ordenamiento de los datos

 Consiste en ordenar los datos en forma ascendente o descendente para facilitar el conteo de datos
que correspondan a cada uno de los intervalos.

A continuación se presenta la tabla de datos ordenados de las estaturas en metros de 31 estudiantes de 6°

6
Paso #3: Determinación del número de clases

El número de clases en que se agrupan los datos se determina con la raíz cuadrada del número de datos cuando
este es menor de 200.

Para muestras con 200 o más datos el número de clases se determina con la raíz cúbica del número de datos

Problema: Determinar el número de clases de la muestra de las estaturas de los alumnos de 6º (N=31)

Solución: √ si redondeamos N= 6

Paso #4 Cálculo del tamaño de la clase

Para determinar el tamaño de clase es necesario conocer el rango de la muestra, que se obtiene con la diferencia
entre el dato mayor y el dato menor de la muestra y se representa con la letra R.

Rango: es el intervalo entre el valor máximo y el valor mínimo

R= 1.87-1.52= 0.35

Tamaño de clase: El tamaño de clase se obtiene al dividir el rango entre el número de clases, y se representa con la
letra c.

c= 0.35/6 = 0.058

Paso #5: Elaboración de intervalos

El tamaño de clase indica el número de datos que conforman a cada intervalo, considerando los valores extremos
llamados límites. En cada intervalo aparece un límite inferior (LI) y un límite superior (LS).

Cada intervalo se forma sumando al límite inferior (LI) un número menos que el tamaño de clase para obtener el
límite superior (LS).

7
En la elaboración de la distribución de frecuencias se debe dejar un renglón antes de la primera clase y otro
después de la última.

Si en la elaboración de los intervalos se observa que algunos datos quedan fuera del número de clases, entonces se
debe agregar una clase más al final, esto no alterará los resultados.

Los intervalos quedarían de la siguiente manera:

LI de primer intervalo = 1.52-0.058=1.462

[1.462-1.52]

[1.52-1.578]

[1.578-1.636]

[1.636-1.694]

[1.694-1.752]

[1.752-1.81]

Paso #6: Obtención de frecuencias

La frecuencia de clase se obtiene contando, en la tabla de datos ordenados, los que correspondan al intervalo de
dicha clase.

Intervalos Frecuencia

1.46-1.52 1

1.52-1.57 4

1.57-1.63 6

1.63-1.69 10

1.69-1.75 8

1.75-1.81 1

1.81-1.868 1

8
Paso #7: Cálculo de la marca de clase

Marca de clase: La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros como la media aritmética o la desviación
típica.

El primer cálculo sería de la siguiente forma:

Intervalos Frecuencia Marca (Xi)

1.46-1.52 1 1.49

1.52-1.57 4 1.545

1.57-1.63 6 1.6

1.63-1.69 10 1.66

1.69-1.75 8 1.72

1.75-1.81 1 1.78

1.81-1.868 1 1.839

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

Rango: El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato menor al dato mayor.

Este dato permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están
los datos de un conjunto.

Ejemplo:

Se preguntó a 9 familias cuántas bicicletas tenían en total, dieron las respuestas ordenadas en la siguiente tabla:

- ¿Cómo hallarías el rango?

Se resta el dato mayor al dato menor: 3 - 0 = 3; Por lo tanto el rango sería 3 en este caso.

Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango es muy amplio, es conveniente
agruparlos y ordenarlos en intervalos o clases.

9
La amplitud o tamaño de cada intervalo se puede calcular dividiendo el valor del rango por la cantidad de
intervalos que se desean obtener.

Media: La media de los datos x1, . . . , xn, denotada por , es simplemente el promedio (x1 + · · · + xn)/n. En donde n
es el número de sumandos.

Ejemplo: Obtener la media del siguiente conjunto de números (1,2,3,4,5,6,7,8,9)

Solución:

Moda: La moda es el valor observado con mayor frecuencia. La moda puede no existir para un conjunto de datos, y
en caso de existir puede no ser única.

Ejemplo: Obtener la moda del siguiente conjunto numérico (1,1,2,3,3,2,2,1,1,2,1)

Solución: El valor que más veces se repita es la moda, para encontrar la moda es necesario contar la cantidad de
veces que aparece cada valor:

Valor Frecuencia

1 5

2 4

3 2

Respuesta: La moda del conjunto numérico es 5

Frecuencia: La frecuencia es el conteo de las veces que se repite un determinado valor.

Mediana: La mediana es el valor que se encuentra en medio del conjunto de datos ordenados

Ejemplo: Obtenga la mediana del siguiente conjunto numérico: 3, 13, 7, 5, 21, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29

Solución:

Lo único que tenemos que hacer es ordenar los valores e identificar el valor del medio:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23,


29, 39, 40, 56
La mediana de este conjunto de valores es 23

Ejemplo: Encuentre la mediana del siguiente conjunto numérico:

3, 13, 7, 5, 21, 23, 23, 40, 23, 14, 12,


56, 23, 29

10
Si ordenamos los números nos queda:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56

En este ejemplo los números intermedios son 21 y 23.

Para calcular el valor en medio de ellos, sumamos y dividimos entre 2:

21 + 23 = 44
44 ÷ 2 = 22

Así que la mediana en este ejemplo es 22.

CÓMO CALCULAR CUARTILES PARA DATOS NO AGRUPADOS

Ejercicio: Del siguiente conjunto número encontrar los cuartiles:

3, 13, 7, 5, 21, 23, 23, 40, 23, 14, 12,


56, 23, 29
El primer paso es ordenar los datos:

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56
Al realizar el conteo de los datos observamos que son 14 es decir que
n=14.

Otra cosa que podemos observar es que n es un número par por lo que es
necesario realizar la siguiente operación:

I2= =7

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56

Para encontrar el cuartil Q2 es necesario contar hasta llegar al valor


i2, en nuestro caso n=7, por lo que el valor que buscamos es el 21,
después se realiza el promedio con su vecino, quedando de la siguiente
forma:

Q2=

11
Para el cuartil Q1 es necesario encontrar i, pero antes debemos tomar a
n como n=7, que es la posición del segundo cuartil:

i1= =

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56

Por lo tanto Q1=12

Para encontrar la posición del tercer cuartil simplemente nos desplazamos i1 posiciones a la derecha, partiendo del
cuartil Q2

3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56

CALCULO DE LA MEDIA, MEDIANA Y MODA PARA DATOS AGRUPADOS

MEDIA

Se calcula sumando todos los productos de marca clase con la frecuencia absoluta respectiva y su resultado
dividirlo por el número total de datos:

La marca clase de una tabla para datos agrupados en intervalos corresponde al promedio de los extremos de cada
intervalo.

MODA

12
Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con datos agrupados,
hablaremos de intervalo modal.

La moda se representa por Mo.

 Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).
 fi Frecuencia absoluta del intervalo modal.
 fi-1 Frecuencia absoluta del intervalo anterior al modal.
 fi+1 Frecuencia absoluta del intervalo posterior al modal.
 t Amplitud de los intervalos.

MEDIANA

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La
mediana se representa por Me. La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las
frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre. N / 2

Luego calculamos según la siguiente fórmula:

Li-1 es el límite inferior de la clase donde se encuentra la mediana.

N / 2 es la semisuma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

fi es la frecuencia absoluta del intervalo mediano.

ti es la amplitud de los intervalos.

Ahora veamos un ejemplo:

- En la siguiente tabla se muestran las edades de un grupo de personas.

13
1° Calculemos la media aritmética:

2° Ahora calculemos la mediana (Me) según las fórmulas explicadas más arriba:

Lo primero que debemos hacer para poder calcular la mediana es identificar la clase mediana. Para esto tenemos
que buscar el intervalo en el que se encuentre. N / 2

En este caso N / 2 = 31 / 2 ⇒ 15,5

Ahora debemos buscar el intervalo donde la frecuencia acumulada (F i ) contenga el valor obtenido (15,5).

14
Recuerda:

Li-1 :es el límite inferior de la clase donde se encuentra la mediana, en este caso el límite inferior es 20.

N / 2 :es la semisuma de las frecuencias absolutas, en este caso es 15,5.

Fi-1 :es la frecuencia acumulada anterior a la clase mediana, en este caso es 9.

fi : es la frecuencia absoluta del intervalo mediano, en este caso es 7

ti :es la amplitud de los intervalos. Se calcula restando el extremo superior menos el inferior del intervalo, en este
caso es:

30 - 20 = 10

3° Calculemos la moda Mo :

Lo primero que debemos hacer es identificar el intervalo modal:

15
Ahora podemos reemplazar los datos en la fórmula:

- Si la moda está en el primer intervalo, entonces fi-1= 0. Si la moda está en el último intervalo, entonces fi+1= 0.

- Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma frecuencia
(distribuciones bimodales o multimodales).

4° Calculemos el rango :

R=Lm-Lo=50-0=50

VARIANZA Y DESVIACIÓN ESTÁNDAR DATOS NO AGRUPADOS

Determine la varianza y desviación estándar de los datos de la siguiente muestra:

10,11,11,12,12,13,13,13,14,15,17,18,20

Solución:

1° Primero calculamos la media aritmética de la muestra

N=13

16
2° Luego calculamos la varianza

S2=8.859

La variación cuadrática con respecto a la media es de 8.859

3° Luego calculamos la desviación estándar

S=√ =2.9764

La desviación estándar muestral es de 2.9764

VARIANZA Y DESVIACIÓN ESTÁNDAR DATOS AG RUPADOS

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:

Ejemplo

Calcular la desviación media de la distribución:

17
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución
estadística.

La varianza se representa por

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las
anteriores.

Calcular la varianza de la distribución de la tabla:

18
1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un número la varianza no varía.
3. Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por
el cuadrado de dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede
calcular la varianza total.

Si todas las muestras tienen el mismo tamaño:

Observaciones sobre la varianza

1. La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
2. En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3. La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están
elevadas al cuadrado.

Desviación estándar típica

 La desviación típica es la raíz cuadrada de la varianza.


 Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
 La desviación típica se representa por σ.

Ejemplo

Calcular la desviación estándar típica de la distribución de la


tabla:

Propiedades de la desviación estándar:

 La desviación típica será siempre un valor positivo o


cero, en el caso de que las puntuaciones sean iguales.
 Si a todos los valores de la variable se
les suma un número la desviación típica no varía.
 Si todos los valores de la variable se multiplican por
un número la desviación típica queda multiplicada por
dicho número.
 Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones típicas se
puede calcular la desviación típica total.

19
REPRESENTACIONES GRA FICAS

GRÁFICA DE BARRAS

HISTOGRAMA

GRÁFICA POLIGONAL

20
Gráfica ojiva

GRÁFICA CIRCULAR

TEORÍA DE CONJUNTOS

Un conjunto es un grupo de elementos u objetos especificados en tal forma que se puede afirmar con certeza si
cualquier objeto dado pertenece o no a la agrupación. Para denotar a los conjuntos, se usan letras mayúsculas.

Cuando un elemento 1 x pertenece a un conjunto A se expresa de forma simbólica como: x1 ∈ A . En caso de que
un elemento 1 y no pertenezca a este mismo conjunto se utiliza la notación: y1 ∉ A

Existen cuatro formas de enunciar a los conjuntos:

1. Por extensión o enumeración: los elementos son encerrados entre llaves y separados por comas. Es decir,
el conjunto se describe listando todos sus elementos entre llaves.
2. Por comprensión: los elementos se determinan a través de una condición que se establece entre llaves.
En este caso se emplea el símbolo | que significa “tal que". En forma simbólica es:

A = { x | P(x) }= {x1, x2 ,x3 , ⋅ ⋅ ⋅ xn }

21
Que significa que el conjunto A es el conjunto de todos los elementos x tales que la condición P(x) es verdadera,
como x1 x2 x3, , etc.

3. Diagramas de Venn: son regiones cerradas que sirven para visualizar el contenido de un conjunto o las
relaciones entre conjuntos.
4. Por descripción verbal: Es un enunciado que describe la característica que es común para los elementos.

Ejemplo:

Dada la descripción verbal “el conjunto de las letras vocales”, expresarlo por extensión, comprensión y por
diagrama de Venn.

Solución.

 Por extensión: V = { u,o,i,e,a }


 Por comprensión: V = {x| x es una vocal }
 Por diagrama de Venn:

Ejemplo:

Expresar de las tres formas al conjunto de los planetas del sistema solar.

Solución.

 Por extensión: P =
{Mercurio,Venus,Tierra,Marte,Júpiter,Saturno,Urano,Neptuno,Plu
tón }
 Por comprensión: P = { x |x es un planeta del sistema solar }
 Por diagrama de Venn:

Si cada elemento de un conjunto A es también un elemento del conjunto B, se dice que A es un subconjunto de B.
La notación A ⊂ B significa que A está incluido en B y se lee: “A es subconjunto de B ” o “ A está contenido en B ”.

Si no todos los elementos de un conjunto A son elementos del conjunto B, se dice que A no es subconjunto de B .
En este caso la notación A ⊄ B significa que A no es un subconjunto de B. Gráficamente, esto es:

22
En los ejemplos anteriores, si F = { o,e,a } es el conjunto de las vocales fuertes y S = {Mercurio,Venus } es el
conjunto de planetas que no poseen satélites, entonces se cumple que: F ⊂ V y que S ⊂ P . De la misma forma,
nótese como: F ⊄ P , S ⊄ V , F ⊄ S y S ⊄ F .

La cardinalidad de un conjunto se define como el número de elementos que posee. Se denota por medio de los
símbolos η o # . De los conjuntos anteriores: η(V ) = 5 , η(F ) = 3 , η(P) = 9 y η(S ) = 2 .

CONJUNTOS CON NOMBRES ESPECÍFICOS

 Un conjunto vacío o nulo es aquel que no posee elementos. Se denota por: φ o bien por { }. El conjunto
vacío siempre forma parte de otro, así que es subconjunto de cualquier conjunto.

Ejemplos.

φ = { x | x son los dinosaurios que viven en la actualidad }

{ }= { x | x son los hombres mayores de 300 años }

φ = { x | x son números positivos menores que cero}

 Un conjunto universal es aquel que contiene a todos los elementos bajo consideración. Se denota por U .
Gráficamente se le representará mediante un rectángulo.

Ejemplos.

 U = { x | x son los días de la semana }= {lunes,martes,miércoles, jueves,viernes,sábado ,domingo }


 A = { x | x son los días de la semanainglesa}= {lunes,martes,miércoles, jueves,viernes}
 B = { x | x son los días del fin de semana }= {sábado,domingo }
 C = { x | x son los días de la semana con menos de siete letras}= {lunes,martes, jueves,sábado}

Nótese cómo: A ⊂ U , B ⊂ U , C ⊂ U

 Un conjunto finito es aquel cuyos elementos pueden ser contados.

Ejemplos.

 J = { x | x es el número de un día del mes de junio }


 K = {x | x2 = 4}
 L = { x | x es la cantidad de autos en la ciudad de México }

Conjunto finito

 Un conjunto infinito es aquel cuyos elementos no pueden ser contados, es decir, su cardinalidad no está
definida.

Ejemplos.

 N = {1,3,5,7,9,11,⋅ ⋅ ⋅ }
 M = {2,4,6,8,10,12,⋅ ⋅ ⋅ }
 Q = { x | x es la cantidad de puntos en una línea }

23
 Dos conjuntos son iguales si tienen exactamente los mismos elementos. Se denota por el símbolo =.

Ejemplo.

R = {1,2,3,4,5,6,7,8,9,0}

S = { x |x es un dígito }

R=S

 Dos conjuntos son desiguales si por lo menos difieren en un elemento, es decir, si no tienen exactamente
los mismos elementos. Se denota por el símbolo ≠ .

Ejemplo.

 D = {x| x2 =9}
 E = {− 2,2 }
 D≠E

Conjuntos equivalentes

 Dos conjuntos son equivalentes si tienen la misma cantidad de elementos, es decir, si poseen la misma
cardinalidad. Se denota por el símbolo ≈.

Ejemplos.

 W = {x|x son las estaciones del año }


 Z = {x|x es un punto cardinal }
 η(W ) = 4
 η(Z) = 4
 W ≈Z

Cuando los conjuntos son equivalentes existe una correspondencia uno a uno o biunívoca. Esto significa que se
puede establecer una relación que asocie a cada elemento del primer conjunto con un único elemento del
segundo conjunto sin que sobren elementos en ningún conjunto.

En el ejemplo anterior:

24
OPERACIONES CON CONJUNTOS

La unión de los conjuntos A y B es el conjunto de todos los elementos de A con todos los elementos de B sin repetir
ninguno y se denota como A∪ B . Esto es:

A∪ B = { x| x ∈ A o x ∈ B }

Gráficamente:

Ejemplo.

 A = {mango,ciruela,uva,naranja,manzana,sandía }
 B = {durazno,melón,uva,naranja,sandía, plátano }
 A∪ B = {mango,ciruela,uva,naranja,manzana,sandía,durazno,melón, plátano }

La intersección de los conjuntos A y B es el conjunto de los elementos de A que también pertenecen a B y se


denota como A∩ B. Esto es:

A ∩ B = { x |x ∈ A y x ∈ B }

Gráficamente:

25
Ejemplo.

 A = {mango,ciruela,uva,naranja,manzana,sandía }
 B = {durazno,melón,uva,naranja,sandía, plátano }
 A∩ B = { uva,naranja,sandía }

Dos conjuntos son ajenos o disjuntos cuando su intersección es el conjunto vacío, es decir, que no tienen nada en
común. Por ejemplo:

 A = {mango,ciruela,uva,naranja,manzana,sandía }
 E = {limón, fresa, pera,mandarina,cereza}
 A∩ E = φ

 El complemento del conjunto A con respecto al conjunto universal U es el conjunto de todos los
elementos de U que no están en A y se denota como A'. Esto es:

A'= { x ∈ U | x∉ A}

Gráficamente:

PROBABILIDAD

La probabilidad mide la mayor o menor posibilidad de que se dé un determinado resultado (suceso o evento)
cuando se realiza un experimento aleatorio

TEORÍA DE LA PROBABILIDAD

Esta teoría matemática tuvo como uno de sus primeros puntos de partida el intentar resolver un problema
particular concerniente a una apuesta de juego de dados entre dos personas. El problema al que nos referimos
involucraba una gran cantidad de dinero y puede plantearse de la siguiente forma:

Dos jugadores escogen cada uno de ellos un número del 1 al 6, distinto uno del otro, y apuestan 32 doblones de oro
a que el número escogido por uno de ellos aparece en tres ocasiones antes que el número del contrario al lanzar

26
sucesivamente un dado. Suponga que el número de uno de los jugadores ha aparecido dos veces y el número del
otro una sola vez. Bajo estas circunstancias, ¿cómo debe dividirse el total de la apuesta si el juego se suspende?

Uno de los apostadores, Antonio de Gombaud, popularmente conocido como el caballero De Meré, deseando
conocer la respuesta al problema plantea la situación a Blaise Pascal (1623-1662). Pascal a su vez consulta con
Pierre de Fermat (1601-1665) e inician estos últimos un intercambio de cartas a propósito del problema. Esto
sucede en el año de 1654. Con ello se inician algunos esfuerzos por dar solución a éste y otros problemas similares
que se plantean. Con el paso del tiempo se sientan las bases y las experiencias necesarias para la búsqueda de una
teoría matemática que sintetice los conceptos y los métodos de solución de los muchos problemas particulares
resueltos a lo largo de varios anos. En el segundo congreso internacional de matemáticas, celebrado en la ciudad
de Paris en el año 1900, el matemático David Hilbert (1862-1943) plantea 23 problemas matemáticos de
importancia. Uno de estos problemas es el de encontrar axiomas o postulados a partir de los cuales se pueda
construir una teoría matemática de la probabilidad. Aproximadamente treinta años después, en 1933, el
matemático ruso A. N. Kolmogorov (1903-1987) propone ciertos axiomas que a la postre resultaron adecuados
para la construcción de una teoría de la probabilidad. Esta teoría prevalece hoy en día y ha adquirido el calificativo
de teoría clásica.

Actualmente la teoría de la probabilidad se ha desarrollado y extendido enormemente gracias a muchos


pensadores que han contribuido a su crecimiento, y es sin duda una parte muy importante y bien establecida de
las matemáticas. La teoría de la probabilidad ha resultado muy útil para modelar fenómenos de muy diversas
disciplinas del conocimiento humano en donde es necesario incorporar la incertidumbre o el azar como un
elemento del modelo.

CALCULO DE LA PROBABILIDAD

Para calcular la probabilidad de un evento se toma en cuenta todos los casos posibles de ocurrencia del mismo; es
decir, de cuántas formas puede ocurrir determinada situación.

 Los casos favorables de ocurrencia de un evento serán los que cumplan con la condición que estamos
buscando.
 La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%):
 El valor cero corresponde al suceso imposible; ejemplo: lanzamos un dado al aire y la probabilidad de que
salga el número 7 es cero.
 El valor uno corresponde al suceso seguro, ejemplo: lanzamos un dado al aire y la probabilidad de que
salga cualquier número del 1 al 6 es igual a uno (100%).
 El resto de sucesos tendrá probabilidades entre cero y uno: que será tanto mayor cuanto más probable
sea que dicho suceso tenga lugar.

27
En el estudio de la probabilidad, definimos un EXPERIMENTO como un proceso que genera resultados bien
definidos. En cualquier repetición siempre de un experimento, ocurrirá uno y solo uno de los posibles resultados
experimentales. A continuación vemos algunos ejemplos de experimentos y sus resultados.

Uno de los métodos más utilizados es aplicando la Regla de Laplace: define la probabilidad de un suceso como el
cociente entre casos favorables y casos posibles.

Ejemplos:

a) Probabilidad de que al lanzar un dado salga el número 2: el caso favorable (f) es tan sólo uno (que salga el
dos), mientras que los casos posibles (n) son seis (puede salir cualquier número del uno al seis).

También podemos expresar el resultado en porcentajes, por lo tanto: 16.6%

b) Probabilidad de que al lanzar un dado salga un número par: en este caso los casos favorables (f) son tres
(que salga el dos, el cuatro o el seis), mientras que los casos posibles (n) siguen siendo seis.

c) Probabilidad de que al lanzar un dado salga un número menor que 5: en este caso tenemos cuatro casos
favorables (f) (que salga el uno, el dos, el tres o el cuatro), frente a los seis casos posibles.

ESTADÍSTICA INFERENC IAL


La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales para toda la
población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

Muestreo probabilístico

Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de muestreo:

 Muestreo aleatorio simple: Para obtener una muestra, se numeran los elementos de la población y
se seleccionan al azar los n elementos que contiene la muestra.

28
 Muestreo aleatorio sistemático: Se elige un individuo al azar y a partir de él, a intervalos constantes,
se eligen los demás hasta completar la muestra.

Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25
elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A
continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4, y a partir de
él obtenemos los restantes elementos de la muestra.

Muestreo aleatorio estratificado

Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato
proporcional al número de componentes de cada estrato.

En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200
trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.

Un muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita.

En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición.

Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra podemos calcular
un estadístico (media, desviación típica, proporción, ...) que variará de una a otra.

Así obtenemos una distribución del estadístico que se llama distribución muestral.

EXPERIMENTOS DETERMINISTAS
Son los experimentos de los que podemos predecir el resultado antes de que se realicen.

Si dejamos caer una piedra desde una ventana sabemos, sin lugar a dudas, que la piedra bajará. Si la arrojamos
hacia arriba, sabemos que subirá durante un determinado intervalo de tiempo; pero después bajará.

EXPERIMENTOS ALEATOR IOS


Son aquellos en los que no se puede predecir el resultado, ya que éste depende del azar.

29
Ejemplos:

 Si lanzamos una moneda no sabemos de antemano si saldrá cara o cruz.


 Si lanzamos un dado tampoco podemos determinar el resultado que vamos a obtener.

ESPACIO MUESTRAL

Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la
letra griega Ω).

Espacio muestral de una moneda: E = {C, X}.

Espacio muestral de un dado: E = {1, 2, 3, 4, 5, 6}.

Suceso aleatorio es cualquier subconjunto del espacio muestral.

Tirar un dado: Un suceso sería que saliera par, otro, obtener múltiplo de 3, y otro, sacar 5.

REGLA DE CONTEO

Un paso necesario en la asignación de probabilidades es poder identificar y contar los resultados experimentales. A
continuación se analizan tres reglas de conteo que resultan útiles.

La primera regla de conteo es para experimentos de varias etapas. Considere el experimento que consiste en
lanzar dos monedas. Los resultados experimentales se definen en términos de la sucesión de caras o escudos que
aparecen en las caras superiores de las dos monedas. ¿Cuantos resultados experimentales son posibles para este
experimento? Lanzar las dos monedas se pueden considerar como un experimento de dos pasos en que el primero
es el lanzamiento de la primera moneda y el segundo es el lanzamiento de la segunda. Si para denotar escudo
usamos la H y para denotar cara empleamos una T.(H,H) indica el resultado experimental con escudo en la primera
moneda y un escudo en la segunda. Con esta notación podemos describir el espacio muestral S para el
lanzamiento de monedas de la manera siguiente:

S={(H,H),(H,T),(T,H),(T,T)}

Así vemos que son posibles cuatro resultados experimentales. En este caso, no es difícil listarlos todos.

La regla de conteo para experimentos de varias etapas permite determinar el número de resultados
experimentales sin listarlos.

Un ejemplo completo

Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas. Calcular:

1. El espacio muestral:

E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}

30
2. El suceso A = {extraer tres bolas del mismo color}.

A = {(b,b,b); (n, n,n)}

3. El suceso B = {extraer al menos una bola blanca}.

B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}

4. El suceso C = {extraer una sola bola negra}.

C = {(b,b,n); (b,n,b); (n,b,b)}

DIAGRAMA DE ARBOL
Para la construcción de un diagrama en árbol se partirá poniendo una rama para cada una de las posibilidades,
acompañada de su probabilidad.

En el final de cada rama parcial se constituye a su vez, un nudo del cual parten nuevas ramas, según
las posibilidades del siguiente paso, salvo si el nudo representa un posible final del experimento (nudo final).

Hay que tener en cuenta: que la suma de probabilidades de las ramas de cada nudo ha de dar 1.

Ejemplo:

Una clase consta de seis niñas y 10 niños. Si se escoge un comité de


tres al azar, hallar la probabilidad de:

1. Seleccionar tres niños.

2. Seleccionar exactamente dos niños y una niña.

3. Seleccionar exactamente dos niñas y un niño.

31
4. Seleccionar tres niñas.

Ejemplo:

Calcular la probabilidad de que al arrojar al aire tres monedas, salgan:

Tres caras.

REGLA DE CONTEO PARA EXPERIMENTOS DE ETAP AS MÚLTIPLES

Si un experimento se puede describir como una sucesión de K etapas, en las que hay n1 resultados posibles de la
primera etapa, n2 en la segunda, etc.., la cantidad total de resultados experimentales es igual a (n1),(n2)......(nK).

Si el experimento de lanzar dos monedas se considera como una sucesión de primero lanzar una moneda (n1=2) y
luego lanzar la otra (n2=2), podemos inferir de la regla de conteo que hay (2)(2)=4 resultados experimentales
distintos. Como se observa, hay S={(H,H),(H,T),(T,H),(T,T)}. El número de resultados experimentales en un
experimento que consiste en el lanzamiento d seis monedas es (2)(2)(2)(2)(2)(2)=64.

COMBINACIONES

Una segunda regla de conteo que con frecuencia es de utilidad, permite contar la cantidad de resultados
experimentales cuando en un experimento se deben seleccionar r objetos entre un conjunto de n objetos(por lo
común más grande). Se llama regla de conteo para combinaciones. El orden de los objetos seleccionados no es
importante en el orden.

La cantidad de combinaciones de n objetos tomados r a la vez es

32
La notación ! significa factorial; por ejemplo, 5 factorial es 5!=(5)(4)(3)(2)(1)=120. Por definición, 0! es igual a 1.

Un ejemplo de la regla de conteo para combinaciones es un procedimiento de control de calidad en que un


inspector selecciona al azar dos de cinco partes, para examinar y ver si tiene defectos. En un grupo de cinco partes,
¿cuantas combinaciones de dos partes se puede seleccionar?. La regla de conteo de la ecuación que para n=5 y r=2
el resultado es

Así, hay 10 resultados en el experimento de seleccionar al azar dos partes de un grupo de cinco. Si identificamos a
cinco partes como A,B,C,AD,AE,BC,BD,BE,CD,CE y DE.

Otro ejemplo es el siguiente: la lotería de Ohio emplea selección aleatoria de seis números de un grupo de 47 para
determinar al ganador semanal. Se puede aplicar la regla de conteo. Para combinaciones, para calcular la cantidad
de maneras en que se pueden seleccionar seis números distintos de entre un grupo de 47 números.

La regla de conteo para combinaciones indica que hay más de 10 millones de resultados experimentales para
determinar al ganador de la lotería. Una persona se compra un boleto de lotería tiene una posibilidad de ganar
10737573 .

La tercera regla de conteo que a veces resulta útil es la regla de conteo para permutaciones. Esta permite que uno
pueda calcular el número de resultados experimentales al seleccionar objetos de un conjunto n objetos, donde es
importante el orden de selección. Si los mismos objetos se seleccionan en otro orden se considera que se trata de
un resultado experimental distinto. En las permutaciones sí importa el orden

Regla de conteo para permutaciones

El número de permutaciones de n objetos tomando r a la vez está dado por

33
La regla de conteo para permutaciones tiene estrecha relación con la de las combinaciones. No obstante, un
experimento tendrá más permutaciones que combinaciones para el mismo número de objetos porque cada
selección de r objetos tiene n! formas distintas para ordenarlos.

Como ejemplo, considere de nuevo el proceso de control de calidad en que un inspector selecciona dos de cinco
parte para hallar los defectos. ¿Cuantas permutaciones es posible seleccionar? La regla de conteo de ecuación
muestra que con n=5 y r=2 se tiene

Por tanto, 20 resultados son posibles para el experimento de elegir al azar dos pares de un grupo de cinco cuando
hay que tomar en cuenta el orden de selección. Si marcamos las partes A,B,C, y E, las 20 permutaciones son
AB,BA,AC,CA,AD,DA,AE,EA,BC,CB,BD,,DB,BE,EB,CD,DC,CE,EC,DE,ED.

DISTRIBUCIONES DE PROBABILIDAD

Un experimento aleatorio se dice que es de Bernoulli cuando únicamente puede tener dos resultados mutuamente
excluyentes; uno de ellos se denomina “éxito” y el otro “fracaso”.

Ejemplos:

 Los resultados “cara” o “cruz” en el lanzamiento de una moneda.


 Las piezas “defectuosa” o “no defectuosa” en el control de calidad de un producto.
 Resultado “exitoso” o “fallido” de la petición a un servidor.

Sea X una v. a. asociada a un experimento de Bernoulli y que toma los valores:

Entonces se dice que X sigue una distribución de Bernoulli X ≡ B(1, p). Su función de probabilidad viene dada por:

Propiedades:

34
Una sucesión de n pruebas se dice que es de Bernoulli cuando los experimentos individuales verifican las
siguientes condiciones:

1. Las n pruebas son independientes.


2. Cada prueba es de Bernoulli.
3. La probabilidad p de éxito es igual en todas las pruebas.

La variable aleatoria definida como “número de éxitos en n pruebas”, X ≡ B(n, p), se dice que sigue una distribución
binomial de parámetros n, p. La variable puede tomar los valores {0, 1, 2, . . . , k, . . . , n} y su función de
probabilidad es la siguiente:

Ejemplos:

 Numero de “veces” que aparece el


resultado cara al lanzar una moneda diez
veces.
 Numero de éxitos en la recepción de un mensaje enviado a 100 destinatarios.
 Número de ordenadores en una subred que han sido infectados por un virus.

Distribución normal

Es la más importante de las distribuciones continuas ya que permite describir un número muy grande de
fenómenos aleatorios, como por ejemplo aquellos en los que intervienen un número elevado de factores no
controlables, que actúan de manera independiente y con efectos pequeños.

Una v.a. se dice que sigue una distribución normal X ≡ N(µ; σ), si su función de densidad es:

35
ENFOQUES DE LA PROBA BILIDAD

ENFOQUE SUBJETIVO

La probabilidad de un evento es el grado de certidumbre que tiene una persona, o grupo de personas, acerca de la
ocurrencia de un evento. Puede ser que se base en la experiencia o en cierta información que se tenga. Es de juicio
personal

Ejemplo: Está nublado, hay un 70% de probabilidad de lluvia.

ENFOQUE CLÁSICO

Se basa en el supuesto de que cada resultado es igualmente probable

P(A) = N(A)=

Si en un grupo hay 40 ingenieros y 20 arquitectos, la probabilidad de que al seleccionar aleatoriamente a una


persona del grupo, su profesión sea de ingeniero es: P(A) = N(A)= 40/60 = 4/6 = .67 %

36
DE FRECUENCIAS RELAT IVA

La probabilidad se determina en base a la proporción de veces en que ocurre un resultado en cierto número de
observaciones o experimentos. Se basa en una muestra, en una estimación real desconocida.

P=

Ejemplo: Al sacar de una urna muy grande 100 pelotas, se observaron 30 rojas y 70 blancas. La probabilidad de que
al sacar otra pelota ésta sea blanca es: (se desconoce cuántas pelotas hay dentro de la urna)

P=

37