Sunteți pe pagina 1din 74

Probabilidad y Estadística

1.1.1 Bosquejo histórico de la Estadística


Babilonios

Hacia el año 3000 a.C. los babilonios usaban


pequeñas tablillas de arcilla para recopilar datos
sobre la producción agrícola y sobre los géneros
vendidos o cambiados mediante trueque.
Egipcios
En el siglo XXXI a.C., mucho antes de construir las
pirámides, los egipcios analizaban los datos de la
población y la renta del país. Los libros bíblicos de
Números y Crónicas incluyen, en algunas partes,
trabajos de estadística. El primero contiene dos
censos de la población de Israel y el segundo
describe el bienestar material de las diversas
tribus judías.
Chinos

En China existían registros numéricos


similares a la de los egipcios con
anterioridad al año 2000 a.C.
Griegos

Los griegos clásicos realizaban censos cuya


información se utilizaba hacia el 594 a.C. para
cobrar impuestos.
Imperio romano

El Imperio romano fue el primer gobierno


que recopiló una gran cantidad de datos sobre
la población, superficie y renta de todos los
territorios bajo su control.
Edad Media

Durante la edad media sólo se realizaron algunos


censos exhaustivos en Europa. Después de la
conquista normanda de Inglaterra en 1066, el rey
Guillermo I de Inglaterra encargó la realización de
un censo.
1.1.2 Definición y clasificación de Estadística
Estadística
Ciencia que recoge, organiza, presenta, analiza e
interpreta datos con el fin de propiciar la toma de
decisiones más eficaz.

Se divide en dos categorías: la estadística descriptiva


y la estadística inferencial.
Estadística Descriptiva

Es la ciencia que “recoge, organiza, presenta,


analiza… datos”.

Método para organizar, resumir y presentar datos de


manera informativa.
Estadística Descriptiva

“El gobierno de Estados Unidos informa que en


1960, la población de este país fue de 179 323 000;
en 1970, de 203 302 000; en 1980, de 226 542 000;
en 1990, de 248 709 000 y en 2000 de 265 000 000”.
Estadística Inferencial
Métodos empleados para determinar una propiedad
de una población con base en la información de una
muestra.

El principal interés respecto de la estadística


inferencial tiene que ver con encontrar algo
relacionado con la población a partir de una muestra
de dicha población.
Estadística Inferencial
“Una muestra aleatoria de 1 260 graduados de
marketing de escuelas que imparten la carrera en
cuatro años mostró que su sueldo inicial promedio
era de $42 694. Por tanto, se estima que el sueldo
inicial promedio de todos los graduados de
contabilidad de instituciones que imparten la carrera
en cuatro años es de $42 694”.
La empresa de publicidad con sede en Atlanta, Brandon
and Associates, solicitó a una muestra de 1 960
consumidores que probaran un platillo con pollo recién
elaborado por Boston Market.
De las 1 960 personas de la muestra, 1176 dijeron que
comprarían el alimento si se comercializaba.
a) ¿Qué podría informar Brandon and Associates a
Boston Market respecto de la aceptación en la población
del platillo de pollo?
b) ¿Es un ejemplo de estadística descriptiva o estadística
inferencial? Explique su respuesta.
1.2 Definición y clasificación de variables
1.2.1 Definición de población y muestra
Población

Se denomina población al conjunto completo de


elementos, con alguna característica común, que es
el objeto de nuestro estudio.

Una población puede ser finita o infinita.


• Población finita:
Los habitantes de un país, los planetas del Sistema
Solar, las estrellas en la Vía Láctea.

• Población Infinita:
El número de posibles medidas que se puedan hacer
de la velocidad de la luz, o el número de tiradas de un
dado.
Muestra

Porción o parte de la población de interés.

Al número de elementos de la muestra se le llama


tamaño de la muestra.
¿Por qué tomar una muestra en lugar de
estudiar a cada miembro de la población?
• Si los catadores de vino probaran todo el vino, no
quedaría una gota para vender.

• En la práctica resulta imposible que unos cuantos


biólogos marinos capturen y rastreen a todas las
focas en el océano.

• Las pruebas en el trigo acerca de la humedad que


lo destruye, hacen imprescindible la toma de una
muestra.
Razones para muestrear:

1. Establecer contacto con toda la población


requeriría mucho tiempo.

2. El costo de estudiar todos los elementos de una


población resultaría prohibitivo.
Razones para muestrear:
3. Es imposible verificar de manera física todos los
elementos de la población.

4. Algunas pruebas son de naturaleza destructiva.

5. Los resultados de la muestra son adecuados.


1.2.2 Tipos de muestreo
Muestreo aleatorio simple

Muestra seleccionada de manera que cada


elemento o individuo de la población tenga las
mismas posibilidades de que se le incluya.
Suponga que una población consta de 845 empleados de
Nitra Industries. Se va a elegir una muestra de 52 empleados
de dicha población. Una forma de asegurarse de que todos los
empleados de la población tienen las mismas posibilidades de
que se les elija consiste en escribir primero el nombre de cada
empleado en un papel y depositarlos todos en una caja.

Después de mezclarlos, se efectúa la primera selección


tomando un papel de la caja sin mirarlo. Se repite este
proceso hasta terminar de elegir la muestra de 52 empleados.
Muestreo aleatorio sistemático

Se selecciona un punto aleatorio de inicio y


posteriormente se elige cada k-ésimo miembro de
la población.

Primero se calcula k, que es el resultado de dividir


el tamaño de la población entre el tamaño de la
muestra.
Muestreo aleatorio estratificado

Una población se divide en subgrupos, denominados


estratos, y se selecciona al azar una muestra de cada
estrato.
1.2.3 Definición de variable, parámetro y
estadístico
Variable

Se entiende por variable estadística al símbolo


que representa al dato o carácter objeto de
nuestro estudio de los elementos de la muestra y
que puede tomar un conjunto de valores.
Parámetro

Es una medición numérica que describe algunas


características de una población
Parámetro

“En la ciudad de Nueva York hay 3250 botones


para caminar, que los peatones emplean en las
intersecciones de tránsito. Se descubrió que el
77% de dichos botones no funciona”.
Estadístico

Es una medición numérica que describe algunas


características de una muestra.
Estadístico

“Con base en una muestra de 877 ejecutivos


encuestados, se encontró que el 45% de ellos no
contrataría a alguien con un error ortográfico en
su solicitud de empleo”.
1.2.4 Clasificación de variables
Variables cualitativas

Miden una cualidad o característica en cada


unidad experimental.

Producen datos que se pueden clasificar de


acuerdo a similitudes o diferencias en clase.
Variables cualitativas
• Afiliación política: Priista, panista, independiente.

• Clasificación de gusto: Excelente, bueno, regular,


malo

• Color de un dulce M&M’S®: Café, amarillo, rojo,


anaranjado, verde,
azul
Variables cuantitativas

Miden una cantidad numérica en cada unidad


experimental.

Las variables cuantitativas, con frecuencia


representadas por la letra x, producen datos
numéricos.
Variables cuantitativas

• x = Tasa preferencial de interés.


• x = Número de pasajeros en un vuelo de Los
Ángeles a Nueva York.
• x = Peso de un paquete listo para ser enviado.
• x = Volumen de jugo de naranja en un vaso.
Variable discreta

Una variable discreta puede tomar sólo un número


finito o contable de valores.

El nombre de discreta se refiere a las brechas


discretas entre los posibles valores que la variable
puede tomar.
Variable continua
Una variable continua puede tomar infinitamente
muchos valores correspondientes a los puntos en
un intervalo de recta.

Para cualesquier dos valores que se escojan, un


tercer valor siempre puede hallarse entre ellos.
Identifique cada una de las siguientes variables
como cualitativas o cuantitativas:

1. El uso más frecuente de su horno de microondas


(recalentar, descongelar, calentar, otros).

2. El número de consumidores que se niegan a


contestar una encuesta por teléfono.
Identifique cada una de las siguientes variables
como cualitativas o cuantitativas:

1. El uso más frecuente de su horno de microondas


(recalentar, descongelar, calentar, otros). Cualitativa

2. El número de consumidores que se niegan a


contestar una encuesta por teléfono. Discreta
3. La puerta escogida por un ratón en un experimento
de laberinto (A, B o C).

4. El tiempo ganador para un caballo que corre en el


Derby de Kentucky.

5. El número de niños en un grupo de quinto grado


que leen al nivel de ese grado o mejor.
3. La puerta escogida por un ratón en un experimento
de laberinto (A, B o C). Cualitativa

4. El tiempo ganador para un caballo que corre en el


Derby de Kentucky. Continua

5. El número de niños en un grupo de quinto grado


que leen al nivel de ese grado o mejor. Discreta
1.2.5 Datos
Dato
Un dato es un hecho/información o cifra que se
recoge, analiza y resume para su presentación e
interpretación.

A todos los datos reunidos para un determinado


estudio se les llama conjunto de datos.
Niveles de medición
En una bolsa de M&M hay lunetas de seis diferentes
colores. Suponga que asigna el 1 al café, el 2 al
amarillo, el 3 al azul, el 4 al naranja, el 5 al verde y el
6 al rojo. Sume la cantidad de lunetas que hay en una
bolsa, la divide entre el número de lunetas e informa
que el color promedio es 3.56. ¿Significa que el color
promedio es azul o anaranjado?
Niveles de medición

En la pista de una escuela secundaria hay ocho


competidores para la carrera de 400 metros. Para
indicar el orden en que llegan a la meta dice que
la media es de 4.5. ¿Qué revela este promedio?
Datos de nivel nominal

Las observaciones acerca de una variable cualitativa


sólo se clasifican y cuentan.

No existe una forma particular para ordenar las


etiquetas.
Suministro mundial del petróleo para 2004.
Los datos de nivel nominal poseen las
siguientes propiedades:

1. Las categorías de datos se encuentran


representadas por etiquetas o nombres.

2. Aun cuando las etiquetas se codifiquen


con números, las categorías de datos no
tienen ningún orden lógico.
Datos de nivel ordinal

Los datos muestran las propiedades de los


datos nominales y además tiene sentido el
orden o jerarquía de los datos.
Los datos de nivel ordinal poseen las
siguientes propiedades:
1. Las clasificaciones de los datos se encuentran
representadas por conjuntos de etiquetas o
nombres (alto, medio, bajo), las cuales tienen
valores relativos.

2. En consecuencia, los valores relativos de los


datos se pueden clasificar u ordenar.
Datos de nivel de intervalo

Estos datos tienen las características de los


datos ordinales. El intervalo entre valores se
expresa en términos de una unidad de medición
fija (existe una magnitud constante).

Los datos de intervalo siempre son numéricos.


Los datos de nivel de intervalo poseen las
siguientes propiedades:

1. Las clasificaciones de datos se ordenan de


acuerdo con el grado que posea de la
característica en cuestión.

2. Diferencias iguales en la característica


representan diferencias iguales en las mediciones.
Datos de nivel de razón

Los datos tienen todas las propiedades de


los datos de intervalo y la proporción entre dos
valores tiene significado.
Datos de nivel de razón

Variables como distancia, altura, peso y


tiempo usan la escala de razón en la medición.
Esta escala requiere que se tenga el valor cero
para indicar que en este punto no existe la
variable.
Los datos de nivel de intervalo poseen las
siguientes propiedades:

1. Las clasificaciones de datos se ordenan de acuerdo


con la cantidad de características que poseen.

2. Diferencias iguales en la característica representan


diferencias iguales en los números asignados a las
clasificaciones.
Los datos de nivel de intervalo poseen las
siguientes propiedades:

3. El punto cero representa la ausencia de


características y la razón entre dos números es
significativa.
¿Cuál es el nivel de medición de cada una de las
siguientes variables?

a) Coeficientes intelectuales de los estudiantes.

b) La distancia que viajan los estudiantes para


llegar a clases.
¿Cuál es el nivel de medición de cada una de las
siguientes variables?

c) Las calificaciones de los estudiantes en el primer


examen de estadística.

d) Una clasificación de estudiantes por fecha de


nacimiento.
¿Cuál es el nivel de medición de cada una de las
siguientes variables?

e) Una clasificación de estudiantes que cursan


primero, segundo, tercero o último grado.

f) Número de horas que los alumnos estudian a la


semana.
1.3 Presentación de datos
1.3.1 Recopilación y ordenación de datos

S-ar putea să vă placă și