pequeñas tablillas de arcilla para recopilar datos sobre la producción agrícola y sobre los géneros vendidos o cambiados mediante trueque. Egipcios En el siglo XXXI a.C., mucho antes de construir las pirámides, los egipcios analizaban los datos de la población y la renta del país. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. Chinos
En China existían registros numéricos
similares a la de los egipcios con anterioridad al año 2000 a.C. Griegos
Los griegos clásicos realizaban censos cuya
información se utilizaba hacia el 594 a.C. para cobrar impuestos. Imperio romano
El Imperio romano fue el primer gobierno
que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Edad Media
Durante la edad media sólo se realizaron algunos
censos exhaustivos en Europa. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó la realización de un censo. 1.1.2 Definición y clasificación de Estadística Estadística Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de propiciar la toma de decisiones más eficaz.
Se divide en dos categorías: la estadística descriptiva
y la estadística inferencial. Estadística Descriptiva
Es la ciencia que “recoge, organiza, presenta,
analiza… datos”.
Método para organizar, resumir y presentar datos de
manera informativa. Estadística Descriptiva
“El gobierno de Estados Unidos informa que en
1960, la población de este país fue de 179 323 000; en 1970, de 203 302 000; en 1980, de 226 542 000; en 1990, de 248 709 000 y en 2000 de 265 000 000”. Estadística Inferencial Métodos empleados para determinar una propiedad de una población con base en la información de una muestra.
El principal interés respecto de la estadística
inferencial tiene que ver con encontrar algo relacionado con la población a partir de una muestra de dicha población. Estadística Inferencial “Una muestra aleatoria de 1 260 graduados de marketing de escuelas que imparten la carrera en cuatro años mostró que su sueldo inicial promedio era de $42 694. Por tanto, se estima que el sueldo inicial promedio de todos los graduados de contabilidad de instituciones que imparten la carrera en cuatro años es de $42 694”. La empresa de publicidad con sede en Atlanta, Brandon and Associates, solicitó a una muestra de 1 960 consumidores que probaran un platillo con pollo recién elaborado por Boston Market. De las 1 960 personas de la muestra, 1176 dijeron que comprarían el alimento si se comercializaba. a) ¿Qué podría informar Brandon and Associates a Boston Market respecto de la aceptación en la población del platillo de pollo? b) ¿Es un ejemplo de estadística descriptiva o estadística inferencial? Explique su respuesta. 1.2 Definición y clasificación de variables 1.2.1 Definición de población y muestra Población
Se denomina población al conjunto completo de
elementos, con alguna característica común, que es el objeto de nuestro estudio.
Una población puede ser finita o infinita.
• Población finita: Los habitantes de un país, los planetas del Sistema Solar, las estrellas en la Vía Láctea.
• Población Infinita: El número de posibles medidas que se puedan hacer de la velocidad de la luz, o el número de tiradas de un dado. Muestra
Porción o parte de la población de interés.
Al número de elementos de la muestra se le llama
tamaño de la muestra. ¿Por qué tomar una muestra en lugar de estudiar a cada miembro de la población? • Si los catadores de vino probaran todo el vino, no quedaría una gota para vender.
• En la práctica resulta imposible que unos cuantos
biólogos marinos capturen y rastreen a todas las focas en el océano.
• Las pruebas en el trigo acerca de la humedad que
lo destruye, hacen imprescindible la toma de una muestra. Razones para muestrear:
1. Establecer contacto con toda la población
requeriría mucho tiempo.
2. El costo de estudiar todos los elementos de una
población resultaría prohibitivo. Razones para muestrear: 3. Es imposible verificar de manera física todos los elementos de la población.
4. Algunas pruebas son de naturaleza destructiva.
5. Los resultados de la muestra son adecuados.
1.2.2 Tipos de muestreo Muestreo aleatorio simple
Muestra seleccionada de manera que cada
elemento o individuo de la población tenga las mismas posibilidades de que se le incluya. Suponga que una población consta de 845 empleados de Nitra Industries. Se va a elegir una muestra de 52 empleados de dicha población. Una forma de asegurarse de que todos los empleados de la población tienen las mismas posibilidades de que se les elija consiste en escribir primero el nombre de cada empleado en un papel y depositarlos todos en una caja.
Después de mezclarlos, se efectúa la primera selección
tomando un papel de la caja sin mirarlo. Se repite este proceso hasta terminar de elegir la muestra de 52 empleados. Muestreo aleatorio sistemático
Se selecciona un punto aleatorio de inicio y
posteriormente se elige cada k-ésimo miembro de la población.
Primero se calcula k, que es el resultado de dividir
el tamaño de la población entre el tamaño de la muestra. Muestreo aleatorio estratificado
Una población se divide en subgrupos, denominados
estratos, y se selecciona al azar una muestra de cada estrato. 1.2.3 Definición de variable, parámetro y estadístico Variable
Se entiende por variable estadística al símbolo
que representa al dato o carácter objeto de nuestro estudio de los elementos de la muestra y que puede tomar un conjunto de valores. Parámetro
Es una medición numérica que describe algunas
características de una población Parámetro
“En la ciudad de Nueva York hay 3250 botones
para caminar, que los peatones emplean en las intersecciones de tránsito. Se descubrió que el 77% de dichos botones no funciona”. Estadístico
Es una medición numérica que describe algunas
características de una muestra. Estadístico
“Con base en una muestra de 877 ejecutivos
encuestados, se encontró que el 45% de ellos no contrataría a alguien con un error ortográfico en su solicitud de empleo”. 1.2.4 Clasificación de variables Variables cualitativas
Miden una cualidad o característica en cada
unidad experimental.
Producen datos que se pueden clasificar de
acuerdo a similitudes o diferencias en clase. Variables cualitativas • Afiliación política: Priista, panista, independiente.
• Clasificación de gusto: Excelente, bueno, regular,
malo
• Color de un dulce M&M’S®: Café, amarillo, rojo,
anaranjado, verde, azul Variables cuantitativas
Miden una cantidad numérica en cada unidad
experimental.
Las variables cuantitativas, con frecuencia
representadas por la letra x, producen datos numéricos. Variables cuantitativas
• x = Tasa preferencial de interés.
• x = Número de pasajeros en un vuelo de Los Ángeles a Nueva York. • x = Peso de un paquete listo para ser enviado. • x = Volumen de jugo de naranja en un vaso. Variable discreta
Una variable discreta puede tomar sólo un número
finito o contable de valores.
El nombre de discreta se refiere a las brechas
discretas entre los posibles valores que la variable puede tomar. Variable continua Una variable continua puede tomar infinitamente muchos valores correspondientes a los puntos en un intervalo de recta.
Para cualesquier dos valores que se escojan, un
tercer valor siempre puede hallarse entre ellos. Identifique cada una de las siguientes variables como cualitativas o cuantitativas:
1. El uso más frecuente de su horno de microondas
(recalentar, descongelar, calentar, otros).
2. El número de consumidores que se niegan a
contestar una encuesta por teléfono. Identifique cada una de las siguientes variables como cualitativas o cuantitativas:
contestar una encuesta por teléfono. Discreta 3. La puerta escogida por un ratón en un experimento de laberinto (A, B o C).
4. El tiempo ganador para un caballo que corre en el
Derby de Kentucky.
5. El número de niños en un grupo de quinto grado
que leen al nivel de ese grado o mejor. 3. La puerta escogida por un ratón en un experimento de laberinto (A, B o C). Cualitativa
4. El tiempo ganador para un caballo que corre en el
Derby de Kentucky. Continua
5. El número de niños en un grupo de quinto grado
que leen al nivel de ese grado o mejor. Discreta 1.2.5 Datos Dato Un dato es un hecho/información o cifra que se recoge, analiza y resume para su presentación e interpretación.
A todos los datos reunidos para un determinado
estudio se les llama conjunto de datos. Niveles de medición En una bolsa de M&M hay lunetas de seis diferentes colores. Suponga que asigna el 1 al café, el 2 al amarillo, el 3 al azul, el 4 al naranja, el 5 al verde y el 6 al rojo. Sume la cantidad de lunetas que hay en una bolsa, la divide entre el número de lunetas e informa que el color promedio es 3.56. ¿Significa que el color promedio es azul o anaranjado? Niveles de medición
En la pista de una escuela secundaria hay ocho
competidores para la carrera de 400 metros. Para indicar el orden en que llegan a la meta dice que la media es de 4.5. ¿Qué revela este promedio? Datos de nivel nominal
Las observaciones acerca de una variable cualitativa
sólo se clasifican y cuentan.
No existe una forma particular para ordenar las
etiquetas. Suministro mundial del petróleo para 2004. Los datos de nivel nominal poseen las siguientes propiedades:
1. Las categorías de datos se encuentran
representadas por etiquetas o nombres.
2. Aun cuando las etiquetas se codifiquen
con números, las categorías de datos no tienen ningún orden lógico. Datos de nivel ordinal
Los datos muestran las propiedades de los
datos nominales y además tiene sentido el orden o jerarquía de los datos. Los datos de nivel ordinal poseen las siguientes propiedades: 1. Las clasificaciones de los datos se encuentran representadas por conjuntos de etiquetas o nombres (alto, medio, bajo), las cuales tienen valores relativos.
2. En consecuencia, los valores relativos de los
datos se pueden clasificar u ordenar. Datos de nivel de intervalo
Estos datos tienen las características de los
datos ordinales. El intervalo entre valores se expresa en términos de una unidad de medición fija (existe una magnitud constante).
Los datos de intervalo siempre son numéricos.
Los datos de nivel de intervalo poseen las siguientes propiedades:
1. Las clasificaciones de datos se ordenan de
acuerdo con el grado que posea de la característica en cuestión.
2. Diferencias iguales en la característica
representan diferencias iguales en las mediciones. Datos de nivel de razón
Los datos tienen todas las propiedades de
los datos de intervalo y la proporción entre dos valores tiene significado. Datos de nivel de razón
Variables como distancia, altura, peso y
tiempo usan la escala de razón en la medición. Esta escala requiere que se tenga el valor cero para indicar que en este punto no existe la variable. Los datos de nivel de intervalo poseen las siguientes propiedades:
1. Las clasificaciones de datos se ordenan de acuerdo
con la cantidad de características que poseen.
2. Diferencias iguales en la característica representan
diferencias iguales en los números asignados a las clasificaciones. Los datos de nivel de intervalo poseen las siguientes propiedades:
3. El punto cero representa la ausencia de
características y la razón entre dos números es significativa. ¿Cuál es el nivel de medición de cada una de las siguientes variables?
a) Coeficientes intelectuales de los estudiantes.
b) La distancia que viajan los estudiantes para
llegar a clases. ¿Cuál es el nivel de medición de cada una de las siguientes variables?
c) Las calificaciones de los estudiantes en el primer
examen de estadística.
d) Una clasificación de estudiantes por fecha de
nacimiento. ¿Cuál es el nivel de medición de cada una de las siguientes variables?
e) Una clasificación de estudiantes que cursan
primero, segundo, tercero o último grado.
f) Número de horas que los alumnos estudian a la
semana. 1.3 Presentación de datos 1.3.1 Recopilación y ordenación de datos