Sunteți pe pagina 1din 116

Aspectos generales de la estadística

La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos,


ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o
irregulares de algún fenómeno o estudio aplicado de ocurrencia de forma aleatoria o
condicional. Es transversal a una amplia variedad de disciplinas desde la física hasta las
ciencias sociales, desde las ciencias de la salud hasta control de calidad. Se usa para la
toma de decisiones en áreas de negocios o instituciones gubernamentale
Importancia de la estadística
La estadística es la base del conocimiento práctico y real. Su definición.- La
estadística es una de las ramas de la ciencia matemática que se centra en el
trabajo con datos e informaciones que son ya de por sí numéricos o que ella
misma se encarga de transformar en números. La estadística, si bien es una
ciencia de extracción exacta, tiene una injerencia directa en cuestiones sociales
por lo cual su utilidad práctica es mucho más comprensible que lo que sucede
normalmente con otras ciencias exactas como la matemática.

A diferencia de otras ramas de la matemática que poseen una parte importante de


abstracción, la estadística tiene aplicaciones directas y concretas en la vida real ya
que toma los números y cifras de diferentes fenómenos sociales como por ejemplo
la desocupación, la tasa de mortalidad, la de natalidad y muchos otros datos
incluso más complejos.

Podemos decir que la función principal de la estadística es justamente la


recolección y agrupamiento de datos de diverso tipo para construir con ellos
informes estadísticos que nos den idea sobre diferentes y muy variados temas,
siempre desde un punto de vista cuantitativo y no cualitativo. Esto es muy
importante de remarcar ya que la estadística se convierte entonces en una ciencia
que nos habla de cantidades (por ejemplo, cuántas personas viven en un país por
metro cuadrado) pero no nos da información directa sobre la calidad de vida de
esas personas. En este sentido podemos decir que se presentan varias
limitaciones ya que no permite conocer más que numéricamente aspectos que
requieren un trabajo más complejo y profundo.

Evolución histórica de la estadística


Desde los comienzos de la civilización han existido formas sencillas de estadística,
pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas,
palos de madera y paredes de cuevas para contar el número de
personas, animales o cosas.
Hacia el año 3000 a.C. los babilonios usaban pequeñas tablillas de arcilla para
recopilar datos sobre la producción agrícola y sobre los géneros vendidos o
cambiados mediante trueque. En el siglo XXXI a.C., mucho antes de construir las
pirámides, los egipcios analizaban los datos de la población y la renta del país.
Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de
estadística. El primero contiene dos censos de la población de Israel y el segundo
describe el bienestar material de las diversas tribus judías.
En China existían registros numéricos similares con anterioridad al año 2000 a.C.
Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594
a.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopiló
una gran cantidad de datos sobre la población, superficie y renta de todos los
territorios bajo su control. Durante la edad media sólo se realizaron algunos
censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y
Carlomagno ordenaron hacer estudios minuciosos de las propiedades de
la Iglesia en los años 758 y 762 respectivamente. Después de
la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra
encargó la realización de un censo. La información obtenida con este censo,
llevado a cabo en 1086, se recoge en el Domesday Book. El registro de
nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en
1662 apareció el primer estudio estadístico notable de población, titulado
Observations on the London Bills of Mortality -Comentarios sobre las partidas de
defunción en Londres. Un estudio similar sobre la tasa de mortalidad en la ciudad
de Breslau, en Alemania, realizado en 1691, fue utilizado por el
astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad.
En el siglo XIX, con la generalización del método científico para estudiar todos los
fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la
necesidad de reducir la información a valores numéricos para evitar la
ambigüedad de las descripciones verbales. En nuestros días, la estadística se ha
convertido en un método efectivo para describir con exactitud los valores de datos
económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve como
herramienta para relacionar y analizar dichos datos.
El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos,
sino sobre todo en el proceso de "interpretación" de esa información.
El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar,
con gran exactitud, utilizando determinadas distribuciones probabilísticas; los
resultados de éstas se pueden utilizar para analizar datos estadísticos. La
probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y
para predecir el tipo y la cantidad de datos necesarios en un determinado estudio
estadístico.
La Estadística es una ciencia matemática que trata de la recolección, clasificación
y presentación de los hechos sujetos a una apreciación numérica y se utiliza para
describir, analizar e interpretar ciertas características de un fenómeno o conjunto
de individuos llamado población.
Definiciones de estadística
La estadística (la forma femenina del alemán Statistik, y
este derivado del italiano statista 'hombre de Estado')1 es una rama de las
matemáticas y una herramienta que estudia usos y análisis provenientes de una
muestra representativa de datos, que busca explicar las correlaciones y
dependencias de un fenómeno físico o natural, de ocurrencia en
forma aleatoria o condicional.
Es transversal a una amplia variedad de disciplinas, desde la física hasta
las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
Además, se usa en áreas de negocios o instituciones gubernamentales ya que su
principal objetivo es describir al conjunto de datos obtenidos para la toma de
decisiones o bien, para realizar generalizaciones sobre las características
observadas.
Hoy en día, la estadística es una ciencia que se encarga de estudiar una
determinada población por medio de la recolección, recopilación e interpretación
de datos. Del mismo modo, también es considerada una técnica especial apta
para el estudio cuantitativo de los fenómenos de masa o colectivo.
La estadística se divide en dos grandes áreas:

 Estadística descriptiva: Se dedica a la descripción, visualización y resumen


de datos originados a partir de los fenómenos de estudio. Los datos pueden
ser resumidos numérica o gráficamente. Su objetivo es organizar y describir
las características sobre un conjunto de datos con el propósito de facilitar su
aplicación, generalmente con el apoyo de gráficas, tablas o medidas
numéricas.
 Ejemplos básicos de parámetros estadísticos son: la media y la desviación
estándar.
 Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular,
entre otros.

 Estadística inferencial: Se dedica a la generación de los modelos, inferencias


y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta
la aleatoriedad de las observaciones. Se usa para modelar patrones en los
datos y extraer inferencias acerca de la población bajo estudio. Estas
inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de
hipótesis), estimaciones de unas características numéricas
(estimación), pronósticos de futuras observaciones, descripciones de
asociación (correlación) o modelamiento de relaciones entre variables (análisis
de regresión). Otras técnicas de modelamiento incluyen análisis de
varianza, series de tiempo y minería de datos. Su objetivo es obtener
conclusiones útiles para lograr hacer deducciones acerca de la totalidad de
todas las observaciones hechas, basándose en la informaciónnumérica.
Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada, pero
la estadística inferencial, por su parte, se divide en estadística
paramétrica y estadística no paramétrica.
Existe también una disciplina llamada estadística matemática, la que se refiere a
las bases teóricas de la materia. La palabra «estadísticas» también se refiere al
resultado de aplicar los logaritmo S estadístico a un conjunto de datos, como
en estadísticas económicas, estadísticas criminales, etc.

La Estadística es la parte de las Matemáticas que se encarga del


estudio de una determinada característica en una población, recogiendo
los datos, organizándolos en tablas, representándolos gráficamente y
analizándolos para sacar conclusiones de dicha población.

Según se haga el estudio sobre todos los elementos de la


población o sobre un grupo de ella, vamos a diferenciar dos tipos de
Estadística:

Estadística descriptiva. Realiza el estudio sobre la población


completa, observando una característica de la misma y calculando unos
parámetros que den información global de toda la población.

Estadística inferencial. Realiza el estudio descriptivo sobre un


subconjunto de la población llamado muestra y, posteriormente,
extiende los resultados obtenidos a toda la población.

La estadística podría definirse como la ciencia que se encarga de recopilar,


organizar, procesar, analizar e interpretar datos con el fin de deducir las
características de una población objetivo, pero esta sería solo una visión estrecha
de lo que comprende esta rama del saber. A continuación se hace una muy breve
introducción teórica al amplio concepto de la estadística.
La estadística como ciencia y como método
La estadística no se puede utilizar como una caja mágica para extraer certezas,
donde se introducen datos y se extraen leyes. La estadística, en el contexto de
probabilidades y técnicas de inferencia, es incapaz por sí misma de suplantar al
Método Científico, sólo es un gran apoyo.
¿Cómo ayuda la estadística en el Método Científico?
Definimos el Método Científico como un método o conjunto sistematizado de
procesos en los que se basa la ciencia para explicar cualquier fenómeno y las
leyes que los administran.
En la siguiente imagen os muestro, muy esquematizado, el proceso que se sigue
al aplicar el Método Científico.

La estadística descriptiva es la herramienta más útil en la etapa de observación,


ya que nos permite extraer información para realizar nuestras hipótesis fundadas
en estos resultados. También es utilizada para valorar los resultados
del experimento.
La estadística analítica se utiliza a partir de la observación, ya que dependiendo
de los datos observados, se utilizará una técnica u otra, y por supuesto en el
proceso del experimento, ya que su diseño dependerá en cierta medida de las
técnicas estadísticas más apropiadas, además, la estadística analítica es el primer
y principal razonamiento válido.
Como vemos, la estadística proporciona un gran apoyo al Método Científico en las
fases de observación y experimentación, pero en el proceso de hipótesis y en el
de la obtención de una ley científica son otras las bases.

Relación de la estadística con la demás ciencias


"La estadística es una técnica especial apta para el estudio cuantitativo de los
fenómenos de masa o colectivo, cuya mediación requiere una masa de
observaciones de otros fenómenos más simples llamados individuales o
particulares".
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones
válidas y tomar decisiones razonables basadas en tal análisis.
"La estadística es la ciencia que trata de la recolección, clasificación y
presentación de los hechos sujetos a una apreciación numérica como base a la
explicación, descripción y comparación de los fenómenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que
tiene la estadística, debido al gran campo de aplicación que posee. La
investigación en Psicología, Sociología y Educación, al igual que ocurre en otras
ciencias, en buena medida se basa en el manejo de recursos estadísticos como
elementos indispensables para llegar a conclusiones aceptables por el resto de
la comunidad científica. Dada la peculiaridad de su objeto de estudio, inabordable
en la mayoría de los casos si no es a través de perspectivas complejas de relación
entre variables, la atención de los investigadores en las ciencias humanas y
sociales se concentra cada vez más en la llamada Estadística Multivariante. Los
diseños complejos de investigación y análisis, las aportaciones más recientes de
la informática para la aplicación de técnicas avanzadas de manipulación de datos
y la discusión de estos aspectos desde perspectivas teóricas y aplicadas,
preocupan y concentran a multitud de profesionales cuyo quehacer cotidiano es el
estudio de cómo se investiga, haciendo de ello su especialidad. Paralelamente,
otras especialidades dentro de estas ciencias utilizan el conocimiento ya
elaborado y retransmitido, preocupadas más por los resultados y posibilidades que
por las condiciones de aplicación y el fundamentos de uso, de tal forma que se ha
propiciado la utilización de las técnicas estadísticas, sin considerar la adecuación
de éstas a las condiciones en las que se aplican.
A su vez, las ciencias sociales se han visto apabulladas en los últimos años por
avances vertiginosos en informática y aplicaciones estadísticas (Manheim, 1982;
Rossi y otros, 1983), y muy especialmente en la psicología (Judd y otros, 1995), lo
que favorece una absorción de poca calidad por parte de los especialistas en
áreas no metodológicas. Por otro lado, la adopción de procedimientos informáticos
para realizar tareas metodológicas no parece ser una solución inmediata,
considerando la ansiedad que generan los ordenadores, fenómeno muy
generalizado (Fariña y Arce, 1993).
La fusión de esta creciente complicación de las herramientas de análisis, junto con
la discrepancia entre los objetivos de formación y la necesidad de uso de los
recursos estadísticos, consigue finalmente que el especialista en áreas aplicadas
tienda a descuidar aspectos muy básicos, previos a la aplicación de estos
recursos estadísticos complejos. Por otro lado, en muchas ocasiones, la aplicación
de herramientas estadísticas se deja arrastrar por hipótesis de comodidad, en el
sentido de aplicarse para permitir la ejecución de una prueba o el ajuste de
un modelo, no porque son las estrategias más adecuadas, sino porque son las
más cómodas
La física estadística o mecánica estadística es la parte de la física que trata de
determinar el comportamiento agregado termodinámico
de sistemas macroscópicos a partir de consideraciones microscópicas utilizando
para ello herramientas estadísticas junto a leyes mecánicas.
La física estadística puede describir numerosos campos con
una naturaleza estocástica (reacciones nucleares, sistemas biológicos, químicos,
neurológicos, etc.).
La estadística industrial es la rama de la estadística que busca implementar
los procesos probabilísticos y estadísticos de análisis e interpretación de datos o
características de un conjunto de elementos al entorno industrial, a efectos de
ayudar en la toma de decisiones y en el control de los procesos industriales y
organizacionales.
La historia es la ciencia que tiene como objeto de estudio el pasado de la
humanidad y como método el propio de las ciencias sociales.[1] Se denomina
también historia al periodo histórico que transcurre desde la aparición de
la escritura hasta la actualidad.
Es considerada "la ciencia de las ciencias" por englobar en su estudio multitud de
otras ciencias, a priori sin relación a ella. Más allá de las acepciones propias de la
ciencia histórica, historia en el lenguaje usual es la narración de cualquier suceso,
incluso de sucesos imaginarios y de mentiras.[2] [3] En medicina se utiliza
el concepto de historia clínica para el registro de datos sanitarios significativos de
un paciente, que se remontan hasta su nacimiento o incluso a
su herencia genética.
En la historia la estadística cumple una función primordial para poder ubicar en el
tiempo y en el espacio cada uno de los acontecimientos desde la creación
del universo.
La bioestadística, de forma general, es la aplicación de la estadística a la biología.
Debido a que las cuestiones a investigar en biología son de naturaleza muy
variada, por ejemplo, la medicina, ciencias agropecuarias y forestales, la
bioestadística ha expandido sus dominios para incluir cualquier modelo
cuantitativo, no sólo estadístico, que pueda ser usado para responder a estas
necesidades.
La bioestadística puede ser considerada como una rama, altamente especializada,
de la informática médica que puede ser, a su vez, complementada por la
bioinformática.
Algunos campos de investigación usan la estadística tan extensamente que tienen
terminología especializada. Estas disciplinas incluyen:
 Ciencias actuariales
 Física estadística
 Estadística industrial
 Estadística Espacial
 Matemáticas Estadística
 Estadística en Medicina
 Estadística en Nutrición
 Estadística en Agronomía
 Estadística en Planificación
 Estadística en Investigación
 Estadística en Derecho
 Estadística en Restauración de Obras
 Estadística en Literatura
 Estadística en Astronomía
 Estadística en la Antropología (Antropometría)
 Estadística en Historia
 Estadística Militar
 Geoestadística
 Bioestadística
 Estadísticas de Negocios
 Estadística Computacional
 Estadística en las Ciencias de la Salud
 Investigación de Operaciones
 Estadísticas de Consultoría
 Estadística de la educación, la enseñanza, y la formación
 Estadística en la comercialización o mercadotecnia
 Cienciometría
 Estadística del Medio Ambiente
 Estadística en Epidemiología
 Minería de datos (aplica estadística y reconocimiento de patrones para
el conocimiento de datos)
 Estadística económica (Econometría)
 Estadística en Ingeniería
 Geografía y Sistemas de información geográfica, más específicamente en Análisis
espacial
 Demografía
 Estadística en psicología (Psicometría)
 Calidad y productividad
 Estadísticas sociales (para todas las ciencias sociales)
 Cultura estadística
 Encuestas por Muestreo
 Análisis de procesos y quimiometría (para análisis de datos en química analítica
e ingeniería química)
 Estadísticas Deportivas

Aspectos básicos

Definición del Objeto de Investigación: Debe responder el qué, el cómo y


establecer el momento correcto para hacerse, debe también restringir el espacio
físico o geográfico donde se llevará a cabo. Es este punto el núcleo de la
investigación, es por ello que no puede haber ambigüedad en sus planteamientos y
alcances.

Unidad de Investigación: Se trata del elemento de la población que origina la


información. La unidad o elemento de investigación debe ser clara, adecuada,
mesurable y comparable. Debe determinarse la naturaleza cuantitativa o cualitativa
de esta unidad, es decir, definir qué aspectos de la unidad de investigación son
cuantitativos (registrados por medio de números) o cualitativos (recogidos mediante
anotaciones literarias). También ha de considerarse la posibilidad o viabilidad de la
investigación y si estos aspectos pueden ser conocidos con precisión. De igual
manera, es necesario delimitar esta unidad en el tiempo y en el espacio, y a veces
en el número.

Clases de Investigación: En la planeación, debe también tenerse en cuenta el


tipo de investigación que se va a realizar. Ésta puede ser descriptiva, que consiste
en obtener información con respecto a grupos; experimental o controlada,
provocada por el investigador en condiciones controladas, en la que se busca
conocer por qué causa se produce un caso particular; o
bien, explicada o analítica, que permite establecer comparaciones y verificar
hipótesis.

Fuentes de Información: Después de determinar el qué y el por qué de la


investigación estadística, se debe preguntar el dónde conseguir la información
requerida. Se trata entonces de definir las fuentes de información. Estas pueden ser
directas o indirectas.

 Una fuente de información estadística directa es aquella en donde el hecho se


produce. Este tipo de fuentes son las mejores, pero no siempre son posibles.
 Cuando no sea posible, se emplea una fuente de información
estadística indirecta, aquella donde el hecho se refleja. En muchos casos este
tipo de fuentes son complementarias de las primeras.

Propósito de los datos


La estadística es una ciencia que nos proporciona métodos para:
Recopilar, Organizar, Presentar, Analizar y Concluir información para la toma de
decisiones.
Nuestras decisiones se basan en datos estadísticos, el método estadístico nos
ayuda a obtener informacion y sobre todo a analizarla para desidir.
De conocimiento científicos
Como conocimiento científico se denomina el conjunto ordenado, comprobado
y sistematizado de saberes obtenidos de forma metódica y sistemática a
partir del estudio, la observación, la experimentación y el análisis de
fenómenos o hechos, valiéndose de una serie de rigurosos procedimientos que
dotan los datos y las conclusiones obtenidas de validez, objetividad y
universalidad.
Como tal, el conocimiento científico es ordenado, coherente, preciso, objetivo y
universal. Se estructura como un sistema verificable e interrelacionado de
conocimientos que nos permite comprender y explicar la realidad y los
fenómenos de la naturaleza.
Vea también Ciencia.

Como tal, el conocimiento científico se vale del método científico, que es un


conjunto de normas y procedimientos por el cual un científico debe regirse para
realizar un estudio o investigación cuyos resultados tengan validez científica.

Prácticos (descriptivos)

Se trata de aplicar los conocimientos teóricos a la resolución de casos y problemas


concretos. Basados en unos conocimientos teóricos previos, posibilitan la
clarificación de conceptos, la eliminación de fallos en el aprendizaje anterior y el
desarrollo de habilidades. En grupos, se trata de que el alumno participe y encuentre
la solución de los casos planteados en listas que se distribuirán con antelación. El
profesor actúa de guía para analizar los procedimientos de solución seguidos, los
resultados obtenidos y las dudas o aspectos no comprendidos por los estudiantes.
El programa de clases de problemas es el siguiente:

1. Fundamentos de probabilidad: Cálculo de probabilidades en espacios


muestrales finitos usando los tópicos de Combinatoria. Manejo de las propiedades
de las probabilidades en problemas generales y en problemas de fiabilidad. Tratar
con sucesos independientes y sucesos condicionados. Manejo de probabilidades
condicionadas y aplicación del Teorema de Bayes.
2. Variables aleatorias y modelos discretos: Cálculo de probabilidades usando
distribuciones de probabilidad de variables aleatorias discretas. Descripción de
variables mediante la esperanza y la varianza. Identificación y cálculo de
probabilidades binomiales, hipergeométricas, binomiales negativas, geométricas y
de Poisson.
3. Variables aleatorias y modelos continuos: Cálculo de probabilidades usando
distribuciones de probabilidad de variables aleatorias continuas. Descripción de
variables mediante la esperanza y la varianza. Cálculo de intervalos de
probabilidad mediante la desigualdad de Tchebychev. Identificación y cálculo de
probabilidades exponenciales, de Erlang y Normales. Cálculo de fiabilidades
usando probabilidades de Weibull.
4. Muestreo: Cálculo de la distribución de probabilidad de estadísticos muestrales
sencillos y muestra reducida. Cálculo de probabilidades de estadísticos basados
en muestras normales. Cálculo de probabilidades aproximadas de estadísticos
basados en muestras grandes.
5. Intervalos de confianza y test de hipótesis: Cálculo e interpretación de
intervalos de confianza conocidos las medidas muestrales. Construcción de test
de hipótesis y valoración de las reglas de decisión más adecuadas para cada
caso. Interpretación de cada una de las posibles decisiones.
Tipos de datos
Cualitativos

Datos cualitativos

Son aquellos que no se pueden expresar numéricamente. Representan una cualidad o


atributo que clasifica a cada sujeto en una de varias categorías. Entre ellos es posible
distinguir:

Datos binarios (dicotómicos)

Son aquellos que no se pueden expresar numéricamente. Representan una cualidad o


atributo que clasifica a cada sujeto en una de varias categorías. Entre ellos es posible
distinguir:

 vivo/muerto: este es el ejemplo más claro (por lo menos no se conocen muchos


casos de estados intermedios entre la vida y la muerte).
 sano/enfermo: requiere una definición para la condición de enfermo.
 fumador/no fumador.
 respuesta a tratamiento (+)/(-): se cumplieron o no los criterios de éxito terapéutico.
 hombre/mujer.
Los valores para grupos de individuos generalmente se tabulan utilizando tablas de
contingencia:

Y se expresan en términos de proporciones o porcentajes:

 Proporción de fallecidos.
 Porcentaje de fumadores.
Cuantitativos

Datos Cuantitativos

Son aquellos que pueden medirse o cuantificarse (que pueden ser contados).
Pueden ser de dos tipos:

Datos cuantitativos continuos

Existe un continuo de valores posibles de la variable, que no se restringe a valores enteros


(aunque pueden ser reducidos a valores enteros –discretos- por aproximación). Los valores
se “miden” en vez de contarse.

Ejemplos:

 Presión arterial.
 Edad.
 Colesterolemia.

La mayoría de las veces, al analizarlas en un grupo de individuos, estas variables se


expresan en términos del valor promedio de la variable en el grupo:

 Promedio de edad: 25,3 años.


 Colesterolemia: 158,1 mg/dl.

En ocasiones, por convenciones previas o por iniciativa del investigador (ej. para facilitar el
análisis de los datos), datos de naturaleza continua son agrupados en categorías según sus
valores se encuentren dentro de ciertos rangos, o sobre o bajo un umbral determinado,
siendo tratados como variables discretas:

 Variable presión arterial expresada en forma dicotómica: Normotensión /


Hipertensión.
 Variable edad expresada como datos categóricos: Adulto joven / Adulto / Adulto
mayor.
Datos cuantitativos discretos

No admiten valores intermedios. Se enumeran (cuentan) más que se “miden”. Suelen tomar
solamente valores enteros (número de hijos, número de partos, número de hermanos, etc).

La mayoría de las veces, al analizarlas en un grupo de individuos, estas variables se


expresan también en términos del valor promedio de la variable en el grupo.

Variables
Discretas (sus unidades no admiten división)

Prácticamente hablamos de números enteros, por valores completos. Se cuentan,


no se miden.

Ejemplo:

 Número de hijos, adultos o mascotas en su familia.

Son datos discretos, porque se cuentan por números indivisibles: no se puede tener
2,5 hijos, o 1,3 mascotas. Los datos discretos también puede ser categóricos, como
decir si prefieres el color “rojo” o “azul”, o si eres “hombre” o “mujer”, o si un producto
es “bueno” o “malo”..

Continuas (sus unidades que puede expresarse en fracciones)

Este tipo de datos cuantitativos se refiere al flujo constante de valores posibles de


la variable, estos datos no se restringen a valores enteros (aunque normalmente
son reducidos a valores enteros por aproximación). Los datos cuantitativos
continuos se miden en lugar de contarse. Además tienen entre sus características
que pueden dividirse.

Ejemplo:

 Medir la altura de una persona. (Puedes mediar la altura en metros, centímetros y


hasta dar una medida en milímetros, es decir, los datos son continuos.
 Edad (Puedes definir una edad en años, meses y hasta días)

En ocasiones, algunos expertos en investigación deciden por iniciativa o convención


(para facilitar el análisis de datos cuantitativos), agrupar los datos en categorías
según sus valores, podrán ser encontrados dentro de ciertos rangos, o bajo un
umbral determinado.

Métodos de recopilación de datos

La elección del método depende de la estrategia de recopilación de datos, el tipo


de variable, la precisión necesaria, el punto de recopilación y la formación del
encuestador. Las vínculos entre una variable, su origen y los métodos prácticos
para su recopilación (Cuadro 6.1, Cuadro 6.2 y 6.3) pueden ayudar a escoger
métodos apropiados. Los principales métodos de recopilación de datos son:

 Registros: los registros y licencias son particularmente valiosos para los


censos completos, pero se limitan a variables que cambian lentamente,
como el número de embarcaciones pesqueras y sus características.
 Cuestionarios: formularios que los encuestados devuelven cumplimentados.
Un método poco costoso que resulta útil cuando los índices de
alfabetización son altos y los encuestados colaboran.
 Entrevistas: formularios que se cumplimentan a lo largo de una entrevista
con el encuestado. Más caros que los cuestionarios, pero mejores para
preguntas más complejas, y cuando se dan unos índices de alfabetización
bajos o se encuentra menos colaboración.
 Observaciones directas: la realización de mediciones directas es el método
más preciso para todas las variables, como las capturas, pero a menudo
resulta caro. Muchos métodos, como los programas de observación, se
limitan a la pesca industrial.
 Presentación de informes: la principal alternativa a la realización de
mediciones directas consiste en pedir a los pescadores y a terceros que
presenten informes de sus actividades. La preparación de informes
presupone la alfabetización y requiere espíritu de colaboración, pero ello
puede reforzarse mediante una obligación legal y mediciones directas.

La entrevista personal: los datos estadísticos necesarios para una investigación,


se reúnen frecuentemente mediante un proceso que consiste en enviar un
entrevistador o agente, directamente a la persona investigada. El investigador
efectuará a esta persona una serie de preguntas previamente escritas en
un cuestionario, donde anotará las respuestas correspondientes.
Este procedimiento permite obtener una información más veraz y completa que la
que proporcionan otros métodos, debido a que al tener contacto directo con la
persona entrevistada, el entrevistador podrá aclarar cualquier duda que se
presente sobre el cuestionario o investigación.

Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje


de las preguntas al nivel intelectual de las personas entrevistadas.

Una de las desventajas de este método se debe a que si el entrevistador no obra


de buena fé o no tiene un entrenamiento adecuado, puede alterar las respuestas
por las personas entrevistadas.

Otra desventaja es su alto costo, ya que resulta bastante oneroso el


entrenamiento de los agentes o entrenadores y los supervisores de estos, sobre
todo si se trata de una investigación extensa.

Cuestionarios por correo: consiste en enviar por correo el cuestionario


acompañado por el instructivo necesario, dando en este no solo las instrucciones
pertinentes para cada una de las preguntas, sino también una breve explicación
del objeto de la encuesta con el fin de evitar interpretaciones erróneas.

Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento,
puesto que no hay que incluir gastos de entrenamiento de personal, el único gasto
sería el de franqueo postal.

Dentro de las desventajas de este procedimiento podemos señalar que solo un


porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos
seguros de que los formularios hayan sido recibidos por sus destinatarios y que
hayan sido respondido por ellos mismos. Lo que trae como consecuencia que la
información se obtenga con una serie de errores difíciles de precisar por el
investigador.

Entrevista por teléfono: como lo indica su nombre, este método consiste en


telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este
método es bastante simple y económico, ya que el entrenamiento y supervisión de
las personas encargadas de efectuar las preguntas es siempre fácil.

Entre las limitaciones que presenta este método podemos señalar el número de
preguntas que pueden formularse es relativamente limitado; además las
investigaciones efectuadas por este método tienen un carácter selectivo, debido a
que muchas de las personas que potencialmente podrían ser investigadas no
posee servicio telefónico, por lo que quedan sin la posibilidad de ser entrevistados.

Por cuestionario y otros métodos


Los conceptos que interesan al investigador deben traducirse en fenómenos
observables y registrables. De aquí que la definición de la variables de
investigación y la selección o desarrollo de métodos adecuados para recabar
datos, constituye una de las tareas más excitantes del proceso de investigación,
ya que si el experimentador no cuenta con métodos de alta calidad para recolectar
datos, deberá siempre cuestionar la precisión y pertinencia de sus conclusiones.
Así como sucede en el caso del diseño de la investigación y el muestreo, el
investigador debe con frecuencia elegir a partir de un conjunto de alternativas para
decidir de qué modo habrá de recabar la información.
Los métodos de recolección de datos difieren en varios aspectos importantes:
Estructura. Los datos de una investigación suelen recabarse de acuerdo con
un plan estructurado que indica el tipo de información que debe reunirse y la forma
exacta en la que habrá de recolectarse. Sin embargo, a veces resulta adecuado
establecer un mínimo de estructura y ofrecer al sujeto la oportunidad de revelar
información pertinente de manera natural, como sucede en el caso de los estudios
de campo.
Posibilidad de cuantificar. Los datos que se sometan a análisis estadísticos
deben recabarse de tal forma que sea posible cuantificarlo. Por otra parte, valga
considerar que los datos que habrán de cuantificarse a menudo se recaben de
manera narrativa. Los enfoques de recolección estructurada de datos, por lo
general, aportan los que pueden cuantificarse con mayor facilidad, si bien, suele
ser igualmente posible inútil cuantificar información no estructurada.
Intervención del investigador. Los métodos de recolección de datos difieren
conforme el grado en que los sujetos se percaten de su propia categoría de
sujetos ya que es posible que al estar plenamente conscientes de la función que
desempeñan en el estudio no exhiban comportamiento y respuestas "normales".
No obstante, en la recolección discreta pueden surgir problemas éticos.
Objetividad. Algunos de los enfoques para la recolección precisan mayor número
de juicios subjetivos que otros. Pese a que el científico generalmente se esfuerza
por obtener métodos que sean lo mas objetivos posible, en algunas
investigaciones (particularmente las que se fundamentan en observaciones
fenomenológicas) el criterio subjetivo del investigador constituye un valioso
componente de la recolección de datos.
A veces la naturaleza del planteamiento de la investigación dicta en qué parte de
estos cuatro puntos se ubicara el método de recolección de datos. Por ejemplo,
las preguntas requeridas para un estudio de campo, por lo general, no satisfacen
completamente las cuatro condiciones anteriores, en tanto que los planteamientos
formulados en encuestas se acatan en su mayor parte a ellas. Sin embargo, el
investigador suele contar con considerable flexibilidad para seleccionar o diseñar
un plan adecuado de recolección de datos.
Además de estas condiciones, el experimentador debe tomar en cuenta la forma
de recolección de datos que habrá de utilizar, de las cuales existen tres de uso
frecuente en ciencias de la salud: autocomunicados, observación y mediciones
fisiológicas. Aquí se describe las opciones relativas a dos tipos de
autocomunicados: las entrevistas y los cuestionarios.

Fuentes de información (directas e indirectas)


Las fuentes directas son los documentos escritos por los propios protagonistas de la
historia,mientras que las fuentes indirectas son documentos escritos por personas que no
estuvieronpresentes en un hecho histórico, pero que lo cuentan igualmente. Las fuentes
directas sonaquellas de las cuales existen antecedentes documentados.Las indirectas son
las que surgen a raíz del estudio de otros. **Fuentes Directas: Son lostestimonios
elaborados con la intención de dar una información a la posteridad acerca
dedeterminados hechos, hazañas o acontecimientos. Ejemplo: Memorias, Crónicas,
inscripcionesconmemorativas en documentos y datos similares.**Fuentes Indirectas: Son
las que no provienen de intención de proporcionar información. Estodo producto de la
actividad humana que nos dice algo acerca de la existencia y de lasparticularidades de
ésta y sus autores. Ej.: utensilios, vestimentas, habitaciones, sepulcros. Lasciudades o sus
restos, las obras de arte, los caminos, las carreteras, acueductos, instalacionesportuarias u
otros. Todas ellas proporcionan información. Dentro de estas fuentes puedenseñalarse:
las cartas particulares, registros de propiedad, leyes, actas gubernamentales,informes de
policía, de diplomáticos, mapas, exposición y discusión de ideas religiosas,filosóficas u
otras que facilitan la comprensión sobre el período estudiado.*Fuentes Primarias:
Elementos elaborados simultáneamente o en contacto directo con elacontecimiento que
se describe. Ej.: instrumentos de labor, de las armas, de los relatos hechospor los
contemporáneos, etc.*Fuentes Secundarias: Conocimientos ya analizados y sintetizados;
estudios o consecuenciasreferentes al hecho que se examina, basados de manera directa
o indirecta en las fuentesprimarias o en el acontecimiento mismo.La Historia es una de las
ciencias sociales y está estrechamente unida a ellas, además deestarlo con muchas de las
ciencias naturales
Instituto nacional de estadistica (INE)
es un organismo guatemalteco. Se trata de un órgano con carácter de entidad
estatal descentralizada, semiautónoma, con personalidad jurídica, patrimonio
propio y plena capacidad para adquirir derechos y contraer obligaciones que
tiendan al desarrollo de sus fines. El INE está adscrito al Ministerio de Economía,
siendo su duración indefinida.
El INE tiene como objetivo principal formular y realizar la política estadística
nacional, así como planificar, dirigir, coordinar y supervisar las actividades
del Sistema Estadístico Nacional.
Funciones[editar]
Las funciones del Instituto Nacional de Estadística son las siguientes:
1) Investigar y definir las necesidades de información que requieran las distintas
actividades del país.
2) Supervisar, coordinar y evaluar las operaciones de investigación, recolección,
formación, análisis y divulgación que lleve a cabo el Sistema Estadístico Nacional.
3) Ejercer jurisdicción técnica en materia estadística sobre las entidades y
dependencias que integran el Sistema Estadístico Nacional, las cuales en lo
administrativo, estarán sujetas exclusivamente a la jurisdicción que les
corresponde.
4) Promover y ejecutar programas de capacitación de personal y asistencia
técnica, en materia estadística y otras actividades que contribuyan al cumplimiento
de sus finalidades.
5) Promover, organizar, dirigir y ejecutar por sí mismo o en coordinación con otras
entidades colaboradoras, investigaciones o encuestas generales y especiales de
carácter estadístico nacional o en cumplimiento de convenios internacionales.
6) Recolectar, elaborar y publicar las estadísticas oficiales, salvo las expresamente
asignadas a otras entidades o dependencias.
7) Establecer y mantener actualizado un inventario de las series estadísticas,
producidas por las entidades y dependencias integrantes del Sistema Estadístico
Nacional.
8) Actuar como órgano central de información y de distribución de datos
estadísticos oficiales, tanto en el ámbito nacional como en el internacional.
9) Promover y supervisar la aplicación uniforme de métodos, procedimientos,
definiciones, clasificaciones y normas técnicas, para la ejecución de los programas
estadísticos.
10) Establecer y mantener un registro centralizado de cuestionarios, formularios,
instructivos y otros documentos autorizados y utilizados por las entidades y
dependencias del Sistema Estadístico Nacional, para la obtención de información
estadística.
11) Establecer y mantener un registro de los lugares poblados de la República,
con sus categorías administrativas y características más sobresalientes.
12) Participar en reuniones, seminarios, congresos, conferencias, o cualesquiera
otros eventos de similar naturaleza, nacionales e internacionales, relacionados con
la materia estadística.
13) Tener acceso a todos los registros estadísticos de entidades y dependencias
públicas para estudiar su funcionamiento, comprobar la veracidad de las
informaciones estadísticas que le proporcionen.
14) Prestar servicios remunerados de asistencia técnica, investigación y otros
relacionados con sus finalidades.
15) Las demás funciones que le correspondan de acuerdo con su naturaleza y
objetivos.
Registro en empresas o instituciones tanto nacionales como internacionales
El registro estadístico de empresas (REE) desempeña un papel fundamental en la
construcción y el mantenimiento de un sistema integrado de información
económica con diversos fines. Uno de sus objetivos es proporcionar los datos de
calidad necesarios para la compilación de indicadores de cuentas nacionales. En
otras palabras, es una lista de empresas que abarca a todos los implicados en la
producción de bienes y servicios.
A efectos estadísticos, el registro de empresas es una herramienta utilizada para
la preparación y coordinación de encuestas, así como una fuente de información
empleada en el análisis estadístico de la población empresarial y de su
demografía. También se emplea para obtener datos administrativos, así como
para identificar y construir unidades estadísticas.
El registro abarca:

 todas las empresas que ejercen una actividad económica que contribuye
al PIB y sus unidades locales;
 las unidades jurídicas que constituyen dichas empresas;
 los grupos de empresas truncados y los grupos multinacionales de empresas;
 los grupos de empresas totalmente residentes.

Objetivo
El REE existe principalmente con el objetivo de proporcionar un marco para todas
las encuestas económicas. En consecuencia, está diseñado para proporcionar un
medio para coordinar la cobertura de las encuestas a empresas y para obtener
coherencia en la clasificación de unidades de información estadística. También
sirve como fuente de datos para compilar de información demográfica sobre
empresas.

Variables
Las unidades típicas de un REE son las unidades jurídicas y las unidades locales
aunque, con fines estadísticos, estas pueden transformarse en unidades tales
como empresas y establecimientos.
Las unidades jurídicas comprenden:

 las personas jurídicas cuya existencia está reconocida por la ley


independientemente de las personas o instituciones que las posean o que
sean miembros de ellas;
 las personas físicas que, en calidad de independientes, ejercen una actividad
económica.

La unidad jurídica sigue constituyendo, sola o a veces junto con otras unidades
jurídicas, el soporte jurídico de la unidad estadística "empresa".
Una unidad local es una empresa o parte de la misma (por ejemplo, un taller, una
fábrica, un almacén, una oficina, una mina o un depósito) situada en un lugar
identificado geográficamente. En dicho lugar o desde él se lleva a cabo una
actividad económica en la cual, salvo algunas excepciones, trabajan una o más
personas (aunque solo sea a tiempo parcial) para la misma empresa.
En la primera sección, conceptos básicos, del articulo, Formulación del sistema de
cuentas nacionales - conceptos básicos, están explicadas las relaciones entre
empresas, unidades locales y establecimientos.
Las unidades registradas deben describirse según el tipo de unidad estadística
(unidad jurídica, unidad local o empresa) mediante tres categorías de variables:

 variables de identificación (número de identificación, nombre de la empresa,


nombre del propietario, dirección, estatuto jurídico);
 variables de estratificación (actividad económica, número de asalariados,
volumen de ventas, situación geográfica;
 variables demográficas (creación, fecha de los cambios de actividad
económica, cierre).

Es importante garantizar la máxima exactitud de los datos, especialmente de los


datos utilizados como variables de estratificación en el proceso de muestreo (por
ejemplo, las variables relativas a la clasificación por tamaño y actividad), junto con
los datos identificativos que permitan contactar con las empresas. Las principales
variables incluidas en el REE se presentan en los Gráficos 1, 2 y 3.
El uso de unidades estadísticas uniformizadas en un REE garantiza la coherencia
temporal de las encuestas, evita las duplicidades y las omisiones en la
recopilación de datos y mejora la calidad final de los resultados permitiendo una
mejor coordinación entre encuestas. La existencia de un número de identificación
único, normalmente un código jurídico asignado por la administración tributaria,
puede mejorar considerablemente la capacidad de coordinación entre las distintas
fuentes, inclusive las administrativas.

Internet

Es una fuente que el investigador crea en un momento concreto para


resolver un problema concreto. Se refiere a los portadores originales de
la información que no la han retransmitido, grabado o transcrito en
cualquier medio de soporte. Se puede decir que estas fuentes no existen
hasta el momento en que se necesitan, para reunirlas se acude a
diversas técnicas como la observación, reuniones de grupo, métodos
experimentales, encuestas, entrevistas, experiencias de campo o
laboratorio, etc.
Revistas, periódicos, libros, etc
Son datos o estudios realizados previamente sobre los temas que uno
desea investigar, los cuales ya existen en algún medio como informes,
paginas web, libros, investigaciones previas, documentos, etc. En la
investigación documental la recolección de datos se efectúa por medio
de fichas. Si es una información secundaria interna es porque ha sido
creada en el pasado por el mismo investigador, y si es externa es
porque fue generada por terceros externos a él.

Principales pasos de una investigación estadística


Planificación
Es este el primer paso que sigue una investigación estadística. El éxito de una
investigación estadística depende en gran parte de la planeación que de ella se haga.
Algunas veces, solamente se prevé una etapa determinada y por falta de recursos
económicos o humanos es necesario archivarla. Otras veces se cometen errores en el
transcurso de la investigación, los cuales pudieron evitarse con con una buena planeación
mediante un buen diseño del proyecto, una metodología bien definida, utilización
adecuada de términos, y formularios bien ajustados a las necesidades de la investigación.
En nuestro medio, se observa entre otras fallas de planeación:
la falta de definición de los objetivos o demasiado generales, metodología equivocada,
iniciación de estudios sin el presupuesto adecuado, ausencia de instrucciones claras para
los procesos de recolección, crítica de la información, etc
. Toda recolección de datos estadísticos requiere de un plan que detalle los aspectos que
la investigación quiere abarcar, que fije el procedimiento que se va a seguir y que resuelva
las posibles dificultades que puedan presentarse a lo largo de la investigación.
El objetivo principal de la planificación consiste en determinar adecuada y
razonablemente los procedimientos de auditoría que correspondan aplicar, cómo y
cuándo se ejecutarán, para que se cumpla la actividad en forma eficiente y
efectiva.
La planificación es un proceso dinámico, que si bien se inicia al comienzo de las
labores de auditoría, puede modificarse durante la ejecución de la misma.
Objetivos
El objetivo principal de la planificación consiste en determinar adecuada y
razonablemente los procedimientos de auditoría que correspondan aplicar, cómo y
cuándo se ejecutarán, para que se cumpla la actividad en forma eficiente y
efectiva.
La planificación es un proceso dinámico, que si bien se inicia al comienzo de las
labores de auditoría, puede modificarse durante la ejecución de la misma.

Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos,


para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo
trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y
el cálculo de medidas descriptivas.
Ahora bien, las técnicas estadísticas se aplican de manera amplia
en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios
de consumidores; análisis de resultados en deportes; administradores
de instituciones; en la educación; organismos políticos; médicos; y por otras
personas que intervienen en la toma de decisiones.
UNIVERSO
En estadística es el nombre especifico que recibe particularmente en
la investigación social la operación dentro de la delimitación del campo
de investigación que tienen por objeto la determinación del conjunto de unidades
de observaciones del conjunto de unidades de observación que van a ser
investigadas. Para muchos investigadores él termino universo y población son
sinónima. En general, el universo es la totalidad de elementos o características
que conforman el ámbito de un estudio o investigación.
POBLACIÓN
Es la recolección completa de todas las observaciones de interés para el
observador.
Es un conjunto completo de individuos, objetos o medidas que tienen una
característica común observable.
La población es el conjunto de todos los individuos cuyo conocimiento es objeto de
interés desde un punto de vista estadístico. Por ejemplo, si se está interesado en
las ventas de los comercios de una cierta ciudad, cada comercio es un individuo, y
la población -también llamada universo- es el conjunto de todos los comercios de
la ciudad.
El estudio estadístico de una población se puede realizar mediante un análisis
exhaustivo de todos sus individuos (estadística descriptiva) o bien mediante una
inferencia realizada a partir de una muestra extraída de la población (estadística
inferencial).
Muestra
"Se llama muestra a una parte de la población a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
Conjunto de individuos extraído de una población con el fin de inferir mediante su
estudio, características de toda la población.
En los estudios estadísticos, en vez de analizar la totalidad de la población o
universo, se acude al recurso de considerar solamente una parte de ella, a la cual
se llama muestra.
Se dice que una muestra es representativa cuando, por la forma en que ha sido
seleccionada, aporta garantías suficientes para realizar inferencias fiables a partir
de ella.
Una muestra se puede definir como un conjunto de observaciones individuales
seleccionadas por un procedimiento específico. Ejemplo, el peso de un ratón a
través de un periodo de tiempo.
Parámetro
Es una medida descriptiva de la población total de todas las observaciones de
interés para el observador.
Las tablas estadísticas son una forma organizada de dar toda (o casi toda) la
información, todos los datos de que disponemos.
Con las gráficas estadísticas se pierde algo de información (mucho o poco, según
los casos).
En cualquiera de los dos casos, la cantidad de datos que se dan es excesiva para
que sea operativo, para poder hacer referencias concisas a esa distribución o
comparaciones rápidas con otras distribuciones.
Esa es la razón de ser de los parámetros estadísticos, el resumir en un número un
aspecto relevante de la distribución que pueda dar una idea de la misma o
compararla en ese aspecto con otras.
Cualquier característica medible de una población; por ejemplo: la proporción real
de demócratas inscritos entre todos los ciudadanos norteamericanos de edad para
votar.
Estadígrafo
Es la medida que en Estadística se aplica sobre una muestra. En general se
utilizan dos tipos: Los de Tendencia Central y los de Dispersión. Entre los primeros
tenemos: a) las medidas denominadas promedios, osea aquellas que tratan de
localizarse hacia el centro de la serie; moda, media y mediana; y b) los cuartiles y
deciles, o cuartas y décimas partes de las observaciones; esto sólo se aplican en
los datos agrupados. Entre los de Dispersión están: la desviación media, la
desviación mediana, la varianza, la desviación típica o estándar, la dispersión
absoluta y relativa.

Recopilación de datos
Es este el segundo paso de una investigación estadística. La información que requiere la
investigación es suministrada por el ama de casa, el hombre de negocios, o cualquier otro
informante; ya sea por intermedio de una persona que visita al informante y le hace las
preguntas necesarias para anotarlas en un formulario, o enviando al informante una lista
de preguntas que puede contestar en el momento que desee, o que debe contestar con
carácter obligatorio como sucede en la encuesta anual manufacturera que anualmente
realiza el DANE, organismo rector de las estadísticas en Colombia. También pueden
obtenerse los datos a través de encuestas telefónicas o
entrevistas personales. Algunas veces la información se obtiene mediante “
registron lo cual significa, que la información se proporciona a la autoridad competente en
el momento que ocurre el hecho, o después de que éste suceda. Son ejemplos de
recolección por registro: los nacimientos, las defunciones, los accidentes automovilísticos,
las ventas de propiedad raíz ante una notaría, el consumo de energía. , etc. Para fines
estadísticos, los datos se clasifican como INTERNOS y EXTERNOS. Los datos obtenidos de
los propios archivos son datos internos
Sin embargo, en muchas ocasiones es necesario establecer comparaciones con datos de la
misma índole pero referidos a una escala de mayor magnitud o simplemente es necesario
obtener la información de una fuente diferente a los propios archivos. Estos datos
exógenos se denominan datos externos
. Ahora bien, desde el punto de vista de la frecuencia con que se realiza la investigación, la
recolección puede hacerse de manera: OCASIONAL si la información se toma en
circunstancias extraordinarias como algunas encuestas de opinión, PERIÓDICA cuando la
investigación se realiza en lapsos de tiempos regulares como por ejemplo la recolección
sobre precios al consumidor de carácter mensual, los censos de población que
normalmente se efectúan cada diez años, etc., y CONTINUA cuando los datos se registran
automáticamente en el momento que se presenten los hechos, sin interrupción, como los
datos sobre criminalidad, natalidad, etc
Procesamiento de la información
Comprender y aplicar la probabilidad y estadística descriptiva e inferencial que le permitan
recolectar, organizar, presentar y analizar datos para abordar la resolución de problemas en
el contexto educativo.
Crítica y codificación, tabulación

Una vez realizado el trabajo de campo y la edición de los datos obtenidos, es


necesario efectuar el procesamiento de los datos, es decir, que los mismos se
preparan para ser analizados, para ello se apela a dos técnicas de elaboración de
los datos: la codificación y la tabulación. Lo que precede es válido, en lo que atañe
a la codificación, tanto para una perspectiva metodológica cuantitativa como
cualitativa.
En el caso de la tabulación, cabe señalar que no necesariamente está reñida con
los estudios cualitativos, el hecho de realizarla o no depende de la decisión
adoptada por el investigador.

Codificación

Comboni, S. y Juárez, J., afirman desde una perspectiva cuantitativa que: “La
codificación es un procedimiento técnico mediante el cual, los datos obtenidos se
clasifican en categorías y se traducen en símbolos, ya sean cifras o letras; es decir,
se asigna a cada opción de respuestas un número o una letra que permita tabularla
rápidamente.”

Es importante señalar que la elaboración de un sistema de categorías y la


codificación se pueden efectuar en forma simultánea, pero desde un punto de vista
lógico, la codificación depende del sistema de categorías o valores que adopte la
variable o alternativas que presente la pregunta.

Taylor, S.J. y Bogdan, R., por su parte, sostienen desde una perspectiva
cualitativa lo siguiente: “… la codificación es un modo sistemático de desarrollar y
refinar las interpretaciones de los datos. El proceso de codificación incluye la
reunión y análisis de todos los datos que se refieren a temas, ideas, conceptos,
interpretaciones y proposiciones. Durante esta etapa del análisis, lo que inicialmente
fueron ideas e intuiciones vagas se refinan, expanden, descartan o desarrollan por
completo.”

A continuación se enumeran y describen cinco 5 fases para codificar los datos


cualitativos:

1) Desarrolle categorías de codificación. Empiece redactando una lista de todos los


temas, conceptos e interpretaciones, tipologías y proposiciones identificados o
producidos durante el análisis inicial.

2) Codifique todos los datos. Codifique todas las notas de campo, las
transcripciones, los documentos y otros materiales, escribiendo en el margen el
número asignado o la letra correspondiente a cada categoría.

3) Separe los datos pertenecientes a las diversas categorías de codificación. …El


investigador reúne los datos codificados pertenecientes a cada categoría. …se
recortan las notas de campo, las transcripciones y otros materiales y se colocan los
datos de cada categoría en carpetas de archivo… .

4) Vea que datos han sobrado. … Algunos de esos datos probablemente se ajusten
a las categorías de codificación existentes. También se pueden plantear nuevas
categorías… .
5) Refine su análisis. La codificación y separación de los datos permite comparar
diferentes fragmentos relacionados con cada tema, concepto, proposición, etcétera,
y en consecuencia refinar y ajustar las ideas.”

Una vez realizada la codificación de los datos, se puede proceder a la confección


de la matriz de datos. Según Galtung, J. (16): “La matriz de datos es un modo de
ordenar los datos de manera que sea particularmente visible la forma tripartita.”

En efecto, cada fila de la matriz corresponde a una unidad de análisis, cada


columna a una variable y en cada celda, figura el valor que cada unidad asume para
cada variable. De esta manera, con la articulación de estos tres elementos se
configura una Matriz de Datos.

Tabulación

Luego de confeccionar la matriz de datos, se procede a la tabulación de los


mismos. Según Rojas Soriano, R: “La tabulación es el proceso mediante el cual los
datos recopilados se organizan y concentran, con base a determinadas ideas o
hipótesis, en tablas o cuadros para su tratamiento estadístico.”

Entonces tabular es contar las unidades que son ubicadas, ya sea en forma
manual o con la utilización de una computadora, en cada categoría de una variable
o unidades que son ubicadas simultáneamente en categorías determinadas de dos
o más variables. Por lo tanto, la tabulación puede ser simple, esto es, univariable o
cruzada, es decir, bivariable o multivariable.

Por supuesto, lo que antecede requiere un “plan de tabulación”,esto es,


determinar de antemano qué resultados de las variables se van a presentar y cuáles
relaciones entre las mismas se van analizar, a fin de brindar respuesta al problema
y los objetivos formulados.

La tabulación puede ser tratada de forma manual o informática. La primera se


recomienda efectuar cuando el cuestionario es reducido y se realiza mediante el
simple recuento de los datos. Para tabular mecánicamente se utiliza la informática,
ya que la información que se recoge en las encuestas es muy amplia y exige, para
su eficaz utilización, la realización de múltiples clasificaciones combinadas entre
variables. Y la tabulación electrónica se realiza mediante el uso de equipo
electrónico, el cual facilita de alguna manera el conteo de frecuencias.

Presentación de la información
La presentación de datos estadísticos constituye en sus diferentes modalidades
uno de los aspectos de mas uso en la estadística descriptiva. A partir podemos
visualizar a través de los diferentes medios escritos y televisivos
de comunicación masiva la presentación de los datos estadísticos sobre
el comportamiento de las principales variables económicas y sociales, nacionales
e internacionales.
1-Presentación escrita: Esta forma de presentación de informaciones se usa
cuando una serie de datos incluye pocos valores, por lo cual resulta mas
apropiada la palabra escrita como forma de escribir el comportamiento de los
datos; mediante la forma escrita, se resalta la importancia de las informaciones
principales.
2-Presentación tabular: Cuando los datos estadísticos se presentan a través de
un conjunto de filas y de columnas que responden a un ordenamiento lógico; es de
gran eso e importancia para el uso e importancia para el usuario ya que constituye
la forma más exacta de presentar las informaciones. Una tabla consta de varias
partes, las principales son las siguientes:
Titulo: Es la parte más importante del cuadro y sirve para describir todo él
contenido de este.
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de
cada columna.
Columna matriz: Es la columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la
tabla.
Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de
estos.
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que
aparecen en la tabla o cuadro y que no han sido explicados en otras partes.
3-Presentación grafica: Proporciona al lector o usuario mayor rapidez en la
comprensión de los datos, una grafica es una expresión artística usada para
representar un conjunto de datos.
De acuerdo al tipo de variable que vamos a representar, las
principales graficas son las siguientes:
Histograma: Es un conjunto de barras o rectángulos unidos uno de otro, en razón
de que lo utilizamos para representar variables continuas.
Polígono de frecuencias: Esta grafica se usa para representar los puntos medios
de clase en una distribución de frecuencias
Gráfica de barras: Es un conjunto de rectángulos o barras separadas una de la
otra, en razón de que se usa para representar variables discretas; las barras
deben ser de igual base o ancho y separadas a igual distancia. Pueden
disponerse en forma vertical y horizontal.
Gráfica lineal: Son usadas principalmente para representar datos clasificados por
cantidad o tiempo; o sea, se usan para representar series de tiempo o
cronológicas.
Gráfica de barra 100% y gráfica circular: se usan especialmente para representar
las partes en que se divide una cantidad total.
La ojiva: Esta grafica consiste en la representación de las frecuencias acumuladas
de una distribución de frecuencias. Puede construirse de dos maneras diferentes;
sobre la base "menor que" o sobre la base "o más". Puede determinar el valor de
la mediana de la distribución.
En estadística denominamos gráficos a aquellas imágenes que, combinando la
utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y
un sistema De referencia (coordenadas), permiten
presentar información cuantitativa.
La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a
las tablas, sino que también constituyen por sí mismos una poderosa herramienta
para el análisis De los datos, siendo en ocasiones el medio más efectivo no sólo
para describir y resumir la información, sino también para analizarla.
En este trabajo solo nos vamos a centrar únicamente en los gráficos como
vehículo de presentación de datos, sin abordar su otra faceta como herramienta
de análisis.

Descripción y análisis de datos


es la ciencia que examina datos en bruto con el propósito de sacar
conclusiones sobre la información. El análisis de datos es usado en
varias industrias para permitir que las compañías y las organizaciones
tomen mejores decisiones empresariales y también es usado en las
ciencias para verificar o reprobar modelos o teorías existentes. El análisis
de datos se distingue de la extracción de datos por su alcance, su
propósito y su enfoque sobre el análisis. Los extractores de datos
clasifican inmensos conjuntos de datos usando software sofisticado para
identificar patrones no descubiertos y establecer relaciones escondidas.
El análisis de datos se centra en la inferencia, el proceso de derivar una
conclusión basándose solamente en lo que conoce el investigador.

Descargue esta guía gratuit


Principales medidas de tendencia central

Media aritmética
En matemáticas y estadística, la media aritmética (también llamada promedio o media) de
un conjunto finito de números es el valor característico de una serie de datos cuantitativos,
objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se
obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos.
Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno
de los principales estadísticos muestrales.
 La suma de las desviaciones con respecto a la media aritmética es cero (0).
 La media aritmética de los cuadrados de las desviaciones de los valores de la variable con
respecto a una constante cualquiera se hace mínima cuando dicha constante coincide con
la media aritmética.
 Si a todos los valores de la variable se le suma una misma cantidad, la media aritmética
queda aumentada en dicha cantidad.
 Si todos los valores de la variable se multiplican por una misma constante la media
aritmética queda multiplicada por dicha constante.
 La media aritmética de un conjunto de números positivos siempre es igual o superior a
la media geométrica:

Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se
representa por la letra griega µ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra)
cuando se trata del promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras que el
promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a
tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas,
gramos, etc.

Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:

Estos cálculos se pueden simbolizar:

Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda observación y así


sucesivamente. En general, con “n” observaciones, Yi representa el valor de la i-ésima observación. En este
caso el promedio está dado por

De aquí se desprende la fórmula definitiva del promedio:

Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:

Ejemplo de desviaciones:

Una propiedad interesante de la media aritmética es que la suma de las desviaciones es cero.

Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición
central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene
valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.

Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por
ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

 Mediana (estadística), el valor de la variable que deja el mismo número de datos antes y
después que él;
 Mediana (geometría), la línea que une cualquier vértice de un triángulo con el punto
medio del lado opuesto;
 Mediana (arqueología), un yacimiento arqueológico romano en la ciudad serbia de Niš;
 Mediana (tráfico), es la separación que impide el paso entre los carriles de dirección
contraria en una calzada.
Moda
La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de
frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una
muestra puede tener más de una moda.

En estadística, la moda es el valor con mayor frecuencia en una distribución de datos.


Se hablará de una distribución bimodal de los datos adquiridos en una columna cuando
encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta
máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. En el
caso de la distribución uniforme discreta, cuando todos los datos tienen la misma frecuencia,
se puede definir las modas como indicado, pero estos valores no tienen utilidad. Por eso
algunos matemáticos califican esta distribución como «sin moda».
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.

Media geométrica
En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números
(por decir n números) es la raíz n-ésima del producto de todos los números, es recomendada
para datos de progresión geométrica, para promediar razones, interés compuesto y números
índices.

 El logaritmo de la media geométrica es igual a la media aritmética de los logaritmos de los


valores de la variable.
 La media geométrica de un conjunto de números positivos es siempre menor o igual que
la media aritmética:

La igualdad sólo se alcanza si .


Ventajas

 Considera todos los valores de la distribución


 Es menos sensible que la media aritmética a los valores extremos.
Desventajas

 Es de significado estadístico menos intuitivo que la media aritmética.


 Su cálculo es más difícil.

 Si un valor entonces la media geométrica se anula o no queda determinada.


Solo es relevante la media geométrica si todos los números son positivos. Como hemos visto,
si uno de ellos es 0, entonces el resultado es 0. Si hubiera un número negativo (o una
cantidad impar de ellos) entonces la media geométrica sería o bien negativa, o bien
inexistente en los números reales.
En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables con
distribución no normal.
La media geométrica es relevante cuando varias cantidades son multiplicadas para producir
un total.

Media armónica
La media armónica (designada usualmente mediante H) de una cantidad finita de números es
igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos valores y es
recomendada para promediar velocidades.
La media armónica resulta poco influida por la existencia de determinados valores mucho más
grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más
pequeños que el conjunto.
La media armónica no está definida en el caso de que exista algún valor nulo.

Medidas de dispersión o variabilidad


Rango
Una medida razonable de la variabilidad podr´ıa ser la
amplitud o rango,
que se obtiene restando el valor m´as bajo de un
conjunto de observaciones
del valor m´as alto.
Propiedades del rango
Es f´acil de calcular y sus unidades son las mismas que
las de la variable.
No utiliza todas las observaciones (s´olo dos de ellas);
Se puede ver muy afectada por alguna observaci´on
extrema;
El rango aumenta con el n´umero de observaciones, o
bien se queda
igual. En cualquier caso nunca disminuye.

Desviación estándar
La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden en
metros, la varianza lo hace en metros cuadrados. Si queremos que la medida de dispersi´on sea de
la misma dimensionalidad que las observaciones bastar´a con tomar su ra´ız cuadrada.

Desviación media

Desviación media, Dm

Se define la desviación media como la media de las diferencias en


valor absoluto de los valores de la variable a la media, es decir, si
tenemos un conjunto de n observaciones, x1, ..., xn, entonces

Si los datos están agrupados en una tabla estadística es más sencillo


usar la relación

Como se observa, la desviación media guarda las mismas


dimensiones que las observaciones. La suma de valores absolutos
es relativamente sencilla de calcular, pero esta simplicidad tiene un
inconveniente, esto hace que sea muy engorroso trabajar con ella a
la hora de hacer inferencia a la población.
Medida de tendencia central
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un
conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las
medidas de tendencia central más utilizadas son: media, mediana y moda. Las medidas de dispersión
en cambio miden el grado de dispersión de los valores de la variable. Dicho en otros términos las medidas de
dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de medidas
usadas en conjunto permiten describir un conjunto de datos entregando información acerca de su posición y
su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que
se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos que se
encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos “no agrupados”.

Coeficiente de variación
Hemos visto que las medidas de centralizaci´on y dispersi´on nos dan informaci´on sobre una
muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para comparar dos
poblaciones. Por ejemplo, si nos piden comparar la dispersi´on de los pesos de las poblaciones de
elefantes de dos circos diferentes, S nos dar´a informaci´on ´util. ¿Pero qu´e ocurre si lo que
comparamos es la altura de unos elefantes con respecto a su peso? Tanto la media como la
desviaci´on t´ıpica, x y S, se expresan en las mismas unidades que la variable. Por ejemplo, en la
variable altura podemos usar como unidad de longitud el metro y en la variable peso, el kilogramo.
Comparar una desviaci´on (con respecto a la media) medida en metros con otra en kilogramos no
tiene ning´un sentido. El problema no deriva s´olo de que una de las medidas sea de longitud y la
otra sea de masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa,
de dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el peso en
toneladas de una poblaci´on de 100 elefantes con el correspondiente en miligramos de una
poblaci´on de 50 hormigas.

Cuartiles, deciles y percentiles


Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las
personas cuando atienden características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes
porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula:

k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
 Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento
restante.

 El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el
40% de las observaciones.

 El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.

Fórmulas Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:
Para los percentiles, cuando n es par:

Cuando n es impar:
Siendo A, el número del percentil.
Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer
cuartil con el percentil 75.

Curva de Lorenz
La curva de Lorenz es una representación gráfica utilizada frecuentemente para plasmar
la distribución relativa de una variable en un dominio determinado. El dominio puede ser el
conjunto de hogares o personas de una región o país, por ejemplo. La variable cuya
distribución se estudia puede ser el ingreso de los hogares o las personas. Utilizando como
ejemplo estas variables, la curva se trazaría considerando en el eje horizontal el porcentaje
acumulado de personas u hogares del dominio en cuestión y en el eje vertical el porcentaje
acumulado del ingreso. Su autoría es de Max O. Lorenz en 1905.
Cada punto de la curva se lee como porcentaje acumulativo de los hogares o las personas. La
curva parte del origen (0,0) y termina en el punto (100,100). Si el ingreso estuviera distribuido
de manera perfectamente equitativa, la curva coincidiría con la línea de 45 grados que pasa
por el origen (por ejemplo el 30% de los hogares o de la población percibe el 30% del ingreso).
Si existiera desigualdad perfecta, o sea, si un hogar o persona poseyera todo el ingreso, la
curva coincidiría con el eje horizontal hasta el punto (100,0) donde saltaría el punto (100,100).
En general la curva se encuentra en una situación intermedia entre estos dos extremos.
Curva de Lorenz y desigualdad[editar]
Si una curva de Lorenz se encuentra siempre por encima de otra (por lo tanto, está más cerca
de la línea de 45 grados que la otra), entonces podemos decir, sin ambigüedad, que la primera
exhibe menor desigualdad que la segunda. Esta comparación gráfica entre distribuciones de
distintos dominios geográficos o temporales es el principal empleo de las curvas de Lorenz. El
indicador gráfico de bienestar más usado es la Curva de Lorenz Generalizada (CLG), que es
una derivación de la curva de Lorenz habitual. La CLG sólo se diferencia de la de Lorenz en
que en la escala vertical no se representan las cantidades relativas acumuladas sino las
cantidades acumuladas (no relativas) divididas por el número N de elementos de la población.
La lógica pretendida es representar qué cantidad absoluta corresponde a cada porcentaje de
individuos. Para clarificar este aspecto, supóngase que la curva de Lorenz normal de una
población nos dice que el 50% de los menos ricos poseen el 25% de la riqueza total. Se puede
comprender que es muy diferente la situación de bienestar de este 50% de la población según
si la riqueza total es muy pequeña o muy grande. Es obvio que es peor poseer el 50% de una
cantidad pequeña que poseer el 25% de una cantidad mucho mayor. El dividir las cantidades
acumuladas por el total de elementos N es necesario para poder comparar riquezas entre
poblaciones distintas que tengan un número diferente de elementos: no es lo mismo una
riqueza total de 1.000.000€ en un conjunto de 10 personas que esa misma riqueza total en un
conjunto formado por 1.000 personas.

Coeficiente de gini
El coeficiente de Gini es una medida de la desigualdad ideada por
el estadístico italiano Corrado Gini. Normalmente se utiliza para medir la desigualdad en los
ingresos, dentro de un país, pero puede utilizarse para medir cualquier forma de distribución
desigual. El coeficiente de Gini es un número entre 0 y 1, en donde 0 se corresponde con la
perfecta igualdad (todos tienen los mismos ingresos) y donde el valor 1 se corresponde con la
perfecta desigualdad (una persona tiene todos los ingresos y los demás ninguno).
El índice de Gini es el coeficiente de Gini expresado en referencia a 100 como máximo, en
vez de como 1, y es igual al coeficiente de Gini multiplicado por 100. Una variación de dos
céntesimas del coeficiente de Gini (o dos unidades del índice) equivale a una distribución de
un 7% de riqueza del sector más pobre de la población (por debajo de la mediana) al más rico
(por encima de la mediana).
Aunque el coeficiente de Gini se utiliza sobre todo para medir la desigualdad en los ingresos,
también puede utilizarse para medir la desigualdad en la riqueza. Este uso requiere que nadie
disponga de una riqueza neta negativa.
El coeficiente de Gini se calcula como una proporción de las áreas en el diagrama de
la curva de Lorenz. Si el área entre la línea de perfecta igualdad y la curva de Lorenz es a, y el
área por debajo de la curva de Lorenz es b, entonces el coeficiente de Gini es a/(a+b).
Esta proporción se expresa como porcentaje o como equivalente numérico de ese porcentaje,
que es siempre un número entre 0 y 1. El coeficiente de Gini se calcula a menudo con
la Fórmula de Brown, que es más práctica:

Propiedades
 Todas las curvas de Lorenz pasan por los puntos (0,0) y (1,1). A mayor índice de Gini se
tiene una mayor desigualdad. Si dos curvas de Lorenz se cruzan entre sí, se recomienda
no sacar conclusiones visualmente pues pueden ser engañosas; es mejor comparar la
desigualdad que representan, calculando primero los índices de Gini correspondientes a
cada curva.
 Para determinar el área entre la curva de Lorenz y la línea de perfecta equidad, lo ideal es
calcular una integral definida, pero a veces no se conoce la definición explícita de la curva
de Lorenz, por lo que es interesante utilizar otras fórmulas con un número finito de
sumandos.
 Las propiedades del índice de Gini son comparables con las del cuadrado del coeficiente
de variación.1
 Empíricamente, la renta de muchos países se aproxima a una distribución Gamma (con
parámetro k < 5), lo cual lleva a los índices de Gini observados entre 0,50 y 0,25. Los
países con índices superior a 0,50 tienen una distribución aún más desigual que
la distribución exponencial.

Medidas de deformación y apuntamiento


Coeficiente de asimetría o sesgo
Para saber si una distribución de frecuencias es simétrica, hay que precisar con
respecto a qué. Un buen candidato es la mediana, ya que para variables
continuas, divide al histograma de frecuencias en dos partes de igual área.
Podemos basarnos en ella para, de forma natural, decir que una distribución de
frecuencias es simétrica si el lado derecho de la gráfica (a partir de la mediana)
es la imagen por un espejo del lado izquierdo
Coeficiente de curtosis o apuntamiento
Se define el coeficiente de curtosis de Fisher como:

donde es el momento de cuarto orden. Es éste un coeficiente


adimensional, invariante ante cambios de escala y de origen. Sirve para
medir si una distribución de frecuencias es muy apuntada o no. Para
decir si la distribución es larga y estrecha, hay que tener un patrón de
referencia. El patrón de referencia es la distribución normal o
gaussiana para la que se tiene

Dependiendo del valor alcanzado por se puede clasificar una


distribución en

leptocúrtica: Si (más apuntada que la normal)

platicúrtica: Si (más aplastada que la normal).


Simetría
es un rasgo característico de formas geométricas, sistemas, ecuaciones y otros objetos
materiales, o entidades abstractas, relacionada con su invariancia bajo ciertas
transformaciones, movimientos o intercambios. En condiciones formales, un objeto
es simétrico en lo que concierne a una operación matemática dada si el resultado de aplicar
esa operación o transformación al objeto, el resultado es un objeto indistinguible en su aspecto
del objeto original. Dos objetos son simétricos uno al otro en lo que concierne a un grupo dado
de operaciones si uno es obtenido de otro por algunas operaciones (y viceversa). En la
geometría 2D las clases principales de simetría de interés son las que conciernen a
las isometrías de un espacio euclídeo: traslaciones, rotaciones, reflexiones y reflexiones que
se deslizan. Además de simetrías geométricas existen simetrías abstractas relacionadas con
operaciones abstractas como la permutación de partes de un objeto.
La simetría también se encuentra en organismos vivos.

Teoría de probabilidades
La teoría de la probabilidad es una rama de las matemáticas que estudia los fenómenos
aleatorios y estocásticos. Los fenómenos aleatorios se contraponen a los fenómenos
deterministas, los cuales son resultados únicos y/o previsibles de experimentos realizados
bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 ºC a nivel
del mar se obtendrá vapor. Los fenómenos aleatorios, por el contrario, son aquellos que se
obtienen de experimentos realizados, otra vez, bajo las mismas condiciones determinadas
pero como resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento
de un dado o de una moneda.
La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado
que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y
saber si un suceso es más probable que otro.
Muchos fenómenos naturales son aleatorios, pero existen algunos como el lanzamiento de un
dado, donde el fenómeno no se repite en las mismas condiciones, debido a que las
características del material hace que no exista una simetría del mismo, así las repeticiones no
garantizan una probabilidad definida. En los procesos reales que se modelizan
mediante distribuciones de probabilidad corresponden a modelos complejos donde no se
conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las
cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a
la teoría de la probabilidad en sí.
En 1933, el matemático soviético Andréi Kolmogórov propuso un sistema de axiomas para la
teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida,
desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros.
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual
obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la
rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de
los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más
variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el
desarrollo de las difusiones y el movimiento Browniano), o la economía (donde destaca el
modelo de Black y Scholes para la valuación de acciones).
La teoría de la probabilidad se desarrolló originalmente a partir de ciertos problemas
planteados en el contexto de juegos de azar. Inicialmente, no existía una teoría axiomática
bien definida y las definiciones iniciales de probabilidad se basaron en la idea intuitiva de un
cociente de ocurrencias:

(1)
donde A es un suceso cualquiera y:

es el número de veces que se ha repetido una acción u observación cuyo


resultado puede dar el suceso A o no-A.

es el número de veces que observa A en todas las observaciones.


Este tipo de definiciones si bien permitieron desarrollar un gran número de
propiedades, no permitían deducir todos los teoremas y resultados importantes que
hoy forman parte de la teoría de la probabilidad. De hecho el resultado anterior se
puede demostrar rigurosamente dentro del enfoque axiomático de la teoría de la
probabilidad, bajo ciertas condiciones.
La primera axiomatización completa se debió a Andréi Kolmogórov (quien usó dicho
enfoque por ejemplo para deducir su "ley 0-1 para sucesos cola" y otros resultados
relacionados con la convergencia de sucesiones aleatorias). La definición axiomática
de la probabilidad se basa en resultados de la teoría de la medida y en
formalizaciones de la idea de independencia probabilística. En este enfoque se parte

de un espacio de medida normalizada donde es un conjunto llamado


espacio de sucesos (según el tipo de problema puede ser un conjunto finito,

numerable o no-numerable), es una σ-álgebra de subconjuntos

de y es una medida normalizada (es decir, ). Los sucesos posibles se


consideran como subconjuntos S de eventos elementales posibles: y la
probabilidad de que cada suceso viene dada por la medida de dicho conjunto:

,
La interpretación de esta probabilidad es la frecuencia promedio con la que aparece

dicho suceso si se considera una elección de muestras aleatorias sobre .


La definición anterior es complicada de representar matemáticamente ya

que debiera ser infinito. Otra manera de definir la probabilidad es de forma


axiomática esto estableciendo las relaciones o propiedades que existen entre los
conceptos y operaciones que la componen.

Definición clásica de probabilidad[editar]


La probabilidad es la característica de un evento, que hace que existan razones para
creer que éste se realizará.
La probabilidad p de que suceda un evento S de un total de n casos posibles
igualmente probables es igual a la razón entre el número de ocurrencias h de dicho
evento (casos favorables) y el número total de casos posibles n.

La probabilidad es un número (valor) que varia entre 0 y 1. Cuando el evento es


imposible se dice que su probabilidad es 0, si el evento es cierto y siempre tiene que
ocurrir su probabilidad es 1.
La probabilidad de no ocurrencia de un evento está dada por q, donde:

Sabemos que p es la probabilidad de que ocurra un evento y q es la probabilidad de


que no ocurra, entonces p + q = 1

Simbólicamente el espacio de resultados, que normalmente se denota por , es el


espacio que consiste en todos los resultados que son posibles. Los resultados, que se

denota por , etcétera, son elementos del espacio .

Definición axiomática[editar]
Artículo principal: Axiomas de probabilidad

Como se ha adelantado anteriormente la definción axiomática de probabilidad es una


extensión de la teoría de la medida, en la que se introducen la noción de
independencia relativa. Este enfoque permite reproducir los resultados de la teoría
clásica de la probabilidad además de resultados nuevos referidos a la convergencia
de variables aleatorias. Además de los procesos estocásticos, el cálculo de Ito y
las ecuaciones diferenciales estocásticas.

.
Probabilidad discreta[editar]
Este tipo de probabilidad, es aquel que puede tomar sólo ciertos valores diferentes
que son el resultado de la cuenta de alguna característica de interés. Más
exactamente, un problema de probabilidad discreta es un problema definido por un
conjunto de variables aleatorias que sólo pueden tomar un conjunto finito o infinito
numerable de valores diferentes:

Probabilidad continua[editar]
Un problema de probabilidad continua es uno en el que aparecen variables
aleatorias capaces de tomar valores en algún intervalo de números reales (y
por tanto asumir un conjunto no numerable de valores), por lo que
continuando con la notación anterior:

Función de distribución de probabilidad[editar]


Artículo principal: Distribución de probabilidad

La distribución de probabilidad se puede definir para cualquier variable


aleatoria X, ya sea de tipo continuo o discreto, mediante la siguiente relación:

Para una variable aleatoria discreta esta función no es continua sin constante
a tramos (siendo continua por la derecha pero no por la izquierda). Para una
variable aleatoria general la función de distribución puede descomponerse en
una parte continua y una parte discreta:

Función de densidad de probabilidad[editar]


Artículo principal: Función de densidad

La función de densidad, o densidad de probabilidad de una variable aleatoria


absolutamente continua, es una función a partir de la cual se obtiene la
probabilidad de cada valor que toma la variable definida como:

Es decir, su integral en el caso de variables aleatorias continuas es


la distribución de probabilidad. En el caso de variables aleatorias discretas la
distribución de probabilidad se obtiene a través del sumatorio de la función de
densidad. La noción puede generalizarse a varias variables aleatorias.

Enfoque de probabilidades
Clásico
Los resultados de un experimento son igualmente viables, es decir, tienen teóricamente las mismas
posibilidades de ocurrir.
En este caso la probabilidad de ocurrencia de un evento será:

Número de resultados en los que se presenta el evento / número total de resultados posibles

Por ejemplo, la probabilidad de que en una baraja francesa de 52 cartas salga el cinco de trébol es de
1/52.

Empírico

La probabilidad de que un evento suceda se determina observando eventos similares en el


pasado. Este método utiliza la frecuencia relativa de las presentaciones pasadas de un evento como
una probabilidad. Determinamos qué tan frecuente ha sucedido algo en el pasado y usamos esa
cifra para predecir la probabilidad de que suceda de nuevo en el futuro.
En este caso la probabilidad de ocurrencia de un evento será:

Número de resultados esperados ocurridos en el pasado / número total de experimentos adelantados

Por ejemplo, la probabilidad de que Brasil gané el mundial de Suráfrica 2010 es de 5 mundiales
ganados anteriormente / 18 mundiales que se han celebrado en total.

Subjetivo

Se puede definir como la probabilidad asignada a un evento por parte de un individuo, basada en la
evidencia que se tenga disponible. Esa evidencia puede presentarse en forma de frecuencia relativa
de presentación de eventos pasados o puede tratarse simplemente de una creencia meditada.

Eventos simples y compuestos


EVENTO SIMPLE
Es un subconjunto del espacio muestral que contiene un único elemento.Ejemplos de espacios
muéstrales y sucesos elementales:
y
Si se trata de contar objetos y el espacio muestralS = {0, 1, 2, 3, ...} (los númerosnaturales),
entonces los sucesos elementales son cada uno de los conjuntos {k}, dondek

N
.
y
Si se lanza una moneda dos veces, S = {cc, cs, sc, ss}, donde (c representa "sale cara" ys, "sale
cruz"), los sucesos elementales son {cc}, {cs}, {sc} y {ss}.
y
Si X es una variable aleatorianormalmente distribuida, S = (-’, +’), los números reales, lossucesos
elementales son todos los conjuntos {x}, donde x

.Pueden tener probabilidades que son estrictamente mayores que cero, cero, no definidas
ocualquier combinación de estas. Por ejemplo, la probabilidad de cualquier variable
aleatoriadiscreta está determinada por las probabilidades asignadas a los sucesos elementales
delexperimento que determina la variable. Por otra parte, cualquier suceso elemental
tieneprobabilidad cero en cualquier variable aleatoria continua. Existen distribuciones mixtas que
no soncompletamente continuas, ni completamente discretas, entre las que pueden darse
ambassituaciones.
EVENTO COMPUESTO
C
uando calculas probabilidades, a menudo tienes que tomar en consideración dos o más
eventos,conocidos como eventos compuestos. En un evento compuesto, si el segundo evento no
dependedel resultado del primer evento, entonces los eventos son independientes. Si el resultado
de unevento de un evento compuesto influye en el otro evento, entonces los eventos son
dependientes.
Probabilidad de dos eventos independientes
La probabilidad de que ocurran dos eventos independientes secalcula multiplicando la
probabilidaddel primer evento por la probabilidad del segundo evento. P(A y B) = P(A)
·
P (B)
Probabilidad de dos eventos dependientes
Si dos eventos A y B son dependientes, entonces la probabilidadde que ocurran los dos eventos
esigual al producto de la probabilidad de A por la probabilidad de B después de ocurrir A. P(A y B)
=P(A)

Eventos dependientes e
independientes
Eventos dependientes

Dos o más eventos serán dependientes cuando la ocurrencia o no-ocurrencia de uno de ellos
afecta la probabilidad de ocurrencia del otro (o otros). Cuando tenemos este caso, empleamos
entonces, el concepto de probabilidad condicional para denominar la probabilidad del evento
relacionado. La expresión P(A|B) indica la probabilidad de ocurrencia del evento A sí el evento B
ya ocurrió.
Eventos Independientes

Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento no


tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso típico de
eventos independiente es el muestreo con reposición, es decir, una vez tomada la muestra se
regresa de nuevo a la población donde se obtuvo.

Ejemplo:

lanzar al aire dos veces una moneda son eventos independientes por que el resultado del primer
evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo
lanzamiento.

Técnicas de contar y medir


Principio multiplicativo
Si se desea realizar una actividad que consta de r pasos, en donde el primer paso de la actividad a
realizar puede ser llevado a cabo de N1 maneras o formas, el segundo paso de N2 maneras o formas y el r-
ésimo paso de Nr maneras o formas, entonces esta actividad puede ser llevada a efecto de;
N1 x N2 x ..........x Nr maneras o formas
El principio multiplicativo implica que cada uno de los pasos de la actividad deben ser llevados a efecto, uno
tras otro.
Ejemplos:
1) Una persona desea construir su casa, para lo cuál considera que puede construir los cimientos de su
casa de cualquiera de dos maneras (concreto o block de cemento), mientras que las paredes las puede hacer
de adobe, adobón o ladrillo, el techo puede ser de concreto o lámina galvanizada y por último los acabados
los puede realizar de una sola manera ¿cuántas maneras tiene esta persona de construir su casa?
Solución:
Considerando que r = 4 pasos
N1= maneras de hacer cimientos = 2
N2= maneras de construir paredes = 3
N3= maneras de hacer techos = 2
N4= maneras de hacer acabados = 1
N1 x N2 x N3 x N4 = 2 x 3 x 2 x 1 = 12 maneras de construir la casa
El principio multiplicativo, el aditivo y las técnicas de conteo que posteriormente se tratarán nos proporcionan
todas las maneras o formas posibles de como se puede llevar a cabo una actividad cualquiera.
2) ¿Cuántas placas para automóvil pueden ser diseñadas si deben constar de tres letras seguidas de
cuatro números, si las letras deben ser tomadas del abecedario y los números de entre los dígitos del 0 al 9?,
a. Si es posible repetir letras y números, b. No es posible repetir letras y números, c. Cuántas de las placas
diseñadas en el inciso b empiezan por la letra D y empiezan por el cero, d. Cuantas de las placas diseñadas
en el inciso b empiezan por la letra D seguida de la G.
Solución:
a. Considerando 26 letras del abecedario y los dígitos del 0 al 9
26 x 26 x 26 x 10 x 10 x 10 x 10 = 75,760,000 placas para automóvil que es posible diseñar
b. 26 x 25 x 24 x 10 x 9 x 8 x 7 = 78,624,000 placas para automóvil
c. 1 x 25 x 24 x 1 x 9 x 8 x 7 = 302,400 placas para automóvil
d. 1 x 1 x 24 x 10 x 9 x 8 x 7 = 120,960 placas para automóvil
3) ¿Cuántos números telefónicos es posible diseñar, los que deben constar de seis dígitos tomados del 0
al 9?, a. Considere que el cero no puede ir al inicio de los números y es posible repetir dígitos, b. El cero no
debe ir en la primera posición y no es posible repetir dígitos, c. ¿Cuántos de los números telefónicos del inciso
b empiezan por el número siete?, d. ¿Cuántos de los números telefónicos del inciso b forman un número
impar?.
Solución:
a. 9 x 10 x 10 x 10 x 10 x 10 = 900,000 números telefónicos
b. 9 x 9 x 8 x 7 x 6 x 5 = 136,080 números telefónicos
c. 1 x 9 x 8 x 7 x 6 x 5 = 15,120 números telefónicos
d. 8 x 8 x 7 x 6 x 5 x 5 = 67,200 números telefónicos
Principio aditivo
Si se desea llevar a efecto una actividad, la cuál tiene formas alternativas para ser realizada, donde la primera
de esas alternativas puede ser realizada de M maneras o formas, la segunda alternativa puede realizarse de
N maneras o formas ..... y la última de las alternativas puede ser realizada de W maneras o formas, entonces
esa actividad puede ser llevada a cabo de,
M + N + .........+ W maneras o formas
Ejemplos:
1) Una persona desea comprar una lavadora de ropa, para lo cuál ha pensado que puede seleccionar de
entre las marcas Whirpool, Easy y General Electric, cuando acude a hacer la compra se encuentra que la
lavadora de la marca W se presenta en dos tipos de carga ( 8 u 11 kilogramos), en cuatro colores diferentes y
puede ser automática o semiautomática, mientras que la lavadora de la marca E, se presenta en tres tipos de
carga (8, 11 o 15 kilogramos), en dos colores diferentes y puede ser automática o semiautomática y la
lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11 kilogramos, dos colores
diferentes y solo hay semiautomática. ¿Cuántas maneras tiene esta persona de comprar una lavadora?
Solución:
M = Número de maneras de seleccionar una lavadora Whirpool
N = Número de maneras de seleccionar una lavadora de la marca Easy
W = Número de maneras de seleccionar una lavadora de la marca General Electric
M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras
M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora
2 ) Rafael Luna desea ir a las Vegas o a Disneylandia en las próximas vacaciones de verano, para ir a las
Vegas él tiene tres medios de transporte para ir de Chihuahua al Paso Texas y dos medios de transporte para
ir del Paso a las Vegas, mientras que para ir del paso a Disneylandia él tiene cuatro diferentes medios de
transporte, a) ¿Cuántas maneras diferentes tiene Rafael de ir a las Vegas o a Disneylandia?, b) ¿Cuántas
maneras tiene Rafael de ir a las Vegas o a Disneylandia en un viaje redondo, si no se regresa en el mismo
medio de transporte en que se fue?.
Solución:
a) V = maneras de ir a las Vegas
D = maneras de ir a Disneylandia
V = 3 x 2 = 6 maneras
D = 3 x 4 = 12 maneras
V + D = 6 + 12 = 18 maneras de ir a las Vegas o a Disneylandia
b) V = maneras de ir y regresar a las Vegas
D = maneras de ir y regresar a Disneylandia
V = 3 x 2 x 1 x 2 = 12 maneras
D = 3 x 4 x 3 x 2 = 72 maneras
V + D = 12 + 72 = 84 maneras de ir a las Vegas o a Disneylandia en un viaje redondo
¿Cómo podemos distinguir cuando hacer uso del principio multiplicativo y cuando del aditivo?
Es muy simple, cuando se trata de una sola actividad, la cual requiere para ser llevada a efecto de una serie
de pasos, entonces haremos uso del principio multiplicativo y si la actividad a desarrollar o a ser efectuada
tiene alternativas para ser llevada a cabo, haremos uso del principio aditivo.
Permutaciones
Para entender lo que son las permutaciones es necesario definir lo que es una combinación y lo que es una
permutación para establecer su diferencia y de esta manera entender claramente cuando es posible utilizar
una combinación y cuando utilizar una permutación al momento de querer cuantificar los elementos de algún
evento.
COMBINACIÓN Y PERMUTACION.
COMBINACIÓN:
Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los
elementos que constituyen dicho arreglo.
PERMUTACIÓN:
Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos
que constituyen dicho arreglo.
Para ver de una manera objetiva la diferencia entre una combinación y una permutación, plantearemos cierta
situación.
Suponga que un salón de clase está constituido por 35 alumnos.
a) El maestro desea que tres de los alumnos lo ayuden en actividades tales como mantener el aula limpia o
entregar material a los alumnos cuando así sea necesario.
b) El maestro desea que se nombre a los representantes del salón (Presidente, Secretario y Tesorero).
Solución:
a) Suponga que por unanimidad se ha elegido a Daniel, Arturo y a Rafael para limpiar el aula o entregar
material, (aunque pudieron haberse seleccionado a Rafael, Daniel y a Enrique, o pudo haberse formado
cualquier grupo de tres personas para realizar las actividades mencionadas anteriormente).
¿Es importante el orden como se selecciona a los elementos que forma el grupo de tres personas?
Reflexionando al respecto nos damos cuenta de que el orden en este caso no tiene importancia, ya que lo
único que nos interesaría es el contenido de cada grupo, dicho de otra forma, ¿quiénes están en el grupo?
Por tanto, este ejemplo es una combinación, quiere decir esto que las combinaciones nos permiten formar
grupos o muestras de elementos en donde lo único que nos interesa es el contenido de los mismos.
b) Suponga que se han nombrado como representantes del salón a Daniel como Presidente, a Arturo como
secretario y a Rafael como tesorero, pero resulta que a alguien se le ocurre hacer algunos cambios, los que
se muestran a continuación:
CAMBIOS
PRESIDENTE: Daniel Arturo Rafael Daniel
SECRETARIO: Arturo Daniel Daniel Rafael
TESORERO: Rafael Rafael Arturo Arturo
Ahora tenemos cuatro arreglos, ¿se trata de la misma representación?
Creo que la respuesta sería no, ya que el cambio de función que se hace a los integrantes de la
representación original hace que definitivamente cada una de las representaciones trabaje de manera
diferente, ¿importa el orden de los elementos en los arreglos?. La respuesta definitivamente sería sí, luego
entonces las representaciones antes definidas son diferentes ya que el orden o la forma en que se asignan
las funciones sí importa, por lo tanto es este caso estamos tratando con permutaciones.
A continuación obtendremos las fórmulas de permutaciones y de combinaciones, pero antes hay que definir lo
que es n! (ene factorial), ya que está involucrado en las fórmulas que se obtendrán y usarán para la resolución
de problemas.
n!= al producto desde la unidad hasta el valor que ostenta n.
n!= 1 x 2 x 3 x 4 x...........x n
Ejem.
10!=1 x 2 x 3 x 4 x.........x 10=3,628,800
8!= 1 x 2 x 3 x 4 x.........x 8=40,320
6!=1 x 2 x 3 x 4 x..........x 6=720, etc., etc.
Obtención de fórmula de permutaciones.
Para hacer esto, partiremos de un ejemplo.
¿Cuántas maneras hay de asignar los cuatro primeros lugares de un concurso de creatividad que se verifica
en las instalaciones de nuestro instituto, si hay 14 participantes?
Solución:
Haciendo uso del principio multiplicativo,
14x13x12x11 = 24,024 maneras de asignar los primeros tres lugares del concurso
Esta solución se debe, a que al momento de asignar el primer lugar tenemos a 14 posibles candidatos, una
vez asignado ese lugar nos quedan 13 posibles candidatos para el segundo lugar, luego tendríamos 12
candidatos posibles para el tercer lugar y por último tendríamos 11 candidatos posibles para el cuarto lugar.
Luego si n es el total de participantes en el concurso y r es el número de participantes que van a ser
premiados, y partiendo de la expresión anterior, entonces.
14x13x12x11= n x (n - 1) x (n - 2) x .......... x (n - r + 1)
si la expresión anterior es multiplicada por (n - r)! / (n - r)!, entonces
= n x (n -1 ) x (n - 2) x ......... x (n - r + 1) (n - r)! / (n - r)!
= n!/ (n - r)!
Por tanto, la fórmula de permutaciones de r objetos tomados de entre n objetos es:

Esta fórmula nos permitirá obtener todos aquellos arreglos en donde el orden es importante y solo se usen
parte (r) de los n objetos con que se cuenta, además hay que hacer notar que no se pueden repetir objetos
dentro del arreglo, esto es, los n objetos son todos diferentes.
Entonces, ¿ qué fórmula hay que usar para arreglos en donde se utilicen los n objetos con que se cuenta?
Si en la fórmula anterior se sustituye n en lugar de r, entonces.
nPn= n!/ (n -n)! = n! / 0! = n! / 1 = n!
Como 0! = 1 de acuerdo a demostración matemática, entonces
nPn= n!
Ejemplos:
1) ¿Cuantas representaciones diferentes serán posibles formar, si se desea que consten de Presidente,
Secretario, Tesorero, Primer Vocal y Segundo Vocal?, sí esta representación puede ser formada de entre 25
miembros del sindicato de una pequeña empresa.
Solución:
Por principio multiplicativo:
25 x 24 x 23 x 22 x 21 = 6,375,600 maneras de formar una representación de ese sindicato que conste de
presidente, secretario, etc., etc.
Por Fórmula:
n = 25, r=5
25P5 = 25!/ (25 -5)! = 25! / 20! = (25 x 24 x 23 x 22 x 21 x....x 1) / (20 x 19 x 18 x ... x 1)=
= 6,375,600 maneras de formar la representación
2) a. ¿Cuántas maneras diferentes hay de asignar las posiciones de salida de 8 autos que participan en una
carrera de fórmula uno? (Considere que las posiciones de salida de los autos participantes en la carrera son
dadas totalmente al azar) b. ¿Cuántas maneras diferentes hay de asignar los primeros tres premios de esta
carrera de fórmula uno?
Solución:
a. Por principio multiplicativo:
8 x 7 x 6 x 5 x 4 x 3 x 2 x 1= 40,320 maneras de asignar las posiciones de salida de los autos participantes en
la carrera
Por Fórmula:
n = 8, r = 8
8P8= 8! = 8 x 7 x 6 x 5 x 4 x......x 1= 40,320 maneras de asignar las posiciones de salida ......etc., etc.
b. Por principio multiplicativo:
8 x 7 x 6 = 336 maneras de asignar los tres primeros lugares de la carrera
Por fórmula:
n =8, r = 3
8P3 = 8! / (8 - 3)! = 8! / 5! = (8 x 7 x 6 x 5 x ........x1)/ (5 x 4 x 3 x......x1) = 336 maneras de asignar los tres
primeros lugares de la carrera
3) ¿Cuántos puntos de tres coordenadas ( x, y, z ), será posible generar con los dígitos 0, 1, 2, 4, 6 y 9?,
Si, a. No es posible repetir dígitos, b. Es posible repetir dígitos.
Solución:
a. Por fórmula
n = 6, r = 3
6P3 = 6! / (6 - 3)! = 6! / 3! = 6 x 5 x 4 x 3! / 3! = 6 x 5 x 4 = 120 puntos posibles
Nota: este inciso también puede ser resuelto por el principio multiplicativo
b. Por el principio multiplicativo
6 x 6 x 6 = 216 puntos posibles
¿Cuál es la razón por la cuál no se utiliza en este caso la fórmula?. No es utilizada debido a que la fórmula de
permutaciones sólo se usa cuando los objetos no se repiten, esto quiere decir que en el inciso a. Los puntos
generados siempre van a tener coordenadas cuyos valores son diferentes ejem. (1, 2, 4), (2, 4, 6), (0, 4, 9),
etc. etc., mientras que los puntos generados en el inciso b. Las coordenadas de los puntos pueden tener
valores diferentes o repeticiones de algunos valores o pueden tener todas las coordenadas un mismo
valor ejem. (1, 2, 4), (1, 2, 2), (1, 1, 1), etc., etc.
4) a. ¿Cuántas maneras hay de asignar las 5 posiciones de juego de un equipo de básquetbol, si el equipo
consta de 12 integrantes?, b. ¿Cuántas maneras hay de asignar las posiciones de juego si una de ellas solo
puede ser ocupada por Uriel José Esparza?, c. ¿Cuántas maneras hay de que se ocupen las posiciones de
juego si es necesario que en una de ellas este Uriel José Esparza y en otra Omar Luna?
Solución:
a. Por fórmula:
n = 12, r = 5
12P5 = 12! / (12 - 5 )! = 12 x 11 x 10 x 9 x 8 = 95,040 maneras de asignar las cinco posiciones de juego
a. Por principio multiplicativo:
1 x 11 x 10 x 9 x 8 =7,920 maneras de asignar las posiciones de juego
Por fórmula:
1 x 11P4 = 1 x 11! / (11 - 4)! = 11! / 7! = 11 x 10 x 9 x 8 = 7,920 maneras de asignar las posiciones de juego
con Uriel José en una determinada posición
a. Por principio multiplicativo
1 x 1 x 10 x 9 x 8 = 720 maneras de ocupar las diferentes posiciones de juego
Por fórmula:
1 x 1 x 10P3 = 1 x 1 x 10! / (10 - 3)! = 10! / 7! = 10 x 9 x 8 = 720 maneras de ocupar las posiciones de juego
con Uriel José y Omar Luna en posiciones previamente definidas
5) Cuántas claves de acceso a una computadora será posible diseñar, si debe constar de dos letras,
seguidas de cinco dígitos, las letras serán tomadas del abecedario y los números de entre los dígitos del 0 al
9. a. Considere que se pueden repetir letras y números, b. Considere que no se pueden repetir letras y
números, c. ¿Cuántas de las claves del inciso b empiezan por la letra A y terminan por el número 6?, d.
¿Cuántas de las claves del inciso b tienen la letra R seguida de la L y terminan por un número impar?
Solución:
a. Por principio multiplicativo:
26 x 26 x 10 x 10 x 10 x 10 x 10 = 67,600,000 claves de acceso
Por fórmula:
26P2 x 10P5 = 26 x 25 x 10 x 9 x 8 x 7 x 6=19,656,000 claves de acceso
a. Por fórmula:

1 x 25P1 x 9P4 x 1 = 1 x 25 x 9 x 8 x 7 x 6 x 1 = 75,600 claves de acceso que empiezan por la letra A y


terminan por el número 6
b. Por fórmula:
1 x 1 x 9P4 x 5 = 1 x 1 x 9 x 8 x 7 x 6 x 5 =15,120 claves de acceso que tienen la letra R seguida de la L y
terminan por un número impar.
Permutaciones con repetición
En los casos anteriores se han obtenido permutaciones en donde todos los elementos utilizados para hacer
los arreglos son diferentes. A continuación se obtendrá una fórmula que nos permite obtener las
permutaciones de n objetos, cuando entre esos objetos hay algunos que son iguales.
Ejemplo:
Obtenga todas las permutaciones posibles a obtener con las letras de la palabra OSO.
Solución:
Para obtener la fórmula, es necesario primero suponer que todas las letras de la palabra OSO son diferentes y
para diferenciarlas pondremos subíndices a las letras O, por lo que quedaría, O1SO2, y las permutaciones a
obtener serían:
3P3 = 3! = 6
definiendo las permutaciones tenemos que estas serían,
O1SO2, O2SO1, SO1O2, SO2O1, O1O2S, O2O1S
¿Pero realmente podemos hacer diferentes a las letras O?, eso no es posible, luego entonces ¿cuántos
arreglos reales se tienen?
Como:
Arreglos reales
O1SO2 = O2SO1 ? OSO
SO1O2 = SO2O1 ? SOO
O1O2S= O2O1S ? OOS
Entonces se observa que en realidad sólo es posible obtener tres permutaciones con las letras de la palabra
OSO debido a que las letras O son idénticas, ¿pero qué es lo que nos hizo pensar en seis arreglos en lugar
de tres?, el cambio que hicimos entre las letras O cuando las consideramos diferentes, cuando en realidad
son iguales.
Para obtener los arreglos reales es necesario partir de la siguiente expresión:
El número de arreglos reales = No. de permutaciones considerando a todos los objetos como diferentes
Los cambios entre objetos iguales

El número de arreglos reales = 3! / 2! = 3 x 2! / 2! = 3


Por tanto la fórmula a utilizar sería;

Donde:
nPx1,x2,......, xk = Número total de permutaciones que es posible obtener con n objetos, entre los que hay una
cantidad x1 de objetos de cierto tipo, una cantidad x2 de objetos de un segundo tipo,...... y una cantidad xk de
objetos del tipo k.
n = x1 + x2 + ...... + xk
Ejemplos:
1) Obtenga todas las señales posibles que se pueden diseñar con seis banderines, dos de los cuales son
rojos, tres son verdes y uno morado.
Solución:
n = 6 banderines
x1 = 2 banderines rojos
x2 = 3 banderines verdes
x3 = 1 banderín morado
6P2,3,1 = 6! / 2!3!1! = 60 señales diferentes
2) a. ¿Cuántas claves de acceso a una computadora será posible diseñar con los números
1,1,1,2,3,3,3,3?, b.¿cuántas de las claves anteriores empiezan por un número uno seguido de un dos?, c.
¿cuántas de las claves del inciso a empiezan por el número dos y terminan por el número tres?
Solución:
a. n = 8 números
x1 = 3 números uno
x2 = 1 número dos
x3 = 4 números cuatro
8P3,1,4 = 8! / 3!1!4! = 280 claves de acceso
b. n = 6 (se excluye un número uno y un dos)
x1 = 2 números uno
x2 = 4 números tres
1 x 1 x 6P2,4 = 1 x 1 x 6! / 2!4! = 15 claves de acceso
El primer número uno nos indica el número de maneras como es posible colocar en la primera posición de la
clave de acceso un número uno, debido a que todos los números uno son iguales, entonces tenemos una sola
manera de seleccionar un número uno para la primera posición, el siguiente número uno nos indica el número
de maneras como se colocaría en la segunda posición el número dos y la expresión siguiente nos indica todos
los arreglos posibles que es posible diseñar con los números restantes.
c. n = 6 (se excluye un número dos y un tres)
x1 = 3 números uno
x2 = 3 números tres
1 x 6P3,3 x1 = 1 x 6! / 3!3! = 20 claves de acceso
El número uno inicial nos indica que existe una sola manera de seleccionar el número dos que va en la
primera posición del arreglo, mientras que el número uno final nos indica que hay una sola manera de
seleccionar el número tres que va al final del arreglo aún y cuando haya cuatro números tres, como estos son
iguales al diseñar una permutación es indistinto cuál número tres se ponga, ya que siempre se tendrá el
mismo arreglo y la expresión intermedia nos indica todos los arreglos posibles a realizar con los números
restantes.
3) ¿De cuántas maneras es posible plantar en una línea divisoria de un terreno dos nogales, cuatro
manzanos y tres ciruelos?
Solución:
n = 9 árboles
x1 = 2 nogales
x2 = 4 manzanos
x3 = 3 ciruelos
9P2,4,3 = 9! / 2!4!3! = 1260 maneras de plantar los árboles
4) Si un equipo de fútbol soccer femenil participa en 12 juegos en una temporada, ¿cuántas maneras hay
de que entre esos doce juegos en que participa, obtenga 7 victorias, 3 empates y 2 juegos perdidos?
Solución:
n = 12 juegos
x1 = 7 victorias
x2 = 3 empates
x3 = 2 juegos perdidos

12P7,3,2 = 12! / 7!3!2! = 7,920 maneras de que en la temporada este equipo logre siete victorias,
tres empates y dos juegos perdidos.
Pruebas ordenadas
Se le llama prueba ordenada al hecho de seleccionar r objetos de entre n objetos contenidos en una urna uno
tras otro. Una prueba ordenada puede ser llevada a efecto de dos maneras:
1) Con sustitución (con reemplazo).- En este caso se procede a seleccionar el primer objeto de entre
los n que hay, se observa de qué tipo es y se procede a regresarlo a la urna, luego se selecciona el siguiente
objeto, lo anterior se repite hasta que se han extraído los r objetos de la prueba, por tanto el número
de pruebas ordenadas de con sustitución se obtiene:
Número total de pruebas ordenadas con sustitución = n x n x n x .........x n = nr
Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, dado que se ha
regresado a la urna el primer objeto, también se tendrán n objetos y así sucesivamente.
2) Sin sustitución (sin reemplazo).- En este caso se procede a seleccionar el primer objeto, el cual no es
regresado a la urna, luego se selecciona el segundo objeto, lo anterior se repite hasta completar los r objetos
de la prueba, por lo que el número total de pruebas ordenadas sin sustitución se obtiene:
Número total de pruebas ordenadas sin sustitución = n(n-1)(n-2).........(n-r +1) = nPr
Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, hay n -1 maneras,
dado que el primer objeto no se regresa a la urna, luego cuando se extrae el r-ésimo objeto, hay (n -r +1) de
que sea seleccionado.
Ejemplos:
1) ¿Cuántas maneras hay de que se asignen tres premios de un sorteo en donde el primer premio es una
departamento, el segundo premio es un auto y el tercer premio es un centro de cómputo, si los participantes
en este sorteo son 120 personas, a.sí la asignación se puede hacer con sustitución, b.sí la asignación se
puede hacer sin sustitución.
Solución:
a. Por principio multiplicativo:
120 x 120 x 120 = 1,728,000 maneras de asignar los premios
Por fórmula: n =120, r = 120
nr = 1203 = 1,728,000 maneras de asignar los tres premios
Hay que considerar que en este caso, al regresar cada boleto que es extraído de la urna, las personas que
participan en el sorteo tienen la posibilidad de no ganar uno solo de los premios, de ganar un premio, dos de
los premios o los tres premios. Cosa que generalmente no ocurre.
b. Por principio multiplicativo:
120 x 119 x 118 = 1,685,040 maneras de asignar los premios
Por fórmula:
n = 120, r = 3
120P3 = 120! / (120 - 3)! = 120! / 117! = 120 x 119 x 118 = 1,685,040 maneras de asignar los premios
Hay que hacer notar que en este caso, como los boletos que son seleccionados ya no regresan a la urna de
donde fueron extraídos, los participantes solo pueden recibir un premio en caso de que fueran de los
afortunados. Esta es la forma en que generalmente se efectúa un sorteo.
2) ¿Cuántas formas hay de asignar las primeras cinco posiciones de una carrera de autos de fórmula K, si
participan 26 autos en esta carrera?. Considere que la asignación es totalmente al azar.
Solución:
Esta asignación debe ser sin sustitución, esto es, se trata de una prueba ordenada sin sustitución, por lo que
la solución es la que se muestra.
n = 26, r = 5
26P5 = 26! / (26 - 5)! = 26! / 21! = 26 x 25 x 24 x 23 x 22 = 7,893,600 maneras de asignar las cinco
primeras posiciones de salida
3) ¿Cuántas formas hay de asignar el orden de participación de las primeras 5 concursantes de 11
finalistas de un concurso de Miss Mundo?
Solución:
Esta asignación debe realizarse sin sustitución, por lo que se trata de una prueba ordenada sin sustitución.
n = 11, r = 5
11P5 = 11! / (11 - 5)! = 11! / 6! = 11 x 10 x 9 x 8 x 7 = 55,440 maneras de asignar la participación
Combinaciones
Como ya se mencionó anteriormente, una combinación, es un arreglo de elementos en donde no nos interesa
el lugar o posición que ocupan los mismos dentro del arreglo. En una combinación nos interesa formar grupos
y el contenido de los mismos.
La fórmula para determinar el número de combinaciones es:
La expresión anterior nos explica como las combinaciones de r objetos tomados de entre n objetos pueden
ser obtenidas a partir de las permutaciones de r objetos tomados de entre n objetos, esto se debe a que como
en las combinaciones no nos importa el orden de los objetos, entonces si tenemos las permutaciones de esos
objetos al dividirlas entre r!, les estamos quitando el orden y por tanto transformándolas en combinaciones, de
otra forma, también si deseamos calcular permutaciones y tenemos las combinaciones, simplemente con
multiplicar estas por el r! obtendremos las permutaciones requeridas.
nPr = nCr r!
Y si deseamos r = n entonces;
nCn = n! / (n -n)!n! = n! / 0!n! = 1
¿Qué nos indica lo anterior?
Que cuando se desea formar grupos con la misma cantidad de elementos con que se cuenta solo es posible
formar un grupo.
Ejemplos:
1) a. Si se cuenta con 14 alumnos que desean colaborar en una campaña pro limpieza del Tec, cuantos
grupos de limpieza podrán formarse si se desea que consten de 5 alumnos cada uno de ellos, b.si entre los 14
alumnos hay 8 mujeres, ¿cuantos de los grupos de limpieza tendrán a 3 mujeres?, c.¿cuántos de los grupos
de limpieza contarán con 4 hombres por lo menos?
Solución:
a. n = 14, r = 5
14C5 = 14! / (14 - 5 )!5! = 14! / 9!5!
= 14 x 13 x 12 x 11 x 10 x 9!/ 9!5!
= 2002 grupos
Entre los 2002 grupos de limpieza hay grupos que contienen solo hombres, grupos que contienen solo
mujeres y grupos mixtos, con hombres y mujeres.
b. n = 14 (8 mujeres y 6 hombres), r=5
En este caso nos interesan aquellos grupos que contengan 3 mujeres y 2 hombres
8C3*6C2 = (8! / (8 -3)!3!)*(6! / (6 - 2)!2!)
= (8! / 5!3!)*(6! / 4!2!)
= 8 x7 x 6 x 5 /2!
= 840 grupos con 3 mujeres y 2 hombres, puesto que cada grupo debe constar
de 5 personas
c. En este caso nos interesan grupos en donde haya 4 hombres o más
Los grupos de interés son = grupos con 4 hombres + grupos con 5 hombres
= 6C4*8C1 + 6C5*8C0 = 15 x 8 + 6 x 1 = 120 + 6 = 126
2) Para contestar un examen un alumno debe contestar 9 de 12 preguntas,
a. ¿Cuántas maneras tiene el alumno de seleccionar las 9 preguntas?,
b. ¿Cuántas maneras tiene si forzosamente debe contestar las 2 primeras preguntas?,
c. ¿Cuántas maneras tiene si debe contestar una de las 3 primeras preguntas?,
d .¿Cuántas maneras tiene si debe contestar como máximo una de las 3 primeras preguntas?
Solución:
a. n = 12, r = 9
12C9 = 12! / (12 - 9)!9! = 12! / 3!9! = 12 x 11 x 10 / 3!
= 220 maneras de seleccionar las nueve preguntas o dicho de otra manera,
el alumno puede seleccionar cualquiera de 220 grupos de 9 preguntas para contestar el examen
b. 2C2*10C7 = 1 x 120 = 120 maneras de seleccionar las 9 preguntas entre las que están las dos primeras
preguntas
c. 3C1*9C8 = 3 x 9 = 27 maneras de seleccionar la 9 preguntas entre las que está una de las tres primeras
preguntas
d. En este caso debe seleccionar 0 o 1 de las tres primeras preguntas
3C0*9C9 + 3C1*9C8 = (1 x 1) + (3 x 9) = 1 + 27 = 28 maneras de seleccionar las preguntas a contestar
3) Una señora desea invitar a cenar a 5 de 11 amigos que tiene, a. ¿Cuántas maneras tiene de invitarlos?,
b. ¿cuántas maneras tiene si entre ellos está una pareja de recién casados y no asisten el uno sin el otro, c.
¿Cuántas maneras tiene de invitarlos si Rafael y Arturo no se llevan bien y no van juntos?
Solución:
a. n = 11, r = 5
11C5 = 11! / (11 - 5 )!5! = 11! / 6!5!
= 11 x 10 x 9 x 8 x 7 x 6! / 6!5!
= 462 maneras de invitarlos
Es decir que se pueden formar 462 grupos de cinco personas para ser invitadas a cenar.
b. Esta señora tiene dos alternativas para hacer la invitación, la primera es no invitar a la pareja y la segunda
es invitar a la pareja.
2C0*9C5 + 2C2*9C3 = (1 x 126) + (1 x 84) = 210 maneras de invitarlos
En este caso separamos a la pareja de los demás invitados para que efectivamente se cumpla el que no
asistan o que asistan a la cena.
c.La señora tiene dos alternativas para hacer la invitación, una de ellas es que no invitar a Rafael y a
Arturo o que asista solo uno de ellos.
2C0*9C5 + 2C1*9C4 = (1 x 126) + (2 x 126) = 126 + 252 = 378 maneras de hacer la invitación
4) En un plano hay 10 puntos denominados A, B, C, ....,etc. etc., en una misma línea no hay más de dos
puntos, a. ¿Cuántas líneas pueden ser trazadas a partir de los puntos?, b. ¿Cuántas de las líneas no pasan
por los puntos A o B?, c. ¿Cuántos triángulos pueden ser trazados a partir de los puntos?, d. ¿Cuántos de los
triángulos contienen el punto A?, e. ¿Cuántos de los triángulos tienen el lado AB?.
Solución:
a. En la redacción del problema se aclara que en una misma línea no hay más de dos puntos debido a que
si lo anterior ocurriera no se podría dar contestación a las preguntas que se hacen.
Una línea puede ser trazada a partir de cómo mínimo dos puntos por lo tanto,
10C2 = 10! / (10 - 2)!2! = 10! / 8!2! = 45 líneas que se pueden trazar
b. En este caso excluiremos los puntos A y B y a partir de los ocho puntos restantes se obtendrán las
líneas.
2C0*8C2 = 1 x 28 = 28 líneas que no pasan por los puntos A o B
c. Un triángulo puede ser trazado a partir de tres puntos, luego;
10C3 = 10! / (10 - 3)!3! = 10! / 7!3! = 120 triángulos posibles de trazar
d. En este caso se separa el punto A de los demás, se selecciona y posteriormente también se
seleccionan dos puntos más.
1C1*9C2 = 1 x 36 = 36 triángulos que contienen el punto A
e. Los puntos A y B forman parte de los triángulos a trazar por lo que;
2C2*8C1 = 1 X 8 = 8 triángulos que contienen el lado AB
Particiones ordenadas
Se le llama partición ordenada al hecho de repartir n objetos en células de una cantidad
de x1 objetos, x2 objetos,......y xk objetos.
Para deducir la fórmula de particiones ordenadas partiremos de un ejemplo.
¿Cuántas maneras hay de repartir 10 libros diferentes entre tres alumnos, si al primero le daremos 2, al
segundo 3 y el resto al tercer alumno?
Ejemplos de esta partición serían las siguientes si se numeran los libros del 1 al 10;
Solución:
Lo primero que debemos hacer es seleccionar 2 libros de los 10 que se tienen para el primer alumno, esto es;
10C2 = 10! / (10 - 2)!2! = 10! / 8!2! = 45 maneras de seleccionar los libros
Luego se seleccionan 3 libros de los 8 que quedan para el segundo alumno;
8C3 = 8! / (8 - 3)!3! = 8! / 5!3! = 56 maneras
Y por último se procederá a seleccionar cinco libros de los cinco que quedan para el tercer alumno, lo que
se muestra a continuación;
5C5 = 5! / (5 -5)!5! = 5! / 0!5! = 1 manera
Por tanto el número total de particiones ordenadas en células de 2, 3 y 5 elementos se determina:
10C2*8C3*5C5 = (10! / (10 - 2)!2!)*(8! / (8 - 3)!3!)*(5! / (5 - 5)!5!) = 10! /2!3!5!
La expresión anterior nos recuerda a la fórmula utilizada para encontrar las permutaciones de n objetos, entre
los cuales hay algunos objetos que son iguales, por lo que usaremos la misma fórmula para encontrar las
particiones ordenadas.
Por tanto la fórmula para las particiones ordenadas sería:

Esta fórmula sólo puede ser utilizada cuando se reparten todos los objetos, no parte de ellos, en ese caso se
usarán combinaciones.
Donde:
nPx1,x2,.....,xk = Total de particiones ordenadas o reparticiones que es posible hacer cuando los n objetos
son repartidos en grupos de x1 objetos, x2 objetos ...... y xk objetos.
n = x1 + x2 + ......+ xk
Ejemplos: 1) ¿Cuántas maneras hay de repartir 9 juguetes entre tres niños, si se desea que al primer niño
le toquen 4 juguetes, al segundo 2 y al tercero 3 juguetes?
Solución:
Por combinaciones,
9C4*5C2*3C3 = 126*10*1= 1260 maneras de repartir los juguetes
Por fórmula,
n=9
x1 = 4
x2 = 2
x3 =3
9P4,2,3 = 9! / 4!2!3! = 1,260 maneras de repartir los juguetes
2) ¿Cuántas maneras hay de repartir los mismos 9 juguetes entre tres niños, si se desea darle 3 al primer
niño, 2 al segundo niño y 2 al tercer niño?
Solución:
En este caso únicamente se puede dar solución por combinaciones, ya que no es posible usar la fórmula
debido a que se reparten solo parte de los juguetes.
9C3*6C2*4C2 = 84*15*6 = 7,560 maneras de repartir los juguetes (solo se reparten 7 y quedan dos juguetes)
3) a. ¿Cuántas maneras hay de que se repartan 14 libros diferentes entre 3 alumnos, si se pretende que al
primer alumno y al segundo les toquen 5 libros a cada uno y al tercero le toque el resto?, b. ¿Cuántas
maneras hay de que se repartan los libros si se desea dar 5 libros al primer alumno, 3 al segundo y 2 libros al
tercer alumno?
Solución:
a. Por fórmula:
n = 14
x1 = 5
x2 = 5
x3 = 4
14P5,5,4 = 14! / 5!5!4! = 21,021 maneras de repartir los libros en grupos de 5, 5 y 4 libros
b. Por combinaciones:
14C5*9C3*6C2 = 2,002*84*15 = 2,522,520 maneras de repartir 10 de los 14 libros en grupos de 5, 3 y 2 libros
4) a. ¿Cuántas maneras hay de repartir a 12 alumnos en 4 equipos de 3 personas cada uno de ellos para
que realicen prácticas de laboratorio diferentes?,
b. ¿Cuantas maneras hay de que se repartan los 12 alumnos en 4 equipos de 3 personas si se va a realizar
una misma práctica?
Solución:
a. En este caso al ser prácticas de laboratorio diferentes, es posible resolver el problema por
combinaciones o por la fórmula, dado que se reparten todos los alumnos
Por fórmula:
n = 12
x1 = 3 práctica 1
x2 = 3 práctica 2
x3 = 3 práctica 3
x4 = 3 práctica 4
12P3,3,3,3 = 12! / 3!3!3!3! = 369,600 maneras de repartir a los estudiantes en cuatro equipos de 3 personas
para realizar prácticas diferentes
b. En este caso lo más probable es que se crea que la solución es igual que la que se ha dado al inciso a,
pero esto no puede ser debido a que si se desea repartir a los alumnos para realizar una misma práctica, el
orden en el que se hace la repartición no tiene importancia, ya que al equipo de tres personas les da lo mismo
quedar en el primer equipo a quedar en el segundo o tercero, ya que la práctica a realizar es la misma,
entonces la solución es;
12P3,3,3,3 * 1 /4! = 12! / 3!3!3!3! * 1 / 4! = 369,600 / 4! = 15,400 maneras de repartir a los alumnos en equipos
de 3 personas para realizar una misma práctica
Al multiplicar la solución que se da al inciso a, por 1/4! se está quitando el orden de los grupos, que en este
caso no nos interesa.
Distribuciones discretas de
probabilidad
sociado con él un suceso A de probabilidad p y sea A* el suceso contrario, cuya
probabilidad será q=1-p. Para distinguirlos con mayor facilidad, al suceso A lo
llamaremos éxito, y al suceso A* fracaso.

Repitamos el experimento en las mismas condiciones n veces y supongamos


que:

a) El resultado de cada ensayo es independiente de los resultados anteriores.

b) La probabilidad de A permanece constante y no varía de una prueba a otra..

Todo experimento que tenga esta características diremos que sigue el modelo de
la distribución binomial.

A la variable X que expresa el número de éxitos obtenidos en las n pruebas del


experimento aleatorio la llamaremos variable aleatoria binomial.
Representaremos por B(n, p) a la variable de la distribución, siendo n y p los
parámetros.

Función de probabilidad de la distribución Binomial.

La variable aleatoria que expresa el número de éxitos en n pruebas, es una


variable aleatoria discreta cuyos valores varían de 0, 1, 2, …, n. Y las
probabilidades con que toman dichos valores se calculan de la siguiente

forma:

Media y varianza de la distribución binomial.

a) Media:

b) Varianza:
En ella hay que observar:

c) Es simétrica si p=q. Si p<q asimetría a la derecha; si p>q, asimetría a la


izquierda. Cuando n la distribución tiende a ser simétrica (distribución
normal).

d) Los valores de P(X=k) están tabulados para valores de p comprendidos entre


0 y 0.5. Si p>0.5, hay que tener en cuenta que B(n, k, p) = B(n, n-k, q).

Ajuste.

El problema del ajuste es el de buscar una distribución binomial que “mejor” se


adapta a unos datos, es decir, se ha de calcular el valor del parámetro p para el
cual las probabilidades binomiales obtenidas sean las mas cercanas posibles a
los datos. El procedimiento que se sigue es igualar la media de la muestra a la
media de la población, con lo que tenemos:

Con este valor de p se calculan las correspondientes probabilidades y se


comprueba si el ajuste es bueno. Para medir la bondad del ajuste de una
manera objetiva existen métodos matemáticos que se tratarán más adelante.

[Volver al principio]

Distribución polinomial.

Es una generalización de la distribución binomial para el caso de que en cada


prueba se consideren k sucesos excluyentes A1, A2, …, Ak con probabilidades
respectivas p1, p2, …, pk siendo la suma de todas igual a la unidad.

Supongamos que se realizan sucesivamente n pruebas independientes de este


tipo y consideremos las variables Xi = ”Número de veces que ocurre el suceso
Ai en las n pruebas”.
A la variable k-dimensional (X1, X2, …, Xk) se le denomina variable polinomial o
multinomial.

Para hallar su función de probabilidad P(X1=n1, X2=n2, …, Xk=nk) con

consideremos uno de sus sucesos favorables:

En ella hay que observar:

a) Depende de k parámetros n, p1, p2, …, pk-1.

b) Si el experimento consiste en extracciones de una urna, estas han de ser con


reemplazamiento para mantener las probabilidades de los sucesos Ai constantes a
lo largo de todas las pruebas.

[Volver al principio]

Distribución de Poisson.

Una variable aleatoria X sigue una distribución de Poisson si puede tomat


valores enteros 0, 1, 2, …, n, …, con probabilidades:

En esta distribución hay que observar:

a) Depende de un solo parámetro.


b) Su media, varianza son

c) Es una buena aproximación de la binomial cuando n grande y p pequeño:

En general si n>50 y p<0.1 ó n.p<5 la distribución de Poisson es una buena


aproximación de la Binomial.

d) La distribución de Poisson presenta una ligera asimetría hacia la izquierda.


Cuando n tiende hacia infinito tiende a ser simétrica (distribución normal).

[Volver al principio]

Distribución Hipergeométrica.

Consideremos una población de N elementos de dos clases A y A* excluyentes,


de los cuales nA son de la clase A y nA* son de la Clase A*, con nA + nA* = N.

Al tomar un elemento de esta población la probabilidad de que proceda de una


u otra clase es:

Sea ahora el experimento de tomar n elementos consecutivos de una


población sin reemplazamiento. A la variable aleatoria X= “ número de
elementos de la clase A en la muestra de tamaño n” se le denomina variable
hipergeométrica.

Para hallar su función de probabilidad P(X=k) consideremos uno de los sucesos


favorables:
Luego

En ella hay que observar

a) Depende de los parámetros N, n, p

b) Su media y varianza son:

c) Se diferencia de la binomial en que, en aquella las probabilidades son


constantes a lo largo de las pruebas(extracciones con reemplazamiento) mientras
que en la hipergeométrica, varían de una prueba a otra (extracciones sin
reemplazamiento).

d) Si N es grande respecto de n, las probabilidades varían muy poco de una


prueba a la siguiente, por lo que en estos casos se puede decir que la variable
hipergeométrica sigue aproximadamente una distribución binomial, es decir:

Se conviene en sustituirla cuando n/N<0.1

Por otra parte y de manera análoga a la distribución polinomial, si tenemos una


población con N elementos repartidos en k clases excluyentes A1, A2, …, Ak con
N1 elementos de la clase A1, N2 elementos de la clase A2, …, Nk elementos de la
clase Ak siendo N1+N2+ …+ Nk = N, al tomar consecutivamente n elementos sin
reemplazamiento y llamando Xi = “Número de elementos que hay de la clase
Ai en la muestra de tamaño n” la variable k-dimensional (X1, X2, …, Xk) tiene por
función de probabilidad:

[Volver al principio]

Distribución geométrica o de Pascal

Sea el experimento consistente en la realización sucesiva de pruebas de


Bernoulli. A la variable X= “número de la prueba en la que aparece por primera
vez el suceso A” se le denomina variable geométrica. Ara hallar la probabilidad
de P(X=k), hay que notar que esta probabilidad es la del
suceso luego P(X=k)=qk-1.p

a) Esta distribución depende de un solo parámetro p.

b) Su media y varianza son

c) Si el experimento consiste en extracciones de una urna estas han de ser con


reeemplazamiento.

[Volver al principio]

Distribución Binomial negativa.

Sea X = “número de pruebas en que aparece el suceso A* hasta la enésima


aparición del suceso A”.
Para hallar la probabilidad del suceso P(X=k), consideremos uno de los sucesos
favorables:

luego:

En ella hay que observar:

a) Depende de dos parámetros n y p.

b) Su media y varianza son:

c) Si el experimento consiste en extracciones de una urna, estas han de ser con


reemplazamiento.

Principales características
Medición
Existen diversas definiciones del termino "medición", pero estas dependen de los diferentes puntos de vista
que se puedan tener al abordar el problema de la cuantificación y el proceso mismo de la construcción de
una escala o instrumento de medición.
En general, se entiende por medición la asignación de números a elementos u objetos para representar o
cuantificar una propiedad. El problema básico está dado por la asignación un numeral que represente la
magnitud de la característica que queremos medir y que dicho números pueden analizarse por
manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los atributos de nuestras percepciones
se transforman en entidades conocidas y manejables llamadas "números". Es evidente que el mundo
resultaría caótico si no pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la físico
saber que el hierro tiene una alta temperatura de fusión.
Niveles o Escalas de mediciones
Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la asignación,
puramente arbitraria de números o símbolos a cada una de las diferentes categorías en las cuales podemos
dividir el carácter que observamos, sin que puedan establecerse relaciones entre dichas categorías, a no ser
el de que cada elemento pueda pertenecer a una y solo una de estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes
respecto del atributo o propiedad en estudio, después de lo cual se asignan nombres a tales clases, y el
hecho de que a veces, en lugar de denominaciones, se le atribuyan números, puede ser una de las razones
por las cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo San Carlos de
acuerdos a la carrera que cursan.
Carrera Número asignada a la categoría
Educación 1
Administración 2
Se ha de tener presente que los números asignados a cada categoría sirven única y exclusivamente par
identificar la categoría y no poseen propiedades cuantitativas.
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal
es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los números asignándolo a
los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que
A posee un mayor grado de atributo que B.
La asignación de números a las distintas categorías no puede ser completamente arbitraria, debe hacerse
atendiendo al orden existente entre éstas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas
sus categorías, el cálculo de las medidas estadísticas de posición, como por ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el orden de llegada, estamos llevando
una escala ordinal, es decir que al primero en llegar ordinal, es decir que al primeo en llegar le asignamos el
nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada número representará una categoría en
general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los números asignados
guardan la misma relación que el orden de llegada a la consulta.
Escalas de intervalos iguales:
la escala de intervalos iguales, está caracterizada por una unidad de medida común y constante que asigna
un número igual al número de unidades equivalentes a la de la magnitud que posea el elemento observado.
Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en
ningún momento ausencia de la magnitud que estamos midiendo. Esta escala, además de poseer las
características de la escala ordinal, encontramos que la asignación de los números a los elemento es tan
precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la
escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente
cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las medidas
estadísticas a excepción del coeficiente de variación.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.
Escala de coeficientes o Razones:
El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos
iguales únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala
significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se
dispone de una unidad de medida para el efecto. A iguales diferencias entre los números asignados
corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Además, siendo
que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no tienen hijos,
otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos.
Las variables y su medición:
Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de valores,
llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier
valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable
es discreta".
Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de
ser medidas cuantitativamente, es decir, que pueden expresar numéricamente la magnitud de dichas
variaciones. Por intuición y por experiencia sabemos que pueden distinguirse dos tipos de variables; las
continuas y las discretas
Las variables continuas se caracterizan por el hecho de que para todo para de valores siempre se puede
encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.)
Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores
consecutivos. Por ejemplo, la estatura, el peso, la temperatura.
Para ver el gráfico seleccione la opción "Descargar" del menú superior
Ejemplo:
En el preescolar Blanca de Pérez, ubicado en la urbanización Monseñor Padilla de esta ciudad se procedió a
recoger las medidas de talla y peso de los niños que a este asisten.
Niño Peso Talla
José 18,300 1,15
Julio 20,500 1,20
Pedro 19,000 1,10
Luis 18,750 1,18
.Las variables discretas serán aquellas que pueden tomar solo un número limitado de valores separados y
no continuos; son aquellas que solo toman un determinado números de valores, porque entre dos valores
consecutivos no pueden tomar ningún otro; por ejemplo el número de estudiantes de una clase es una
variable discreta ya que solo tomará los valores 1, 2, 3, 4... nótese que no encontramos valor como 1,5
estudiantes

Distribuciones binomial, de poisson e


hipergeotrica.
Esta distribución es una de las más importantes distribuciones de variable
discreta. Sus principales aplicaciones hacen referencia a la modelización de
situaciones en las que nos interesa determinar el número de hechos de cierto tipo
que se pueden producir en un intervalo de tiempo o de espacio, bajo presupuestos
de aleatoriedad y ciertas circunstancias restrictivas. Otro de sus usos frecuentes
es la consideración límite de procesos dicotómicos reiterados un gran número de
veces si la probabilidad de obtener un éxito es muy pequeña .

Proceso experimental del que se puede hacer derivar

Esta distribución se puede hacer derivar de un proceso experimental de


observación en el que tengamos las siguientes características

 Se observa la realización de hechos de cierto tipo durante un cierto periodo


de tiempo o a lo largo de un espacio de observación

 Los hechos a observar tienen naturaleza aleatoria ; pueden producirse o


no de una manera no determinística.

 La probabilidad de que se produzcan un número x de éxitos en un


intervalo de amplitud t no depende del origen del intervalo (Aunque, sí de su
amplitud)
 La probabilidad de que ocurra un hecho en un intervalo infinitésimo es
prácticamente proporcional a la amplitud del intervalo.

 La probabilidad de que se produzcan 2 o más hechos en un intervalo


infinitésimo es un infinitésimo de orden superior a dos.

En consecuencia, en un intervalo infinitésimo podrán producirse O ó 1


hecho pero nunca más de uno

 Si en estas circunstancias aleatorizamos de forma que la variable aleatoria


X signifique o designe el "número de hechos que se producen en un intervalo
de tiempo o de espacio", la variable X se distribuye con una distribución de
parámetro  . Así :

El parámetro de la distribución es, en principio, el factor de proporcionalidad


para la probabilidad de un hecho en un intervalo infinitésimo. Se le suele
designar como parámetro de intensidad , aunque más tarde veremos que se
corresponde con el número medio de hechos que cabe esperar que se produzcan
en un intervalo unitario (media de la distribución); y que también coincide con la
varianza de la distribución.

Por otro lado es evidente que se trata de un modelo discreto y que el campo de
variación de la variable será el conjunto de los número naturales, incluido el
cero:

Función de cuantía

A partir de las hipótesis del proceso, se obtiene una ecuación diferencial de


definición del mismo que puede integrarse con facilidad para obtener la función
de cuantía de la variable "número de hechos que ocurren en un intervalo unitario
de tiempo o espacio "

Que sería : ir a
programa de cálculo
Cuya representación gráfica
para un modelo de media 11
sería la adjunta .
Obsérvense los valores
próximos en la media y su
forma parecida a la campana
de Gauss , en definitiva , a la
distribución normal

La función de distribución vendrá dada por :

Función Generatriz de Momentos

Su expresión será :

dado que tendremos


que

luego :
Para la obtención de la media y la varianza aplicaríamos la F.G.M.; derivándola
sucesivamente e igualando t a cero .

Así.

Una vez obtenida la media , obtendríamos la varianza en base


a:

haciendo t = 0

por lo que =

así se observa que media y varianza coinciden con el


parámetro del modelo siendo , 

En cuanto a la moda del modelo tendremos que será el valor de la variable que
tenga mayor probabilidad , por tanto si Mo es el valor modal se cumplirá que
:

Y, en particular:

A partir de estas dos desigualdades, es muy sencillo probar que la moda tiene
que verificar: De manera que la moda será la parte entera del
parámetro  o dicho de otra forma, la parte entera de la media
Podemos observar cómo el intervalo al que debe pertenecer la moda tiene una
amplitud de una unidad , de manera que la única posibilidad de que una
distribución tenga dos modas será que los extremos de este intervalo sean
números naturales, o lo que es lo mismo que el parámetro  sea entero, en cuyo
caso las dos modas serán  -1 y  .

Teorema de adición.

La distribución de Poisson verifica el teorema de adición para el parámetro  .

"La variable suma de dos o más variables independientes que tengan una
distribución de Poisson de distintos parámetros  (de distintas medias) se
distribuirá, también con una distribución de Poisson con parámetro  la suma de
los parámetros  (con media, la suma de las medias) :

En efecto:

Sean x e y dos variables aleatorias que se distribuyen con dos distribuciones de


Poisson de distintos parámetros siendo además x e y independientes

Así e

Debemos probar que la variable Z= x+y seguirá una Poisson con parámetro
igual a la suma de los de ambas:

En base a las F.G.M para X

Para Y

De manera que la función generatriz de momentos de Z será el producto de


ambas ya que son independientes

Siendo la F.G.M de una


Poisson
Convergencia de la distribución binomial a la Poisson

Se puede probar que la distribución binomial tiende a converger a la


distribución de Poisson cuando el parámetro n tiende a infinito y el parámetro p
tiende a ser cero, de manera que el producto de n por p sea una cantidad
constante. De ocurrir esto la distribución binomial tiende a un modelo de Poisson
de parámetro  igual a n por p

Este resultado es importante a la hora del cálculo de probabilidades , o , incluso a


la hora de inferir características de la distribución binomial cuando el número de
pruebas sea muy grande y la probabilidad de éxito sea muy
pequeña .

El resultado se prueba , comprobando como la función de cuantía de una


distribución binomial con y tiende a una función de cuantía de
una distribución de Poisson con siempre que este producto sea una
cantidad constante ( un valor finito)

En efecto : la función de cuantía de la binomial es

Y llamamos tendremos que:

realizando que es la función de cuantía de una


distribución de Poisson
Hasta ahora hemos analizado distribuciones que modelizaban situaciones en las
que se realizaban pruebas que entrañaban una dicotomía (proceso de Bernouilli)
de manera que en cada experiencia la probabilidad de obtener cada uno de los
dos posibles resultados se mantenía constante. Si el proceso consistía en una serie
de extracciones o selecciones ello implicaba la reposición de cada extracción o
selección , o bien la consideración de una población muy grande. Sin embargo si
la población es pequeña y las extracciones no se remplazan las probabilidades no
se mantendrán constantes . En ese caso las distribuciones anteriores no nos
servirán para la modelizar la situación. La distribución hipergeométrica viene a
cubrir esta necesidad de modelizar procesos de Bernouilli con probabilidades no
constantes (sin reemplazamiento) .

La distribución hipergeométrica es especialmente útil en todos aquellos casos


en los que se extraigan muestras o se realizan experiencias repetidas sin
devolución del elemento extraído o sin retornar a la situación experimental
inicial.

Modeliza , de hecho, situaciones en las que se repite un número determinado


de veces una prueba dicotómica de manera que con cada sucesivo resultado se ve
alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es
una distribución .fundamental en el estudio de muestras pequeñas de poblaciones
.pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene grandes
aplicaciones en el control de calidad en otros procesos experimentales en los que
no es posible retornar a la situación de partida.

La distribución hipergeométrica puede derivarse de un proceso experimental


puro o de Bernouilli con las siguientes características:

 El proceso consta de n pruebas , separadas o separables de


entre un conjunto de N pruebas posibles.

 Cada una de las pruebas puede dar únicamente dos


resultados mutuamente excluyentes: A y no A.

 En la primera prueba las probabilidades son :P(A)= p y


P(A)= q ;con p+q=l.

Las probabilidades de obtener un resultado A y de obtener un resultado no A


varían en las sucesivas pruebas, dependiendo de los resultados anteriores.

 (Derivación de la distribución) . Si estas circunstancias a


leatorizamos de forma que la variable aleatoria X sea el número de
resultados A obtenidos en n pruebas la distribución de X será una
Hipergeométrica de parámetros N,n,p así

Un típico caso de aplicación de este modelo es el siguiente :

Supongamos la extracción aleatoria de n elementos de un


conjunto formado por N elementos totales, de los cuales Np son del tipo A y Nq
son del tipo (p+q=l) .Si realizamos las extracciones sin devolver los elementos
extraídos , y llamamos X. al número de elementos del tipo A que extraemos en n
extracciones X seguirá una distribución hipergeométrica de parámetros N , n , p

Función de cuantía.

La función de cuantía de una distribución Hipergeométrica hará corresponder a


cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener
x resultados del tipo A ", y (n-x) resultados del tipo no A en las n pruebas
realizadas de entre las N posibles.

Veamos :

Hay un total de formas distintas de obtener

x resultados del tipo A y n-x del tipo ,


si partimos de una población formada por Np elementos del tipo A
y Nq elementos del tipo

Por otro lado si realizamos n pruebas o extracciones hay un total de

posibles muestras ( grupos de n elementos)

aplicando la regla de Laplace tendríamos


que para valores de X comprendidos entre el conjunto de enteros 0,1,…. .n será
la expresión de la función de cuantía de una distribución , Hipergeométrica de
parámetros N,n,p .

Media y varianza.

Considerando que una variable hipergeométrica de parámetros N, n, p puede


considerarse generada por la reiteración de un proceso dicotómico n veces en el
que las n dicotomías NO son independientes ; podemos considerar que una
variable hipergeométrica es la suma de n variables dicotómicas NO
independientes.

Es bien sabido que la media de la suma de variables aleatorias (sean éstas


independientes o no) es la suma de las medias y por tanto la media de una
distribución hipergeométrica será , como en el caso de la binomial :

En cambio si las variables sumando no son independientes la varianza de la


variable suma no será la suma de las varianzas.

Si se evalúa el valor de la varianza para nuestro caso se obtiene que la varianza


de una distribución hipergeométrica de parámetros N,n,p es : si

para demostración de esta expresión véase Wilks S. ,Mathematical


Statistics,1962

Esta forma resulta ser la expresión de la varianza de una binomial (n, p)


afectada por un coeficiente corrector [N-n/N-1] , llamado coeficiente de
exhaustividad o Factor Corrector de Poblaciones Finitas (F.C.P.F.) y que da
cuenta del efecto que produce la no reposición de los elementos extraídos en el
muestreo.

Este coeficiente es tanto más pequeño cuanto mayor es el tamaño muestral


(número de pruebas de n ) y puede comprobarse como tiende a aproximarse a 1
cuando el tamaño de la población N es muy grande . Este último hecho nos
confirma lo ya comentado sobre la irrelevancia de la reposición o no cuando se
realizan extracciones sucesivas sobre una población muy grande. Con una
población muy grande se cual fuere el tamaño de n , el factor corrector sería uno
lo que convertiría , en cierto modo a la hipergeométrica en una binomial (ver D.
Binomial) . Así
Límite de la distribución hipergeométrica cuando N tiende a infinito.

Hemos visto como la media de la distribución hipergeométrica [H{N,n,p)],


tomaba siempre el mismo valor que la media de una distribución binomial
[B{n,p)] también hemos comentado que si el valor del parámetro N crecía hasta
aproximarse a infinito el coeficiente de exhaustividad tendía a ser 1, y, por lo
tanto, la varianza de la hipergeométrica se aproximaba a la de la binomial : puede
probarse asimismo , cómo la función de cuantía de una distribución
hipergeométrica tiende a aproximarse a la función de cuantía de una distribución
binomial cuando

Puede comprobarse en la
representación gráfica de una
hipergeométrica con N =100000
como ésta ,es idéntica a la de una
binomial con los mismos
parámetros restantes n y p , que
utilizamos al hablar de
la binomial

Moda de la distribución hipergeométrica

De manera análoga a como se obtenía la moda en la distribución binomial es


fácil obtener la expresión de ésta para la distribución hipergeométrica. De manera
que su expresión X0 sería la del valor o valores enteros que verificasen.
Distribuciones continuas
En teoría de la probabilidad una distribución de probabilidad se llama continua si su función
de distribución es continua. Puesto que la función de distribución de una variable aleatoria X

viene dada por , la definición implica que en una distribución de probabilidad


continua X se cumple P[X = a] = 0 para todo número real a, esto es, la probabilidad de
que X tome el valor a es cero para cualquier valor de a. Si la distribución de X es continua, se
llama a X variable aleatoria continua.
En las distribuciones de probabilidad continuas, la distribución de probabilidad es la integral de
la función de densidad, por lo que tenemos entonces que:

Mientras que en una distribución de probabilidad discreta un suceso con probabilidad cero
es imposible, no se da el caso en una variable aleatoria continua. Por ejemplo, si se mide
lo largo de una hoja de roble, el resultado 3,5 cm no es posible, pero tiene probabilidad
uno porque hay infinitos valores posibles entre 3 cm y 4 cm. Cada uno de esos valores
individuales tiene probabilidad cero, aunque la probabilidad de ese intervalo no lo es. Esta
aparente paradoja no se resuelve por el hecho de que la probabilidad de que X tome
algún valor en un conjunto infinito como un intervalo, no puede calcularse mediante la
adición simple de probabilidades de valores individuales. Formalmente, cada valor tiene
una probabilidad infinitesimal que estadísticamente equivale a cero.
Existe una definición alternativa más rigurosa en la que el término "distribución de
probabilidad continua" se reserva a distribuciones que tienen función de densidad de
probabilidad. Estas funciones se llaman, con más precisión, variables
aleatorias absolutamente continuas (véase el Teorema de Radon-Nikodym). Para una
variable aleatoria X absolutamente continua es equivalente decir que la probabilidad
P[X = a] = 0 para todo número real a, en virtud de que hay un incontables conjuntos de
medida de Lebesgue cero (por ejemplo, el conjunto de Cantor).
Una variable aleatoria con la distribución de Cantor es continua de acuerdo con la primera
definición, pero según la segunda, no es absolutamente continua. Tampoco es discreta, ni
una media ponderada de variables discretas y absolutamente continuas.
En aplicaciones prácticas, las variables aleatorias a menudo ofrece una distribución
discreta o absolutamente continua, aunque también aparezcan de forma natural mezclas
de los dos tipos.

Definición[editar]
Para una variable continua hay infinitos valores posibles de la variable y entre cada dos de
ellos se pueden definir infinitos valores más. En estas condiciones no es posible deducir la
probabilidad de un valor puntual de la variable; como se puede hacer en el caso
de variables discretas, pero es posible calcular la probabilidad acumulada hasta un cierto
valor (función de distribución de probabilidad), y se puede analizar como cambia la
probabilidad acumulada en cada punto (estos cambios no son probabilidades sino otro
concepto: la función de densidad.
En el caso de variable continua la distribución de probabilidad es la integral de la función
de densidad, por lo que tenemos entonces que:
Sea una variable continua, una distribución de probabilidad o función de

densidad de probabilidad (FDP) de es una función tal que, para

cualesquiera dos números y siendo .

La gráfica de se conoce a veces como curva de densidad, la probabilidad de

que tome un valor en el intervalo es el área bajo la curva de la función


de densidad; así, la función mide concentración de probabilidad alrededor de los
valores de una variable aleatoria continua.

área bajo la curva de entre y

Para que sea una FDP ( ) legítima, debe satisfacer las siguientes
dos condiciones:

1. 0 para toda .

2.

Ya que la probabilidad es siempre un número positivo, la FDP es una


función no decreciente que cumple:

1. . Es decir, la probabilidad de todo el espacio muestral es 1.

2. . Es decir, la probabilidad del suceso nulo es cero.


Principales características
Distribución normal
En estadística y probabilidad se llama distribución normal, distribución de
Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable
continua que con más frecuencia aparece aproximada en fenómenos reales.[cita requerida]
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de
un determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el
gráfico de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos
naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte
de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo
que cada observación se obtiene como la suma de unas pocas causas independientes.
De hecho, la estadística descriptiva sólo permite describir un fenómeno, sin explicación
alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la
estadística en psicología y sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más simples y antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la
normal son:

 caracteres morfológicos de individuos como la estatura;


 caracteres fisiológicos como el efecto de un fármaco;
 caracteres sociológicos como el consumo de cierto producto por un mismo grupo de
individuos;
 caracteres psicológicos como el cociente intelectual;
 nivel de ruido en telecomunicaciones;
 errores cometidos al medir ciertas magnitudes;
 etc.
La distribución normal también aparece en muchas áreas de la propia estadística. Por
ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal,
cuando la distribución de la población de la cual se extrae la muestra no es normal.1 Además,
la distribución normal maximiza la entropía entre todas las distribuciones con media
y varianzaconocidas, lo cual la convierte en la elección natural de la distribución subyacente a
una lista de datos resumidos en términos de media muestral y varianza. La distribución normal
es la más extendida en estadística y muchos tests estadísticos están basados en una
"normalidad" más o menos justificada de la variable aleatoria bajo estudio.
En probabilidad, la distribución normal aparece como el límite de varias distribuciones de
probabilidad continuas y discretas.
Distribución normal como
aproximación a la binomial
En este caso se estarán calculando probabilidades de experimentos
Binomiales de una forma muy aproximada con la distribución Normal, esto
puede llevarse a cabo si n y p = p(éxito) no es muy cercana a 0 y 1, o
cuando n es pequeño y p tiene un valor muy cercano a ½ ; esto es,

Donde:
x = variable de tipo discreto; solo toma valores enteros
 = np = media de la distribución Binomial
= = desviación estándar de la distribución Binomial

Cuando ocurren las condiciones anteriores, la gráfica de la distribución


Binomial, es muy parecida a la distribución Normal, por lo que es adecuado
calcular probabilidades con la Normal en lugar de con la Binomial y de una
forma más rápida.
En resumen, se utiliza la aproximación Normal para evaluar probabilidades
Binomiales siempre que p no esté cercano a 0 o 1. La aproximación es
excelente cuando n es grande y bastante buena para valores pequeños
de n si p está razonablemente cercana a ½. Una posible guía para determinar
cuando puede utilizarse la aproximación Normal es tener en cuenta el
cálculo de npy nq. Sí ambos, np y nq son mayores o iguales a 5, la
aproximación será buena.

Antes de empezar a resolver problemas con la aproximación Normal, es


bueno aclarar que se están evaluando probabilidades asociadas a una
variable discreta x, con una distribución que evalúa variables de tipo
continuo como es la Normal,
Por lo que z sufre un pequeño cambio como se muestra a continuación:

¿Porqué vamos a sumar o a restar ½ a x?


Este es un factor de corrección debido a que se está evaluando una variable
discreta con una distribución continua, por lo que hay que delimitar
claramente desde que punto se va a evaluar la variable, dicho de otra forma,
en que límite de la barra (inferior o superior) nos debemos posicionar para
determinar la probabilidad requerida, cada barra de probabilidad a evaluar
tiene como base la unidad, ese es el porqué del  ½.

Ejemplos:
1. La probabilidad de que un paciente se recupere de una rara enfermedad
de la sangre es de 0.4. Si se sabe que 100 personas han contraído esta
enfermedad, ¿Cuál es la probabilidad de que: a) al menos 30 sobrevivan?,
b) más de 46 sobrevivan?, c) menos de 50 no sobrevivan?
Solución:
a)
n = 100
p = p(paciente se recupere) = 0.40
q = p(paciente no se recupere) = 1 – p = 1 – 0.40 = 0.60
 = np = (100)(0.40) = 40 pacientes se recuperen
= = pacientes que se recuperan
x = variable que nos define el número de pacientes que se recuperan
x = 0, 1, 2,....,100 pacientes que se recuperan

X = 29.5  = 40

p( z = -2.14) =0.4838

p(x  30 ) = p(z = -2.14) +0.5 = 0.4838 + 0.5 = 0.9838

a)
p(z = 1.33) = 0.4082

p(x  46) = 0.5 – p(z = 1.33) = 0.5 – 0.4082 = 0.0918

b) n = 100
p = p(paciente no sobreviva) = 0.60
q = p(paciente sobreviva) = 1 – p = 0.40
pacientes que no se recuperan
pacientes que no se recuperan
x = variable que nos define el número de pacientes que no sobreviven
x = 0, 1, 2, ....,100
p( z = -2.14) = 0.4838

p(x  50) = 0.5 – p(z = -2.14) = 0.5 – 0.4838 = 0.0162

2. Una prueba de opción múltiple tiene 200 preguntas, cada una con 4
posibles respuestas, de las cuáles solo una es la correcta ¿cuál es la
probabilidad de que al azar se den de 25 a 30 respuestas correctas para
80 de las 200 preguntas acerca de los cuales el estudiante no tiene
conocimientos?

Solución:
n = 80
p = p(dar una contestación correcta) = 0.25
q = p(dar una contestación incorrecta) = 1 – p = 0.75
preguntas contestadas correctamente
preguntas contestadas correctamente
x = número de preguntas que son contestadas correctamente = 0, 1, 2,...,80

, p(z1 = 1.16) = 0.377

, p(z2 = 2.71) = 0.4966

p(25  x  30) = p(z2) – p(z1) = 0.4966 – 0.377 = 0.1196


3. Si 35% de los productos manufacturados en cierta línea de producción es
defectuoso, ¿cuál es la probabilidad de que entre los siguientes 1000
productos manufacturados en esa línea a) menos de 354 productos sean
defectuosos?, b) entre 342 y 364 productos sean defectuosos?,
c)exactamente 354 productos sean defectuosos?
Solución:
a)n = 1000
p = p(un producto sea defectuoso) = 0.35
q = p(un producto no sea defectuoso) = 1- p = 0.65
productos defectuosos
15.0831 productos defectuosos
x = número de productos defectuosos que se manufacturan en la línea = 0,
1, 2,..., 1000
, p(z = 0.23) = 0.091

p(x 354 ) = 0.5 + p(z = 0.23) = 0.5 + 0.091 = 0.5091

b)

, p(z1= - 0.56) = 0.2123

 0.96, p(z2= 0.96) = 0.3315

p(342  x  364) = p(z1) + p(z2) = 0.2123 + 0.3315 = 0.5438


c)

 0.23, p(z1 = 0.23) = 0.091

, p(z2= 0.30) =
0.1179

p(x = 354) = p(z2) - p(z1) = 0.1179 – 0.091 = 0.0269

Distribución t de student
En probabilidad y estadística, la distribución t (de Student) es una distribución de
probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para
la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de
una población y ésta debe ser estimada a partir de los datos de una muestra.

ir a distribuciones derivadas de la normal

La distribución t de student (desarrollada por Gosset ) es , con la chi2 , la F de


Snedecor, y , por supuesto, la normal , transcendental para aplicaciones
inferenciales , en especial para aquellas en las que se desconoce la varianza ; dado
que no depende de las varianzas de las variables que la integran.

Su expresión formal parte de dos variables X e Y tales que :

e de manera que siendo t una


nueva distribución conocida como t de student con n grados de libertad.

La distribución t de student . admite , tambien , una definición alternativa ,


tomada como la distribución marginal de la primera variable de una distribución
"normal-gamma" ; en este sentido la expresión de su función de densidad vendría
dada por :

siendo n los grados


de libertad que actuan de parámetro y la función gamma de Euler
La distribución t de student con n
grados de libertad tiene siempre
como media el valor "0" , sea
cuales fueren los grados de
libertad ; es simétrica
,asitóticamente tiende a ,de
forma campaniforme , al igual
que la distribución normal,
teniendo como varianza el

valor

Los valores de la función de probabilidad para los diversos están tabulados


atendiando al único parámetro de la distribución , es decir , el número de grados
de libertad ; evidentemente , es más recomendable para su cálculo la utilización
del programa que presentamos.

En otro orden de cosas la distribucción t de student con n grados de libertad


congerge en ley a una normal tipificada (estandarizada ) cuando el número de
grados de libertad tiende a infinito

Distribución chi-cuadrado y f (razón)


Las pruebas chi-cuadrado son un grupo de contrastes de hipótesis que sirven
para comprobar afirmaciones acerca de las funciones de probabilidad (o densidad)
de una o dos variables aleatorias.

Estas pruebas no pertenecen propiamente a la estadística paramétrica pues


no establecen suposiciones restrictivas en cuanto al tipo de variables que admiten,
ni en lo que refiere a su distribución de probabilidad ni en los valores y/o el
conocimiento de sus parámetros.

Se aplican en dos situaciones básicas:


a) Cuando queremos comprobar si una variable, cuya descripción parece
adecuada, tiene una determinada función de probabilidad. La prueba
correspondiente se llama chi-cuadrado de ajuste.

b) Cuando queremos averiguar si dos variables (o dos vías de clasificación)


son independientes estadísticamente. En este caso la prueba que
aplicaremos ser la chi-cuadrado de independencia o chi-cuadrado de
contingencia.

Chi-cuadrado de ajuste

En una prueba de ajuste la hipótesis nula establece que una variable X


tiene una cierta distribución de probabilidad con unos determinados valores de los
parámetros. El tipo de distribución se determina, según los casos, en función de:
La propia definición de la variable, consideraciones teóricas al margen de esta y/o
evidencia aportada por datos anteriores al experimento actual.

A menudo, la propia definición del tipo de variable lleva implícitos los


valores de sus parámetros o de parte de ellos; si esto no fuera así dichos
parámetros se estimarán a partir de la muestra de valores de la variable que
utilizaremos para realizar la prueba de ajuste.

Como en casos anteriores, empezaremos definiendo las hipótesis.

Hipótesis nula: X tiene distribución de probabilidad f(x) con


parámetros y1,..., yp

Hipótesis alternativa: X tiene cualquier otra distribución de


probabilidad.

Es importante destacar que el rechazo de la hipótesis nula no implica que


sean falsos todos sus aspectos sino únicamente el conjunto de ellos; por ejemplo,
podría ocurrir que el tipo de distribución fuera correcto pero que nos hubiésemos
equivocado en los valores de los parámetros.

Obviamente, necesitaremos una muestra de valores de la variable X. Si la


variable es discreta y tiene pocos valores posible estimaremos las probabilidades
de dichos valores mediante sus frecuencias muestrales; si la variable es continua
o si es una discreta con muchos o infinitos valores estimaremos probabilidades de
grupos de valores (intervalos).

Metodológicamente, la prueba se basa en la comparación entre la serie de


frecuencias absolutas observadas empíricamente para los valores de la variable
(Oi) y las correspondientes frecuencias absolutas teóricas obtenidas en base a la
función de probabilidad supuesta en la hipótesis nula (Ei).

Así pues, una vez calculadas las frecuencias absolutas de cada valor o
intervalo de valores, obtendremos el número total de observaciones de la muestra
(T) sumando las frecuencias observadas

Para calcular las frecuencias esperadas repartiremos este número total de


observaciones (T) en partes proporcionales a la probabilidad de cada suceso o
grupo de sucesos. Para ello calcularemos dichas probabilidades utilizando la
función de probabilidad definida en la hipótesis nula f(x), de modo que, cada valor
Ei tendrá la siguiente expresión:

Por tanto, tendremos los siguientes datos para la prueba:

Valor de la variable x1 x2 x3 ... xi ... xk


Frecuencias observadas O1 O2 O3 ... Oi ... Ok

Frecuencias esperadas E1 E2 E3 ... Ei ... Ek

Si la hipótesis nula es cierta, las diferencias entre valores observados y


esperados (que siempre existirán por tratarse de una muestra aleatoria) son
atribuibles, exclusivamente, al efecto del azar. En estas condiciones, se puede
calcular un parámetro que depende de ambos, cuya distribución se ajusta a una
chi-cuadrado.
Si, por el contrario, la hipótesis nula fuera falsa los Ei ya no serían,
realmente, los valores esperados de las frecuencias; por tanto, las diferencias
entre los valores "esperados" y los observados reflejarían no sólo el efecto del
azar sino también las diferencias entre los Ei y la auténtica serie de valores
esperados (desconocida) Como consecuencia, las diferencias de los numeradores
de la expresión anterior tienden a ser más grandes y, por estar elevadas al
cuadrado, la suma de cocientes ser positiva y mayor que lo que se esperaría para
los valores de una chi-cuadrado.

Por tanto, el parámetro anterior será el estadístico de contraste de la prueba


de hipótesis y la región crítica se encontrar siempre en la cola derecha de la
distribución chi-cuadrado. Evidentemente, esta prueba será siempre de una sola
cola.

Estadístico de contraste

Se acepta la hipótesis nula si , el percentil 1 – α de la distribución


chi-cuadrado con grados de libertad.

Cabe señalar que en las pruebas chi-cuadrado lo corriente es que


pretendamos comprobar que una variable tiene una cierta distribución y, por tanto,
habitualmente, nos vemos obligados a colocar nuestra propia hipótesis en la
hipótesis nula. Únicamente podremos colocar nuestra hipótesis en la alternativa en
el caso excepcional de que pretendamos demostrar que cierto tratamiento produce
una distorsión de la distribución básica de la variable en estudio.

El número de grados de libertad de la variable chi-cuadrado se calcula de la


siguiente forma:

 A priori, tendrá tantos grados de libertad como parejas frecuencia


observada - frecuencia esperada.

 A esta cantidad se debe restar el número de restricciones lineales


impuestas a las frecuencias observadas, es decir, el número de parámetros
que es necesario calcular directamente a partir de los valores observados
para establecer los valores esperados. Este número es, como mínimo, uno
ya que siempre tendremos que calcular el número total de observaciones
de la muestra.

Una condición básica para que podamos llevar a cabo una prueba chi-
cuadrado es que las frecuencias de las distintas clases deben ser suficientemente
altas como para garantizar que pequeñas desviaciones aleatorias en la muestra
no tengan importancia decisiva sobre el valor del estadístico de contraste.

Las reglas que determinan cuando es posible o no realizar el contraste


varían mucho de unos autores a otros. En un extremo de máxima rigidez se
encuentran aquellos que opinan que no se puede realizar la prueba cuando alguna
de las frecuencias, observadas o esperadas, sea menor que 5. En el otro extremo
se encuentran quienes opinan que, para que la prueba sea viable ninguna de las
frecuencias esperadas debe ser menor que 1 y no más del 25% pueden ser
menores que 5; en lo que refiere a las frecuencias observadas no existirían límites.
La autora de este texto simpatiza más con la segunda postura, no sólo por
razones prácticas, sino porque lo razonable es que la distribución esperada esté
adecuadamente definida y, por tanto, no debe incluir valores muy bajos; sin
embargo, los valores extremos en la distribución observada simplemente reflejan
diferencias importantes entre la distribución supuesta por la hipótesis nula y la
real.

Sea cual sea el criterio que elijamos, si resultara que la prueba no es viable
podríamos recurrir a englobar los valores o clases de valores con sus vecinos más
próximos y pasar así a engrosar sus frecuencias. Este procedimiento no puede
llevarse hasta el absurdo pero proporciona una salida digna a situaciones
complejas. En casos excepcionales se pueden englobar valores que no sean
vecinos porque exista algún nexo lógico de conexión entre ellos.

Cuando sea necesario agrupar valores, los grados de libertad no se deben


calcular hasta que tengamos establecidas definitivamente las parejas de
frecuencias observadas y esperadas con las que calcularemos el estadístico de
contraste.

Chi-cuadrado de contingencia o independencia

La prueba chi-cuadrado de contingencia sirve para comprobar la


independencia de frecuencias entre dos variables aleatorias, X e Y.

Las hipótesis contrastadas en la prueba son:


Hipótesis nula: X e Y son independientes.

Hipótesis alternativa: X e Y no son independientes (No importa cual


sea la relación que mantengan ni el grado de esta.

La condición de independencia, tal como fue definida en la página anterior


era: X e Y son independientes si y sólo si para cualquier pareja de valores x e y la
probabilidad de que X tome el valor x e Y el valor y, simultáneamente, es igual al
producto de las probabilidades de que cada una tome el valor correspondiente.

Por tanto, todo lo que necesitamos serán unas estimas de las funciones de
probabilidad de ambas variables por separado (f(x) y f(y)) y de la función de
probabilidad conjunta (f(x,y))

Empezaremos la prueba tomando una muestra de parejas de valores sobre


la que contaremos la frecuencia absoluta con la que aparece cada combinación de
valores (xi,yj) o de grupos de valores (i,j) (Oij) La tabla siguiente, en la que se
recogen estos datos, es en realidad nuestra estimación de la función de
probabilidad conjunta multiplicada por el número total de datos (T).

Para obtener las estimas de las funciones de probabilidad marginales


debemos sumar por filas y por columnas los valores de las frecuencias conjuntas.
Las sumas de filas (Fi) son, en cada caso, el número de veces que hemos
obtenido un valor de X (xi) en cualquier combinación con distintos valores de Y, es
decir, son nuestra estima de la función de probabilidad de X multiplicada por el
número total de observaciones; análogamente, las sumas de columnas (C j) son
nuestra estima de la función de probabilidad de Y multiplicada por el número total
de observaciones.

El número total de observaciones lo podemos obtener como la suma de


todas las frecuencias observadas o, también, como la suma de las sumas de filas
o de las sumas de columnas:

Así pues, si las variables fueran independientes debería cumplirse que

Naturalmente, nadie espera que esta condición se cumpla exactamente


debido al efecto de los errores de muestreo aleatorio. Por tanto, nuestro problema
consiste en distinguir entre las diferencias producidas por efecto del muestreo y
diferencias que revelen falta de independencia.

Podemos convertir la ecuación anterior a frecuencias absolutas


multiplicando por T:

 Si X e Y son independientes, Oij debe ser igual a y, por


tanto,

 bajo la hipótesis de independencia, es el valor esperado


de Oij (Eij)

Tal como pasaba en la prueba anterior, si las variables son independientes,


es decir, si las frecuencias Eij son realmente los valores esperados de las
frecuencias Oij, se puede calcular un parámetro que depende de ambas que tiene
distribución chi-cuadrado,
Por otra parte, si las variables no son independientes, las diferencias entre
las series de frecuencias observadas y esperadas serán mayores que las
atribuibles al efecto del azar y, al estar elevadas al cuadrado en el numerador de
la expresión anterior, ésta tenderá a ser mayor que lo que suele ser el valor de
una variable chi-cuadrado.

Por tanto, el parámetro anterior ser el estadístico de la prueba de hipótesis


y la región crítica se encontrar siempre en la cola derecha de la distribución chi-
cuadrado. Nuevamente, esta prueba será siempre de una sola cola.

Estadístico de contraste

Se acepta la hipótesis nula si , el percentil 1 – α de la distribución


chi-cuadrado con grados de libertad.

Tal como ocurría en la prueba anterior lo corriente es que queramos


demostrar que dos variables son independientes, es decir, que, habitualmente,
nos veremos obligados a colocar nuestra hipótesis en la hipótesis nula.

El número de grados de libertad de la chi-cuadrado que sirve de contraste


se calcula de la siguiente forma:

 A priori tendremos tantos grados de libertad como combinaciones de


valores xi, yj tengamos (I J)

 A este número tendremos que restarle I debido a que, para calcular las
frecuencias esperadas, necesitamos calcular las I sumas de filas en la tabla
anterior. Conocidas las sumas de filas obtenemos el número total de
observaciones sin perder ningún grado de libertad.

 A continuación, necesitaremos calcular, a partir de las frecuencias


observadas J - 1 de las sumas de columnas; la restante podemos obtenerla
restando la suma de las anteriores del total de observaciones (T).
En resumen, el número de grados de libertad de la prueba es el producto
del número de filas menos uno por el número de columnas menos uno.

En cuanto a la magnitud mínima necesaria de las frecuencias observadas y


esperadas, rigen las mismas normas que en el caso de la prueba de ajuste. En
este caso, si nos viéramos obligados a juntar valores para sumar frecuencias,
debemos unir columnas o filas completas (y contiguas). Obviamente, los grados
de libertad no deben calcularse hasta que no se hayan realizado todas las
agrupaciones necesarias y quede claro cual es el número de filas y columnas de la
tabla definitiva.

Como hemos visto, esta prueba no hace ninguna suposición acerca del tipo
de distribución de ninguna de las variables implicadas y utiliza únicamente
información de la muestra, es decir, información contingente. Esta es la razón por
la que, habitualmente, se le llama chi-cuadrado de contingencia.

Comparación múltiple de distintas proporciones o probabilidades

Una aplicación concreta de la chi-cuadrado de independencia es la


comparación múltiple de las distintas proporciones o probabilidades de un suceso
en I poblaciones diferentes.

Supongamos que tenemos I poblaciones en las cuales las observaciones se


pueden clasificar como A o no-A. Llamemos Pi a la probabilidad del suceso A en
cada población i y P a la frecuencia media de A en el conjunto de las poblaciones;
la probabilidad del suceso no-A en cada población i ser 1 - Pi y la media de todas
ellas valdrá 1 - P.

Las hipótesis de la prueba serán:

Hipótesis nula:

Hipótesis alternativa:
Si tomamos una muestra de tamaño n i en cada población y contamos en
cada caso el número de sucesos A aparecidos en la muestra obtendríamos la
siguiente tabla:

Esta es una tabla típica a la que se puede aplicar la metodología de la prueba chi-
cuadrado de independencia. Veamos como corresponden las hipótesis de una y
otra prueba. Si la clasificación de las observaciones en sucesos A y no-A fuera
independiente de la clasificación en muestras, la frecuencia relativa de A (y la de
no-A) serían iguales en todos los casos y los valores esperados de las frecuencias
absolutas se calcularían multiplicando la estima común de la frecuencia relativa
global por el número de observaciones en cada muestra.

La estima global de la frecuencia de A se hallara dividiendo el número total


de sucesos A por el número total de observaciones:

lo cual no es otra cosa que el cociente entre la suma de la fila uno (F1) y el total de
observaciones (T)

Por tanto, el valor esperado de la frecuencia observada de A en la muestra i


(EA,i) será:

La estima global de la frecuencia de no-A se hallara dividiendo el número


total de sucesos no-A por el número total de observaciones:
lo cual no es otra cosa que el cociente entre la suma de la fila dos (F2) y el total de
observaciones (T)

Por tanto, el valor esperado de la frecuencia observada de no-A en la


muestra i (Eno-A,i) será:

Es decir, los valores esperados se calcularían, en pura lógica, tal como


indica el procedimiento estándar de la prueba de contingencia. En definitiva:

Hipótesis nula: La clasificación en sucesos es


independiente de la clasificación en poblaciones.

Hipótesis alternativa: La clasificación en sucesos no


es independiente de la clasificación en poblaciones.

En resumen, la prueba de comparación múltiple de proporciones se realizar


mediante una prueba de contingencia que nos dirá si las probabilidades son todas
iguales o si, al menos, existe una que sea diferente de las demás.

Los grados de libertad serán siempre:

Análisis de regresión y correlación


lineal simple
Si deseamos estudiar la relación entre dos variables cuantitativas y además una de ellas puede considerarse
como variable dependiente o "respuesta" podemos considerar el uso de la regresión lineal simple. Con la
regresión, aparte de medir el grado de asociación entre las dos variables, podremos realizar predicciones de
la variable dependiente.
Veamos un ejemplo de regresión lineal simple y cómo se interpretarían sus resultados. Dependiendo
del programa estadístico utilizado, pueden variar la cantidad de información y el formato de las salidas,
aunque los resultados van a ser los mismos así como su interpretación.
Supongamos que deseemos estudiar la asociación entre el volumen máximo expirado en el primer segundo
de una expiración forzada (FEV1) y la talla medida en centímetros de un grupo de 170 adolescentes de
edades comprendidas entre los 14 y los 18 años (Tabla I).
Tabla I. Ejemplo en 170 adolescentes.
Nº FEV1 (litros) Altura (cm.)
1 3,46 171
2 4,55 172
3 4,53 182
4 4,59 179
5 3,67 173
6 4,71 180
… … …
… … …
168 4,38 177
169 5,06 184
170 3,06 152
FEV1: Volumen espiratorio forzado en el primer segundo
En primer lugar debemos realizar un gráfico de dispersión como el de la Figura 2A y estudiar visualmente si la
relación entre nuestra variable dependiente (FEV1) y nuestra variable independiente (talla) puede
considerarse lineal 4. Por convenio, se coloca la variable dependiente en el eje Y de las ordenadas y la
variable independiente en el eje X de las abscisas. Si no observamos un comportamiento lineal, debemos
transformar la variable dependiente o incluso replantearnos el tipo de análisis, ya que es posible que la
relación entre ambas variables en caso de existir, pueda no ser lineal.
En nuestro ejemplo, si parece cumplirse una relación lineal entre FEV1 y la talla. Si calculásemos el
coeficiente de correlación de pearson nos daría un resultado de 0,86 (IC95%: 0,82; 0,90), indicando que la
asociación es positiva y por tanto valores altos de FEV1 se corresponden a su vez con valores altos de talla.
Sin embargo sólo con la correlación no tendríamos la suficiente información si quisiéramos hacer predicciones
de los valores de FEV1 en función de la talla.
El objetivo de la regresión lineal simple es encontrar la mejor recta de ajuste de entre todas las posibles dentro
de la nube de puntos de la Figura 2A. La mejor recta de ajuste será aquella que minimice las distancias
verticales entre cada punto y la recta, calculándose normalmente por el método de "mínimos cuadrados"
(Figura 2B) 1, 5. De este modo conseguiremos una ecuación para la recta de regresión de Y (variable
dependiente) en función de X (variable independiente) de la forma Y=a+bX. En nuestro ejemplo, el problema
radica en estimar a (constante de la recta) y b (pendiente de la recta) de modo que podamos construir la
ecuación o recta de regresión: FEV1=a+bTalla que minimice esas distancias.
Figura 2. Gráfico de dispersión.
Regresión lineal
Abordaremos en esta página las distribuciones bidimensionales. Las
observaciones se dispondrán en dos columnas, de modo que en cada fila figuren
la abscisa x y su correspondiente ordenada y. La importancia de las distribuciones
bidimensionales radica en investigar como influye una variable sobre la otra. Esta
puede ser una dependencia causa efecto, por ejemplo, la cantidad de lluvia
(causa), da lugar a un aumento de la producción agrícola (efecto). O bien, el
aumento del precio de un bien, da lugar a una disminución de la cantidad
demandada del mismo.

Si utilizamos un sistema de coordenadas cartesianas para representar la


distribución bidimensional, obtendremos un conjunto de puntos conocido con el
diagrama de dispersión, cuyo análisis permite estudiar cualitativamente, la
relación entre ambas variables tal como se ve en la figura. El siguiente paso, es la
determinación de la dependencia funcional entre las dos variables x e y que mejor
ajusta a la distribución bidimensional. Se denomina regresión lineal cuando la
función es lineal, es decir, requiere la determinación de dos parámetros: la
pendiente y la ordenada en el origen de la recta de regresión, y=ax+b.

La regresión nos permite además, determinar el grado de dependencia de las


series de valores X e Y, prediciendo el valor y estimado que se obtendría para un
valor x que no esté en la distribución.

Vamos a determinar la ecuación de la recta que mejor ajusta a los datos


representados en la figura. Se denomina error ei a la diferencia yi-y, entre el valor
observado yi, y el valor ajustado y= axi+b, tal como se ve en la figura inferior. El
criterio de ajuste se toma como aquél en el que la desviación cuadrática media
sea mínima, es decir, debe de ser mínima la suma
El extremos de una función: máximo o mínimo se obtiene cuando las derivadas
de s respecto de a y de b sean nulas. Lo que da lugar a un sistema de dos
ecuaciones con dos incógnitas del que se despeja a y b.

El coeficiente de correlación es otra técnica de estudiar la distribución


bidimensional, que nos indica la intensidad o grado de dependencia entre las
variables X e Y. El coeficiente de correlación r es un número que se obtiene
mediante la fórmula.

El numerador es el producto de las desviaciones de los valores X e Y respecto de


sus valores medios. En el denominador tenemos las desviaciones cuadráticas
medias de X y de Y.

El coeficiente de correlación puede valer cualquier número comprendido entre -1


y +1.

 Cuando r=1, la correlación lineal es perfecta, directa.


 Cuando r=-1, la correlación lineal es perfecta, inversa

 Cuando r=0, no existe correlación alguna, independencia total de los valores X


eY

Correlación lineal
El c oe f ic i en te de c or r e l ac ió n li n e a l e s el c o ci en t e en t r e
l a co v ar i a nz a y el pr odu ct o d e l as de s vi a c io ne s t í p ic a s d e
amba s v a ri abl e s.

El c oe f ic i en te de c or r e l ac ió n li n e a l s e ex pr e s a m edi an t e l a
l etr a r .

Propiedades

1. El c oe f ic i en te d e co r r el a c ió n n o v arí a al h a c e rl o l a e s cal a d e
me di ci ón .

E s d eci r, si e xp r e sa mo s l a al tu ra en m e tr o s o en c en tí met r o s el
c o efi ci en t e d e c o r r el aci ón n o v a rí a.

2. El si gn o d el c oe f i ci e nt e d e co r r el a c i ón e s el mi s m o qu e el d e
l a co v ar i a nz a .

Si l a c o va ri an z a e s po si ti va, l a c o r r el aci ón es di r e ct a.

Si l a c o va ri an z a e s n eg ati va , l a c o r r el a ci ón es i n v e r sa .
Si l a covari an z a es n u l a, n o exi ste correl aci ón .

3. El c oe f ic i en te d e co r r el a c ió n li n e a l e s u n n ú m e r o r e al
c omp r en di do en t r e −1 y 1 .

−1 ≤ r ≤ 1

4. Si el c oe f ic i en te d e c o rr e l ac i ón l in e al t o ma v al o r es c e r can o s
a −1 l a c o r r el a ci ón e s f ue rt e e i nv e r s a , y s e r á t an t o má s f u e rt e
cu an t o m á s s e ap r o xi me r a −1 .

5. Si el c oe f ic i en te d e c o rr e l ac i ón l in e al t o ma v al o r es c e r can o s
a 1 l a c o r r el aci ón e s f u er te y d i re ct a , y s e rá t an t o má s fu e rt e
cu an t o m á s s e ap r o xi me r a 1.

6. Si el c oe f ic i en te d e c o rr e l ac i ón l in e al t o ma v al o r es c e r can o s
a 0 , l a c or r el a ci ón e s d éb i l .

7. Si r = 1 ó −1 , l os pu n t o s d e l a n u b e e stán s ob r e l a r ect a
c r eci en t e o d e c r e ci e n te . En t r e amb as va ri abl e s h ay de p en d en c i a
fu nc i on a l .

Teoría del muestreo


Es la actividad por la cual se toman ciertas muestras de una población de elementos de los cuales vamos a
tomar ciertos criterios de decisión, el muestreo es importante porque a través de él podemos hacer análisis de
situaciones de una empresa o de algún campo de la sociedad.
b. Terminología básica para el muestreo
Los nuevos términos, los cuales son frecuentemente usados en inferencia estadística son:
Estadístico:
Un estadístico es una medida usada para describir alguna característica de una muestra , tal como una media
aritmética, una mediana o una desviación estándar de una muestra.
Parámetro:
Una parámetro es una medida usada para describir alguna característica de una población, tal como una
media aritmética, una mediana o una desviación estándar de una población.
Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso de estimación en
inferencia estadística puede ser descrito como le proceso de estimar un parámetro a partir del estadístico
correspondiente, tal como usar una media muestral ( un estadístico para estimar la media de la población (un
parámetro).
Los símbolos usados para representar los estadísticos y los parámetros, en éste y los siguientes capítulos,
son resumidos en la tabla siguiente:
Tabla 1
Símbolos para estadísticos y parámetros correspondientes
Medida Símbolo para el estadístico Símbolo para el parámetro
(muestra) (Población)
Media X µ
Desviación estándar s
Número de elementos n N
Proporción p P
Distribución en el muestreo:
Cuando el tamaño de la muestra (n) es más pequeño que el tamaño de la población (N), dos o más muestras
pueden ser extraídas de la misma población. Un cierto estadístico puede ser calculado para cada una de las
muestras posibles extraídas de la población. Una distribución del estadístico obtenida de las muestras es
llamada la distribución en el muestreo del estadístico.
Por ejemplo, si la muestra es de tamaño 2 y la población de tamaño 3 (elementos A, B, C), es posible extraer
3 muestras ( AB, BC Y AC) de la población. Podemos calcular la media para cada muestra. Por lo tanto,
tenemos 3 medias muéstrales para las 3 muestras. Las 3 medias muéstrales forman una distribución. La
distribución de las medias es llamada la distribución de las medias muéstrales, o la distribución en el muestreo
de la media. De la misma manera, la distribución de las proporciones (o porcentajes) obtenida de todas las
muestras posibles del mismo tamaño, extraídas de una población, es llamada la distribución en el muestreo
de la proporción.
Error Estándar:
La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente llamada el
error estándar del estadístico. Por ejemplo, la desviación estándar de las medias de todas la muestras
posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la media. De la
misma manera, la desviación estándar de las proporciones de todas las muestras posibles del mismo tamaño,
extraídas de una población, es llamada el error estándar de la proporción. La diferencia entre los términos
"desviación estándar" y "error de estándar" es que la primera se refiere a los valores originales, mientras que
la última está relacionada con valores calculados. Un estadístico es un valor calculado, obtenido con los
elementos incluidos en una muestra.
Error muestral o error de muestreo
La diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado el cual deberíamos
haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error de muestreo.
Un error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino
que se toma una muestra para estimar las características de la población. El error muestral es medido por el
error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la
precisión de la estimación de la población basada en el estudio de la muestra. Mientras más pequeño el error
muestras, mayor es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en una
encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son
considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta
completa de la población.

Universo y muestra
Definiciones y cualidades de una buena muestra
Una muestra es un subconjunto de la población, que se obtiene para averiguar las propiedades o
características de esta última, por lo que interesa que sea un reflejo de la población, que
sea representativa de ella, concepto al que volveremos más adelante.
Puesto que el fin que perseguimos al hacer una investigación basada en el estudio de una muestra, es inferir
los resultados a la población que nos interesa, es recomendable distinguir entre dos tipos de población: la
población objetivo y la población muestreada. La población objetivo es aquella sobre la cual el investigador
desea establecer una conclusión, por ejemplo, si deseamos determinar la deserción escolar de los estudiante
del Colegio Palma Real en el Sector Los Girasoles, la población objetivo está representada por todos los
estudiantes que estudian en dicho Centro Educativo.
La población muestreada es aquella a partir de la cual se extrajo la muestra y sobre la que puede
establecerse la conclusión. Para el ejemplo anterior, supóngase que se decidió extraer la muestra de
estudiantes del Centro Educativo Palma Real (De Palma real y los Girasoles); en este caso la población
muestreada está constituida por todos los estudiantes del centro. Los métodos de la inferencia
estadística permiten al investigador sacar conclusiones sobre la población muestreada, no sobre la población
objetivo, por lo que es conveniente que ambas coincidan, sin embargo en ocasiones esto no es factible y la
población muestreada es más restringida que el objetivo, en cuyo caso es necesario que el investigador esté
consciente de lo expuesto anteriormente.
Según Roberto Hernández Sampieri 2006, 4ta Edición reza que la muestra es, en esencia, un subgrupo de la
población. Digamos que es un subconjunto de elementos que pertenecen a ese conjunto definido en sus
características al que llamamos población. Esto se representa en la figura 8.3. Con frecuencia leemos y
escuchamos hablar de muestra representativa, muestra al azar, muestra aleatoria, como si con los simples
términos se pudiera dar más seriedad a los resultados. En realidad, pocas veces es posible medir a toda la
población, por 10 que obtenemos 0 seleccionamos una muestra y, desde luego, se pretende que este
subconjunto sea un reflejo fiel del conjunto de la población. Todas las muestras bajo el enfoque cuantitativo
deben ser representativas; por 10 tanto, el uso de este término resulta por demás inútil. Los términos al azar y
aleatorio denotan un tipo de procedimiento mecánico relacionado con la probabilidad y con la selección de
elementos; pero no logran esclarecer tampoco el tipo de muestra y el procedimiento de muestreo. Hablemos
entonces de estos conceptos en los siguientes apartados.

Características de una buena muestra


Una muestra debe ser adecuada en cantidad y en calidad. En relación con el primer aspecto,
existen procedimientos estadísticos para saber cuál es el número mínimo de elementos que debemos incluir
en el estudio para obtener resultados válidos. La calidad involucra el concepto de representatividad de la
muestra. Se dice que una muestra es representativa de la población cuando es un reflejo de ella, es decir
cuando reúne las características principales de la población en relación con la variable en estudio.
Si deseamos determinar cuál es el nivel de deserción en el centro educativo Palma Real en el sector Los
Girasoles y estudiamos una muestra de niños desertados obtenido de la zona este de este sector (donde se
encuentra la mayoría), esa no sería una muestra representativa para dicha investigación y la prevalencia de
desertados que obtendríamos subestimaría la cifra real para el centro. Si nuestro objetivo es determinar la
cantidad desertado por años en dicho centro, para lograr una muestra representativa deberíamos incluir
estudiantes desertados de los sectores aledaños: Villa Nicio, Las Palmeras, Fundación, Los Girasoles I, II, III y
el Barrio Los Militares. La representatividad de la muestra es pues un aspecto de gran importancia en la
investigación y para lograrla es necesario seleccionar el tipo y clase de muestreo que garantice esta condición
y trabajar con un tamaño de muestra adecuado.
Elementos del Muestreo
Conforman el muestreo: el universo, la base, las unidades y las relaciones entre el universo y la muestra.
 a) Universo, población o colectivo: está constituida por la totalidad de elementos a estudiar, utilizando una
fracción denominada muestra.
 b) Base de la muestra: conformado por el substrato material que da soporte al universo o población
(censo, registro, plano, mapa, catálogo, listado, etc.).
 c) Unidad de la muestra: constituida por cada uno de los elementos que integran la muestra. Simple
(individuos), colectiva (grupos, familias, pueblos, entre otros).
 d) Relaciones entre el universo y la muestra: Pueden ser cuantitativas y cualitativas. Las cuantitativas son:
la Fracción de muestreo F.m. que se obtiene dividiendo la muestra por el universo y multiplicando por 100 y el
coeficiente de elevación C.e. que se refiere a las veces que la muestra está contenida en el Universo. Las
relaciones cualitativas se concretan a exigir que tanto el universo como las muestras reúnan las mismas
características.
Representatividad de la muestra
La muestra debe reproducir las características del universo, por lo tanto surgen dos preguntas, sobre la
cantidad de elementos que debe incluir la muestra y hasta qué punto pueden generalizarse a la población.
Ambas preguntas convergen en un problema de exactitud o precisión cuya finalidad es no incurrir en errores a
la hora de obtener los resultados, no obstante los errores son inevitables, lo importante entonces es
minimizarlos.
Existen dos tipos de errores:
 a) Los sistemáticos o distorsiones, que son causados por factores externos a la muestra y que se pueden
producir en cualquier momento de la investigación, y
 b) el error de muestreo, de azar o de estimación, inevitable, ya que siempre habrá diferencia entre los
valores medios de la muestra y los valores medios del universo, la magnitud de este error depende del
tamaño de la muestra (a mayor tamaño de muestra menor error) y de la dispersión o desviación (a mayor
dispersión mayor error). Se concluye entonces que para que una muestra sea representativa debe estar
dentro de ciertos límites y proporciones establecidas por la estadística.

Tipos y procedimientos de Selección


Se conoce como muestreo el proceso de obtención de la muestra. Puede ser probabilístico y no probabilístico.
Hablamos de un muestreo probabilístico cuando los integrantes de la muestra se escogen al azar y por lo
tanto, puede calcularse con antelación la probabilidad de obtener cada una de las muestras que pueden
formarse de esa población o la probabilidad que tiene cada elemento de la población de ser incluido en la
muestra.
La selección de los elementos puede hacerse por el método de la lotería, la tabla de números aleatorios o con
paquetes automatizados que forman números al azar. El método de la lotería consiste en asignarle un número
a cada integrante de la población y luego seleccionar tantos números como sea necesario para completar la
muestra. Esto puede hacerse con un biombo (como en las loterías), o con papeles numerados introducidos en
una bolsa de la cual se extraen. La tabla de números aleatorios consta de una gran cantidad de números
distribuidos en filas y columnas de la cual podemos extraer tantos como necesitemos para formar la muestra.
Si tenemos una población compuesta por 800 estudiantes y queremos seleccionar aleatoriamente 30, los
pasos serían:
Tabla de números aleatorios
 1. Obtener un listado de las personas o elementos que forman la población, luego enumerarla.
 2. Determinar el orden que va a seguir para seleccionar los números en la tabla. Puede hacerlo en sentido
vertical, horizontal, diagonal, etc. Lo importante es seguir siempre este orden hasta completar la muestra.
Suponga que decidió hacerlo en sentido vertical.
 3. Determine la fila y columna por la cual iniciará la selección. Por ejemplo suponga que se decidió iniciar por
la fila 10, columna 03. 4. Inicie la selección por esa fila y columna teniendo el cuidado de constituir números
de 3 dígitos (recuerde que la población es de 800 personas y todas ellas deben tener la oportunidad de ser
escogidas). De esta manera el primer número a ser incluido en la muestra es el 519. 5. Continúe la selección
(en sentido vertical como se decidió).
El segundo número es el 677, el tercer el 356, y así sucesivamente hasta tener los 30 números (cada uno de
ellos representa una persona). 6. Los números que sobrepasen al 800, no son tomados en cuenta pues no
corresponden a ningún miembro de la población.
Es recomendable trabajar con muestras probabilísticas puesto que permiten que los resultados obtenidos en
ellas puedan ser extrapolados a la población con un margen de confianza determinado. En relación con las
muestras no probabilísticas, llamadas también muestras por conveniencia, los elementos son escogidos con
base en la opinión del investigador y se desconoce la probabilidad que tiene cada elemento de ser elegido
para la muestra. En este tipo de muestreo existen el intencional (o deliberado) y los accidentales (o por
comodidad). En el primero el investigador escoge aquellos elementos que considera típicos de la población.
En los segundos, se toman los casos que estén disponibles en el momento. Otro tipo es el muestreo por
cuotas en el cual el investigador establece una cuota o cantidad de elementos según algunas características
de la población, ejemplo, sexo, estado civil y edad, luego escoge los sujetos que encuentra hasta cubrir la
cuota establecida. Este último se usa frecuentemente en las encuestas de opinión pública. En ocasiones se
trabaja combinando una elección al azar con una no probabilística: es el caso del
muestreo semiprobabilístico superior en el cual se conoce la probabilidad de escoger un segmento de la
población más no la de un elemento dentro de él (Ejemplo: se seleccionan aleatoriamente las manzanas de
una urbanización, dejando a la decisión del entrevistador la elección de las viviendas dentro de las manzanas
seleccionadas). En el muestreo semiprobabilístico inferior se hace lo contrario (Ejemplo: se seleccionan las
manzanas que nos parezcan más típicas de la urbanización y en ellas se escogen al azar las viviendas a
estudiar) .

Tipos de muestreo
Muestreo probabilístico (aleatorio): En este tipo de muestreo, todos los
individuos de la población pueden formar parte de la muestra, tienen probabilidad
positiva de formar parte de la muestra. Por lo tanto es el tipo de muestreo que
deberemos utilizar en nuestras investigaciones, por ser el riguroso y científico.

Muestreo no probabilístico (no aleatorio): En este tipo de muestreo, puede


haber clara influencia de la persona o personas que seleccionan la muestra o
simplemente se realiza atendiendo a razones de comodidad. Salvo en situaciones muy
concretas en la que los errores cometidos no son grandes, debido a la homogeneidad
de la población, en general no es un tipo de muestreo riguroso y científico, dado que no
todos los elementos de la población pueden formar parte de la muestra. Por ejemplo, si
hacemos una encuesta telefónica por la mañana, las personas que no tienen teléfono o
que están trabajando, no podrán formar parte de la muestra.

Muestreo aleatorio simple

En un muestreo aleatorio simple todos los individuos tienen la misma probabilidad de


ser seleccionados. La selección de la muestra puede realizarse a través de cualquier
mecanismo probabilístico en el que todos los elementos tengan las mismas opciones de
salir. Por ejemplo uno de estos mecanismos es utilizar una tabla de números aleatorios,
o también con un ordenador generar números aleatorios, comprendidos entre cero y
uno, y multiplicarlos por el tamaño de la población, este es el que vamos a utilizar.

Muestreo aleatorio estratificado

Es frecuente que cuando se realiza un estudio interese estudiar una serie de


subpoblaciones (estratos) en la población, siendo importante que en la muestra haya
representación de todos y cada uno de los estratos considerados. El muestreo aleatorio
simple no nos garantiza que tal cosa ocurra. Para evitar esto, se saca una muestra de
cada uno de los estratos.
Hay dos conceptos básicos:

Estratificación: El criterio a seguir en la formación de los estratos será formarlos de tal


manera que haya la máxima homogeneidad en relación a la variable a estudio dentro
de cada estrato y la máxima heterogeneidad entre los estratos.

Afijación: Reparto del tamaño de la muestra en los diferentes estratos o


subpoblaciones. Existen varios criterios de afijación entre los que destacamos:

1. Afijación igual: Todos los estratos tienen el mismo número de elementos en la


muestra.
2. Afijación proporcional: Cada estrato tiene un número de elementos en la muestra
proporcional a su tamaño.
3. Afijación Neyman: Cuando el reparto del tamaño de la muestra se hace de forma
proporcional al valor de la dispersión en cada uno de los estratos.

Muestreo aleatorio sistemático

Es un tipo de muestreo aleatorio simple en el que los elementos se seleccionan según


un patrón que se inicia con una elección aleatoria.

Considerando una población de N elementos, si queremos extraer una muestra de


tamaño n, partimos de un número h=N/n, llamado coeficiente de elevación y tomamos
un número al azar a comprendido entre 1 y h que se denomina arranque u origen.

La muestra estará formada por los elementos: a, a+h, a+2h,....a+(n-1)h.


De aqui se deduce que un elemento poblacional no podrá aparecer más de una vez en
la muestra. La muestra será representativa de la población pero introduce algunos
sesgos cuando la población está ordenada en función de determinados criterios.

Muestreo aleatorio por conglomerados o áreas

Mientras que en el muestreo aleatorio estratificado cada estrato presenta cierta


homogeneidad, un conglomerado se considera una agrupación de elementos que
presentan características similares a toda la población.

Por ejemplo, para analizar los gastos familiares o para controlar el nivel de audiencia
de los programas y cadenas de televisión, se utiliza un muestreo por conglomerados-
familias que han sido elegidas aleatoriamente.

Las familias incluyen personas de todas las edades, muy representativas de las mismas
edades y preferencias que la totalidad de la población.

Una vez seleccionados aleatoriamente los conglomerados, se toman todos los


elementos de cada uno para formar la muestra. En este tipo de muestreo lo que se elige
al azar no son unos cuantos elementos de la población, sino unos grupos de elementos
de la población previamente formados. Elegidos estos grupos o "conglomerados" en un
número suficiente, se pasa posteriormente a la elección, también al azar, de los
elementos que han de ser observados dentro de cada grupo, o bien, según se desee, a la
observación de todos los elementos que componen los grupos elegidos.
Por ejemplo, para analizar los gastos familiares o para controlar el nivel de audiencia
de los programas y cadenas de televisión, se utiliza un muestreo por conglomerados-
familias que han sido elegidas aleatoriamente. Las familias incluyen personas de todas
las edades, muy representativas de las mismas edades y preferencias que la totalidad
de la población.

Una vez seleccionados aleatoriamente los conglomerados, se toman todos los


elementos de cada uno para formar la muestra. En este tipo de muestreo lo que se elige
al azar no son unos cuantos elementos de la población, sino unos grupos de elementos
de la población previamente formados. Elegidos estos grupos o "conglomerados" en un
número suficiente, se pasa posteriormente a la elección, también al azar, de los
elementos que han de ser observados dentro de cada grupo, o bien, según se desee, a la
observación de todos los elementos que componen los grupos elegidos.

Muestreo no Probabilístico

Existen otros procedimientos para seleccionar las muestras, que son menos precisos
que los citados y que resultan menos costosos. El procedimiento más utilizado es el
muestreo no probabilístico, denominado opinático consistente en que el investigador
selecciona la muestra que supone sea la más representativa, utilizando un criterio
subjetivo y en función de la investigación que se vaya a realizar.

Con el muestreo opinático la realización del trabajo de campo puede simplificarse


enormemente pues se puede concentrar mucho la muestra. Sin embargo, al querer
concentrar la muestra, se pueden cometer errores y sesgos debidos al investigador y, al
tratarse de un muestreo subjetivo (según las preferencias del investigador), los
resultados de la encuesta no tienen una fiabilidad estadística exacta.

Un muestreo no probabilístico muy utilizado hoy en día por los institutos de opinión es
el de itinerarios, consistente en facilitar al entrevistador el perfil de las personas que
tiene que entrevistar en cada uno de los itinerarios en que se realizan las entrevistas.

El muestreo denominado de cuotas, utiliza en sucesivos sondeos al mismo conjunto


muestral (inicialmente seleccionado de forma aleatoria) y es el empleado para medir
índices de audiencia de programas televisivos.

En muestreo se entiende por población a la totalidad del universo que interesa


considerar, y que es necesario que esté bien definido para que se sepa en todo
momento que elementos lo componen.

No obstante, cuando se realiza un trabajo puntual, conviene distinguir entre población


teórica: conjunto de elementos a los cuales se quieren extrapolar los resultados, y
población estudiada: conjunto de elementos accesibles en nuestro estudio.

Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen
la población, realizándose lo que se denomina un censo, es decir, el estudio de todos
los elementos que componen la población.

La realización de un censo no siempre es posible, por diferentes motivos: a) economía:


el estudio de todos los elementos que componen una población, sobre todo si esta es
grande, suele ser un problema costoso en tiempo, dinero, etc.; b) que las pruebas a las
que hay que someter a los sujetos sean destructivas; c) que la población sea infinita o
tan grande que exceda las posibilidades del investigador.

Si la numeración de elementos, se realiza sobre la población accesible o estudiada, y no


sobre la población teórica, entonces el proceso recibe el nombre de marco o espacio
muestral.

Concepto de muestreo

El muestreo es una herramienta de la investigación científica. Su función básica es


determinar que parte de una realidad en estudio (población o universo) debe
examinarse con la finalidad de hacer inferencias sobre dicha población. El error que se
comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir
de la observación de sólo una parte de ella, se denomina error de muestreo. Obtener
una muestra adecuada significa lograr una versión simplificada de la población, que
reproduzca de algún modo sus rasgos básicos.

Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo,


lo que hacemos es trabajar con una muestra, entendiendo por tal una parte
representativa de la población. Para que una muestra sea representativa, y por lo tanto
útil, debe de reflejar las similitudes y diferencias encontradas en la población,
ejemplificar las características de la misma.

Cuando decimos que una muestra es representativa indicamos que reúne


aproximadamente las características de la población que son importantes para la
investigación.

a. Población Los estadísticos usan la palabra población para referirse no sólo a


personas si no a todos los elementos que han sido escogidos para su estudio.
b. Muestra Los estadísticos emplean la palabra muestra para describir una porción
escogida de la población. Matemáticamente, podemos describir muestras y
poblaciones al emplear mediciones como la Media, Mediana, la moda, la desviación
estándar. Cuando éstos términos describen una muestra se denominan estadísticas.

Una estadística es una característica de una muestra, los estadísticos emplean letras
latinas minúsculas para denotar estadísticas y muestras.

Tipos de muestreo Los autores proponen diferentes criterios de clasificación de los


diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes
grupos: métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.

Terminología

• Población objeto: conjunto de individuos de los que se quiere obtener una


información.
• Unidades de muestreo: número de elementos de la población, no solapados, que se
van a estudiar. Todo miembro de la población pertenecerá a una y sólo una unidad de
muestreo.
• Unidades de análisis: objeto o individuo del que hay que obtener la información.
• Marco muestral: lista de unidades o elementos de muestreo.
• Muestra: conjunto de unidades o elementos de análisis sacados del marco.

Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas.
Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la
muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de
muestreo probabilísticos encontramos los siguientes tipos:

El método otorga una probabilidad conocida de integrar la muestra a cada elemento de


la población, y dicha probabilidad no es nula para ningún elemento.

Los métodos de muestreo no probabilisticos no garantizan la representatividad de la


muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la
población.

(En algunas circunstancias los métodos estadísticos y epidemiológicos permiten


resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.)
Entre los métodos de muestreo probabilísticos más utilizados en investigación
encontramos:

• Muestreo aleatorio simple


• Muestreo estratificado
• Muestreo sistemático
• Muestreo polietápico o por conglomerados

Muestreo aleatorio simple:

El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de


la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas
de números aleatorios, números aleatorios generados con una calculadora u
ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño
de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica
cuando la población que estamos manejando es muy grande.

Muestreo aleatorio sistemático:

Este procedimiento exige, como el anterior, numerar todos los elementos de la


población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte
de ese número aleatorio i, que es un número elegido al azar, y los elementos que
integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir
se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la
población entre el tamaño de la muestra: k= N/n. El número i que empleamos como
punto de partida será un número al azar entre 1 y k.

El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la
población ya que al elegir a los miembros de la muestra con una periodicidad constante
(k) podemos introducir una homogeneidad que no se da en la población. Imaginemos
que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5
primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio
sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no
podría haber una representación de los dos sexos.

Muestreo aleatorio estratificado:

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamaño dado de la muestra.
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran
homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo,
según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se
pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o
el estratificado para elegir los elementos concretos que formarán parte de la muestra.
En ocasiones las dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina


afijación, y puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos


muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la
población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de
modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya
que no se suele conocer la desviación.

Muestreo aleatorio por conglomerados:

Los métodos presentados hasta ahora están pensados para seleccionar directamente
los elementos de la población, es decir, que las unidades muéstrales son los elementos
de la población.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la


población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto,
etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto


numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido)
y en investigar después todos los elementos pertenecientes a los conglomerados
elegidos.

Métodos de muestreo no probabilísticos

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente


costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no
sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra
extraída sea representativa, ya que no todos los sujetos de la población tienen la misma
probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo
determinados criterios procurando que la muestra sea representativa.

Muestreos No Probabilísticos:

• de Conveniencia
• de Juicios
• por Cuotas de Bola de Nieve Discrecional

Muestreo por cuotas:

También denominado en ocasiones "accidental". Se asienta generalmente sobre la base


de un buen conocimiento de los estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de
aleatoriedad de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de


individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de
25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se
eligen los primeros que se encuentren que cumplan esas características. Este método
se utiliza mucho en las encuestas de opinión.

Muestreo opinático o intencional:

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras


"representativas" mediante la inclusión en la muestra de grupos supuestamente
típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en
anteriores votaciones han marcado tendencias de voto.

Muestreo casual o incidental:

Se trata de un proceso en el que el investigador selecciona directa e intencionadamente


los individuos de la población. El caso más frecuente de este procedimiento el utilizar
como muestra los individuos a los que se tiene fácil acceso (los profesores de
universidad emplean con mucha frecuencia a sus propios alumnos).

Bola de nieve:

Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se
hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos
de enfermos, etc.

Muestreo Discrecional • A criterio del investigador los elementos son elegidos sobre lo
que él cree que pueden aportar al estudio. • Ej. : muestreo por juicios; cajeros de un
banco o un supermercado; etc.

Diseño de muestra
Los estudios de consumo, oferta y abastecimiento de dendrocombustibles se realizan
fundamentalmente utilizando técnicas de muestreo. Esto significa que a través del estudio
de un pequeño grupo (muestra) elegido aleatoriamente, se obtienen datos de las variables
de interés de un grupo de mayor tamaño (universo6), para después inferir sobre el
comportamiento de esas variables en el universo. Esto es así porque hacer estos estudios
en todo el universo, con excepción de aquéllos muy pequeños, tiene altos costos.
Números índices
En general, las magnitudes socioeconómicas varían en el tiempo y en el espacio. Con
frecuencia estaremos interesados en hacer comparaciones de dichas magnitudes en dos o
más periodos de tiempo o en dos o más zonas geográficas. Por ejemplo, analizar la evolución
del PIB español en los últimos años, comparar el PIB de los países europeos o, lo que es de
más interés, estudiar la evolución de los precios de los productos de consumo a lo largo del
tiempo o comparar el nivel de desarrollo de los países del mundo.

Un número índice, , es una medida estadística que recoge la evolución relativa en el


periodo t de una magnitud económica (precios, producciones, …) de un conjunto de bienes o
productos respecto de un periodo base o de referencia 0. También permite comparar una
magnitud económica en una zona geográfica respecto de una zona de referencia. Por tanto,
permiten comparar el estado de un fenómeno económico (precios, producción,...) en dos
situaciones y es una herramienta imprescindible en los estudios de coyuntura. Utilizaremos la
notación de los índices temporales, cuyo uso es más habitual que los espaciales, si bien los
desarrollos se pueden generalizar en gran medida a estos últimos.

 Período base o de referencia: período de tiempo fijado arbitrariamente que se toma

como origen de las comparaciones.

 Período actual o corriente: período de tiempo que se compara con el período base.

Tipos de números índices

Según que recojan la evolución de una o más magnitudes:

 Índices simples: recogen la evolución del precio, la cantidad o el valor de un único bien

o producto.

 Índices compuestos, complejos o sintéticos: recogen la evolución conjunta de los

precios, las cantidades o los valores de kbienes o productos. A su vez, los índices

complejos se clasifican como:

 Sin ponderar: todas las magnitudes o componentes tiene la misma

importancia, es decir, los mismos pesos. Los k bienes o productos se

consideran con el mismo peso.

 Ponderados: cada magnitud o componente tiene un peso diferente asignado

en función de diversos criterios. Los kbienes o productos se consideran con


distinto peso, peso que recoge la importancia relativa de cada uno de los

bienes.

Simples
Números Sin Sauerbeck, Brandstreet-Dûtot,
índices Compuestos o ponderar …
complejos Laspeyres, Paasche,
Ponderados
Edgeworth, Fisher, …

Según el tipo de magnitud:

 Índices de precios: estudian la evolución de los precios de un bien o de un conjunto de

bienes.

 Índices de cantidades: estudian la evolución de la cantidad producida o consumida de

un bien o de un conjunto de bienes.

 Índices de valores: estudian la evolución del valor de un bien o de un conjunto de

bienes.

Precios
Números índices Cantidades
Valores

Principales tipos de números índices


or lo general, un índice mide el cambio en una variable durante un cierto período, como en una serie temporal.
Sin embargo, también se le puede utilizar para medir diferencias en una variable dada en diferentes lugares.
Esto se lleva a cabo recolectando datos de manera simultánea en los diferentes lugares y luego
comparándolos.
Los números índices son importantes concernientes a las actividades de negocios y económicos pueden
clasificarse en tres tipos:
1.
2. Índices de precios
3. Índices de cantidades
4. Índice de valores en algún punto anterior en el tiempo (periodo bases) y usualmente el periodo actual.
Cuando solamente esta comprendido un solo producto o mercancía el índice se llama índice simple en tanto
que una corporación que comprende un grupo de elementos recibe el nombre de número compuesto. Los
números índices les ofrecen una forma de medir tales cambios.
 El índice de precios compara niveles de precios de un período a otro. El índice de precios al consumidor (IPC)
mide los cambios globales de precios de una variedad de bienes de consumo y de servicios, y se le utiliza
para definir el costo de vida.
 El índice de cantidad mide qué tanto cambia el número o la cantidad de una variable en el tiempo.
 El índice de valor mide los cambios en el valor monetario total; es decir, mide los cambios en el valor en pesos
de una variable, combina los cambios en precio y cantidad para presentar un índice con más información.

Principales usos de los números


índices
Los números índices son útiles cuando se quiere comparar variables o magnitudes que están medidas en
unidades distintas. Por ejemplo, con los números índices podemos comparar los costes de alimentación o de
otros servicios en una ciudad durante un año con los del año anterior, o la producción de arroz en un año en
una zona del país con la otra zona.
Aunque se usa principalmente en Economía e Industria, los números índices son aplicables en muchos
campos. En Educación, por ejemplo, se pueden usar los números índices para comparar
la inteligencia relativa de estudiantes en sitios diferentes o en años diferentes.
Muchos gobiernos se ocupan de elaborar números índice con el propósito de predecir condiciones
económicas o industriales, tales como: índices de precios, de producción, salariales, del
consumidor, poder adquisitivo, costo de vida, etc.
En la administración se utilizan como parte de un cálculo intermedio para entender mejor otra información.

Construcción de números índices


Problemas en la construcción
Existen varios problemas en la construcción de un número índice, de los cuales podemos mencionar los
siguientes:
 Selección de un elemento para ser incluido en un compuesto

Casi todos los índices se construyen para responder a una cierta pregunta en particular. Los elementos
incluidos en el compuesto dependen de la pregunta en cuestión.
 Selección de los pesos apropiados

Los pesos seleccionados deberían representar la importancia relativa de los diferentes elementos.
Desafortunadamente, lo que resulta apropiado en un período puede volverse inapropiado en un lapso muy
corto.
 Selección de un período base
El período base seleccionado debe ser un período normal, preferentemente un período bastante reciente.
Normal significa que el período no debe estar en un pico o en una depresión de una fluctuación. Una técnica
para evitar la elección de un período irregular consiste en promediar los valores de varios períodos
consecutivos.
10.2 Advertencia en la interpretación de un índice
En cuanto a las advertencias en la interpretación de un índice, podemos mencionar las siguientes :
 Generalización a partir de un índice específico

Generalización de los resultados.


 Falta de conocimiento general con respecto a índices publicados

Es la falta de conocimiento de qué es lo que miden los diferentes índices.


 Efecto del paso del tiempo en un índice

Los factores relacionados con un índice tienden a cambiar con el tiempo, en particular, los pesos apropiados.
A menos que se cambien los pesos de acuerdo a las circunstancias, el índice se vuelve cada vez menos
confiable.
 Cambios de calidad

Los números índice no reflejan los cambios en la calidad de los productos que miden. Si la calidad ha
cambiado realmente, entonces el índice sobrestima o subestima los cambios en los niveles de precios.

Aplicaciones más relevantes


Los números índices son muy versátiles, lo que los hace aplicable a cualquier ciencia o campo de estudio.
Esencialmente se usan para hacer comparaciones.
En educación se pueden usar los números índices para comparar la inteligencia relativa de estudiantes en
sitios diferentes o en años diferentes.
Los gerentes se valen de los números índices como parte de un cálculo intermedio para entender mejor otra
información.
Los índices estaciónales sirven para modificar o mejorar las estimaciones del futuro.
En el campo donde los números índices son de mayor utilidad es, en la economía, ya que esta se vale de
indicadores económicos, para estudiar las situaciones presentes y tratar de predecir las futuras, dichos
indicadores económicos en esencia son números índices, ejemplo de ello son IPC, PNI, deflactor implícito del
PNI, entre muchos otros.