Estadística Descriptiva

Semanas 1 - 6
1ra. Semana:
1. Estadística Descriptiva
1.1 INTRODUCCIÓN A LA ESTADÍSTICA
El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario
para sus intereses cuantificar conceptos. En la mayoría de los casos esta cuantificación se
hará en función de unos fines económicos o militares. El estado quiere conocer censo de
personas, de infraestructura, de recursos en general, para poder obtener conclusiones de
esta información.
Actualmente la estadística es una ciencia. No es ya una cuestión reservada al estado.
Podríamos decir que se encuentra en la totalidad del resto de ciencias. La razón es clara:
por una parte la estadística proporciona técnicas precisas para obtener información,
(recogida y descripción de datos) y por otra parte proporciona métodos para el análisis de
esta información.
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas
y tomar decisiones razonables basadas en tal análisis.
La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos,
ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o
irregulares de algún fenómeno o estudio aplicado, de ocurrencia en
forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es
el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.
Clasificación de la estadística
 La estadística descriptiva, se dedica a los métodos de recolección, descripción,
visualización y resumen de datos originados a partir de los fenómenos de estudio.
Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos
de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos
gráficos son: histograma, pirámide poblacional, clústers, entre otros.
 La estadística inferencial, se dedica a la generación de los modelos, inferencias y
predicciones asociadas a los fenómenos en cuestión teniendo en cuenta
la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y
extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones
de características numéricas (estimación),pronósticos de futuras observaciones,
descripciones de asociación (correlación) o modelamiento de relaciones entre
variables (análisis de regresión). Otras técnicas
de modelamiento incluyen anova, series de tiempo y minería de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay también
una disciplina llamadaestadística matemática, a la que se refiere a las bases teóricas de la
materia. La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo
estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas
criminales, entre otros.
Utilidad e importancia
Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para
organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la
tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas
descriptivas.
Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia,
contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis
de resultados en deportes; administradores de instituciones; en la educación; organismos
políticos; médicos; y por otras personas que intervienen en la toma de decisiones.
UNIVERSO
En estadística es el nombre especifico que recibe particularmente en la investigación social
la operación dentro de la delimitación del campo de investigación que tienen por objeto la
determinación del conjunto de unidades de observaciones del conjunto de unidades de
observación que van a ser investigadas. Para muchos investigadores él termino universo y
población son sinónima. En general, el universo es la totalidad de elementos o
características que conforman el ámbito de un estudio o investigación.
POBLACIÓN
Es la recolección completa de todas las observaciones de interés para el observador.
Es un conjunto completo de individuos, objetos o medidas que tienen una característica
común observable.
La población es el conjunto de todos los individuos cuyo conocimiento es objeto de interés
desde un punto de vista estadístico. Por ejemplo, si se está interesado en las ventas de los
comercios de una cierta ciudad, cada comercio es un individuo, y la población -también
llamada universo- es el conjunto de todos los comercios de la ciudad.
El estudio estadístico de una población se puede realizar mediante un análisis exhaustivo de
todos sus individuos (estadística descriptiva) o bien mediante una inferencia realizada a
partir de una muestra extraída de la población (estadística inferencial).
Muestra
"Se llama muestra a una parte de la población a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
Conjunto de individuos extraído de una población con el fin de inferir mediante su estudio,
características de toda la población.
En los estudios estadísticos, en vez de analizar la totalidad de la población o universo, se
acude al recurso de considerar solamente una parte de ella, a la cual se llama muestra.
Se dice que una muestra es representativa cuando, por la forma en que ha sido
seleccionada, aporta garantías suficientes para realizar inferencias fiables a partir de ella.
Una muestra se puede definir como un conjunto de observaciones individuales
seleccionadas por un procedimiento específico. Ejemplo, el peso de un ratón a través de un
periodo de tiempo.
Parámetro
Es una medida descriptiva de la población total de todas las observaciones de interés para el
observador.
Las tablas estadísticas son una forma organizada de dar toda (o casi toda) la información,
todos los datos de que disponemos.
Con las gráficas estadísticas se pierde algo de información (mucho o poco, según los
casos).
En cualquiera de los dos casos, la cantidad de datos que se dan es excesiva para que sea
operativo, para poder hacer referencias concisas a esa distribución o comparaciones rápidas
con otras distribuciones.
Esa es la razón de ser de los parámetros estadísticos, el resumir en un número un aspecto
relevante de la distribución que pueda dar una idea de la misma o compararla en ese
aspecto con otras.

Cualquier característica medible de una población; por ejemplo: la proporción real de
demócratas inscritos entre todos los ciudadanos norteamericanos de edad para votar.
Estadígrafo
Es la medida que en Estadística se aplica sobre una muestra. En general se utilizan dos
tipos: Los de Tendencia Central y los de Dispersión. Entre los primeros tenemos: a) las
medidas denominadas promedios, osea aquellas que tratan de localizarse hacia el centro de
la serie; moda, media y mediana; y b) los cuartiles y deciles, o cuartas y décimas partes de
las observaciones; esto sólo se aplican en los datos agrupados. Entre los de Dispersión
están: la desviación media, la desviación mediana, la varianza, la desviación típica o
estándar, la dispersión absoluta y relativa.
ELEMENTO
Un elemento es cada unidad utilizada para un estudio estadístico. Por ejemplo, el conjunto
de los datos 3, 5, 5, 3, 7, 2, 4, 1 contiene 8 elementos. Una muestra es un subconjunto de
una población. Las muestras representativas de una población son útiles ya que facilitan el
manejo de los datos. Una muestra es representativa de la población si al escogerla cada
elemento tiene la misma probabilidad de salir o de ser escogido.
Variable
Cualquier característica de una persona, medio ambiente o situación experimental que
pueda variar de persona a persona, de un medio ambiente a otro o de una situación
experimental a otra. Así el peso, el CI y el sexo son variables, ya que toman valores
diferentes al observar distintos individuos.
Es una característica de la población que se esta analizando en un estudio estadístico.
Una variable es una propiedad con respecto a la cual los individuos de una muestra difieren
de algún modo verificable. Ejemplo: la longitud, el peso, la altura.

CLASIFICACIÓN DE LAS VARIABLES
- Variable Independiente: es aquella característica o propiedad que se supone ser la causa
del fenómeno estudiado. En investigación experimental se llama así, a la variable que el
investigador manipula.
- Variable Dependiente: es la propiedad o característica que se trata de cambiar mediante
la manipulación de la variable independiente.La variable dependiente: es el factor que es
observado y medido para determinar el efecto de la variable independiente.
- Variable Interviniente: es aquella característica o propiedad que de una manera u otra
afectan el resultado que se espera y están vinculadas con las variables independientes y
dependientes.
- Variable Moderadora: representa un tipo especial de variable independiente, que es
secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la
variable independiente primaria y las variables dependientes.
- Variables Cualitativas: Son aquellas que se refieren a atributos o cualidades de un
fenómeno. Sabino (1989: 80) señala que sobre este tipo de variable no puede construirse
una serie numérica definida.
- Variable Cuantitativa: Son aquellas variables en las que características o propiedades
pueden presentarse en diversos grados de intensidad, es decir, admiten una escala numérica
de medición.
- En función de la facilidad de su medición, pueden ser simples o complejas:-
Unidimensionales (peso)- Multidimensionales (calidad acústica)- Dicotómicas (con dos
valores, como sexo, si la persona es o no fumadora, etc.)
Atributos
Son variables que no se pueden cuantificar, o expresar por números. Por ejemplo, si
hablamos de la variable peso de un producto, es fácil.. Por decir un estándar de papas fritas
debe pesar unos 60 gramos, o analizando estaturas de personas, es facil cuantificarla
midiéndolas, supongamos un estándar de 170 cms. Hay variables que no se pueden
cuantificar, como los colores, por ejemplo, no hay números para ello.. Otro ejemplo es el
sabor en productos alimenticios.
Escala de medición
Medición
Existen diversas definiciones del término "medición", pero estas dependen de los diferentes
puntos de vista que se puedan tener al abordar el problema de la cuantificación y el proceso
mismo de la construcción de una escala o instrumento de medición.
En general, se entiende por medición la asignación de números a elementos u objetos para
representar o cuantificar una propiedad. El problema básico está dado por la asignación un
numeral que represente la magnitud de la característica que queremos medir y que dicho
números pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la
medición, los atributos de nuestras percepciones se transforman en entidades conocidas y
manejables llamadas "números". Es evidente que el mundo resultaría caótico si no
pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la físico saber
que el hierro tiene una alta temperatura de fusión.
Niveles o Escalas de mediciones
Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en
la asignación, puramente arbitraria de números o símbolos a cada una de las diferentes
categorías en las cuales podemos dividir el carácter que observamos, sin que puedan
establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda
pertenecer a una y solo una de estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma
sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se
asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le
atribuyan números, puede ser una de las razones por las cuales se le conoce como "medidas
nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo
San Carlos de acuerdos a la carrera que cursan.
Número asignada a la
Carrera
categoría
Educación 1
Administración 2
Se ha de tener presente que los números asignados a cada categoría sirven única y
exclusivamente par identificar la categoría y no poseen propiedades cuantitativas.
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto,
la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de
"orden" de los números asignándolo a los objetos en estudio de modo que, si la cifra
asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de
atributo que B.
La asignación de números a las distintas categorías no puede ser completamente arbitraria,
debe hacerse atendiendo al orden existente entre éstas.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo
de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición,
como por ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el orden de llegada,
estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que
al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta
forma, cada número representará una categoría en general, con un solo elemento y se puede
establecer relaciones entre ellas, ya que los números asignados guardan la misma relación
que el orden de llegada a la consulta.
Escalas de intervalos iguales:
La escala de intervalos iguales, está caracterizada por una unidad de medida común y
constante que asigna un número igual al número de unidades equivalentes a la de la
magnitud que posea el elemento observado. Es importante destacar que el punto cero en las
escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la
magnitud que estamos midiendo. Esta escala, además de poseer las características de la
escala ordinal, encontramos que la asignación de los números a los elemento es tan precisa
que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos
de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera
escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida
pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.
Escala de coeficientes o Razones:

El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas
de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que
el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se
observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto.
A iguales diferencias entre los números asignados corresponden iguales diferencias en el
grado de atributo presente en el objeto de estudio. Además, siendo que cero ya no es
arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la
magnitud de la propiedad presente en B.
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no
tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que
tienen 3 hijos.
Formas de observar la población
Atendiendo a la fuente se clasifican en directa o indirecta.
Observación directa: es aquella donde se tienen un contacto directo con los elementos o
caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los resultados
obtenidos se consideran datos estadísticos originales. Para Ernesto Rivas González (1997)
"Investigación directa, es aquella en que el investigador observa directamente los casos o
individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus
resultados se consideran datos estadísticos originales, por esto se llama también a esta
investigación primaria".
Ejemplo; el seguimiento de la población agrícola por año, llevado en una determinada
granja.
Observación Indirecta: es aquella donde la persona que investiga hace uso de datos
estadísticos ya conocidos en una investigación anterior, o de datos observados por un
tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos.Ejemplo; si un
investigador pretende estudiar la producción por años de una granja avícola, en sus últimos
cinco años de producción, tendría que hacer un seguimiento, a tal fin recurriría a las
observaciones que posee la oficina administrativa de la granja durante estos cinco años, o
dirigirse a la oficina de estadística, llevada en el ministerio de producción y comercio
(M.P.C) de la localidad donde está registrada dicha granja. Es de notar que el investigador
se vale de observaciones realizadas por terceros.Atendiendo a la periodicidad, puede ser
continua, periódica o circunstancial.
Una observación continua; como su nombre lo indica es aquella que se lleva acabo de un
modo permanente.
Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras
operaciones que se van registrando a medida que van produciéndose.
Una observación periódica; es aquélla que se lleva a cabo a través de períodos de tiempo
constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años, etc.
Lo que debemos destacar es que los períodos de tiempo tomados como unidad deben
tomarse constantes en los posibles.
Ejemplo; el registro llevado por las Oficinas de Control de Estudios de la UNESR, en
cuanto a la inscripción de los estudiantes por semestre.
La observación circunstancial, es aquella que se efectúa en forma ocasional o esporádica,
esta observación hecha más por una necesidad momentánea, que de carácter regular o
permanente.
Ejemplo; la obtención de números de aulas utilizadas y no utilizadas en los colegios
pertenecientes al municipio San Carlos del Estado Cojedes.
Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta
Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad de los
elementos de la población se habla de una observación exhaustiva.Observación Parcial.
Dados que las poblaciones en general son grandes, la observación de todos sus elementos
se ve imposibilitada. La solución para superar este inconveniente es observar una parte de
esta población.Observación Mixta. En este tipo de observación se combinan
adecuadamente la observación exhaustiva con la observación parcial. Por lo general, este
tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran
básicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la
población es muy grande, parte de ella se observa parcialmente.
Pasos de la investigación directa
El proceso de aplicación de la estadística implica una serie de pasos:
 Selección y determinación de la población o muestra y las características contenidas
que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario
determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o
no probabilístico).
 Obtención de los datos. Esta puede ser realizada mediante la observación directa de
los elementos, la aplicación de encuestas y entrevistas, y la realización de
experimentos.
 Clasificación, tabulación y organización de los datos. La clasificación incluye el
tratamiento de los datos considerados anómalos que pueden en un momento dado,

falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen
de los datos en tablas y gráficos estadísticos.
 Análisis descriptivo de los datos. El análisis se complementa con la obtención de
indicadores estadísticos como las medidas: de tendencia central, dispersión,
posición y forma.
 Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que
involucran elementos probabilísticos que permiten inferir conclusiones de una
muestra hacia la población (opcional).
 Elaboración de conclusiones. Se construye el informe final.
1.1.1 CONCEPTOS BÁSICOS
La estadística es la ciencia que se ocupa de la recogida y obtención de datos y de su
posterior tratamiento para poder expresarlos numéricamente y así poder extraer
conclusiones.
Los primeros estudios estadísticos eran demográficos así que se ha conservado gran parte
del vocabulario.
 Población: Es el conjunto sobre el que se realizará el estudio estadístico.
 Individuo o Unidad Estadística: Cada uno de los elementos que componen la
población.
 Muestra: Conjunto representativo de la población pero más pequeño que esta.
 Muestreo: Es la reunión de los datos sobre una muestra que serán el objeto de
nuestro estudio estadístico.
 Valor: Son todos los resultados que podemos obtener. En el caso de una moneda
serían cara y cruz.

 Dato: Los distintos valores que obtenemos para cada individuo. Si lanzamos la
moneda al aire tres veces obtendríamos 3 datos; por ejemplo: cruz, cara, cruz.
1.1.2 CLASIFICACIÓN DE LA ESTADÍSTICA
La estadística se puede clasificar en dos grandes ramas:
 Estadística descriptiva o deductivaa.
 Estadística inferencial o inductiva.
La primera se emplea simplemente para resumir de forma numérica o gráfica un conjunto
de datos. Se restringe a describir los datos que se analizan. Si aplicamos las herramientas
ofrecidas por la estadística descriptiva a una muestra, solo nos limitaremos a describir los
datos encontrados en dicha muestra, no se podrá generalizar la información hacia la
población. La estadística inferencial permite realizar conclusiones o inferencias, basándose
en los datos simplificados y analizados de una muestra hacia la población o universo. Por
ejemplo, a partir de una muestra representativa tomada a los habitantes de una ciudad, se
podrá inferir la votación de todos los ciudadanos que cumplan los requisitos con un error de
aproximación.
1.1.3 TIPOS DE VARIABLES
Se le llama variable a aquel elemento de un algoritmo, fórmula o proposición que
representa un elemento no especificado de un determinad conjunto. A este conjunto se lo
conoce bajo el nombre de universo de la variable y cada uno de sus elementos es un valor
de la variable. Existen distintos tipos de variables, algunos de ellos son:
Independiente: los valores de este tipo de variables no dependen del de otras, son
representadas en el eje de las abscisas y en las funciones con la letra X.

Dependiente: los valores de estas variables, en cambio, son determinados por los que
adquieran las otras variables. Se las representa en el eje de las ordenadas y se las representa
con la letra Y en las funciones.
Cuantitativas: estas variables se expresan por medio de un número, lo que permite
utilizarlas para operaciones aritméticas. Dentro de estas encontramos dos clases:
1. Continua: este tipo de variables puede adquirir valores existentes entre dos números.
2. Discreta: esta variable no puede adquirir valores intermedios entre dos números,
sino aislados.
Cualitativas: hace alusión a aquellas cualidades que no se las puede medir numéricamente.
Dentro de estas variables encontramos dos clases:
1. Variable cualitativa ordinal o cuasicuantitativa: este tipo de variables presentan
modalidades no numéricas en las que hay un orden.
2. Variable cualitativa ordinal: en este tipo de variables, en cambio, las modalidades
numéricas no pueden ser ordenadas bajo ningún criterio.
Aleatorias: son aquellas funciones que asocian un número real a cada elemento del
espacio muestral E. Dentro de esta variable encontramos los siguientes tipos:
1. Variable aleatoria discreta: esta variable solamente puede adquirir valores enteros.
2. Variable aleatoria continua: a diferencia de la discreta, puede adquirir cualquier
valor dentro de un intervalo de la recta real.
3. Variable aleatoria binominal: con esta variable se muestra el número de éxitos que
se adquirieron en cada prueba de un experimento. Es como la discreta, que sólo
adquiere valores enteros, pero de acuerdo a las pruebas realizadas.

2da. Semana:
1.1.4 NIVELES DE MEDICIÓN
Medir significa “asignar números a objetos y eventos de acuerdo a reglas” (Stevens, 1951),
esta definición es adecuada para el área de ciencias naturales, en el campo de las ciencias
sociales medir es “el proceso de vincular conceptos abstractos con indicadores empíricos”
(Carmines y Zeller, 1979, p. 10).
La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos
de las escalas miden variables categóricas y las otras dos miden variables numéricas
(Therese L. Baker, 1997). Los niveles de medición son las escalas nominal, ordinal, de
intervalo y de razón. Se utilizan para ayudar en la clasificación de las variables, el diseño de
las preguntas para medir variables, e incluso indican el tipo de análisis estadístico
apropiado para el tratamiento de los datos.
Una característica esencial de la medición es la dependencia que tiene de la posibilidad de
variación. La validez y la confiabilidad de la medición de una variable depende de las
decisiones que se tomen para operacionalizarla y lograr una adecuada comprensión del
concepto evitando imprecisiones y ambigüedad, por en caso contrario, la variable corre el
riesgo inherente de ser invalidada debido a que no produce información confiable.
A) MEDICIÓN NOMINAL.
En este nivel de medición se establecen categorías distintivas que no implican un orden
especifico. Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas
se puede establecer la categoría sexo con dos niveles, masculino (M) y femenino (F), los
respondientes solo tienen que señalar su género, no se requiere de un orden real.
Así, si se asignan números a estos niveles solo sirven para identificación y puede ser
indistinto: 1=M, 2=F o bien, se pueden invertir los números sin que afecte la medición: 1=F
y 2=M. En resumen en la escala nominal se asignan números a eventos con el propósito de
identificarlos. No existe ningún referente cuantitativo. Sirve para nombrar las unidades de
análisis en una investigación y es utilizada en cárceles, escuelas, deportes, etc. La relación
lógica que se expresa es: A  B (A es diferente de B).
B) MEDICIÓN ORDINAL.
Se establecen categorías con dos o mas niveles que implican un orden inherente entre si. La
escala de medición ordinal es cuantitativa porque permite ordenar a los eventos en función
de la mayor o menor posesión de un atributo o característica. Por ejemplo, en las
instituciones escolares de nivel básico suelen formar por estatura a los estudiantes, se
desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. La relación
lógica que expresa esta escala es A  B (A es mayor que B). Clasificar a un grupo de
personas por la clase social a la que pertenecen implica un orden prescrito que va de lo mas
alto a lo mas bajo. Estas escalas admiten la asignación de números en función de un orden
prescrito.
Las formas mas comunes de variables ordinales son ítems (reactivos) actitudinales
estableciendo una serie de niveles que expresan una actitud de acuerdo o desacuerdo con
respecto a algún referente. Por ejemplo, ante el ítem: La economía mexicana debe
dolarizarse, el respondiente puede marcar su respuesta de acuerdo a las siguientes
alternativas:
___ Totalmente de acuerdo
___ De acuerdo
___ Indiferente
___ En desacuerdo
___ Totalmente en desacuerdo
las anteriores alternativas de respuesta pueden codificarse con números que van del uno al
cinco que sugieren un orden preestablecido pero no implican una distancia entre un número
y otro. Las escalas de actitudes son ordinales pero son tratadas como variables continuas
(Therese L. Baker, 1997).
C) MEDICIÓN DE INTERVALO.
La medición de intervalo posee las características de la medición nominal y ordinal.
Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables
continuas pero carece de un punto cero absoluto. El ejemplo mas representativo de este tipo
de medición es un termómetro, cuando registra cero grados centígrados de temperatura
indica el nivel de congelación del agua y cuando registra 100 grados centígrados indica el
nivel de ebullición, el punto cero es arbitrario no real, lo que significa que en este punto no
hay ausencia de temperatura.
Una persona que en un examen de matemáticas que obtiene una puntuación de cero no
significa que carezca de conocimientos, el punto cero es arbitrario por que sigue existiendo
la característica medida.
D) MEDICIÓN DE RAZÓN.
Una escala de medición de razón incluye las características de los tres anteriores niveles de
medición anteriores (nominal, ordinal e intervalo). Determina la distancia exacta entre los
intervalos de una categoría. Adicionalmente tiene un punto cero absoluto, es decir, en el
punto cero no existe la característica o atributo que se mide. Las variables de ingreso, edad,
número de hijos, etc. son ejemplos de este tipo de escala. El nivel de medición de razón se
aplica tanto a variables continuas como discretas.

1.1.5 RECOPILACIÓN DE DATOS
6.3.1 Matriculación
Un registro es un depósito de información sobre las embarcaciones pesqueras, las empresas,
las artes, las licencias o los pescadores tomados uno a uno. Pueden utilizarse para obtener
una encuesta completa por exigencia legal. Se establecen registros cuando se requiere un
conocimiento preciso del tamaño y del tipo de flota pesquera y para realizar un seguimiento
más detallado de las actividades pesqueras con el fin de asegurar la observancia de los
reglamentos pesqueros. También pueden incluir información a efectos fiscales (por
ejemplo, concesión o renovación de licencias de pesca). Aunque los registros se establecen
con fines distintos de la recopilación de datos, pueden resultar muy útiles a la hora de
diseñar y ejecutar un sistema estadístico, siempre que los datos que contienen sean fiables,
actuales y completos.
6.3.1.1 Tipos de datos de los registros
En la mayor parte de los países, los buques, en particular los buques pesqueros comerciales
y las embarcaciones pesqueras fletadas o contratadas, se matriculan en registros de las
autoridades pesqueras. Para la matriculación deben comunicarse los datos relativos al tipo
de embarcación, el tamaño, el tipo de artes, el país de origen, la capacidad de las bodegas,
el número de pescadores y la potencia del motor.
Las empresas que se relacionan con las órganos pesqueros se registran con varios fines.
Estas empresas pueden incluir no sólo a empresas pesqueras, sino también a otro tipo de
empresas participantes en la elaboración y la comercialización de productos pesqueros. En
el momento del registro se deben consignar datos relativos al número de embarcaciones, el
tipo de artes y el tamaño de las embarcaciones de las empresas pesqueras registradas. Las
empresas de elaboración deben ofrecer datos básicos acerca del tipo de elaboración, el tipo
de materia prima, la capacidad de elaboración e incluso el origen del material.
A las embarcaciones pesqueras y las artes de pesca se exigirá con frecuencia una licencia
de pesca válida. A diferencia de la matriculación de embarcaciones, las licencias suelen
emitirse para acceder a pesquerías concretas durante un período de tiempo determinado.
Puesto que las licencias pueden tener que renovarse periódicamente, pueden ser una forma
útil de actualizar la información sobre las características de las embarcaciones y las artes.
6.3.1.2 Diseño de los registros
Un registro debe recoger no sólo las nuevas inscripciones, sino que debe poder indicar que
una voz concreta del registro está inactiva (por ejemplo, una empresa que haya suspendido
sus actividades) o anotar los cambios en las actividades (por ejemplo, el aumento de la
capacidad de elaboración de una empresa). Si las licencias deben renovarse todos los años,
los datos recopilados a partir de las licencias son particularmente útiles, ya que los registros
se actualizan de forma anual.
Los datos de los registros deben incluir también criterios para clasificar las unidades
pesqueras por estratos. Estas clasificaciones se basan habitualmente en presuposiciones y
en un conocimiento a priori relativo a las diferencias en las tasas de capturas, la
composición de las especies y las especies capturadas selectivamente.
En general, los registros para la inscripción y datos de buques son sistemas complejos que
requieren unos procedimientos administrativos bien organizados apoyados por unos
sistemas eficaces de comunicación, almacenamiento y elaboración de datos. Como tales,
suelen ocuparse predominantemente sólo de ciertos tipos y tamaños de unidades pesqueras,
que en la mayor parte de los casos pertenecen a flotas industriales y semiindustriales. La
pesca en pequeña escala y de supervivencia, que involucra a un gran número de unidades

pesqueras, no suele figurar en los sistemas de registro o, si se están matriculados, no es fácil
realizar un seguimiento de la misma que permita su validación o actualización.
6.3.2 Cuestionarios
A diferencia de las entrevistas, en las que un encuestador plantea preguntas directamente,
los cuestionarios son formularios que rellenan los encuestados solos. Los cuestionarios
pueden entregarse en mano o enviarse por correo y recogerse posteriormente o devolverse
en un sobre prefranqueado. Este método puede adoptarse para toda la población o para
sectores escogidos.
Los cuestionarios pueden utilizarse para recopilar datos sistemáticos habituales o poco
frecuentes, y datos para estudios especializados. Si bien la información de esta sección se
aplica a los cuestionarios para todos estos usos, los ejemplos se refieren sólo a datos
sistemáticos, tanto si son habituales como poco frecuentes. Algunos de los datos que suelen
obtenerse a través de cuestionarios son: características demográficas, artes de pesca,
opiniones de las partes involucradas en la actividad o la ordenación pesquera, información
general sobre los pescadores y presupuestos de alimentación de las unidades familiares.
Los cuestionarios prevén que los encuestados rellenen el formulario ellos mismos, para lo
que también se requiere un alto nivel de alfabetización. Cuando son habituales varios
idiomas, los cuestionarios deben prepararse utilizando los idiomas principales del grupo
destinatario. Debe prestarse especial atención a estos casos para asegurar la precisión de las
traducciones.
Para maximizar los índices de respuesta, los cuestionarios deben diseñarse de forma que
sean lo más sencillos y claros posible, con secciones y preguntas dirigidas. Lo que es más
importante, los cuestionarios deben ser también lo más cortos posible. Si el cuestionario se
va a entregar a una población de muestra, puede ser preferible preparar varios cuestionarios
más pequeños y más orientados, uno para cada submuestra. Si el cuestionario va a utilizarse
para realizar una encuesta completa, debe prestarse especial atención para evitar
sobrecargar al encuestado. Si, por ejemplo, varios organismos necesitan los mismo datos,
deben tratar de coordinar su recopilación para evitar las duplicaciones.
La información que puede obtenerse a través de los cuestionarios atañe a prácticamente
todas las variables. Por ejemplo, la información acerca de las capturas o los desembarques
puede recopilarse a través de cuestionarios dirigidos a los pescadores, los intermediarios del
mercado, los vendedores y los compradores en el mercado, los elaboradores, etc. De igual
forma, los datos socioeconómicos pueden obtenerse también a través de cuestionarios
destinados a distintas fuentes. Sin embargo, en todos los casos, las variables obtenidas son
una opinión y no una medición directa, y por lo tanto pueden contener errores de bulto. Es
más fiable para este tipo de datos la utilización de observaciones directas (6.3.4) o de
sistemas de presentación de informes (6.3.5).
Los cuestionarios, al igual que las entrevistas, pueden contener preguntas estructuradas con
espacios en blanco para rellenar, preguntas con opciones múltiples o pueden incluir
preguntas abiertas en las que se invita al encuestado a contestar de forma amplia y en cierta
medida elegir su propio enfoque.
Para facilitar la cumplimentación de los formularios y la introducción de datos en un
formato estructurado, éste debería ser preferiblemente de lectura automática o al menos
presentar una disposición en la que los campos de datos sean claramente identificables y las
respuestas estén previamente codificadas. En general, la escritura debería limitarse al
máximo (por ejemplo, casillas para marcar, opciones múltiples), reservándose ésta
preferiblemente a los números. En un formato abierto, deben imponerse posteriormente

palabras clave y otros procedimientos de estructuración para facilitar la introducción en la
base de datos y el análisis, llegado el caso.
6.3.3 Entrevistas
En las entrevistas, la información se obtiene a través de una encuesta y es registrada por
encuestadores. Las entrevistas estructuradas se llevan a cabo utilizando formularios de
encuesta, mientras que en las entrevistas abiertas se toman notas mientras se habla con los
encuestados. Las notas se estructuran (interpretan) luego para su posterior análisis. Las
entrevistas abiertas, que deben interpretarse y analizarse incluso durante la entrevista,
deben realizarlas observadores y/o encuestadores bien formados.
Al igual que al preparar un cuestionario, es importante experimentar con formularios de
prueba diseñados para las entrevistas. El máximo esfuerzo por aclarar y centrar por parte
del diseñador no puede anticipar todas las posibles interpretaciones de los encuestados. Una
prueba a pequeña escala antes de utilizarlos para recopilar realmente datos asegurará unos
datos mejores y evitará que se pierda tiempo y dinero.
Aunque las entrevistas estructuradas pueden utilizarse para obtener casi cualquier
información, al igual que en los cuestionarios, la información se basa en una opinión
personal. Los datos basados en variables como las capturas o el esfuerzo son
potencialmente objeto de errores de bulto, debido a cálculos erróneos o a errores
intencionados en la información delicada.
6.3.3.1 Entrevistas abiertas
Las entrevistas abiertas cubren una serie de actividades de recopilación de datos que
incluyen varios métodos de investigación de las ciencias sociales.
Los grupos de muestra son pequeños (5-15 personas) y están compuestos por miembros
representativos de un grupo cuyas apreciaciones, prácticas u opiniones se están buscando.

Al hacer las preguntas iniciales y estructurar el examen posterior, el
facilitador/entrevistador puede obtener, por ejemplo, información sobre prácticas de uso de
artes comunes, respuestas a las normativas de ordenación u opiniones sobre la pesca.
Las encuestas de grupo comportan la selección aleatoria de un reducido número de
personas que representan a un grupo y que se prestan a estar disponibles durante un período
de tiempo prolongado, a menudo de uno a tres años. Durante ese período, sirven como
muestra aleatoria estratificada de personas de las que pueden extraerse datos sobre una serie
de temas.
6.3.3.2 Entrevistas estructuradas
En general, las entrevistas estructuradas se llevan a cabo con un formulario bien diseñado
previamente establecido. Se diferencian de los cuestionarios en que son los investigadores
quienes rellenan los formularios en lugar de los encuestados. Aunque esta solución resulta
más costosa, pueden hacerse preguntas más complejas y los datos pueden validarse en el
momento de recopilarlos, mejorando así la calidad de los mismos. Las entrevistas pueden
llevarse a cabo con varias fuentes de datos (desde los pescadores a los consumidores), y a
través de medios alternativos, como por teléfono o en persona.
Las entrevistas estructuradas componen la base de una gran parte de la recopilación de
datos realtivos a la pesca en pequeña escala.
En un marco de entrevistas para hacer un muestreo de las capturas, el esfuerzo y los
precios, los encuestadores trabajan siguiendo un programa de visitas a los puntos de
desembarque uno a uno para registrar datos. Los encuestadores pueden ser móviles (visitan
los distintos lugares de forma rotativa) o residir en un punto de muestreo específico. Su
trabajo consiste en hacer un muestreo de las embarcaciones, obteniendo datos sobre los
desembarques, el esfuerzo y los precios de todos los tipos de embarcaciones/artes que se

espera que faenen durante el día del muestreo. La muestra debe ser lo más representativa
posible de las actividades de la flota. Se necesitarán tal vez algunos datos adicionales
relativos a actividades de pesca para ciertos tipos de unidades pesqueras, como artes de
playa o embarcaciones que hacen múltiples salidas de pesca en un día. Para ello, la
entrevista puede abarcar actividades previstas así como actividades ya realizadas.
En un marco de entrevistas relativas a las actividades de los buques/artes, los
encuestadores trabajan siguiendo un programa de visitas al puerto de matrícula para
registrar datos sobre las actividades de los buques/artes. Los encuestadores pueden ser
móviles (visitan los puertos de amarre de forma rotativa) o residir en un punto de muestreo
concreto. En ambos casos, su trabajo consiste en determinar el número total de unidades de
pesca (y si es posible, de artes de pesca) de todos los tipos de buques/artes con base en el
puerto de matrícula y el número de ellos que han faenado durante el día en el que se realiza
el muestreo.
Existen varias formas de registrar las actividades de los buques/artes. En muchos casos,
combinan el método de entrevista con observaciones directas. Las observaciones directas
pueden utilizarse para identificar unidades de pesca inactivas observando las que están
amarradas o encalladas, y, cuando ya se conoce el número total de embarcaciones con base
en ese puerto de matrícula, quizás a partir de una encuesta o registro marco. A menudo, los
encuestadores siguen teniendo que comprobar, por medio de entrevistas durante la visita,
que las embarcaciones estén faenando y no se dediquen a otras actividades.
La entrevista pura puede utilizarse en los casos en que existe un subconjunto
predeterminado de unidades de pesca seleccionado. El trabajo del encuestador consiste en
hacer un seguimiento de todos los pescadores incluidos en la lista y, a través de entrevistas,
identificar a los que han estado faenando durante el día del muestreo. En los lugares que
presenten un número abarcable de unidades de pesca (es decir, no más de 20), la entrevista
puede abarcar todas las unidades de pesca.
En ocasiones es posible plantear preguntas sobre la actividad pesquera del día anterior o
incluso de los dos días anteriores. Esta información extra aumenta significativamente el
tamaño de la muestra con un pequeño costo adicional, ofreciendo en definitiva unas
mejores estimaciones del esfuerzo de pesca total. La experiencia ha demostrado que la
mayor parte de la variabilidad en la actividad de los buques/artes es más temporal que
espacial.
6.3.4 Observaciones directas
6.3.4.1 Observadores
Los observadores pueden realizar mediciones directas en las embarcaciones pesqueras, en
los puntos de desembarque, en las instalaciones de elaboración o en los mercados. Las
variables que los encuestadores pueden recopilar incluyen las capturas (desembarques y
descartes), el esfuerzo, los buques/artes, las actividades, variables medioambientales (por
ejemplo, estado de la mar, temperatura), variables biológicas (como talla, peso, edad), los
valores y las cantidades desembarcadas y las ventas.
En la práctica, los observadores no sólo realizan mediciones directas (observaciones), sino
que también llevan a cabo entrevistas y encuestas por medio de cuestionarios. También
pueden participar en la elaboración y el análisis de datos. Las tareas de un observador son
difíciles y por tanto fundamentales para una formación y una supervisión adecuadas.
Deben tomarse decisiones claras acerca de la naturaleza y el alcance de los datos
recopilados durante cualquier salida. A menudo, la cantidad de datos y la frecuencia de la
recopilación pueden establecerse analíticamente con datos preliminares.

Preferiblemente, los observadores sólo deben recopilar datos, no llevar a cabo otras
actividades, como la aplicación de las medidas, la concesión de licencias o la recaudación
de impuestos. Esto debe ayudar a minimizar el margen de error al reducir los incentivos
para mentir. Los problemas en términos de conflictos entre la recopilación de datos y la
aplicación de la ley, por ejemplo, pueden reducirse mediante una delimitación clara,
separando las actividades por localización o por tiempo. Esto se convierte en una necesidad
para los observadores en mar abierto. Su posición en los buques pesqueros y las tareas que
llevan a cabo dependen en gran medida de una buena relación de trabajo con el capitán y la
tripulación, que puede malograrse si son vistos como personal encargado de la observancia.
Los principales datos que se obtienen a través de los observadores en mar abierto son los
datos acerca de las capturas y el esfuerzo, que a menudo se utilizan para cotejarlos con los
de los registros de pesca. Al mismo tiempo, los observadores en mar abierto pueden
recopilar datos biológicos adicionales (tamaño, madurez y sexo de los peces), datos sobre
subcapturas y datos medioambientales, así como otra información sobre las artes, las
actividades de pesca, etc. Con frecuencia, los datos acerca de los descartes sólo pueden ser
recopilados por observadores en mar abierto.
Los principales datos obtenidos por los observadores en los puntos de desembarque, las
plantas de elaboración y los mercados incluyen datos sobre los desembarques (cantidad,
calidad, valor y precio), biológicos (tamaño, madurez) y el esfuerzo (número de lances,
horas faenando). En la pesca a gran escala en las que se utiliza un sistema de libro de a
bordo, los datos recopilados en los puntos de desembarque pueden utilizarse para cotejar
los datos registrados en los libros de a bordo. Los datos recopilados en las plantas de
elaboración incluyen cantidades por especies y, sobre todo en las prácticas de las fábricas
modernas, el número de lote de las materias primas, del que en ocasiones puede hacerse un
seguimiento retrospectivo hasta los buques pesqueros. Estos datos, si se recopilan, pueden
utilizarse para validar los datos sobre los desembarques.
Puede ser necesario recopilar datos para estimar los factores de extrapolación con el fin de
convertir el peso del pescado elaborado que se ha desembarcado en peso total equivalente.
Al proceder al muestreo del pescado antes y después de la elaboración, pueden mejorarse
los factores de conversión. Los potenciales cambios en las relaciones de peso
cuerpo/vísceras, ya sea en función de la estación, del estadio biológico o de otras
variaciones hacen recomendable que en las muestras se registren las fechas, especies, sexo
y talla.
Los datos económicos y demográficos a cada nivel (por ejemplo, las entradas y salidas de
distintos productos desde y hacia el mercado y desde y hacia los elaboradores) suelen
obtenerse a través de entrevistas y cuestionarios. Sin embargo, los datos recopilados
directamente por los encuestadores pueden constituir también la fuente principal, así como
datos de apoyo para los recopilados mediante otros métodos.
Si bien los datos sobre los productos en las plantas de elaboración pueden recopilarse a
través de cuestionarios (6.3.2) o entrevistas (6.3.3), los encuestadores pueden recopilar
directamente muchas variables físicas (peso, número, tamaño, etc.) con mayor precisión.
Las balanzas automáticas, a través de las cuales pasa un flujo continuo de peces, pueden
registrar el peso de éstos mecánicamente o a través de sensores informatizados. De forma
similar, pueden utilizarse cubos de pesaje mecánicos o automáticos para peces enteros
congelados o descongelados antes de entrar en una línea de elaboración o un almacén
frigorífico para registrar el peso de cada lote. Si no se hace esto, es preciso realizar un
recuento y un submuestreo para asegurar que los peces que contienen hayan sido
correctamente identificados y pesados.

El pescado suele descargarse a granel junto con materiales no procedentes de la pesca (por
ejemplo, hielo, líquido de salmuera, materiales de embalaje y bandejas de carga). Puede
resultar muy difícil calcular el peso total del pescado, y mucho más el peso por especie,
producto y tamaño. Deben establecerse métodos para registrar si el material no procedente
de la pesca se incluye en algún proceso de pesaje (es decir, ¿están programadas las balanzas
para restar automáticamente el peso de la bandeja de carga?). En el caso del pescado
elaborado y en cajas selladas, puede bastar con realizar un muestreo para determinar un
peso medio y luego contar las cajas o las bandejas de carga. O bien, cada caja o bandeja de
carga puede pesarse y tomarse nota de si el peso de dicha caja o bandeja de carga debe
restarse en una fecha posterior al elaborar los datos.
Son preferibles los desembarques completos de todas las capturas relativas a una salida de
una embarcación (es decir, vaciar las bodegas) ya que entonces los registros pueden
cotejarse con los libros de a bordo. Sin embargo, en algunas circunstancias, las descargas
en los puertos, en el muelle o en mar abierto pueden ser tan sólo parciales, reteniéndose una
parte a bordo hasta la siguiente descarga. En este caso, deben conservarse los registros tanto
de las capturas desembarcadas como de las retenidas a bordo.
6.3.4.2 Inspectores
Los inspectores son una especie de encuestadores que participan en la aplicación de la ley y
la vigilancia (en relación con reglamentos pesqueros, inspecciones sanitarias, control
laboral, etc.). Pueden trabajar en mar abierto en buques de vigilancia, en los puntos de
desembarque en tierra, en las plantas de elaboración y en los mercados. En general, los
datos científicos pueden recopilarse mejor mediante encuestadores que no participen
directamente en la aplicación de la ley. No obstante, muchas de las variables recopiladas
por los inspectores son muy útiles, e incluyen información sobre los desembarques, las
actividades, el esfuerzo, los precios del desembarque, el procedimiento de elaboración y el
precio del producto en el mercado y para los elaboradores. Los inspectores son también
útiles a la hora de recopilar datos sobre empleo.
Los inspectores pueden desempeñar un papel importante en la comprobación. En muchos
casos, los informes pueden comprobarse materialmente con las observaciones. Por ejemplo,
pueden tomarse muestras aleatorias de cajas para comprobar su contenido (especie, tipo de
producto y tamaño) en comparación con las marcas identificativas de las cajas. Es preciso
que los inspectores estén cualificados para dichas estrategias de muestreo.
Al igual que ocurre con los encuestadores/observadores, los datos de los inspectores deben
tratarse con precaución debido a la alta probabilidad de que se produzca un sesgo en el
muestreo. En los análisis debe tenerse en cuenta este potencial sesgo de los datos
recopilados por los funcionarios encargados de la aplicación de la ley.
6.3.4.3 Investigación científica
Los métodos de investigación ecológica pueden llevarse a cabo de manera independiente de
las actividades pesqueras comerciales para medir variables relativas a la población de peces
o el medio ambiente. Este tipo de investigación puede correr a cargo de embarcaciones de
investigación institucionales, o por parte del sector o de instituciones mediante buques
pesqueros comerciales. El objetivo es obtener observaciones sobre variables biológicas (por
ejemplo, abundancia de poblaciones o distribución espacial y tamaño de los peces, madurez
y actividades de desove) y medioambientales (por ejemplo, salinidad y temperatura). Es
importante que este tipo de investigaciones se lleven a cabo periódicamente para obtener
series cronológicas de datos.
Del mismo modo, los métodos de investigación sociocultural pueden utilizarse para obtener
información específica útil con fines de ordenación. Aunque estos métodos no puedan
considerarse con frecuencia como rutinarios, ofrecen datos importantes y deberían tenerse
en cuenta en las recopilaciones de datos poco frecuentes, cuando esto sea posible.
Los informadores selectos son personas con conocimientos especializados en un tema
concreto. Pueden incluir a especialistas académicos, líderes de la comunidad o pescadores
de especial cualificación. Las entrevistas suelen comenzar con un conjunto de preguntas
básicas, pero el entrevistador espera obtener información nueva y quizás imprevista
pidiendo al informador clave que amplíe sus respuestas a dichas preguntas iniciales. Este
método es ideal para obtener datos descriptivos en profundidad sobre las convicciones y las
prácticas, incluidas las prácticas históricas.
La observación por participación es una técnica en la que el investigador dedica un
amplio período de tiempo (puede ir desde semanas hasta años, dependiendo del objetivo y
del contexto) viviendo con una comunidad objetivo, observando su comportamiento y
participando en sus prácticas. Durante este tiempo, el investigador llevará a cabo entrevistas
oficiales y oficiosas abiertas acerca de diversos temas. Este es un buen método para
aprender acerca de los procesos reales de toma de decisiones, frente a los procedimientos
oficiales. Las normas culturales e institucionales apenas se siguen al pie de la letra, y suelen
existir normas oficiosas para una libertad de acción aceptable. Sin embargo, suele ocurrir
que la información acerca de estas normas sólo pueda obtenerse a través de la observación
por participación.
6.3.4.4 Registro de datos
Los transmisores automáticos de localización (TAL) registran datos automáticamente a
través de la tecnología de posicionamiento y comunicación. Permiten realizar una
observación remota mediante el registro de las actividades pesqueras en mar abierto, y
pueden sustituir a los libros de a bordo y a los observadores/inspectores en el puente de

mando de los buques pesqueros. Sin embargo, los TAL presentan una deficiencia en un
aspecto: la introducción de datos sobre capturas sigue siendo responsabilidad del capitán.
Muchos datos sobre actividades pesqueras pueden registrarse automáticamente desde los
instrumentos del puente. El registro de la posición, la velocidad y la dirección, y el
despliegue de las artes a través de enlaces con instrumentos electrónicos serán
probablemente más habituales en el futuro. Una vez recopilados, dichos datos pueden
transmitirse automáticamente a bases de datos a través de comunicaciones satelitales o
terrestres.
La tecnología que combina la posición de la embarcación y una evaluación de las capturas
para las autoridades de ordenación a través de medios remotos se conoce generalmente
como sistema de seguimiento de embarcaciones (VMS). La confidencialidad es la clave
para la aceptación generalizada del VMS, ya que la información sobre los caladeros
actuales y, por lo tanto, la seguridad de la información sobre la posición, son una de las
principales preocupaciones.
Sin embargo, gracias a estos sistemas es posible comunicar la posición, actividades y
capturas de las embarcaciones directamente a las bases de datos y desde ahí a informes que
agregan datos o eliminan identificadores de embarcaciones. Dado que resultará
relativamente sencillo comprobar la posición detectada a distancia frente a la posición
registrada, los registros del libro de a bordo serán más representativos de las actividades
reales de las embarcaciones en mar abierto.
6.3.5 Presentación de informes
En la mayoría de enfoques basados en una encuesta completa, el personal pesquero no se
ocupa directamente de recopilar datos, sino que utiliza fuentes externas. Lo más habitual es
que dichas fuentes sean formularios de datos que cumplimentan las propias empresas
pesqueras, los intermediarios, los operadores del mercado, los elaboradores e incluso las
empresas mercantiles y los despachos de aduanas. Estos métodos se utilizan casi
exclusivamente para la pesca industrial y semiindustrial y para las instituciones.
Las empresas pesqueras suelen ser una buena fuente de información relativa a datos básicos
sobre capturas y esfuerzo de pesca. El envío periódico de datos básicos forma parte del
proceso de licencia de pesca. Los datos que presentan las empresas suelen ser libros de a
bordo o declaraciones de desembarques. Los libros de a bordo deben incluir información
detallada sobre las actividades de pesca concretas, indicando los caladeros, el tipo y la
duración de la operación, las capturas por especies y otro tipo de datos relativos al tiempo y
las condiciones del mar. Las declaraciones de desembarques suelen incluir datos agrupados
que se presentan en forma de resumen de las salidas y las capturas por especies.
La ventaja de utilizar informes consiste en que los datos son compilados por agentes
distintos del personal pesquero y en que en ocasiones se pueden entregar en un formato
informatizado preelaborado, directamente de los registros de la empresa, reduciendo así los
gastos administrativos. La confidencialidad de la información (como los caladeros y las
tasas de capturas) deben formar parte de un acuerdo para el envío de datos, y los resultados
estadísticos de la encuesta no deben contener información individualizada relativa a
embarcaciones o empresas pesqueras. Sin embargo, también existe el riesgo de declaración
por defecto o de que se distorsionen deliberadamente los datos, sobre todo los relativos a
los caladeros, las capturas y los ingresos.
6.3.5.1 Capturas
A veces es preciso recopilar datos de todas las embarcaciones pertenecientes a un sector
pesquero, generalmente en el caso de la pesca a gran escala. Normalmente, cada
embarcación tendrá que registrar sus datos sobre capturas y esfuerzo en cada salida en un
libro de a bordo diseñado a tal propósito. Dado que se trata de una tarea meticulosa,
generalmente sólo se piden datos fundamentales. Por varios motivos, los datos recopilados
mediante este método pueden ser poco precisos y por lo tanto es importante que los
inspectores los validen de vez en cuando.
6.3.5.2 Postcaptura
Suelen emplearse datos sobre las actividades posteriores a la captura para obtener
información sobre los desembarques, datos biológicos, sobre los mercados, los gastos y los
ingresos. Cuando no se dispone de libros de a bordo, registros de desembarques e informes
de mercado, a menudo sólo puede obtenerse información fiable de las plantas de
elaboración. En los informes de los elaboradores suelen constar las cantidades y el valor del
pescado recibido y de los productos resultantes. Entre la información adicional puede
incluirse el origen de las capturas (embarcaciones de pesca y de transporte) y las categorías
de talla del pescado.
El seguimiento de la descarga de las capturas en forma de pescado elaborado o de pescado
entero requiere una considerable atención al detalle y depende en gran medida de la
relación entre las autoridades pesqueras y los capitanes de las embarcaciones o las
empresas. Puede que se haya creado la suficiente confianza para permitir utilizar
directamente los registros de descargas de la embarcación o la empresa, quizás con
comprobaciones al azar.
En algunos casos, las descargas pueden dirigirse directamente a un planta de elaboración o
almacén frigorífico (sobre todo a través de cintas transportadoras de pescado a granel como
pequeños pelágicos, atunes, etc.). Sigue siendo posible registrar los desembarques
pormenorizados siempre que cada lote esté marcado con su origen (nombre de la
embarcación e identificador de la salida).

La mayor parte de las fábricas conservan registros del pescado (por especies, tipo de
producto y talla) que pasan directamente a la elaboración o al almacén frigorífico. También
conservan información relativa a sus resultados y sus ventas, incluido el destino y el precio,
aunque estos datos pueden ser mucho más difíciles o imposibles de obtener, a menos que se
obligue a ello por ley. Será necesario adaptar los formularios de datos al tipo de elaboración
y al sistema de gestión de la planta.
6.3.5.3 Venta
Los registros de las transacciones en el mercado constituyen una forma viable de recopilar
datos sobre los desembarques con una encuesta completa, sobre todo en las grandes flotas o
las embarcaciones de pequeña escala que desembarcan en puntos centrales. Todas las
facturas, recibos de venta o albaranes deben diseñarse con cuidado en cuanto al contenido,
estilo y capacidad de asegurar una cobertura completa. Dado el potencial volumen de
papeleo, la simplificación y la brevedad suelen ser los criterios más importantes.
El identificador primario de los registros debe ser el nombre de la embarcación (incluidas
todas las embarcaciones de transporte que descargan pescado procedente de flotillas más
lejanas) que vendió la captura, y la fecha o el número de salida, puesto que las
embarcaciones pueden realizar más de una venta a partir de un desembarque. Debe
recopilarse el peso total por especie o grupo comercial, así como el precio. Lo ideal sería
obtener datos adicionales acerca del caladero y el nivel de esfuerzo de pesca, aunque a
menudo esto no es posible.
De forma análoga a los libros de a bordo y las hojas de desembarque, los registros de venta
deben prepararse en formularios debidamente identificados con copias múltiples según sea
necesario. Es probable que se deban facilitar copias a la administración del mercado (en
caso necesario), al vendedor, al comprador y a las autoridades pesqueras.

Los registros generales de ventas, como el volumen de ventas y los precios por tipo de
producto, ofrecen información útil para realizar análisis bioeconómicos y constituyen una
fuente de datos sobre las capturas y los desembarques cuando no se dispone de todas las
vías restantes para recopilar datos. Suelen existir tres fuentes de información general sobre
las ventas: el mercado, la planta de elaboración y los datos de exportación. Sin embargo,
estos datos deben tratarse siempre con cuidado. Cuanto más alejadas están las fuentes de
datos de la fuente primaria, más errores se introducirán y más detalles (por ejemplo,
caladero, esfuerzo pesquero) se perderán.
Además, las encuestas directas a las empresas pesqueras pueden ofrecer detalles
fundamentales sobre los que es posible basar la ordenación y la administración pesquera
general. Las encuestas estadísticas pesqueras anuales pueden ser voluntarias u obligatorias.
Si son voluntarias, las respuestas dependerán del nivel de cooperación entre el sector
privado y las autoridades. Si son obligatorias, se requerirá una legislación adecuada que
podrá redactarse de distintas formas, ya sea en forma de derecho de sociedades, ya sea
legislación sobre estadística.
6.3.5.4 Comercio
Los datos comerciales se refieren a información obtenida de aduanas o fuentes similares
sobre el comercio. Estos datos se utilizan en indicadores socioeconómicos y, en algunos
casos excepcionales, en datos adicionales sobre los desembarques.
La mayoría de los países publican información sobre exportaciones e importaciones. Esto
es particularmente importante cuando deben pagarse impuestos a la importación o la
exportación, o se ofrecen incentivos a la exportación. Por supuesto, los datos relativos a las
importaciones y exportaciones tienen un uso limitado a la hora de calcular la producción
total de pescado, a menos que se cuente también con medios para establecer la proporción
de capturas destinadas al consumo interno. Sin embargo, en algunos casos concretos, los
datos comerciales son la principal fuente para calcular los desembarques (por ejemplo,
tiburones, atunes). Si los datos comerciales se utilizan para validar o calcular los
desembarques, las cantidades tendrán que convertirse habitualmente en peso total.
La falta de datos pormenorizados sobre las exportaciones puede ser un problema derivado
sencillamente e la forma en que se recopilan. Las categorías de exportación registradas por
las autoridades (generalmente sin cooperar con las autoridades pesqueras) pueden ocultar
gran parte de la información necesaria. El pescado enlatado, congelado, fresco, seco y las
harinas de pescado pueden ser las únicas categorías pertinentes para las autoridades
exportadoras. Junto con unos factores de extrapolación precisos, estos datos pueden
utilizarse para calcular la producción total de pescado. Este método de cálculo es bastante
preciso cuando se trata de un mercado local pequeño. Sin embargo, a menos que se
desglosen por especies y se vinculen de nuevo a las fuentes de datos más cercanas al sector
de la captura, presentan poco valor para la ordenación pesquera.

1.2 PRESENTACIÓN DE DATOS DE UNA SOLA VARIABLE
Una distribución es el patrón de variabilidad mostrado por los datos de una variable. La
distribución muestra la frecuencia de cada valor de la variable.
Distribuciones de Frecuencias para datos cuantitativos
Usando los valores de la variable
(para variables discretas)
Usando intervalos de clase
(para variables continuas)
Distribuciones de Frecuencias para datos cuantitativos
Se recomienda usar intervalos de clase cuando los datos pueden asumir una gran cantidad
de valores. Por ejemplo: la edad, el peso, la estatura, el ingreso mensual familiar , etc.
Se recomienda agrupar los datos usando los valores de la variable cuando ésta asume solo
unos pocos valores. Por ejemplo: el número de hijos, el número de hermanos, etc. de
Distribución de
Frecuencias
(para variables discretas)
Universidad de San Carlos. 2,012.
de Distribución de Frecuencias
(para variables continuas)
Universidad de San Carlos. Noviembre 2014.
Historia.
Universidad de San Carlos. Semestre A-2012

Absolutas simples
(fi)
Intervalos, Marcas de clase y Frecuencias
La dificultad de resumir un conjunto de datos, puede ser superada agrupando los distintos
valores en un número reducido de clases llamado
Intervalos de clase
Se llama Intervalo al conjunto de números reales comprendidos entre otro dos números
dados: a y b , que se llaman extremos del intervalo.
Cuando, en una distribución de frecuencias, los datos se agrupan utilizando intervalos, a
cada uno de estos se les da el nombre de
Clases (K).
El punto medio entre el límite superior de una clase y el límite inferior de la siguiente clase
es la frontera superior o límite real superior de clase y la frontera inferior o límite real
inferior de la siguiente clase. (Límites Reales)
La diferencia entre las fronteras superior e inferior de una clase se denomina
Amplitud de Clase.
El número de datos incluídos en un Intervalo de Clase se denomina
Frecuencia de clase. (fi)
El punto medio entre los dos extremos (o las dos fronteras) de una clase se denomina
Marca de clase. (Xi) fi
Clase
L.R.I= Límite real inferior
L.A.I.= Límite aparente inferior

L.R.S.= Límite real superior
L.A.S.= Límite aparente superior
EJERCICIO
Utilizando los datos de la distribución de frecuencias adjunta, Calcular:
a) Los límites reales de cada clase.
b) Las marcas de clase.
Los Datos
Procedencia, ordenación y recuento de casos
Los datos se obtienen generalmente de observaciones empíricas (experiencias) otras veces
existe una fuente que ya ha recogido la información, por ejemplo: el INE, la publicación de
otra institución, la Dirección de estadística, etc.
Por ejemplo, en la siguiente serie:
2, 6, 7, 4, 5, 7, 5, 9, 8, 7, 5, 1, 8, 4, 7, 7, 7, 6, 5, 4
Los datos estan desordenados, se hace necesario ordenarlos ascendentemente o
descendentemente. Los datos anteriores ordenados de manera ascendente quedan de la
forma siguiente:
1, 2, 4, 4, 4, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 9
El recuento de casos consiste en anotar cuantas veces aparece repetido cada valor.
1/1
2/1
4 /// 3
5 //// 4
6 // 2
7 //// / 6
8 // 2
9/1
Valores
Recuento
Suma
Ejercicio:
Dada la siguiente serie:
25, 30, 28, 27, 30, 37, 29, 31, 28, 38, 25, 28, 32, 38, 28, 30, 21, 21, 25, 31, 28, 25, 31, 29,
25
Se pide:
a) ordenar los datos.
b) Hacer el recuento de casos
La ordenación de los datos es imprescindible para el recuento de casos y cálculos
posteriores.
Construcción de una distribución de frecuencias para datos cuantitativos
Recopilación de datos
Ordenación de datos
Recuento de casos
Se construye una tabla de marcas en donde se anota cuantas veces aparece repetido cada
valor.
VALORES RECUENTO SUMA

23 // 2
24 // 2
25 //// 4
26 / 1
27 //// 5
28 //// 4
29 //// 5
30 //// / 6
33 //// 5
34 / 1
35 // 2
36 / 1
37 //// 4
38 /// 3
39 // 2
40 /// 3
Calculo del Rango (R), Número de Clases (K) y Amplitud de la clase (C)
De los datos ordenados se extraen el valor máximo y el mínimo
Rango (R)= 18
+1
+ (1)
+1 = 18
En el presente caso se utilizaran 6 clases por conveniencia de cálculo.
K = 6 clases
C = 18/6 = 3
C = 3 (Amplitud de clase)
O No existen reglas fijas para la determinación del número y amplitud de los intervalos, lo
aconsejable es seguir los siguientes pasos:
1. Determinar el Rango, recorrido o amplitud de la distribución (R).
2. Dividir el recorrido entre el número de intervalos (K) que se desee (el que más convenga
para el cálculo).
3. El cociente de la división anterior será la amplitud de los intervalos (C).
N = es el número total de datos.
En el ejemplo que estamos desarrollando utilizaremos Intervalos de clase
Semi abiertos por la derecha
Calcular las clases (K):
LS= 23 + 3 = 26
En el ejemplo se usará intervalo semiabierto por la derecha
El siguiente:
LI= 26 y C=3
LS= 26 + 3 = 29
[23-26)
[26-29) y así sucesivamente.

Calcular Marcas de Clase (XI)
23+25/2= 24
26+28/2= 27
29+31/2= 30
32+34/2= 33
35+37/2= 36
38+40/2= 39
Calcular frecuencia absoluta (fi)
VALORES RECUENTO SUMA
23 // 2
24 // 2
25 //// 4
26 / 1
27 //// 5
28 //// 4
29 //// 5
30 //// / 6
33 //// 5
34 / 1
35 // 2
36 / 1
37 //// 4
38 /// 3
39 // 2
40 /// 3
Los valores que se incluyen y que cuentan en cada intervalo del tipo [a-b) son los mayores
o iguales a
A y menores que b.
Como se están usando intervalos semi abiertos por la derecha [a-b) los valores de
B no se cuentan en dicho intervalo
10
11
[a, b) = {x / a < x < b}
Calcular Frecuencia relativa (fri)
N= 50 datos
Al multiplicar la frecuencia relativa por 100 se obtiene el valor del porcentaje de cada clase
(K), muy útil para la elaboración de gráficas.
fri = fi/N
Calcular Frecuencia Acumulada (FI)
La última frecuencia acumulada es igual a N (total de casos o suma de las frecuencias
absolutas). Esto puede servir para comprobar si la acumulación se hizo bien.
La lectura de las frecuencias acumuladas se hace así:
" tantos casos hasta tal valor"
Por ejemplo: Vemos en la columna FI que hay 29 casos hasta el valor 32, que es el límite
superior del intervalo [29-32).
10
Calcular la Frecuencia relativa acumulada (FRI)
FRI = FI/N
N= 50 datos
Al multiplicar la frecuencia relativa acumulada por 100 se obtiene el valor del porcentaje
acumulado de cada clase (K).
Las frecuencias relativas acumuladas (FRI), en proporción o porcentaje, indican la
proporción o el porcentaje acumulado de los valores de la variable, con respecto al total de
casos, ubicados por arriba o por abajo de cada clase (K) .
A las frecuencias acumuladas expresadas en porcentajes se les llama RANGOS
PERCENTILES. dividiendo
A esta tabla se pueden agregar las columnas de: Porcentaje fri x 100, y Porcentaje
acumulado
FRI X 100
Una tabla de Clasificación o Distribución de frecuencias permite mostrar como se clasifican
los sujetos pertenecientes a una muestra o población de acuerdo a las modalidades,
categorías o valores de una sola variable.

1.2.1 DISTRIBUCIÓN DE FRECUENCIAS
Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la
variable por filas. En las columnas se dispone el número de ocurrencias por cada valor,
porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de
la información que contienen los datos.
Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de la
exhibición de imágenes violentas por televisión, para lo cual han recogido los siguientes
datos:
La inspección de los datos originales no permite responder fácilmente a cuestiones como
cuál es la actitud mayoritaria del grupo, y resulta bastante más difícil determinar la
magnitud de la diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable
acompañados del número de veces (la frecuencia) que aparece cada valor:
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).

La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria
de los individuos del grupo estudiado es indiferente.
La interpretación de los datos ha sido facilitada porque se ha reducido el número de
números a examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la
variable y 5 frecuencias).
Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el
número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o "pi"),
frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de los valores
iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No obstante la frecuencia
acumulada también es definida incluyendo al valor de referencia), frecuencias acumuladas
relativas (la frecuencia acumulada relativa es el total de frecuencias relativas de los valores
iguales o inferiores al de referencia, y se simbolizan "fr" o "pa")
Ejemplo: Consideremos el siguiente grupo de datos:
La distribución de freciemcias es:

La reducción de datos mediante el agrupamiento en frecuencias no facilita su
interpretación: La tabla es demasiado grande. Para reducir el tamaño de la tabla agrupamos
los valores en intervalos, y las frecuencias son las de los conjuntos de valores incluidos en
los intervalos:
Ahora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar inmediatamente
que el intervalo con mayor número de datos es el 34-39, o que el 75% de los datos tiene
valor inferior a 46.
Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".
Elementos básicos de las tablas de intervalos:
 Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en
una distribución de frecuencias
 Límites aparentes: Valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisión del instrumento de medida. En el ejemplo, los
límites aparentes del intervalo con mayor número de frecuencias son 34 y 39.
 Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se
contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos
límites son 33.5 y 39.5
 Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido por
dos. Mc del intervalo del ejemplo= 36.5
 Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto
inferior. En el ejemplo es igual a 6.

1.2.2 PRESENTACIÓN GRÁFICA DE DATOS
Las tablas estadísticas representan toda la información de modo esquemático y están
preparadas para los cálculos posteriores. Los gráficos estadísticos nos transmiten esa
información de modo más expresivo, nos van a permitir, con un sólo golpe de vista,
entender de que se nos habla, observar sus caracteícticas más importantes, incluso sacar
alguna conclusión sobre el comportamiento de la muestra donde se esta realizando el
estudio.
Los gráficos estadísticos son muy útiles para comparar distintas tablas de frecuencia.
Los gráficos estadísticos más usuales son:
DIAGRAMA DE BARRAS.
Se utiliza para la representación de variables cuantitativas discretas, cada valor de la
variable se representa por un punto sobre el eje OX y sobre él se dibuja una barra de
longitud igual o proporcinal a su frecuencia absoluta. Si la frecuencia absoluta que se
utiliza es la acumulativa, el diagrama de barras que se obtiene es: diagrama de barras
acumulativo
HISTOGRAMA.
Se utiliza para la representación de variables cuantitativas continuas, cada intervalo se
representa sobre el eje OX , este será la base del rectángulo que se dibuja sobre él con
altura igual o proporcional a su frecuencia absoluta. Como los intervalos son consecutivos,
los rectángulos quedan adosados. Si se utilizarán rectángulos de amplitud diferente, el área
del rectángulo es la que tendría que ser proporcional a la frecuencia absoluta

correspondiente a ese intervalo. Histograma acumulativo, si se utiliza la frecuencia
absoluta acumulativa.
POLÍGONO DE FRECUENCIAS.
Se utilizan para variables estadísticas cuantitativas, discretas o continuas.
Para una variable discreta, el polígono de frecuencias se obtiene uniendo por una
poligonal, los extremos superiores de las barras.
Para una variable continua, el poligono de fecuencias se obtiene uniendo por una poligonal
los puntos medios de la base superior de los poligonos del histograma.
Las escalas utilizadas para representar los polígonos de frecuencias influyen mucho por el
impacto visual de los mismos.
DIAGRAMA DE SECTORES.
Se utiliza para todo tipo de variable estadística, cuantitativa o cualitativa. Consiste en
dibujar sectores sobre un círculo, siendo la amplitud de los sectores proporcional a su
frecuencia absoluta, cada sector se rellena con un color diferente.
El cálculo de la amplitud en grados sexagesimales del sector correspondiente se realiza
así: ángulo = frecuencia relativa*360
Ejemplo 2.- Hemos preguntado a 20 personas por el número medio de días que practican
deporte a la semana y hemos obtenido las siguientes respuestas:
Nº días (xi) fr. absoluta (ni)
0 1
1 2
2 4
3 7
4 1
5 1
6 3
7 1
Total 20
Realiza en tu cuaderno el diagrama de barras, el poligono de frecuencias y el diagrama de
sectores correspondiente, y comprueba en la escena los resultados.
Con el pulsador de "gráfico" puedes, al variar su valor, elegir diferente representación
gráfica: 1 para diagrama de barras, 2 para el polígono de frecuencia y 3 para el diaframa de
sectores.
Puedes cambiar los valores de las frecuencias absolutas y observar su imfluencia en el
correspondiente gráfico.
Ejemplo 3.- En un preconocimiento médico realizado a 30 niños, uno de los datos que se han
tomado ha sido el peso, en kilogramos, de cada uno, los resultados obtenidos se reflejan en la
siguiente tabla:
marca fr.
Intervalo clase absoluta
(xi) (ni)
[20 , 24) 22 3
[24 , 28) 26 6
[28 , 32) 30 10
[32 , 36) 34 8
[36 , 40) 38 3
Total 30
Realiza en tu cuaderno el Histograma, el poligono de frecuencias y el diagrama de sectores
correspondiente, y comprueba en la escena los resultados.
Con el pulsador de "gráfico" puedes, al variar su valor, elegir diferente representación
gráfica: 1 para Histograma, 2 para el polígono de frecuencia y 3 para el diaframa de sectores.
Puedes cambiar los valores de las frecuencias absolutas y observar su imfluencia en el
correspondiente gráfico.
Actividad 4.- Un aparato de radar instalado a la entrada de una población (velocidad máxima
permitida, 60Km./h) ha registrado la siguiente " estadística" de infracciones.
De más de 60 a 70 Km./h ................................... 30 vehículos
Entre 70 y 80 Km./h ........................................... 40 "
Entre 80 y 90 Km./h ........................................... 90 "
Entre 90 y 100 Km./h ........................................... 80 "
Entre 100 y 110 Km./h ........................................... 60 "
Entre 110 y 120 Km./h ........................................... 10 "

Dibuja un Histograma que refleje estos valores.
Actividad 5.- Utilizando la encuesta que has realizado en la actividad 2, construye la tabla de
frecuencias, para cada variable estadística que has considerado, y representa la
correspondiente tabla de frecuencias, en el gráfico más adecuado.

1.2.2.1 GRÁFICA DE BARRAS
Una gráfica de barras tiene barras rectangulares con longitudes proporcionales a los valores
que representan. Las gráficas de barras se utilizan para comparar dos o más valores. Las
barras pueden ser horizontales o verticales.
Antes de empezar
Para poder definir gráficas, primero debe asegurarse de que el entorno de Decision Server
Events esté preparado para la supervisión. Consulte Preparación del entorno para la
supervisión.
Procedimiento
1. Acceda al widget de gestor de gráficas de sucesos (consulte Acceso a los Widgets
de sucesos para obtener más información).
2. Pulse Añadir gráfica. En el campo Nombre de gráfica, escriba un nombre para la
gráfica.
3. Pulse Seleccionar tipo de gráfica y seleccione Barra horizontal o Barra vertical.
4. Especifique el texto que se va a mostrar debajo de la gráfica en el campo Etiqueta
de eje X. Especifique el texto que se va a mostrar a la izquierda de la gráfica en el
campo Etiqueta de eje Y. Si no se especifica ningún valor, no se mostrará ninguna
etiqueta.
5. En el separador Variables en la gráfica, seleccione las variables que se van a incluir
en la gráfica. Consulte Adición o eliminación de variables de gráficas.
6. En el separador Rango de tiempo, defina el rango de historial en los campos Hora
de inicio y Hora de finalización. Para obtener información más detallada sobre la
definición del rango de tiempo, consulte Modificación de los valores de intervalo de
tiempo de una gráfica.

7. Pulse Guardar cambios para guardar la gráfica.
Ejemplo
Tabla 1. Ejemplos de una gráfica de barras horizontales y verticales
1.2.2.2 GRÁFICA DE PASTEL
Gráfico sobre la población mundial.
Gráfico de la población de hablantes del idioma inglés.

Primer gráfico circular conocido de la obra de William Playfair Breviario Estadístico
(1801), mostrando las proporciones del Imperio turco localizado en Asia, Europa y África,
antes de 1789.
Un gráfico circular o gráfica circular, también llamado "gráfico de pastel", "gráfico de
tarta", "gráfico de torta" o "gráfica de 360 grados", es un recurso estadístico que se utiliza
para representar porcentajes y proporciones. El número de elementos comparados dentro de
una gráfica circular suele ser de más de cuatro.
El gráfico circular más temprano conocido se atribuye generalmente al escocés William
Playfair, en la obra Statistical Breviary de 1801.12
Características
Se utilizan en aquellos casos donde interesa no solamente mostrar el número de veces que
se dan una característica o atributo de manera tabular sino más bien de manera gráfica, de
tal manera que se pueda visualizar mejor la proporción en que aparece esa característica
respecto del total.
A pesar de su popularidad, se trata de un tipo de gráfico poco recomendable debido a que
nuestra capacidad perceptual para estimar relaciones de proporción o diferencias entre áreas
de sectores circulares es mucho menor que, por ejemplo, entre longitudes o posiciones, tal y
como sucede en otras gráficas.

1.2.2.3 HISTOGRAMA
En estadística, un histograma es una representación gráfica de una variable en forma de
barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. Sirven para obtener una "primera vista" general, o panorama, de la
distribución de la población, o de la muestra, respecto a una característica, cuantitativa y
continua (como la longitud o el peso). De esta manera ofrece una visión de grupo
permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por
ubicarse hacia una determinada región de valores dentro del espectro de valores posibles
(sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar
comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los
valores de todas las partes que componen la población o la muestra, o, en contraposición,
poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que
toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada
miembro de la población toma por su lado y adquiere un valor de la característica
aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.
En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la
muestra, según sea el caso, que se ubica en un determinado valor o sub-rango de valores de
la característica que toma la característica de interés, evidentemente, cuando este espectro

de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la
tendencia o comportamiento de la población, en otras ocasiones este espectro es extendido
para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de
un valor de interés.
Se utilizan para relacionar variables cuantitativas continuas. Para variables cuantitativas
discretas las barras se dibujan separadas y el gráfico se llama diagrama de frecuencias,
porque la variable representada en el eje horizontal ya no representa un espectro continuo
de valores, sino valores cuantitativos específicos, igual que ocurre en un diagrama de
barras, usado para representar una característica cualitativa o categórica. Su utilidad se hace
más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han
agrupado en intervalos de clase.
Ejemplos de su uso es la representación de edades o estaturas de una población. Por
comodidad, sus valores se agrupan en clases, es decir, en intervalos continuos. En los casos
en los que los datos son cualitativos (no numéricos), como sexto grado de acuerdo o nivel
de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en
ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.
Etimología
El término "histograma" fue acuñado en 1891 por el matemático estadístico inglés Karl
Pearson y es un compuesto de los términos griegos ἱστός (‘histós’, “mástil”) y γράμμα
('gramma', "dibujo, figura")1
Tipos de gráficos relacionados con el histograma
 Histograma de frecuencias absolutas

Representa la frecuencia absoluta mediante la altura de las barras. Se usa mucho en
educación no universitaria por su sencillez, pero sólo se puede aplicar cuando todos
los intervalos son iguales, ya que en ese caso las alturas y las superficies son
proporcionales. En esos niveles educativos se introduce una estadística elemental y
todavía no se puede profundizar en estos detalles.
 Histograma de frecuencias relativas
Representa la frecuencia relativa mediante la altura de las barras. Igual que en el
caso anterior se usa mucho en educación no universitaria. La elaboración del gráfico
es más complicada pues los números ya no son enteros. Como en el caso anterior
sólo se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las
alturas y las superficies son proporcionales.
 Histograma
Representa la frecuencia relativa mediante la superficie de las barras. Aunque esto
sea cierto en todos los histogramas, cuando se agrupan los datos en intervalos
desiguales hay que atender a la superficie de las barras, que no se corresponderá con
la altura como ocurría en los casos anteriores. Es el que se suele usar en educación
universitaria. Para su elaboración debe introducirse el concepto de altura de
histograma, que es un concepto equivalente al de densidad de probabilidad, y que se
calcula dividiendo la frecuencia relativa de ese intervalo (o sea la superficie que
queremos darle) entre la anchura del intervalo (la base del rectángulo). Ahora las
barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas
esas superficies (de todas las barras) será 1, o sea el 100%.
 Función densidad
Representa la probabilidad mediante la superficie de las barras. Es un gráfico
idéntico al histograma pero aplicado a distribuciones teóricas. El concepto de
frecuencia relativa se cambia por el de probabilidad, pero también se representa por
superficies y la suma de todas esas superficies (de todas las barras) será 1, como en
el histograma, o sea el 100% de probabilidad.
 Curva acumulativa u ojiva
Es un gráfico acumulativo (véase Función_de_distribución) que representa la
frecuencia relativa acumulada hasta cada valor de la variable. Si el rango es finito el
primer valor del rango tiene frecuencia acumulada (anterior) cero y el último tiene
frecuencia acumulada 1 (100%). Así el eje vertical siempre toma valores de cero a
uno y representa frecuencias relativas (o probabilidades si se trata de distribuciones
teóricas). Se utiliza para introducir el concepto y el cálculo de la mediana, los
cuartiles, los deciles y en general los parámetros llamados de posición. Si el rango
es infinito, como suele ocurrir en las distribuciones teóricas (Normal, student, chi-
cuadrado, etc,) el cero puede no alcanzarse y será el valor asintótico por la
izquierda, si tampoco se alcanza el uno también será el valor asintótico derecho, y
en muchos casos no se alcanza ni uno ni otro, teniendo dos asintotas. Este gráfico es
la integral del histograma (cuando trabajamos con distribuciones reales) o de la
función densidad (cuando trabajamos con distribuciones teóricas).
 Curva acumulativa de frecuencias absolutas
Es un gráfico acumulativo que representa la frecuencia absoluta acumulada hasta
cada valor de la variable. Realmente no es un gráfico relacionado con el histograma,
pero es muy parecido a la curva acumulativa y a la función de distribución. Se usa
mucho en enseñanza no universitaria por su sencillez, ya que permite trabajar con

números enteros (frecuencias absolutas) y, como la anterior, permite introducir y
calcular mediana, cuartiles, etc. Esta curva no irá entre cero y uno sino entre cero y
el total de individuos de la muestra.
 Nota
En todos estos diagramas la muestra o la población se divide en intervalos (del
parámetro a estudiar, por ejemplo estatura) y aparece el dilema de si incluir el
extremo del intervalo (por ejemplo 180 cm) en el primer o en el segundo intervalo
en los que aparece. Tradicionalmente se incluye en el segundo y los intervalos
quedan abiertos por la derecha: [170, 180) y [180,190). Sin embargo, dependiendo
del problema a estudiar (problemas en que los extremos salen con mucha frecuencia
frente a otros en que no salen nunca) y de la costumbre, se pueden encontrar otras
elecciones.
3ra. Semana:
1.2.2.4 POLÍGONO DE FRECUENCIAS
Polígono de frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de
un histograma de frecuencia. Estos histogramas emplean columnas verticales para reflejar
frecuencias): el polígono de frecuencia es realizado uniendo los puntos de mayor altura de
estas columnas.
Es decir, por tanto, podríamos establecer que un polígono de frecuencia es aquel que se
forma a partir de la unión de los distintos puntos medios de las cimas de las columnas que
configuran lo que es un histograma de frecuencia. Este se caracteriza porque utiliza siempre
lo que son columnas de tipo vertical y porque nunca debe haber espacios entre lo que son
unas y otras.
En las ciencias sociales, en las ciencias naturales y también en las económicas es donde con
más frecuencia se hace uso de estos mencionados histogramas ya que se emplean para
llevar a cabo lo que es la comparación de los resultados de un proceso determinado.
Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se desarrollan
mediante la marca de clase que tiene coincidencia con el punto medio de las distintas
columnas del histograma. En el momento de la representación de todas las frecuencias que
forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias
acumuladas que posibilita la diagramación del polígono correspondiente.
Un polígono de frecuencia, por ejemplo, permite reflejar las temperaturas máximas
promedio de una ciudad en un determinado periodo temporal. En el eje X (horizontal),
deben indicarse los meses del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical),
en cambio, se registran las temperaturas más altas promedio de cada mes (28º, 26º, 22º…).
El polígono de frecuencia se creará al unir, mediante un segmento, las diversas
temperaturas más elevadas promedio.
Los polígonos de frecuencia se suelen usar cuando se pretende retratar varias distribuciones
distintas o la clasificación cruzada de una variable cuantitativa continua con una cualitativa
o cuantitativa discreta en el mismo dibujo.
El punto de más altura de un polígono de frecuencia equivale a la mayor frecuencia,
mientras que el área que se sitúa debajo de la curva incluye todos los datos que existen.
Cabe recordar que la frecuencia es la repetición mayor o menor de un evento, o el número
de veces que un acontecimiento periódico se reitera en una unidad temporal.
Dado el valor y la utilidad que tienen los citados polígonos hay que resaltar que estos se
pueden confeccionar de una manera muy sencilla y rápida. En concreto, se da la
oportunidad de acometerlos mediante un programa informático que se ha convertido en uno
de los ejes claves del funcionamiento de cualquier empresa. Nos estamos refiriendo al
software conocido como Excel.
Este es un programa, de Microsoft Office, que se confeccionó con el claro objetivo de que
sus usuarios pudieran trabajar con lo que son hojas de cálculo. Por tal motivo, es lógico que
también permita la posibilidad de crear polígonos de frecuencia a la hora de comparar cifras
y tomar decisiones en base a las mismas.

1.2.2.5 OJIVA
En estadística la ojiva es un polígono frecuencial acumulado, es decir, que permite ver
cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de
solo exhibir los números asignados a cada intervalo.
La ojiva apropiada para información que presente frecuencias mayores que el dato que se
está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la
que se asigna a valores menores, tendrá una pendiente positiva.
Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar
parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas,
existen las ojivas "mayor que" y las ojivas "menor que".
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por
esto la aplicación de la técnica es parcial):
 Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor que"
sucede con el extremo izquierdo; para la ojiva "menor que", con el derecho.
 En el eje horizontal, en lugar de colocar las marcas de clase, se colocan las fronteras
de clase. Para el caso de la ojiva "mayor que" es la frontera menor; para la ojiva
menor que, la mayor.
La ojiva "mayor que" se le denomina de esta manera porque viendo el aspire que está sobre
el límite superior se ven las frecuencias que tienen por encima de ese límite superior. De
forma análoga, en la ojiva "menor que" la frecuencia que se representa en cada frontera de
clase son el número de observaciones menores que la frontera señalada (en caso de tiempos
sería el número de observaciones antes de la hora que señala la frontera).

1.2.2.6 GRÁFICAS LINEALES
El gráfico lineal (gráfico de líneas o diagrama lineal) se compone de una serie de datos
representados por puntos, unidos por segmentos lineales. Mediante este gráfico se puede
comprobar rápidamente el cambio de tendencia de los datos.
El diagrama lineal se suele utilizar con variables cuantitativas, para ver su
comportamiento en el transcurso del tiempo. Por ejemplo, en las series temporales
mensuales, anuales, trimestrales, etc.
Los pasos para construir el gráfico de líneas son los siguientes:
 En el eje horizontal (eje de abcisas) se colocan los períodos de tiempo (meses,
años, trimestres,…)
 En el eje vertical (eje de coordenadas) se colocan las frecuencias absolutas o
relativas.
 Se señalan los puntos. A cada período de tiempo le corresponde un punto en el
valor de su frecuencia.
 Se unen mediante segmentos lineales los puntos consecutivos.

 Se quiere comparar la deuda pública en el año 2012 de ocho paises: España,
México, Ecuador, Guatemala, Estados Unidos, Colombia, Perú y Argentina. Para
ello, se obtienen los datos de la deuda pública de los paises y se divide por el PIB
(Producto Interior Bruto) de cada uno de ellos. Los porcentajes de deuda respecto
PIB son los siguientes:
 A partir de estos datos, se construye el gráfico lineal.

1.2.2.7 Gráficas de puntos
Los gráficos de puntos son útiles para mostrar datos cuantitativos de una forma organizada.
Los gráficos de puntos usan varios puntos para trazar datos a lo largo de un eje ordinal. Un
gráfico de puntos es similar a un gráfico de líneas, pero sin las líneas. Solamente se
muestran los puntos de datos.
En el ejemplo siguiente se muestran los ingresos de cada línea de producto.
Figura 1. Ejemplo de gráfico de puntos

4ta. Semana:
1.3 Análisis descriptivo de datos de una sola variable
1.3.1 Medidas de tendencia central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son:
media, mediana y moda. Las medidas de dispersión en cambio miden el grado de
dispersión de los valores de la variable. Dicho en otros términos las medidas de dispersión
pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de
medidas usadas en conjunto permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo
de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una
tabla estadística diremos que se encuentran “agrupados” y si los datos no están en una tabla
hablaremos de datos “no agrupados”.
Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no
agrupados y luego para datos agrupados.
Medidas estadísticas en datos no agrupado

Medidas de tendencia central
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o promedio
aritmético. Se representa por la letra griega µ cuando se trata del promedio del universo o
población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es
importante destacar que µ es una cantidad fija mientras que el promedio de la muestra es
variable puesto que diferentes muestras extraídas de la misma población tienden a tener
diferentes medias. La media se expresa en la misma unidad que los datos originales:
centímetros, horas, gramos, etc.
Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:

Estos cálculos se pueden simbolizar:
Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda
observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor
de la i-ésima observación. En este caso el promedio está dado por
De aquí se desprende la fórmula definitiva del promedio:
Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del
dato y la media:
Ejemplo de desviaciones:
Una propiedad interesante de la media aritmética es que la suma de las desviaciones es
cero.
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que
ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el
50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene
valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al promedio de los dos

valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Moda
La moda de una distribución se define como el valor de la variable que más se repite. En un
polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto
más alto del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la
variable.
La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz cuadrada, la
desviación estándar. La varianza se representa con el símbolo σ² (sigma cuadrado) para el
universo o población y con el símbolo s2 (s cuadrado), cuando se trata de la muestra. La
desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma)
cuando pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ
son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores
que cambian de muestra en muestra dentro de una misma población. La varianza se expresa
en unidades de variable al cuadrado y la desviación estándar simplemente en unidades de
variable.
Fórmulas
Donde µ es el promedio de la población.
Donde Ȳ es el promedio de la muestra.
Consideremos a modo de ejemplo una muestra de 4 observaciones

Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas de
dispersión:
s2 = 34 / 3 = 11,33 Varianza de la muestra
La desviación estándar de la muestra (s) será la raíz cuadrada de 11,33 = 3,4.
Interpretación de la varianza (válida también para la desviación estándar): un alto valor de

la varianza indica que los datos están alejados del promedio. Es difícil hacer una
interpretación de la varianza teniendo un solo valor de ella. La situación es más clara si se
comparan las varianzas de dos muestras, por ejemplo varianza de la muestra igual 18 y
varianza de la muestra b igual 25. En este caso diremos que los datos de la muestra b tienen
mayor dispersión que los datos de la muestra a. esto significa que en la muestra a los datos
están más cerca del promedio y en cambio en la muestra b los datos están más alejados del
promedio.
Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar
de la muestra expresada como porcentaje de la media muestral.
Es de particular utilidad para comparar la dispersión entre variables con distintas unidades
de medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar,
es independiente de la unidad de medida de la variable de estudio.
Medidas de tendencia central y de dispersión en datos agrupados
Se identifica como datos agrupados a los datos dispuestos en una distribución de
frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, modo, varianza
y desviación estándar deben incluir una leve modificación. A continuación se entregan los
detalles para cada una de las medidas.
Promedio en datos agrupados

La fórmula es la siguiente:
Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores
de Yi.
Consideremos como ejemplo una distribución de frecuencia de madres que asisten a un
programa de lactancia materna, clasificadas según el número de partos. Por tratarse de una
variable en escala discreta, las clases o categorías asumen sólo ciertos valores: 1, 2, 3, 4, 5.
Entonces las 42 madres han tenido, en promedio, 2,78 partos.
Si la variable de interés es de tipo continuo será necesario determinar, para cada intervalo,
un valor medio que lo represente. Este valor se llama marca de clase (Yc) y se calcula
dividiendo por 2 la suma de los límites reales del intervalo de clase. De ahí en adelante se
procede del mismo modo que en el ejercicio anterior, reemplazando, en la formula de
promedio, Yi por Yc.
Mediana en datos agrupados

Si la variable es de tipo discreto la mediana será el valor de la variable que corresponda a la
frecuencia acumulada que supere inmediatamente a n/2. En los datos de la tabla 1 Me=3, ya
que 42/2 es igual a 21 y la frecuencia acumulada que supera inmediatamente a 21 es 33,
que corresponde a un valor de variable (Yi) igual a 3.
Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia acumulada

que supere en forma inmediata a n/2, y luego aplicar la siguiente fórmula:
Donde:
Moda en datos agrupados

Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi) que tenga
la mayor frecuencia absoluta ( ). En los datos de la tabla 1 el valor de la moda es 3 ya que
este valor de variable corresponde a la mayor frecuencia absoluta =16.
Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza y
desviación estándar en datos agrupados con intervalos.
Varianza en datos agrupados

Para el cálculo de varianza en datos agrupados se utiliza la fórmula
Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78 partos por
madre,
Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca de clase
(Yc), de tal modo que la fórmula queda:
Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo
Yc= (Límite inferior del intervalo + limite superior del intervalo)/2.

Percentiles
Los percentiles son valores de la variable que dividen la distribución en 100 partes iguales.
De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa que el 80% de
los casos tiene edad igual o inferior a 35 años.
Su procedimiento de cálculo es relativamente simple en datos agrupados sin intervalos.
Retomemos el ejemplo de la variable número de partos:

El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada
supera inmediatamente al “j” % de los casos (jxn/100).
El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).
El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el valor 4.
Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que un
80% de las madres estudiadas han tenido 4 partos o menos.
Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente más
complejo ya que se hace necesaria la aplicación de una fórmula.
Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente
superior al “j” % de los casos (jxn/100).
En la siguiente tabla se muestra la distribución de 40 familias según su ingreso mensual en

miles de pesos. Nótese que para calcular el centro de clase se usaron los límites reales de
cada intervalo.
1.3.1.1 MEDIA ARITMÉTICA
La media aritmética es la suma de todos los datos dividida entre el número total de datos.
Se calculan dependiendo de cómo vengan ordenados los datos.
Ejemplo:
¿Cuál es la media de las edades de Andrea y sus primos?
La media aritmética de un grupo de datos se calcula así:
Se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos productos, y
el resultado dividirlo por la suma de los datos.
Ejemplo:
Se ha anotado el número de hermanos que tiene un grupo de amigos. Los datos obtenidos
son los siguientes:
Hermanos: 1, 1, 1, 1, 2, 2, 2, 3, 3, 4
Si hacemos el recuento de los datos y seguimos los pasos anteriormente descritos,
tenemos:
2- Moda
La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel que
tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos valores de la
variable que tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún
valor, no existe moda.
- Ejemplo1:
¿Cuál es el dato que más se repite en el ejemplo anterior?
El dato que más se repite es el 1, es el que tiene mayor frecuencia absoluta (4 veces).
La moda del número de hermanos es 1
- Ejemplo 2:
2, 3, 4, 5 , 6 , 9
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto
de valores no tiene moda.
- Ejemplo 3:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es
la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

- Ejemplo 4:
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio
de las dos puntuaciones adyacentes.
3- La mediana
La mediana es el valor que ocupa el lugar central entre todos los valores del conjunto de
datos, cuando estos están ordenados en forma creciente o decreciente.
La mediana se representa por Me.
Calculo de la mediana:
1° Ordenamos los datos de menor a mayor.
- La mediana de un conjunto con un número impar de datos es, una vez ordenados los
datos, el dato que ocupa el lugar central.
Ejemplo:
Calcular la mediana del conjunto de datos:
- También podemos usar la siguiente fórmula para determinar la posición del dato central:
(n + 1) /2 = mediana datos impares.

- La mediana de un conjunto con un número par de datos es, una vez ordenados, la
media de los dos datos centrales.
Ejemplo:
Calcular la mediana del conjunto de datos:
4- Rango
El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato
menor al dato mayor.
Este dato permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango,
más dispersos están los datos de un conjunto.
Ejemplo:
Se preguntó a 9 familias cuántas bicicletas tenían en total, dieron las respuestas ordenadas
en la siguiente tabla:
- ¿Cómo hallarías el rango?
Se resta el dato mayor al dato menor: 3 - 0 = 3; Por lo tanto el rango sería 3 en este caso.
Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango es muy
amplio, es conveniente agruparlos y ordenarlos en intervalos o clases.
La amplitud o tamaño de cada intervalo se puede calcular dividiendo el valor del rango
por la cantidad de intervalos que se desean obtener.
4- Ejercicios:
1- Se le pregunta a un grupo de personas acerca de la cantidad de libros que leyó durante el
año 2015, y las respuestas son: 4; 3; 2; 7; 10; 8; 2; 9; 3; 6; 8; 1; 1; 9; 2. La moda de la
muestra es:
a) 2 b) 3 c) 4 d) 5 e) 9
2- Halla la mediana de las siguientes series estadísticas.
a) 1, 7, 3, 2, 4, 6, 2, 5, 6
b) 4, 2, 1, 3, 8, 5, 3, 1, 6, 7
3- Se tienen dos distribuciones cuyos datos son los siguientes:
Distribución A: 9, 5, 3, 2, 1, 2, 6, 4, 9, 8, 1, 3, 5, 4, 2, 6, 3, 2, 5, 6, 7
Distribución B: 1, 1, 3, 2, 5, 6, 7, 2, 5, 4, 3, 1, 2, 1, 5, 7, 8, 9, 9, 2, 1
a) Halla el rango de ambas distribuciones.
4- Se tiene el siguiente conjunto de datos:
10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
a) Obtén la mediana
Respuestas:
1- a
2- a) 1, 2, 2, 3, 4, 5, 6, 6, 7 M=4
b) 1, 1, 2, 3, 3, 4, 5, 6, 7, 8; La mediana es la media aritmética de los dos valores centrales,
M = 3,5.
3- Rango de A: 9 - 1 = 8
Rango de B: 9 - 1 = 8
4- a) Ordenamos los datos de menor a mayor:
3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20
Como hay 26 valores, la mediana es la media de los dos valores centrales: M= 10 + 10 / 2
= 10
1.3.1.2 MEDIA PONDERADA
La media ponderada (MP) es una medida de centralización. Consiste en otorgar a cada
observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la
importancia de cada elemento.
Cuanto más grande sea el peso de un elemento, más importante se considera que es éste.
La media ponderada tiene numerosas aplicaciones, por ejemplo, la nota de una
asignatura donde el examen final tiene un peso mayor al de un trabajo. O en el cálculo del
IPC (Índice de Precios de Consumo). El IPC es un indicador de los precios de los bienes y
servicios básicos que consume la población. Para calcularlo, se otorga pesos a los diferentes
bienes (pan, fruta, vivienda,…) y se calcula la media ponderada.
La media aritmética es un caso particular de media ponderada, en la que todos los pesos
son uno, ya que a todos los elementos se les otorga la misma importancia.
Ejercicio
La nota final de una asignatura es una media ponderada de las notas que han obtenido los
alumnos en los cuatro elementos evaluables que determina el profesor. El responsable de la
asignatura otorga un peso de 3 al examen inicial, de 1 al trabajo entregable, 2 al trabajo
final y 4 al examen final. Las notas de un alumno han sido las siguientes:
Se hace la suma de los productos de las notas por el peso de cada nota y se divide por la
suma de los pesos.
La nota final del alumno en esta asignatura es de 6,14. Se puede ver en el siguiente gráfico
como la nota es muy próxima a las notas sacadas en los exámenes. Esto es a causa de que
los exámenes eran más importantes y tenían unos pesos mucho mayores que los de los
trabajos.
1.3.1.3 MEDIA GEOMÉTRICA
La media geométrica (MG) de un conjunto de números estrictamente positivos (X1,
X2,…,XN) es la raíz N-ésima del producto de los N elementos.
Todos los elementos del conjunto tienen que ser mayores que cero. Si algún elemento fuese
cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores estuviesen alejados del
cero.
La media geométrica es útil para calcular medias de porcentajes, tantos por uno,
puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a los
valores extremos.
Ejercicios
Ejercicio 1
En una empresa quieren saber la proporción media de mujeres en los diferentes
departamentos. Para ello, se recoge el porcentaje de mujeres en los cinco principales
departamentos.
Como es la media de porcentajes, calculamos la media geométrica que es más
representativa.
Ejercicio 2
Una aldea sufre un proceso rápido de envejecimiento. El primer año aumentan los mayores
de 65 años un 10%, el segundo año, un 20%, el tercer año un 30% y el cuarto año, un 40%.
Si la población de inicial es de 100 mayores de 65 años, ¿cuál será un mejor indicador para
caracterizar ese envejecimiento: la media aritmética o la media geométrica?

Solución:
Sabemos que para llegar a la cifra final al cabo de los cuatro años, debemos acumular
sucesivamente los porcentajes anuales:
Tras el cuarto año, en la aldea hay 240 personas con más de 65 años.
Si calculamos la media aritmética de los porcentajes de incremento anual, obtendremos:
Si esta media aritmética la acumulamos a los cuatro años:
El resultado obtenido excede a la realidad.
Pero si hubiésemos empleado la media geométrica de los incrementos anuales:
Llegamos a un porcentaje anual obtenido con la media geométrica del 24,02%.
Calculamos la población final a partir de este último indicador, acumulándolo a los cuatro
años.
Obtenemos el resultado final exacto. Por lo que resulta más representativa, trabajando con
porcentajes, la media geométrica que la aritmética:
Relación entre medias
Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye la
media ponderada porque depende de los pesos. Sean:
 H la media armónica
 MG la media geométrica
 x la media aritmética
 RMS la media cuadrática
Entonces:
En esta relación, solamente se cumple la igualdad cuando todos los datos sean iguales, es
decir si: x1 = x2 = x3 = … = xN.
Se da la siguiente relación, en el caso de distribuciones de solamente dos datos, sean estos
los que sean:
Cuando en la distribución hay solamente dos datos, la media geométrica es la media
geométrica entre la media aritmética y la media armónica.
Esta relación se convierte en una aproximación, cuando, habiendo múltiples valores, estos
están muy agrupados en torno a la media.

5ta. Semana:
1.3.1.4 MEDIANA
La mediana de un conjunto de datos
La mediana de un conjunto de números es el número medio en el conjunto (después que los
números han sido arreglados del menor al mayor) -- o, si hay un número par de datos, la
mediana es el promedio de los dos números medios.
Ejemplo 1 :
Encuentre la mediana del conjunto {2, 5, 8, 11, 16, 21, 30}.
Hay 7 números en el conjunto, y estos están acomodados en orden ascendente. El número
medio (el cuarto en la lista) es 11. Así, la mediana es 11.
Ejemplo 2 :
Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.
Primero, arregle los números en orden ascendente.
{3, 5, 8, 10, 24, 36, 79, 255}
Hay 8 números en el conjunto -- un número par. Así, encuentre el promedio de los dos
números medios, 10 y 24.
(10 + 24)/2 = 34/2 = 17
Así, la mediana es 17.
1.3.1.5 MODA
La moda de un conjunto de datos
La moda de un conjunto de números es el número que aparece más a menudo.
Ejemplo 1 :
Encuentre la moda del conjunto {2, 3, 5, 5, 7, 9, 9, 9, 10, 12}.
El 2, 3, 7, 10 y 12 aparecen una vez cada uno.

El 5 aparece dos veces y el 9 aparece tres veces.
Así, el 9 es la moda.
Ejemplo 2 :
Encuentre la moda del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.
En este caso, hay dos modas -- el 5 y el 8 ambos aparecen dos veces, mientras que los otros
números solo aparecen una vez.

https://www.sangakoo.com/es/temas/conceptos-basicos-estadisticos
https://www.monografias.com/trabajos89/estadistica-clasificacion/estadistica-
clasificacion.shtml
https://www.tiposde.org/general/35-tipos-de-variables/
http://www.eumed.net/libros-gratis/2006c/203/1v.htm
http://www.fao.org/docrep/005/x2465s/x2465s08.htm
https://prezi.com/oenoqibrflcn/presentacion-de-datos-de-una-sola-variable/
https://www.uv.es/webgid/Descriptiva/3_distribucin_de_frecuencias.html
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Estadistica_3eso/grafic
os_estadisticos_mgc.html
https://www.ibm.com/support/knowledgecenter/es/SSQP76_8.5.1/com.ibm.odm.dcenter.bu
.events/charts_topics/tsk_dse_barchart.html
https://es.wikipedia.org/wiki/Gráfico_circular
https://es.wikipedia.org/wiki/Histograma
https://definicion.de/poligono-de-frecuencia/
https://es.wikipedia.org/wiki/Ojiva_(estad%C3%ADstica)
https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
http://www.universoformulas.com/estadistica/descriptiva/media-ponderada/
http://www.universoformulas.com/estadistica/descriptiva/media-geometrica/
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/mean-median-mode

Estadística Descriptiva

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Estadística Descriptiva

Încărcat de

Drepturi de autor:

Formate disponibile

Semanas 1 - 6

1.1 INTRODUCCIÓN A LA ESTADÍSTICA

personas, de infraestructura, de recursos en general, para poder obtener conclusiones de

Actualmente la estadística es una ciencia. No es ya una cuestión reservada al estado.

y tomar decisiones razonables basadas en tal análisis.

La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos,

ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o

irregulares de algún fenómeno o estudio aplicado, de ocurrencia en

visualización y resumen de datos originados a partir de los fenómenos de estudio.

Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos

de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos

gráficos son: histograma, pirámide poblacional, clústers, entre otros.

 La estadística inferencial, se dedica a la generación de los modelos, inferencias y

predicciones asociadas a los fenómenos en cuestión teniendo en cuenta

la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y

extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden

tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones

de características numéricas (estimación),pronósticos de futuras observaciones,

descripciones de asociación (correlación) o modelamiento de relaciones entre

variables (análisis de regresión). Otras técnicas

de modelamiento incluyen anova, series de tiempo y minería de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay también

una disciplina llamadaestadística matemática, a la que se refiere a las bases teóricas de la

materia. La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo

estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas

criminales, entre otros.

Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para

organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la

tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas

contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis

de resultados en deportes; administradores de instituciones; en la educación; organismos

políticos; médicos; y por otras personas que intervienen en la toma de decisiones.

En estadística es el nombre especifico que recibe particularmente en la investigación social

determinación del conjunto de unidades de observaciones del conjunto de unidades de

población son sinónima. En general, el universo es la totalidad de elementos o

características que conforman el ámbito de un estudio o investigación.

Es la recolección completa de todas las observaciones de interés para el observador.

Es un conjunto completo de individuos, objetos o medidas que tienen una característica

La población es el conjunto de todos los individuos cuyo conocimiento es objeto de interés

comercios de una cierta ciudad, cada comercio es un individuo, y la población -también

llamada universo- es el conjunto de todos los comercios de la ciudad.

El estudio estadístico de una población se puede realizar mediante un análisis exhaustivo de

partir de una muestra extraída de la población (estadística inferencial).

representarla". Murria R. Spiegel (1991).

características de toda la población.

En los estudios estadísticos, en vez de analizar la totalidad de la población o universo, se

Una muestra se puede definir como un conjunto de observaciones individuales

seleccionadas por un procedimiento específico. Ejemplo, el peso de un ratón a través de un

todos los datos de que disponemos.

con otras distribuciones.

Esa es la razón de ser de los parámetros estadísticos, el resumir en un número un aspecto

aspecto con otras.

están: la desviación media, la desviación mediana, la varianza, la desviación típica o

estándar, la dispersión absoluta y relativa.

de los datos 3, 5, 5, 3, 7, 2, 4, 1 contiene 8 elementos. Una muestra es un subconjunto de

manejo de los datos. Una muestra es representativa de la población si al escogerla cada

elemento tiene la misma probabilidad de salir o de ser escogido.

Cualquier característica de una persona, medio ambiente o situación experimental que

pueda variar de persona a persona, de un medio ambiente a otro o de una situación

diferentes al observar distintos individuos.

Es una característica de la población que se esta analizando en un estudio estadístico.

de algún modo verificable. Ejemplo: la longitud, el peso, la altura.

- Variable Independiente: es aquella característica o propiedad que se supone ser la causa

del fenómeno estudiado. En investigación experimental se llama así, a la variable que el