Sunteți pe pagina 1din 90

Semanas 1 - 6

1ra. Semana:

1. Estadística Descriptiva

1.1 INTRODUCCIÓN A LA ESTADÍSTICA

El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario

para sus intereses cuantificar conceptos. En la mayoría de los casos esta cuantificación se

hará en función de unos fines económicos o militares. El estado quiere conocer censo de

personas, de infraestructura, de recursos en general, para poder obtener conclusiones de

esta información.

Actualmente la estadística es una ciencia. No es ya una cuestión reservada al estado.

Podríamos decir que se encuentra en la totalidad del resto de ciencias. La razón es clara:

por una parte la estadística proporciona técnicas precisas para obtener información,

(recogida y descripción de datos) y por otra parte proporciona métodos para el análisis de

esta información.

Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para

recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas

y tomar decisiones razonables basadas en tal análisis.

La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos,

ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o

irregulares de algún fenómeno o estudio aplicado, de ocurrencia en

forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es

el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.

Clasificación de la estadística
 La estadística descriptiva, se dedica a los métodos de recolección, descripción,

visualización y resumen de datos originados a partir de los fenómenos de estudio.

Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos

de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos

gráficos son: histograma, pirámide poblacional, clústers, entre otros.

 La estadística inferencial, se dedica a la generación de los modelos, inferencias y

predicciones asociadas a los fenómenos en cuestión teniendo en cuenta

la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y

extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden

tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones

de características numéricas (estimación),pronósticos de futuras observaciones,

descripciones de asociación (correlación) o modelamiento de relaciones entre

variables (análisis de regresión). Otras técnicas

de modelamiento incluyen anova, series de tiempo y minería de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada. Hay también

una disciplina llamadaestadística matemática, a la que se refiere a las bases teóricas de la

materia. La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo

estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas

criminales, entre otros.

Utilidad e importancia

Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para

organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la

tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas

descriptivas.
Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia,

contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis

de resultados en deportes; administradores de instituciones; en la educación; organismos

políticos; médicos; y por otras personas que intervienen en la toma de decisiones.

UNIVERSO

En estadística es el nombre especifico que recibe particularmente en la investigación social

la operación dentro de la delimitación del campo de investigación que tienen por objeto la

determinación del conjunto de unidades de observaciones del conjunto de unidades de

observación que van a ser investigadas. Para muchos investigadores él termino universo y

población son sinónima. En general, el universo es la totalidad de elementos o

características que conforman el ámbito de un estudio o investigación.

POBLACIÓN

Es la recolección completa de todas las observaciones de interés para el observador.

Es un conjunto completo de individuos, objetos o medidas que tienen una característica

común observable.

La población es el conjunto de todos los individuos cuyo conocimiento es objeto de interés

desde un punto de vista estadístico. Por ejemplo, si se está interesado en las ventas de los

comercios de una cierta ciudad, cada comercio es un individuo, y la población -también

llamada universo- es el conjunto de todos los comercios de la ciudad.

El estudio estadístico de una población se puede realizar mediante un análisis exhaustivo de

todos sus individuos (estadística descriptiva) o bien mediante una inferencia realizada a

partir de una muestra extraída de la población (estadística inferencial).

Muestra
"Se llama muestra a una parte de la población a estudiar que sirve para

representarla". Murria R. Spiegel (1991).

Conjunto de individuos extraído de una población con el fin de inferir mediante su estudio,

características de toda la población.

En los estudios estadísticos, en vez de analizar la totalidad de la población o universo, se

acude al recurso de considerar solamente una parte de ella, a la cual se llama muestra.

Se dice que una muestra es representativa cuando, por la forma en que ha sido

seleccionada, aporta garantías suficientes para realizar inferencias fiables a partir de ella.

Una muestra se puede definir como un conjunto de observaciones individuales

seleccionadas por un procedimiento específico. Ejemplo, el peso de un ratón a través de un

periodo de tiempo.

Parámetro

Es una medida descriptiva de la población total de todas las observaciones de interés para el

observador.

Las tablas estadísticas son una forma organizada de dar toda (o casi toda) la información,

todos los datos de que disponemos.

Con las gráficas estadísticas se pierde algo de información (mucho o poco, según los

casos).

En cualquiera de los dos casos, la cantidad de datos que se dan es excesiva para que sea

operativo, para poder hacer referencias concisas a esa distribución o comparaciones rápidas

con otras distribuciones.

Esa es la razón de ser de los parámetros estadísticos, el resumir en un número un aspecto

relevante de la distribución que pueda dar una idea de la misma o compararla en ese

aspecto con otras.


Cualquier característica medible de una población; por ejemplo: la proporción real de

demócratas inscritos entre todos los ciudadanos norteamericanos de edad para votar.

Estadígrafo

Es la medida que en Estadística se aplica sobre una muestra. En general se utilizan dos

tipos: Los de Tendencia Central y los de Dispersión. Entre los primeros tenemos: a) las

medidas denominadas promedios, osea aquellas que tratan de localizarse hacia el centro de

la serie; moda, media y mediana; y b) los cuartiles y deciles, o cuartas y décimas partes de

las observaciones; esto sólo se aplican en los datos agrupados. Entre los de Dispersión

están: la desviación media, la desviación mediana, la varianza, la desviación típica o

estándar, la dispersión absoluta y relativa.

ELEMENTO

Un elemento es cada unidad utilizada para un estudio estadístico. Por ejemplo, el conjunto

de los datos 3, 5, 5, 3, 7, 2, 4, 1 contiene 8 elementos. Una muestra es un subconjunto de

una población. Las muestras representativas de una población son útiles ya que facilitan el

manejo de los datos. Una muestra es representativa de la población si al escogerla cada

elemento tiene la misma probabilidad de salir o de ser escogido.

Variable

Cualquier característica de una persona, medio ambiente o situación experimental que

pueda variar de persona a persona, de un medio ambiente a otro o de una situación

experimental a otra. Así el peso, el CI y el sexo son variables, ya que toman valores

diferentes al observar distintos individuos.

Es una característica de la población que se esta analizando en un estudio estadístico.

Una variable es una propiedad con respecto a la cual los individuos de una muestra difieren

de algún modo verificable. Ejemplo: la longitud, el peso, la altura.


CLASIFICACIÓN DE LAS VARIABLES

- Variable Independiente: es aquella característica o propiedad que se supone ser la causa

del fenómeno estudiado. En investigación experimental se llama así, a la variable que el

investigador manipula.

- Variable Dependiente: es la propiedad o característica que se trata de cambiar mediante

la manipulación de la variable independiente.La variable dependiente: es el factor que es

observado y medido para determinar el efecto de la variable independiente.

- Variable Interviniente: es aquella característica o propiedad que de una manera u otra

afectan el resultado que se espera y están vinculadas con las variables independientes y

dependientes.

- Variable Moderadora: representa un tipo especial de variable independiente, que es

secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la

variable independiente primaria y las variables dependientes.

- Variables Cualitativas: Son aquellas que se refieren a atributos o cualidades de un

fenómeno. Sabino (1989: 80) señala que sobre este tipo de variable no puede construirse

una serie numérica definida.

- Variable Cuantitativa: Son aquellas variables en las que características o propiedades

pueden presentarse en diversos grados de intensidad, es decir, admiten una escala numérica

de medición.

- En función de la facilidad de su medición, pueden ser simples o complejas:-

Unidimensionales (peso)- Multidimensionales (calidad acústica)- Dicotómicas (con dos

valores, como sexo, si la persona es o no fumadora, etc.)

Atributos
Son variables que no se pueden cuantificar, o expresar por números. Por ejemplo, si

hablamos de la variable peso de un producto, es fácil.. Por decir un estándar de papas fritas

debe pesar unos 60 gramos, o analizando estaturas de personas, es facil cuantificarla

midiéndolas, supongamos un estándar de 170 cms. Hay variables que no se pueden

cuantificar, como los colores, por ejemplo, no hay números para ello.. Otro ejemplo es el

sabor en productos alimenticios.

Escala de medición

Medición

Existen diversas definiciones del término "medición", pero estas dependen de los diferentes

puntos de vista que se puedan tener al abordar el problema de la cuantificación y el proceso

mismo de la construcción de una escala o instrumento de medición.

En general, se entiende por medición la asignación de números a elementos u objetos para

representar o cuantificar una propiedad. El problema básico está dado por la asignación un

numeral que represente la magnitud de la característica que queremos medir y que dicho

números pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la

medición, los atributos de nuestras percepciones se transforman en entidades conocidas y

manejables llamadas "números". Es evidente que el mundo resultaría caótico si no

pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la físico saber

que el hierro tiene una alta temperatura de fusión.

Niveles o Escalas de mediciones

Escala Nominal:

La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en

la asignación, puramente arbitraria de números o símbolos a cada una de las diferentes

categorías en las cuales podemos dividir el carácter que observamos, sin que puedan
establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda

pertenecer a una y solo una de estas categorías.

Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma

sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se

asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le

atribuyan números, puede ser una de las razones por las cuales se le conoce como "medidas

nominales".

Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo

San Carlos de acuerdos a la carrera que cursan.

Número asignada a la
Carrera
categoría

Educación 1

Administración 2

Se ha de tener presente que los números asignados a cada categoría sirven única y

exclusivamente par identificar la categoría y no poseen propiedades cuantitativas.

Escala Ordinal:

En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto,

la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de

"orden" de los números asignándolo a los objetos en estudio de modo que, si la cifra

asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de

atributo que B.

La asignación de números a las distintas categorías no puede ser completamente arbitraria,

debe hacerse atendiendo al orden existente entre éstas.


Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo

de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición,

como por ejemplo la mediana.

Ejemplo:

Al asignar un número a los pacientes de una consulta médica, según el orden de llegada,

estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que

al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta

forma, cada número representará una categoría en general, con un solo elemento y se puede

establecer relaciones entre ellas, ya que los números asignados guardan la misma relación

que el orden de llegada a la consulta.

Escalas de intervalos iguales:

La escala de intervalos iguales, está caracterizada por una unidad de medida común y

constante que asigna un número igual al número de unidades equivalentes a la de la

magnitud que posea el elemento observado. Es importante destacar que el punto cero en las

escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la

magnitud que estamos midiendo. Esta escala, además de poseer las características de la

escala ordinal, encontramos que la asignación de los números a los elemento es tan precisa

que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos

de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera

escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida

pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación.

Ejemplo:

El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.

Escala de coeficientes o Razones:


El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas

de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que

el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se

observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto.

A iguales diferencias entre los números asignados corresponden iguales diferencias en el

grado de atributo presente en el objeto de estudio. Además, siendo que cero ya no es

arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la

magnitud de la propiedad presente en B.

Ejemplo:

En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no

tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que

tienen 3 hijos.

Formas de observar la población

Atendiendo a la fuente se clasifican en directa o indirecta.

Observación directa: es aquella donde se tienen un contacto directo con los elementos o

caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los resultados

obtenidos se consideran datos estadísticos originales. Para Ernesto Rivas González (1997)

"Investigación directa, es aquella en que el investigador observa directamente los casos o

individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus

resultados se consideran datos estadísticos originales, por esto se llama también a esta

investigación primaria".

Ejemplo; el seguimiento de la población agrícola por año, llevado en una determinada

granja.
Observación Indirecta: es aquella donde la persona que investiga hace uso de datos

estadísticos ya conocidos en una investigación anterior, o de datos observados por un

tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos.Ejemplo; si un

investigador pretende estudiar la producción por años de una granja avícola, en sus últimos

cinco años de producción, tendría que hacer un seguimiento, a tal fin recurriría a las

observaciones que posee la oficina administrativa de la granja durante estos cinco años, o

dirigirse a la oficina de estadística, llevada en el ministerio de producción y comercio

(M.P.C) de la localidad donde está registrada dicha granja. Es de notar que el investigador

se vale de observaciones realizadas por terceros.Atendiendo a la periodicidad, puede ser

continua, periódica o circunstancial.

Una observación continua; como su nombre lo indica es aquella que se lleva acabo de un

modo permanente.

Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras

operaciones que se van registrando a medida que van produciéndose.

Una observación periódica; es aquélla que se lleva a cabo a través de períodos de tiempo

constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años, etc.

Lo que debemos destacar es que los períodos de tiempo tomados como unidad deben

tomarse constantes en los posibles.

Ejemplo; el registro llevado por las Oficinas de Control de Estudios de la UNESR, en

cuanto a la inscripción de los estudiantes por semestre.

La observación circunstancial, es aquella que se efectúa en forma ocasional o esporádica,

esta observación hecha más por una necesidad momentánea, que de carácter regular o

permanente.
Ejemplo; la obtención de números de aulas utilizadas y no utilizadas en los colegios

pertenecientes al municipio San Carlos del Estado Cojedes.

Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta

Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad de los

elementos de la población se habla de una observación exhaustiva.Observación Parcial.

Dados que las poblaciones en general son grandes, la observación de todos sus elementos

se ve imposibilitada. La solución para superar este inconveniente es observar una parte de

esta población.Observación Mixta. En este tipo de observación se combinan

adecuadamente la observación exhaustiva con la observación parcial. Por lo general, este

tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran

básicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la

población es muy grande, parte de ella se observa parcialmente.

Pasos de la investigación directa

El proceso de aplicación de la estadística implica una serie de pasos:

 Selección y determinación de la población o muestra y las características contenidas

que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario

determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o

no probabilístico).

 Obtención de los datos. Esta puede ser realizada mediante la observación directa de

los elementos, la aplicación de encuestas y entrevistas, y la realización de

experimentos.

 Clasificación, tabulación y organización de los datos. La clasificación incluye el

tratamiento de los datos considerados anómalos que pueden en un momento dado,


falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen

de los datos en tablas y gráficos estadísticos.

 Análisis descriptivo de los datos. El análisis se complementa con la obtención de

indicadores estadísticos como las medidas: de tendencia central, dispersión,

posición y forma.

 Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que

involucran elementos probabilísticos que permiten inferir conclusiones de una

muestra hacia la población (opcional).

 Elaboración de conclusiones. Se construye el informe final.

1.1.1 CONCEPTOS BÁSICOS

La estadística es la ciencia que se ocupa de la recogida y obtención de datos y de su

posterior tratamiento para poder expresarlos numéricamente y así poder extraer

conclusiones.

Los primeros estudios estadísticos eran demográficos así que se ha conservado gran parte

del vocabulario.

 Población: Es el conjunto sobre el que se realizará el estudio estadístico.

 Individuo o Unidad Estadística: Cada uno de los elementos que componen la

población.

 Muestra: Conjunto representativo de la población pero más pequeño que esta.

 Muestreo: Es la reunión de los datos sobre una muestra que serán el objeto de

nuestro estudio estadístico.

 Valor: Son todos los resultados que podemos obtener. En el caso de una moneda

serían cara y cruz.


 Dato: Los distintos valores que obtenemos para cada individuo. Si lanzamos la

moneda al aire tres veces obtendríamos 3 datos; por ejemplo: cruz, cara, cruz.

1.1.2 CLASIFICACIÓN DE LA ESTADÍSTICA

La estadística se puede clasificar en dos grandes ramas:

 Estadística descriptiva o deductivaa.

 Estadística inferencial o inductiva.

La primera se emplea simplemente para resumir de forma numérica o gráfica un conjunto

de datos. Se restringe a describir los datos que se analizan. Si aplicamos las herramientas

ofrecidas por la estadística descriptiva a una muestra, solo nos limitaremos a describir los

datos encontrados en dicha muestra, no se podrá generalizar la información hacia la

población. La estadística inferencial permite realizar conclusiones o inferencias, basándose

en los datos simplificados y analizados de una muestra hacia la población o universo. Por

ejemplo, a partir de una muestra representativa tomada a los habitantes de una ciudad, se

podrá inferir la votación de todos los ciudadanos que cumplan los requisitos con un error de

aproximación.

1.1.3 TIPOS DE VARIABLES

Se le llama variable a aquel elemento de un algoritmo, fórmula o proposición que

representa un elemento no especificado de un determinad conjunto. A este conjunto se lo

conoce bajo el nombre de universo de la variable y cada uno de sus elementos es un valor

de la variable. Existen distintos tipos de variables, algunos de ellos son:

Independiente: los valores de este tipo de variables no dependen del de otras, son

representadas en el eje de las abscisas y en las funciones con la letra X.


Dependiente: los valores de estas variables, en cambio, son determinados por los que

adquieran las otras variables. Se las representa en el eje de las ordenadas y se las representa

con la letra Y en las funciones.

Cuantitativas: estas variables se expresan por medio de un número, lo que permite

utilizarlas para operaciones aritméticas. Dentro de estas encontramos dos clases:

1. Continua: este tipo de variables puede adquirir valores existentes entre dos números.

2. Discreta: esta variable no puede adquirir valores intermedios entre dos números,

sino aislados.

Cualitativas: hace alusión a aquellas cualidades que no se las puede medir numéricamente.

Dentro de estas variables encontramos dos clases:

1. Variable cualitativa ordinal o cuasicuantitativa: este tipo de variables presentan

modalidades no numéricas en las que hay un orden.

2. Variable cualitativa ordinal: en este tipo de variables, en cambio, las modalidades

numéricas no pueden ser ordenadas bajo ningún criterio.

Aleatorias: son aquellas funciones que asocian un número real a cada elemento del

espacio muestral E. Dentro de esta variable encontramos los siguientes tipos:

1. Variable aleatoria discreta: esta variable solamente puede adquirir valores enteros.

2. Variable aleatoria continua: a diferencia de la discreta, puede adquirir cualquier

valor dentro de un intervalo de la recta real.

3. Variable aleatoria binominal: con esta variable se muestra el número de éxitos que

se adquirieron en cada prueba de un experimento. Es como la discreta, que sólo

adquiere valores enteros, pero de acuerdo a las pruebas realizadas.


2da. Semana:

1.1.4 NIVELES DE MEDICIÓN

Medir significa “asignar números a objetos y eventos de acuerdo a reglas” (Stevens, 1951),

esta definición es adecuada para el área de ciencias naturales, en el campo de las ciencias

sociales medir es “el proceso de vincular conceptos abstractos con indicadores empíricos”

(Carmines y Zeller, 1979, p. 10).

La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos

de las escalas miden variables categóricas y las otras dos miden variables numéricas

(Therese L. Baker, 1997). Los niveles de medición son las escalas nominal, ordinal, de

intervalo y de razón. Se utilizan para ayudar en la clasificación de las variables, el diseño de

las preguntas para medir variables, e incluso indican el tipo de análisis estadístico

apropiado para el tratamiento de los datos.

Una característica esencial de la medición es la dependencia que tiene de la posibilidad de

variación. La validez y la confiabilidad de la medición de una variable depende de las

decisiones que se tomen para operacionalizarla y lograr una adecuada comprensión del

concepto evitando imprecisiones y ambigüedad, por en caso contrario, la variable corre el

riesgo inherente de ser invalidada debido a que no produce información confiable.

A) MEDICIÓN NOMINAL.

En este nivel de medición se establecen categorías distintivas que no implican un orden

especifico. Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas

se puede establecer la categoría sexo con dos niveles, masculino (M) y femenino (F), los

respondientes solo tienen que señalar su género, no se requiere de un orden real.

Así, si se asignan números a estos niveles solo sirven para identificación y puede ser

indistinto: 1=M, 2=F o bien, se pueden invertir los números sin que afecte la medición: 1=F
y 2=M. En resumen en la escala nominal se asignan números a eventos con el propósito de

identificarlos. No existe ningún referente cuantitativo. Sirve para nombrar las unidades de

análisis en una investigación y es utilizada en cárceles, escuelas, deportes, etc. La relación

lógica que se expresa es: A  B (A es diferente de B).

B) MEDICIÓN ORDINAL.

Se establecen categorías con dos o mas niveles que implican un orden inherente entre si. La

escala de medición ordinal es cuantitativa porque permite ordenar a los eventos en función

de la mayor o menor posesión de un atributo o característica. Por ejemplo, en las

instituciones escolares de nivel básico suelen formar por estatura a los estudiantes, se

desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. La relación

lógica que expresa esta escala es A  B (A es mayor que B). Clasificar a un grupo de

personas por la clase social a la que pertenecen implica un orden prescrito que va de lo mas

alto a lo mas bajo. Estas escalas admiten la asignación de números en función de un orden

prescrito.

Las formas mas comunes de variables ordinales son ítems (reactivos) actitudinales

estableciendo una serie de niveles que expresan una actitud de acuerdo o desacuerdo con

respecto a algún referente. Por ejemplo, ante el ítem: La economía mexicana debe

dolarizarse, el respondiente puede marcar su respuesta de acuerdo a las siguientes

alternativas:

___ Totalmente de acuerdo

___ De acuerdo

___ Indiferente
___ En desacuerdo

___ Totalmente en desacuerdo

las anteriores alternativas de respuesta pueden codificarse con números que van del uno al

cinco que sugieren un orden preestablecido pero no implican una distancia entre un número

y otro. Las escalas de actitudes son ordinales pero son tratadas como variables continuas

(Therese L. Baker, 1997).

C) MEDICIÓN DE INTERVALO.

La medición de intervalo posee las características de la medición nominal y ordinal.

Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables

continuas pero carece de un punto cero absoluto. El ejemplo mas representativo de este tipo

de medición es un termómetro, cuando registra cero grados centígrados de temperatura

indica el nivel de congelación del agua y cuando registra 100 grados centígrados indica el

nivel de ebullición, el punto cero es arbitrario no real, lo que significa que en este punto no

hay ausencia de temperatura.

Una persona que en un examen de matemáticas que obtiene una puntuación de cero no

significa que carezca de conocimientos, el punto cero es arbitrario por que sigue existiendo

la característica medida.

D) MEDICIÓN DE RAZÓN.

Una escala de medición de razón incluye las características de los tres anteriores niveles de

medición anteriores (nominal, ordinal e intervalo). Determina la distancia exacta entre los

intervalos de una categoría. Adicionalmente tiene un punto cero absoluto, es decir, en el

punto cero no existe la característica o atributo que se mide. Las variables de ingreso, edad,

número de hijos, etc. son ejemplos de este tipo de escala. El nivel de medición de razón se

aplica tanto a variables continuas como discretas.


1.1.5 RECOPILACIÓN DE DATOS

6.3.1 Matriculación

Un registro es un depósito de información sobre las embarcaciones pesqueras, las empresas,

las artes, las licencias o los pescadores tomados uno a uno. Pueden utilizarse para obtener

una encuesta completa por exigencia legal. Se establecen registros cuando se requiere un

conocimiento preciso del tamaño y del tipo de flota pesquera y para realizar un seguimiento

más detallado de las actividades pesqueras con el fin de asegurar la observancia de los

reglamentos pesqueros. También pueden incluir información a efectos fiscales (por

ejemplo, concesión o renovación de licencias de pesca). Aunque los registros se establecen

con fines distintos de la recopilación de datos, pueden resultar muy útiles a la hora de

diseñar y ejecutar un sistema estadístico, siempre que los datos que contienen sean fiables,

actuales y completos.

6.3.1.1 Tipos de datos de los registros

En la mayor parte de los países, los buques, en particular los buques pesqueros comerciales

y las embarcaciones pesqueras fletadas o contratadas, se matriculan en registros de las

autoridades pesqueras. Para la matriculación deben comunicarse los datos relativos al tipo

de embarcación, el tamaño, el tipo de artes, el país de origen, la capacidad de las bodegas,

el número de pescadores y la potencia del motor.

Las empresas que se relacionan con las órganos pesqueros se registran con varios fines.

Estas empresas pueden incluir no sólo a empresas pesqueras, sino también a otro tipo de

empresas participantes en la elaboración y la comercialización de productos pesqueros. En

el momento del registro se deben consignar datos relativos al número de embarcaciones, el

tipo de artes y el tamaño de las embarcaciones de las empresas pesqueras registradas. Las
empresas de elaboración deben ofrecer datos básicos acerca del tipo de elaboración, el tipo

de materia prima, la capacidad de elaboración e incluso el origen del material.

A las embarcaciones pesqueras y las artes de pesca se exigirá con frecuencia una licencia

de pesca válida. A diferencia de la matriculación de embarcaciones, las licencias suelen

emitirse para acceder a pesquerías concretas durante un período de tiempo determinado.

Puesto que las licencias pueden tener que renovarse periódicamente, pueden ser una forma

útil de actualizar la información sobre las características de las embarcaciones y las artes.

6.3.1.2 Diseño de los registros

Un registro debe recoger no sólo las nuevas inscripciones, sino que debe poder indicar que

una voz concreta del registro está inactiva (por ejemplo, una empresa que haya suspendido

sus actividades) o anotar los cambios en las actividades (por ejemplo, el aumento de la

capacidad de elaboración de una empresa). Si las licencias deben renovarse todos los años,

los datos recopilados a partir de las licencias son particularmente útiles, ya que los registros

se actualizan de forma anual.

Los datos de los registros deben incluir también criterios para clasificar las unidades

pesqueras por estratos. Estas clasificaciones se basan habitualmente en presuposiciones y

en un conocimiento a priori relativo a las diferencias en las tasas de capturas, la

composición de las especies y las especies capturadas selectivamente.

En general, los registros para la inscripción y datos de buques son sistemas complejos que

requieren unos procedimientos administrativos bien organizados apoyados por unos

sistemas eficaces de comunicación, almacenamiento y elaboración de datos. Como tales,

suelen ocuparse predominantemente sólo de ciertos tipos y tamaños de unidades pesqueras,

que en la mayor parte de los casos pertenecen a flotas industriales y semiindustriales. La

pesca en pequeña escala y de supervivencia, que involucra a un gran número de unidades


pesqueras, no suele figurar en los sistemas de registro o, si se están matriculados, no es fácil

realizar un seguimiento de la misma que permita su validación o actualización.

6.3.2 Cuestionarios

A diferencia de las entrevistas, en las que un encuestador plantea preguntas directamente,

los cuestionarios son formularios que rellenan los encuestados solos. Los cuestionarios

pueden entregarse en mano o enviarse por correo y recogerse posteriormente o devolverse

en un sobre prefranqueado. Este método puede adoptarse para toda la población o para

sectores escogidos.

Los cuestionarios pueden utilizarse para recopilar datos sistemáticos habituales o poco

frecuentes, y datos para estudios especializados. Si bien la información de esta sección se

aplica a los cuestionarios para todos estos usos, los ejemplos se refieren sólo a datos

sistemáticos, tanto si son habituales como poco frecuentes. Algunos de los datos que suelen

obtenerse a través de cuestionarios son: características demográficas, artes de pesca,

opiniones de las partes involucradas en la actividad o la ordenación pesquera, información

general sobre los pescadores y presupuestos de alimentación de las unidades familiares.

Los cuestionarios prevén que los encuestados rellenen el formulario ellos mismos, para lo

que también se requiere un alto nivel de alfabetización. Cuando son habituales varios

idiomas, los cuestionarios deben prepararse utilizando los idiomas principales del grupo

destinatario. Debe prestarse especial atención a estos casos para asegurar la precisión de las

traducciones.

Para maximizar los índices de respuesta, los cuestionarios deben diseñarse de forma que

sean lo más sencillos y claros posible, con secciones y preguntas dirigidas. Lo que es más

importante, los cuestionarios deben ser también lo más cortos posible. Si el cuestionario se

va a entregar a una población de muestra, puede ser preferible preparar varios cuestionarios
más pequeños y más orientados, uno para cada submuestra. Si el cuestionario va a utilizarse

para realizar una encuesta completa, debe prestarse especial atención para evitar

sobrecargar al encuestado. Si, por ejemplo, varios organismos necesitan los mismo datos,

deben tratar de coordinar su recopilación para evitar las duplicaciones.

La información que puede obtenerse a través de los cuestionarios atañe a prácticamente

todas las variables. Por ejemplo, la información acerca de las capturas o los desembarques

puede recopilarse a través de cuestionarios dirigidos a los pescadores, los intermediarios del

mercado, los vendedores y los compradores en el mercado, los elaboradores, etc. De igual

forma, los datos socioeconómicos pueden obtenerse también a través de cuestionarios

destinados a distintas fuentes. Sin embargo, en todos los casos, las variables obtenidas son

una opinión y no una medición directa, y por lo tanto pueden contener errores de bulto. Es

más fiable para este tipo de datos la utilización de observaciones directas (6.3.4) o de

sistemas de presentación de informes (6.3.5).

Los cuestionarios, al igual que las entrevistas, pueden contener preguntas estructuradas con

espacios en blanco para rellenar, preguntas con opciones múltiples o pueden incluir

preguntas abiertas en las que se invita al encuestado a contestar de forma amplia y en cierta

medida elegir su propio enfoque.

Para facilitar la cumplimentación de los formularios y la introducción de datos en un

formato estructurado, éste debería ser preferiblemente de lectura automática o al menos

presentar una disposición en la que los campos de datos sean claramente identificables y las

respuestas estén previamente codificadas. En general, la escritura debería limitarse al

máximo (por ejemplo, casillas para marcar, opciones múltiples), reservándose ésta

preferiblemente a los números. En un formato abierto, deben imponerse posteriormente


palabras clave y otros procedimientos de estructuración para facilitar la introducción en la

base de datos y el análisis, llegado el caso.

6.3.3 Entrevistas

En las entrevistas, la información se obtiene a través de una encuesta y es registrada por

encuestadores. Las entrevistas estructuradas se llevan a cabo utilizando formularios de

encuesta, mientras que en las entrevistas abiertas se toman notas mientras se habla con los

encuestados. Las notas se estructuran (interpretan) luego para su posterior análisis. Las

entrevistas abiertas, que deben interpretarse y analizarse incluso durante la entrevista,

deben realizarlas observadores y/o encuestadores bien formados.

Al igual que al preparar un cuestionario, es importante experimentar con formularios de

prueba diseñados para las entrevistas. El máximo esfuerzo por aclarar y centrar por parte

del diseñador no puede anticipar todas las posibles interpretaciones de los encuestados. Una

prueba a pequeña escala antes de utilizarlos para recopilar realmente datos asegurará unos

datos mejores y evitará que se pierda tiempo y dinero.

Aunque las entrevistas estructuradas pueden utilizarse para obtener casi cualquier

información, al igual que en los cuestionarios, la información se basa en una opinión

personal. Los datos basados en variables como las capturas o el esfuerzo son

potencialmente objeto de errores de bulto, debido a cálculos erróneos o a errores

intencionados en la información delicada.

6.3.3.1 Entrevistas abiertas

Las entrevistas abiertas cubren una serie de actividades de recopilación de datos que

incluyen varios métodos de investigación de las ciencias sociales.

Los grupos de muestra son pequeños (5-15 personas) y están compuestos por miembros

representativos de un grupo cuyas apreciaciones, prácticas u opiniones se están buscando.


Al hacer las preguntas iniciales y estructurar el examen posterior, el

facilitador/entrevistador puede obtener, por ejemplo, información sobre prácticas de uso de

artes comunes, respuestas a las normativas de ordenación u opiniones sobre la pesca.

Las encuestas de grupo comportan la selección aleatoria de un reducido número de

personas que representan a un grupo y que se prestan a estar disponibles durante un período

de tiempo prolongado, a menudo de uno a tres años. Durante ese período, sirven como

muestra aleatoria estratificada de personas de las que pueden extraerse datos sobre una serie

de temas.

6.3.3.2 Entrevistas estructuradas

En general, las entrevistas estructuradas se llevan a cabo con un formulario bien diseñado

previamente establecido. Se diferencian de los cuestionarios en que son los investigadores

quienes rellenan los formularios en lugar de los encuestados. Aunque esta solución resulta

más costosa, pueden hacerse preguntas más complejas y los datos pueden validarse en el

momento de recopilarlos, mejorando así la calidad de los mismos. Las entrevistas pueden

llevarse a cabo con varias fuentes de datos (desde los pescadores a los consumidores), y a

través de medios alternativos, como por teléfono o en persona.

Las entrevistas estructuradas componen la base de una gran parte de la recopilación de

datos realtivos a la pesca en pequeña escala.

En un marco de entrevistas para hacer un muestreo de las capturas, el esfuerzo y los

precios, los encuestadores trabajan siguiendo un programa de visitas a los puntos de

desembarque uno a uno para registrar datos. Los encuestadores pueden ser móviles (visitan

los distintos lugares de forma rotativa) o residir en un punto de muestreo específico. Su

trabajo consiste en hacer un muestreo de las embarcaciones, obteniendo datos sobre los

desembarques, el esfuerzo y los precios de todos los tipos de embarcaciones/artes que se


espera que faenen durante el día del muestreo. La muestra debe ser lo más representativa

posible de las actividades de la flota. Se necesitarán tal vez algunos datos adicionales

relativos a actividades de pesca para ciertos tipos de unidades pesqueras, como artes de

playa o embarcaciones que hacen múltiples salidas de pesca en un día. Para ello, la

entrevista puede abarcar actividades previstas así como actividades ya realizadas.

En un marco de entrevistas relativas a las actividades de los buques/artes, los

encuestadores trabajan siguiendo un programa de visitas al puerto de matrícula para

registrar datos sobre las actividades de los buques/artes. Los encuestadores pueden ser

móviles (visitan los puertos de amarre de forma rotativa) o residir en un punto de muestreo

concreto. En ambos casos, su trabajo consiste en determinar el número total de unidades de

pesca (y si es posible, de artes de pesca) de todos los tipos de buques/artes con base en el

puerto de matrícula y el número de ellos que han faenado durante el día en el que se realiza

el muestreo.

Existen varias formas de registrar las actividades de los buques/artes. En muchos casos,

combinan el método de entrevista con observaciones directas. Las observaciones directas

pueden utilizarse para identificar unidades de pesca inactivas observando las que están

amarradas o encalladas, y, cuando ya se conoce el número total de embarcaciones con base

en ese puerto de matrícula, quizás a partir de una encuesta o registro marco. A menudo, los

encuestadores siguen teniendo que comprobar, por medio de entrevistas durante la visita,

que las embarcaciones estén faenando y no se dediquen a otras actividades.

La entrevista pura puede utilizarse en los casos en que existe un subconjunto

predeterminado de unidades de pesca seleccionado. El trabajo del encuestador consiste en

hacer un seguimiento de todos los pescadores incluidos en la lista y, a través de entrevistas,

identificar a los que han estado faenando durante el día del muestreo. En los lugares que
presenten un número abarcable de unidades de pesca (es decir, no más de 20), la entrevista

puede abarcar todas las unidades de pesca.

En ocasiones es posible plantear preguntas sobre la actividad pesquera del día anterior o

incluso de los dos días anteriores. Esta información extra aumenta significativamente el

tamaño de la muestra con un pequeño costo adicional, ofreciendo en definitiva unas

mejores estimaciones del esfuerzo de pesca total. La experiencia ha demostrado que la

mayor parte de la variabilidad en la actividad de los buques/artes es más temporal que

espacial.

6.3.4 Observaciones directas

6.3.4.1 Observadores

Los observadores pueden realizar mediciones directas en las embarcaciones pesqueras, en

los puntos de desembarque, en las instalaciones de elaboración o en los mercados. Las

variables que los encuestadores pueden recopilar incluyen las capturas (desembarques y

descartes), el esfuerzo, los buques/artes, las actividades, variables medioambientales (por

ejemplo, estado de la mar, temperatura), variables biológicas (como talla, peso, edad), los

valores y las cantidades desembarcadas y las ventas.

En la práctica, los observadores no sólo realizan mediciones directas (observaciones), sino

que también llevan a cabo entrevistas y encuestas por medio de cuestionarios. También

pueden participar en la elaboración y el análisis de datos. Las tareas de un observador son

difíciles y por tanto fundamentales para una formación y una supervisión adecuadas.

Deben tomarse decisiones claras acerca de la naturaleza y el alcance de los datos

recopilados durante cualquier salida. A menudo, la cantidad de datos y la frecuencia de la

recopilación pueden establecerse analíticamente con datos preliminares.


Preferiblemente, los observadores sólo deben recopilar datos, no llevar a cabo otras

actividades, como la aplicación de las medidas, la concesión de licencias o la recaudación

de impuestos. Esto debe ayudar a minimizar el margen de error al reducir los incentivos

para mentir. Los problemas en términos de conflictos entre la recopilación de datos y la

aplicación de la ley, por ejemplo, pueden reducirse mediante una delimitación clara,

separando las actividades por localización o por tiempo. Esto se convierte en una necesidad

para los observadores en mar abierto. Su posición en los buques pesqueros y las tareas que

llevan a cabo dependen en gran medida de una buena relación de trabajo con el capitán y la

tripulación, que puede malograrse si son vistos como personal encargado de la observancia.

Los principales datos que se obtienen a través de los observadores en mar abierto son los

datos acerca de las capturas y el esfuerzo, que a menudo se utilizan para cotejarlos con los

de los registros de pesca. Al mismo tiempo, los observadores en mar abierto pueden

recopilar datos biológicos adicionales (tamaño, madurez y sexo de los peces), datos sobre

subcapturas y datos medioambientales, así como otra información sobre las artes, las

actividades de pesca, etc. Con frecuencia, los datos acerca de los descartes sólo pueden ser

recopilados por observadores en mar abierto.

Los principales datos obtenidos por los observadores en los puntos de desembarque, las

plantas de elaboración y los mercados incluyen datos sobre los desembarques (cantidad,

calidad, valor y precio), biológicos (tamaño, madurez) y el esfuerzo (número de lances,

horas faenando). En la pesca a gran escala en las que se utiliza un sistema de libro de a

bordo, los datos recopilados en los puntos de desembarque pueden utilizarse para cotejar

los datos registrados en los libros de a bordo. Los datos recopilados en las plantas de

elaboración incluyen cantidades por especies y, sobre todo en las prácticas de las fábricas

modernas, el número de lote de las materias primas, del que en ocasiones puede hacerse un
seguimiento retrospectivo hasta los buques pesqueros. Estos datos, si se recopilan, pueden

utilizarse para validar los datos sobre los desembarques.

Puede ser necesario recopilar datos para estimar los factores de extrapolación con el fin de

convertir el peso del pescado elaborado que se ha desembarcado en peso total equivalente.

Al proceder al muestreo del pescado antes y después de la elaboración, pueden mejorarse

los factores de conversión. Los potenciales cambios en las relaciones de peso

cuerpo/vísceras, ya sea en función de la estación, del estadio biológico o de otras

variaciones hacen recomendable que en las muestras se registren las fechas, especies, sexo

y talla.

Los datos económicos y demográficos a cada nivel (por ejemplo, las entradas y salidas de

distintos productos desde y hacia el mercado y desde y hacia los elaboradores) suelen

obtenerse a través de entrevistas y cuestionarios. Sin embargo, los datos recopilados

directamente por los encuestadores pueden constituir también la fuente principal, así como

datos de apoyo para los recopilados mediante otros métodos.

Si bien los datos sobre los productos en las plantas de elaboración pueden recopilarse a

través de cuestionarios (6.3.2) o entrevistas (6.3.3), los encuestadores pueden recopilar

directamente muchas variables físicas (peso, número, tamaño, etc.) con mayor precisión.

Las balanzas automáticas, a través de las cuales pasa un flujo continuo de peces, pueden

registrar el peso de éstos mecánicamente o a través de sensores informatizados. De forma

similar, pueden utilizarse cubos de pesaje mecánicos o automáticos para peces enteros

congelados o descongelados antes de entrar en una línea de elaboración o un almacén

frigorífico para registrar el peso de cada lote. Si no se hace esto, es preciso realizar un

recuento y un submuestreo para asegurar que los peces que contienen hayan sido

correctamente identificados y pesados.


El pescado suele descargarse a granel junto con materiales no procedentes de la pesca (por

ejemplo, hielo, líquido de salmuera, materiales de embalaje y bandejas de carga). Puede

resultar muy difícil calcular el peso total del pescado, y mucho más el peso por especie,

producto y tamaño. Deben establecerse métodos para registrar si el material no procedente

de la pesca se incluye en algún proceso de pesaje (es decir, ¿están programadas las balanzas

para restar automáticamente el peso de la bandeja de carga?). En el caso del pescado

elaborado y en cajas selladas, puede bastar con realizar un muestreo para determinar un

peso medio y luego contar las cajas o las bandejas de carga. O bien, cada caja o bandeja de

carga puede pesarse y tomarse nota de si el peso de dicha caja o bandeja de carga debe

restarse en una fecha posterior al elaborar los datos.

Son preferibles los desembarques completos de todas las capturas relativas a una salida de

una embarcación (es decir, vaciar las bodegas) ya que entonces los registros pueden

cotejarse con los libros de a bordo. Sin embargo, en algunas circunstancias, las descargas

en los puertos, en el muelle o en mar abierto pueden ser tan sólo parciales, reteniéndose una

parte a bordo hasta la siguiente descarga. En este caso, deben conservarse los registros tanto

de las capturas desembarcadas como de las retenidas a bordo.

6.3.4.2 Inspectores

Los inspectores son una especie de encuestadores que participan en la aplicación de la ley y

la vigilancia (en relación con reglamentos pesqueros, inspecciones sanitarias, control

laboral, etc.). Pueden trabajar en mar abierto en buques de vigilancia, en los puntos de

desembarque en tierra, en las plantas de elaboración y en los mercados. En general, los

datos científicos pueden recopilarse mejor mediante encuestadores que no participen

directamente en la aplicación de la ley. No obstante, muchas de las variables recopiladas

por los inspectores son muy útiles, e incluyen información sobre los desembarques, las
actividades, el esfuerzo, los precios del desembarque, el procedimiento de elaboración y el

precio del producto en el mercado y para los elaboradores. Los inspectores son también

útiles a la hora de recopilar datos sobre empleo.

Los inspectores pueden desempeñar un papel importante en la comprobación. En muchos

casos, los informes pueden comprobarse materialmente con las observaciones. Por ejemplo,

pueden tomarse muestras aleatorias de cajas para comprobar su contenido (especie, tipo de

producto y tamaño) en comparación con las marcas identificativas de las cajas. Es preciso

que los inspectores estén cualificados para dichas estrategias de muestreo.

Al igual que ocurre con los encuestadores/observadores, los datos de los inspectores deben

tratarse con precaución debido a la alta probabilidad de que se produzca un sesgo en el

muestreo. En los análisis debe tenerse en cuenta este potencial sesgo de los datos

recopilados por los funcionarios encargados de la aplicación de la ley.

6.3.4.3 Investigación científica

Los métodos de investigación ecológica pueden llevarse a cabo de manera independiente de

las actividades pesqueras comerciales para medir variables relativas a la población de peces

o el medio ambiente. Este tipo de investigación puede correr a cargo de embarcaciones de

investigación institucionales, o por parte del sector o de instituciones mediante buques

pesqueros comerciales. El objetivo es obtener observaciones sobre variables biológicas (por

ejemplo, abundancia de poblaciones o distribución espacial y tamaño de los peces, madurez

y actividades de desove) y medioambientales (por ejemplo, salinidad y temperatura). Es

importante que este tipo de investigaciones se lleven a cabo periódicamente para obtener

series cronológicas de datos.

Del mismo modo, los métodos de investigación sociocultural pueden utilizarse para obtener

información específica útil con fines de ordenación. Aunque estos métodos no puedan
considerarse con frecuencia como rutinarios, ofrecen datos importantes y deberían tenerse

en cuenta en las recopilaciones de datos poco frecuentes, cuando esto sea posible.

Los informadores selectos son personas con conocimientos especializados en un tema

concreto. Pueden incluir a especialistas académicos, líderes de la comunidad o pescadores

de especial cualificación. Las entrevistas suelen comenzar con un conjunto de preguntas

básicas, pero el entrevistador espera obtener información nueva y quizás imprevista

pidiendo al informador clave que amplíe sus respuestas a dichas preguntas iniciales. Este

método es ideal para obtener datos descriptivos en profundidad sobre las convicciones y las

prácticas, incluidas las prácticas históricas.

La observación por participación es una técnica en la que el investigador dedica un

amplio período de tiempo (puede ir desde semanas hasta años, dependiendo del objetivo y

del contexto) viviendo con una comunidad objetivo, observando su comportamiento y

participando en sus prácticas. Durante este tiempo, el investigador llevará a cabo entrevistas

oficiales y oficiosas abiertas acerca de diversos temas. Este es un buen método para

aprender acerca de los procesos reales de toma de decisiones, frente a los procedimientos

oficiales. Las normas culturales e institucionales apenas se siguen al pie de la letra, y suelen

existir normas oficiosas para una libertad de acción aceptable. Sin embargo, suele ocurrir

que la información acerca de estas normas sólo pueda obtenerse a través de la observación

por participación.

6.3.4.4 Registro de datos

Los transmisores automáticos de localización (TAL) registran datos automáticamente a

través de la tecnología de posicionamiento y comunicación. Permiten realizar una

observación remota mediante el registro de las actividades pesqueras en mar abierto, y

pueden sustituir a los libros de a bordo y a los observadores/inspectores en el puente de


mando de los buques pesqueros. Sin embargo, los TAL presentan una deficiencia en un

aspecto: la introducción de datos sobre capturas sigue siendo responsabilidad del capitán.

Muchos datos sobre actividades pesqueras pueden registrarse automáticamente desde los

instrumentos del puente. El registro de la posición, la velocidad y la dirección, y el

despliegue de las artes a través de enlaces con instrumentos electrónicos serán

probablemente más habituales en el futuro. Una vez recopilados, dichos datos pueden

transmitirse automáticamente a bases de datos a través de comunicaciones satelitales o

terrestres.

La tecnología que combina la posición de la embarcación y una evaluación de las capturas

para las autoridades de ordenación a través de medios remotos se conoce generalmente

como sistema de seguimiento de embarcaciones (VMS). La confidencialidad es la clave

para la aceptación generalizada del VMS, ya que la información sobre los caladeros

actuales y, por lo tanto, la seguridad de la información sobre la posición, son una de las

principales preocupaciones.

Sin embargo, gracias a estos sistemas es posible comunicar la posición, actividades y

capturas de las embarcaciones directamente a las bases de datos y desde ahí a informes que

agregan datos o eliminan identificadores de embarcaciones. Dado que resultará

relativamente sencillo comprobar la posición detectada a distancia frente a la posición

registrada, los registros del libro de a bordo serán más representativos de las actividades

reales de las embarcaciones en mar abierto.

6.3.5 Presentación de informes

En la mayoría de enfoques basados en una encuesta completa, el personal pesquero no se

ocupa directamente de recopilar datos, sino que utiliza fuentes externas. Lo más habitual es

que dichas fuentes sean formularios de datos que cumplimentan las propias empresas
pesqueras, los intermediarios, los operadores del mercado, los elaboradores e incluso las

empresas mercantiles y los despachos de aduanas. Estos métodos se utilizan casi

exclusivamente para la pesca industrial y semiindustrial y para las instituciones.

Las empresas pesqueras suelen ser una buena fuente de información relativa a datos básicos

sobre capturas y esfuerzo de pesca. El envío periódico de datos básicos forma parte del

proceso de licencia de pesca. Los datos que presentan las empresas suelen ser libros de a

bordo o declaraciones de desembarques. Los libros de a bordo deben incluir información

detallada sobre las actividades de pesca concretas, indicando los caladeros, el tipo y la

duración de la operación, las capturas por especies y otro tipo de datos relativos al tiempo y

las condiciones del mar. Las declaraciones de desembarques suelen incluir datos agrupados

que se presentan en forma de resumen de las salidas y las capturas por especies.

La ventaja de utilizar informes consiste en que los datos son compilados por agentes

distintos del personal pesquero y en que en ocasiones se pueden entregar en un formato

informatizado preelaborado, directamente de los registros de la empresa, reduciendo así los

gastos administrativos. La confidencialidad de la información (como los caladeros y las

tasas de capturas) deben formar parte de un acuerdo para el envío de datos, y los resultados

estadísticos de la encuesta no deben contener información individualizada relativa a

embarcaciones o empresas pesqueras. Sin embargo, también existe el riesgo de declaración

por defecto o de que se distorsionen deliberadamente los datos, sobre todo los relativos a

los caladeros, las capturas y los ingresos.

6.3.5.1 Capturas

A veces es preciso recopilar datos de todas las embarcaciones pertenecientes a un sector

pesquero, generalmente en el caso de la pesca a gran escala. Normalmente, cada

embarcación tendrá que registrar sus datos sobre capturas y esfuerzo en cada salida en un
libro de a bordo diseñado a tal propósito. Dado que se trata de una tarea meticulosa,

generalmente sólo se piden datos fundamentales. Por varios motivos, los datos recopilados

mediante este método pueden ser poco precisos y por lo tanto es importante que los

inspectores los validen de vez en cuando.

6.3.5.2 Postcaptura

Suelen emplearse datos sobre las actividades posteriores a la captura para obtener

información sobre los desembarques, datos biológicos, sobre los mercados, los gastos y los

ingresos. Cuando no se dispone de libros de a bordo, registros de desembarques e informes

de mercado, a menudo sólo puede obtenerse información fiable de las plantas de

elaboración. En los informes de los elaboradores suelen constar las cantidades y el valor del

pescado recibido y de los productos resultantes. Entre la información adicional puede

incluirse el origen de las capturas (embarcaciones de pesca y de transporte) y las categorías

de talla del pescado.

El seguimiento de la descarga de las capturas en forma de pescado elaborado o de pescado

entero requiere una considerable atención al detalle y depende en gran medida de la

relación entre las autoridades pesqueras y los capitanes de las embarcaciones o las

empresas. Puede que se haya creado la suficiente confianza para permitir utilizar

directamente los registros de descargas de la embarcación o la empresa, quizás con

comprobaciones al azar.

En algunos casos, las descargas pueden dirigirse directamente a un planta de elaboración o

almacén frigorífico (sobre todo a través de cintas transportadoras de pescado a granel como

pequeños pelágicos, atunes, etc.). Sigue siendo posible registrar los desembarques

pormenorizados siempre que cada lote esté marcado con su origen (nombre de la

embarcación e identificador de la salida).


La mayor parte de las fábricas conservan registros del pescado (por especies, tipo de

producto y talla) que pasan directamente a la elaboración o al almacén frigorífico. También

conservan información relativa a sus resultados y sus ventas, incluido el destino y el precio,

aunque estos datos pueden ser mucho más difíciles o imposibles de obtener, a menos que se

obligue a ello por ley. Será necesario adaptar los formularios de datos al tipo de elaboración

y al sistema de gestión de la planta.

6.3.5.3 Venta

Los registros de las transacciones en el mercado constituyen una forma viable de recopilar

datos sobre los desembarques con una encuesta completa, sobre todo en las grandes flotas o

las embarcaciones de pequeña escala que desembarcan en puntos centrales. Todas las

facturas, recibos de venta o albaranes deben diseñarse con cuidado en cuanto al contenido,

estilo y capacidad de asegurar una cobertura completa. Dado el potencial volumen de

papeleo, la simplificación y la brevedad suelen ser los criterios más importantes.

El identificador primario de los registros debe ser el nombre de la embarcación (incluidas

todas las embarcaciones de transporte que descargan pescado procedente de flotillas más

lejanas) que vendió la captura, y la fecha o el número de salida, puesto que las

embarcaciones pueden realizar más de una venta a partir de un desembarque. Debe

recopilarse el peso total por especie o grupo comercial, así como el precio. Lo ideal sería

obtener datos adicionales acerca del caladero y el nivel de esfuerzo de pesca, aunque a

menudo esto no es posible.

De forma análoga a los libros de a bordo y las hojas de desembarque, los registros de venta

deben prepararse en formularios debidamente identificados con copias múltiples según sea

necesario. Es probable que se deban facilitar copias a la administración del mercado (en

caso necesario), al vendedor, al comprador y a las autoridades pesqueras.


Los registros generales de ventas, como el volumen de ventas y los precios por tipo de

producto, ofrecen información útil para realizar análisis bioeconómicos y constituyen una

fuente de datos sobre las capturas y los desembarques cuando no se dispone de todas las

vías restantes para recopilar datos. Suelen existir tres fuentes de información general sobre

las ventas: el mercado, la planta de elaboración y los datos de exportación. Sin embargo,

estos datos deben tratarse siempre con cuidado. Cuanto más alejadas están las fuentes de

datos de la fuente primaria, más errores se introducirán y más detalles (por ejemplo,

caladero, esfuerzo pesquero) se perderán.

Además, las encuestas directas a las empresas pesqueras pueden ofrecer detalles

fundamentales sobre los que es posible basar la ordenación y la administración pesquera

general. Las encuestas estadísticas pesqueras anuales pueden ser voluntarias u obligatorias.

Si son voluntarias, las respuestas dependerán del nivel de cooperación entre el sector

privado y las autoridades. Si son obligatorias, se requerirá una legislación adecuada que

podrá redactarse de distintas formas, ya sea en forma de derecho de sociedades, ya sea

legislación sobre estadística.

6.3.5.4 Comercio

Los datos comerciales se refieren a información obtenida de aduanas o fuentes similares

sobre el comercio. Estos datos se utilizan en indicadores socioeconómicos y, en algunos

casos excepcionales, en datos adicionales sobre los desembarques.

La mayoría de los países publican información sobre exportaciones e importaciones. Esto

es particularmente importante cuando deben pagarse impuestos a la importación o la

exportación, o se ofrecen incentivos a la exportación. Por supuesto, los datos relativos a las

importaciones y exportaciones tienen un uso limitado a la hora de calcular la producción

total de pescado, a menos que se cuente también con medios para establecer la proporción
de capturas destinadas al consumo interno. Sin embargo, en algunos casos concretos, los

datos comerciales son la principal fuente para calcular los desembarques (por ejemplo,

tiburones, atunes). Si los datos comerciales se utilizan para validar o calcular los

desembarques, las cantidades tendrán que convertirse habitualmente en peso total.

La falta de datos pormenorizados sobre las exportaciones puede ser un problema derivado

sencillamente e la forma en que se recopilan. Las categorías de exportación registradas por

las autoridades (generalmente sin cooperar con las autoridades pesqueras) pueden ocultar

gran parte de la información necesaria. El pescado enlatado, congelado, fresco, seco y las

harinas de pescado pueden ser las únicas categorías pertinentes para las autoridades

exportadoras. Junto con unos factores de extrapolación precisos, estos datos pueden

utilizarse para calcular la producción total de pescado. Este método de cálculo es bastante

preciso cuando se trata de un mercado local pequeño. Sin embargo, a menos que se

desglosen por especies y se vinculen de nuevo a las fuentes de datos más cercanas al sector

de la captura, presentan poco valor para la ordenación pesquera.


1.2 PRESENTACIÓN DE DATOS DE UNA SOLA VARIABLE

Una distribución es el patrón de variabilidad mostrado por los datos de una variable. La

distribución muestra la frecuencia de cada valor de la variable.

Distribuciones de Frecuencias para datos cuantitativos

Usando los valores de la variable

(para variables discretas)

Usando intervalos de clase

(para variables continuas)

Distribuciones de Frecuencias para datos cuantitativos

Se recomienda usar intervalos de clase cuando los datos pueden asumir una gran cantidad

de valores. Por ejemplo: la edad, el peso, la estatura, el ingreso mensual familiar , etc.

Se recomienda agrupar los datos usando los valores de la variable cuando ésta asume solo

unos pocos valores. Por ejemplo: el número de hijos, el número de hermanos, etc. de

Distribución de

Frecuencias

(para variables discretas)

Universidad de San Carlos. 2,012.

de Distribución de Frecuencias

(para variables continuas)

Universidad de San Carlos. Noviembre 2014.

Historia.

Universidad de San Carlos. Semestre A-2012


Absolutas simples

(fi)

Intervalos, Marcas de clase y Frecuencias

La dificultad de resumir un conjunto de datos, puede ser superada agrupando los distintos

valores en un número reducido de clases llamado

Intervalos de clase

Se llama Intervalo al conjunto de números reales comprendidos entre otro dos números

dados: a y b , que se llaman extremos del intervalo.

Cuando, en una distribución de frecuencias, los datos se agrupan utilizando intervalos, a

cada uno de estos se les da el nombre de

Clases (K).

El punto medio entre el límite superior de una clase y el límite inferior de la siguiente clase

es la frontera superior o límite real superior de clase y la frontera inferior o límite real

inferior de la siguiente clase. (Límites Reales)

La diferencia entre las fronteras superior e inferior de una clase se denomina

Amplitud de Clase.

El número de datos incluídos en un Intervalo de Clase se denomina

Frecuencia de clase. (fi)

El punto medio entre los dos extremos (o las dos fronteras) de una clase se denomina

Marca de clase. (Xi) fi

Clase

L.R.I= Límite real inferior

L.A.I.= Límite aparente inferior


L.R.S.= Límite real superior

L.A.S.= Límite aparente superior

EJERCICIO

Utilizando los datos de la distribución de frecuencias adjunta, Calcular:

a) Los límites reales de cada clase.

b) Las marcas de clase.

Los Datos

Procedencia, ordenación y recuento de casos

Los datos se obtienen generalmente de observaciones empíricas (experiencias) otras veces

existe una fuente que ya ha recogido la información, por ejemplo: el INE, la publicación de

otra institución, la Dirección de estadística, etc.

Por ejemplo, en la siguiente serie:

2, 6, 7, 4, 5, 7, 5, 9, 8, 7, 5, 1, 8, 4, 7, 7, 7, 6, 5, 4

Los datos estan desordenados, se hace necesario ordenarlos ascendentemente o

descendentemente. Los datos anteriores ordenados de manera ascendente quedan de la

forma siguiente:

1, 2, 4, 4, 4, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 9

El recuento de casos consiste en anotar cuantas veces aparece repetido cada valor.

1/1

2/1

4 /// 3

5 //// 4
6 // 2

7 //// / 6

8 // 2

9/1

Valores

Recuento

Suma

Ejercicio:

Dada la siguiente serie:

25, 30, 28, 27, 30, 37, 29, 31, 28, 38, 25, 28, 32, 38, 28, 30, 21, 21, 25, 31, 28, 25, 31, 29,

25

Se pide:

a) ordenar los datos.

b) Hacer el recuento de casos

La ordenación de los datos es imprescindible para el recuento de casos y cálculos

posteriores.

Construcción de una distribución de frecuencias para datos cuantitativos

Recopilación de datos

Ordenación de datos

Recuento de casos

Se construye una tabla de marcas en donde se anota cuantas veces aparece repetido cada

valor.

VALORES RECUENTO SUMA


23 // 2

24 // 2

25 //// 4

26 / 1

27 //// 5

28 //// 4

29 //// 5

30 //// / 6

33 //// 5

34 / 1

35 // 2

36 / 1

37 //// 4

38 /// 3

39 // 2

40 /// 3

Construcción de una distribución de frecuencias para datos cuantitativos

Calculo del Rango (R), Número de Clases (K) y Amplitud de la clase (C)

De los datos ordenados se extraen el valor máximo y el mínimo

Rango (R)= 18

+1

+ (1)
+1 = 18

En el presente caso se utilizaran 6 clases por conveniencia de cálculo.

K = 6 clases

C = 18/6 = 3

C = 3 (Amplitud de clase)

O No existen reglas fijas para la determinación del número y amplitud de los intervalos, lo

aconsejable es seguir los siguientes pasos:

1. Determinar el Rango, recorrido o amplitud de la distribución (R).

2. Dividir el recorrido entre el número de intervalos (K) que se desee (el que más convenga

para el cálculo).

3. El cociente de la división anterior será la amplitud de los intervalos (C).

N = es el número total de datos.

En el ejemplo que estamos desarrollando utilizaremos Intervalos de clase

Semi abiertos por la derecha

Construcción de una distribución de frecuencias para datos cuantitativos

Calcular las clases (K):

LS= 23 + 3 = 26

En el ejemplo se usará intervalo semiabierto por la derecha

El siguiente:

LI= 26 y C=3

LS= 26 + 3 = 29

[23-26)

[26-29) y así sucesivamente.


Construcción de una distribución de frecuencias para datos cuantitativos

Calcular Marcas de Clase (XI)

23+25/2= 24

26+28/2= 27

29+31/2= 30

32+34/2= 33

35+37/2= 36

38+40/2= 39

Construcción de una distribución de frecuencias para datos cuantitativos

Calcular frecuencia absoluta (fi)

VALORES RECUENTO SUMA

23 // 2

24 // 2

25 //// 4

26 / 1

27 //// 5

28 //// 4

29 //// 5

30 //// / 6

33 //// 5

34 / 1

35 // 2
36 / 1

37 //// 4

38 /// 3

39 // 2

40 /// 3

Los valores que se incluyen y que cuentan en cada intervalo del tipo [a-b) son los mayores

o iguales a

A y menores que b.

Como se están usando intervalos semi abiertos por la derecha [a-b) los valores de

B no se cuentan en dicho intervalo

10

11

[a, b) = {x / a < x < b}

Construcción de una distribución de frecuencias para datos cuantitativos

Calcular Frecuencia relativa (fri)

N= 50 datos

Al multiplicar la frecuencia relativa por 100 se obtiene el valor del porcentaje de cada clase

(K), muy útil para la elaboración de gráficas.

fri = fi/N
Construcción de una distribución de frecuencias para datos cuantitativos

Calcular Frecuencia Acumulada (FI)

La última frecuencia acumulada es igual a N (total de casos o suma de las frecuencias

absolutas). Esto puede servir para comprobar si la acumulación se hizo bien.

La lectura de las frecuencias acumuladas se hace así:

" tantos casos hasta tal valor"

Por ejemplo: Vemos en la columna FI que hay 29 casos hasta el valor 32, que es el límite

superior del intervalo [29-32).

Construcción de una distribución de frecuencias para datos cuantitativos

10

Calcular la Frecuencia relativa acumulada (FRI)

FRI = FI/N

N= 50 datos

Al multiplicar la frecuencia relativa acumulada por 100 se obtiene el valor del porcentaje

acumulado de cada clase (K).

Las frecuencias relativas acumuladas (FRI), en proporción o porcentaje, indican la

proporción o el porcentaje acumulado de los valores de la variable, con respecto al total de

casos, ubicados por arriba o por abajo de cada clase (K) .

A las frecuencias acumuladas expresadas en porcentajes se les llama RANGOS

PERCENTILES. dividiendo

Construcción de una distribución de frecuencias para datos cuantitativos

A esta tabla se pueden agregar las columnas de: Porcentaje fri x 100, y Porcentaje

acumulado
FRI X 100

Una tabla de Clasificación o Distribución de frecuencias permite mostrar como se clasifican

los sujetos pertenecientes a una muestra o población de acuerdo a las modalidades,

categorías o valores de una sola variable.


1.2.1 DISTRIBUCIÓN DE FRECUENCIAS

Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la

variable por filas. En las columnas se dispone el número de ocurrencias por cada valor,

porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de

la información que contienen los datos.

Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de la

exhibición de imágenes violentas por televisión, para lo cual han recogido los siguientes

datos:

La inspección de los datos originales no permite responder fácilmente a cuestiones como

cuál es la actitud mayoritaria del grupo, y resulta bastante más difícil determinar la

magnitud de la diferencia de actitud entre hombres y mujeres.

Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable

acompañados del número de veces (la frecuencia) que aparece cada valor:

X: Símbolo genérico de la variable.

f: Frecuencia (también se simboliza como ni).


La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria

de los individuos del grupo estudiado es indiferente.

La interpretación de los datos ha sido facilitada porque se ha reducido el número de

números a examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la

variable y 5 frecuencias).

Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el

número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o "pi"),

frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de los valores

iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No obstante la frecuencia

acumulada también es definida incluyendo al valor de referencia), frecuencias acumuladas

relativas (la frecuencia acumulada relativa es el total de frecuencias relativas de los valores

iguales o inferiores al de referencia, y se simbolizan "fr" o "pa")

Ejemplo: Consideremos el siguiente grupo de datos:

La distribución de freciemcias es:


La reducción de datos mediante el agrupamiento en frecuencias no facilita su

interpretación: La tabla es demasiado grande. Para reducir el tamaño de la tabla agrupamos

los valores en intervalos, y las frecuencias son las de los conjuntos de valores incluidos en

los intervalos:
Ahora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar inmediatamente

que el intervalo con mayor número de datos es el 34-39, o que el 75% de los datos tiene

valor inferior a 46.

Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".

Elementos básicos de las tablas de intervalos:

 Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en

una distribución de frecuencias

 Límites aparentes: Valores mayor y menor del intervalo que son observados en la

tabla. Dependen de la precisión del instrumento de medida. En el ejemplo, los

límites aparentes del intervalo con mayor número de frecuencias son 34 y 39.

 Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se

contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos

límites son 33.5 y 39.5

 Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido por

dos. Mc del intervalo del ejemplo= 36.5

 Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto

inferior. En el ejemplo es igual a 6.


1.2.2 PRESENTACIÓN GRÁFICA DE DATOS

Las tablas estadísticas representan toda la información de modo esquemático y están

preparadas para los cálculos posteriores. Los gráficos estadísticos nos transmiten esa

información de modo más expresivo, nos van a permitir, con un sólo golpe de vista,

entender de que se nos habla, observar sus caracteícticas más importantes, incluso sacar

alguna conclusión sobre el comportamiento de la muestra donde se esta realizando el

estudio.

Los gráficos estadísticos son muy útiles para comparar distintas tablas de frecuencia.

Los gráficos estadísticos más usuales son:

DIAGRAMA DE BARRAS.

Se utiliza para la representación de variables cuantitativas discretas, cada valor de la

variable se representa por un punto sobre el eje OX y sobre él se dibuja una barra de

longitud igual o proporcinal a su frecuencia absoluta. Si la frecuencia absoluta que se

utiliza es la acumulativa, el diagrama de barras que se obtiene es: diagrama de barras

acumulativo

HISTOGRAMA.

Se utiliza para la representación de variables cuantitativas continuas, cada intervalo se

representa sobre el eje OX , este será la base del rectángulo que se dibuja sobre él con

altura igual o proporcional a su frecuencia absoluta. Como los intervalos son consecutivos,

los rectángulos quedan adosados. Si se utilizarán rectángulos de amplitud diferente, el área

del rectángulo es la que tendría que ser proporcional a la frecuencia absoluta


correspondiente a ese intervalo. Histograma acumulativo, si se utiliza la frecuencia

absoluta acumulativa.

POLÍGONO DE FRECUENCIAS.

Se utilizan para variables estadísticas cuantitativas, discretas o continuas.

Para una variable discreta, el polígono de frecuencias se obtiene uniendo por una

poligonal, los extremos superiores de las barras.

Para una variable continua, el poligono de fecuencias se obtiene uniendo por una poligonal

los puntos medios de la base superior de los poligonos del histograma.

Las escalas utilizadas para representar los polígonos de frecuencias influyen mucho por el

impacto visual de los mismos.

DIAGRAMA DE SECTORES.

Se utiliza para todo tipo de variable estadística, cuantitativa o cualitativa. Consiste en

dibujar sectores sobre un círculo, siendo la amplitud de los sectores proporcional a su

frecuencia absoluta, cada sector se rellena con un color diferente.

El cálculo de la amplitud en grados sexagesimales del sector correspondiente se realiza

así: ángulo = frecuencia relativa*360

Ejemplo 2.- Hemos preguntado a 20 personas por el número medio de días que practican

deporte a la semana y hemos obtenido las siguientes respuestas:

Nº días (xi) fr. absoluta (ni)

0 1

1 2
2 4

3 7

4 1

5 1

6 3

7 1

Total 20

Realiza en tu cuaderno el diagrama de barras, el poligono de frecuencias y el diagrama de

sectores correspondiente, y comprueba en la escena los resultados.

Con el pulsador de "gráfico" puedes, al variar su valor, elegir diferente representación

gráfica: 1 para diagrama de barras, 2 para el polígono de frecuencia y 3 para el diaframa de

sectores.

Puedes cambiar los valores de las frecuencias absolutas y observar su imfluencia en el

correspondiente gráfico.

Ejemplo 3.- En un preconocimiento médico realizado a 30 niños, uno de los datos que se han

tomado ha sido el peso, en kilogramos, de cada uno, los resultados obtenidos se reflejan en la

siguiente tabla:

marca fr.

Intervalo clase absoluta

(xi) (ni)

[20 , 24) 22 3
[24 , 28) 26 6

[28 , 32) 30 10

[32 , 36) 34 8

[36 , 40) 38 3

Total 30

Realiza en tu cuaderno el Histograma, el poligono de frecuencias y el diagrama de sectores

correspondiente, y comprueba en la escena los resultados.

Con el pulsador de "gráfico" puedes, al variar su valor, elegir diferente representación

gráfica: 1 para Histograma, 2 para el polígono de frecuencia y 3 para el diaframa de sectores.

Puedes cambiar los valores de las frecuencias absolutas y observar su imfluencia en el

correspondiente gráfico.

Actividad 4.- Un aparato de radar instalado a la entrada de una población (velocidad máxima

permitida, 60Km./h) ha registrado la siguiente " estadística" de infracciones.

De más de 60 a 70 Km./h ................................... 30 vehículos

Entre 70 y 80 Km./h ........................................... 40 "

Entre 80 y 90 Km./h ........................................... 90 "

Entre 90 y 100 Km./h ........................................... 80 "

Entre 100 y 110 Km./h ........................................... 60 "

Entre 110 y 120 Km./h ........................................... 10 "


Dibuja un Histograma que refleje estos valores.

Actividad 5.- Utilizando la encuesta que has realizado en la actividad 2, construye la tabla de

frecuencias, para cada variable estadística que has considerado, y representa la

correspondiente tabla de frecuencias, en el gráfico más adecuado.


1.2.2.1 GRÁFICA DE BARRAS

Una gráfica de barras tiene barras rectangulares con longitudes proporcionales a los valores

que representan. Las gráficas de barras se utilizan para comparar dos o más valores. Las

barras pueden ser horizontales o verticales.

Antes de empezar

Para poder definir gráficas, primero debe asegurarse de que el entorno de Decision Server

Events esté preparado para la supervisión. Consulte Preparación del entorno para la

supervisión.

Procedimiento

1. Acceda al widget de gestor de gráficas de sucesos (consulte Acceso a los Widgets

de sucesos para obtener más información).

2. Pulse Añadir gráfica. En el campo Nombre de gráfica, escriba un nombre para la

gráfica.

3. Pulse Seleccionar tipo de gráfica y seleccione Barra horizontal o Barra vertical.

4. Especifique el texto que se va a mostrar debajo de la gráfica en el campo Etiqueta

de eje X. Especifique el texto que se va a mostrar a la izquierda de la gráfica en el

campo Etiqueta de eje Y. Si no se especifica ningún valor, no se mostrará ninguna

etiqueta.

5. En el separador Variables en la gráfica, seleccione las variables que se van a incluir

en la gráfica. Consulte Adición o eliminación de variables de gráficas.

6. En el separador Rango de tiempo, defina el rango de historial en los campos Hora

de inicio y Hora de finalización. Para obtener información más detallada sobre la

definición del rango de tiempo, consulte Modificación de los valores de intervalo de

tiempo de una gráfica.


7. Pulse Guardar cambios para guardar la gráfica.

Ejemplo

Tabla 1. Ejemplos de una gráfica de barras horizontales y verticales

1.2.2.2 GRÁFICA DE PASTEL

Gráfico sobre la población mundial.

Gráfico de la población de hablantes del idioma inglés.


Primer gráfico circular conocido de la obra de William Playfair Breviario Estadístico

(1801), mostrando las proporciones del Imperio turco localizado en Asia, Europa y África,

antes de 1789.

Un gráfico circular o gráfica circular, también llamado "gráfico de pastel", "gráfico de

tarta", "gráfico de torta" o "gráfica de 360 grados", es un recurso estadístico que se utiliza

para representar porcentajes y proporciones. El número de elementos comparados dentro de

una gráfica circular suele ser de más de cuatro.

El gráfico circular más temprano conocido se atribuye generalmente al escocés William

Playfair, en la obra Statistical Breviary de 1801.12

Características

Se utilizan en aquellos casos donde interesa no solamente mostrar el número de veces que

se dan una característica o atributo de manera tabular sino más bien de manera gráfica, de

tal manera que se pueda visualizar mejor la proporción en que aparece esa característica

respecto del total.

A pesar de su popularidad, se trata de un tipo de gráfico poco recomendable debido a que

nuestra capacidad perceptual para estimar relaciones de proporción o diferencias entre áreas

de sectores circulares es mucho menor que, por ejemplo, entre longitudes o posiciones, tal y

como sucede en otras gráficas.


1.2.2.3 HISTOGRAMA

En estadística, un histograma es una representación gráfica de una variable en forma de

barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores

representados. Sirven para obtener una "primera vista" general, o panorama, de la

distribución de la población, o de la muestra, respecto a una característica, cuantitativa y

continua (como la longitud o el peso). De esta manera ofrece una visión de grupo

permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por

ubicarse hacia una determinada región de valores dentro del espectro de valores posibles

(sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar

comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los

valores de todas las partes que componen la población o la muestra, o, en contraposición,

poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que

toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada

miembro de la población toma por su lado y adquiere un valor de la característica

aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la

muestra, según sea el caso, que se ubica en un determinado valor o sub-rango de valores de

la característica que toma la característica de interés, evidentemente, cuando este espectro


de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la

tendencia o comportamiento de la población, en otras ocasiones este espectro es extendido

para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de

un valor de interés.

Se utilizan para relacionar variables cuantitativas continuas. Para variables cuantitativas

discretas las barras se dibujan separadas y el gráfico se llama diagrama de frecuencias,

porque la variable representada en el eje horizontal ya no representa un espectro continuo

de valores, sino valores cuantitativos específicos, igual que ocurre en un diagrama de

barras, usado para representar una característica cualitativa o categórica. Su utilidad se hace

más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han

agrupado en intervalos de clase.

Ejemplos de su uso es la representación de edades o estaturas de una población. Por

comodidad, sus valores se agrupan en clases, es decir, en intervalos continuos. En los casos

en los que los datos son cualitativos (no numéricos), como sexto grado de acuerdo o nivel

de estudios, es preferible un diagrama de sectores.

Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en

ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Etimología

El término "histograma" fue acuñado en 1891 por el matemático estadístico inglés Karl

Pearson y es un compuesto de los términos griegos ἱστός (‘histós’, “mástil”) y γράμμα

('gramma', "dibujo, figura")1

Tipos de gráficos relacionados con el histograma

 Histograma de frecuencias absolutas


Representa la frecuencia absoluta mediante la altura de las barras. Se usa mucho en

educación no universitaria por su sencillez, pero sólo se puede aplicar cuando todos

los intervalos son iguales, ya que en ese caso las alturas y las superficies son

proporcionales. En esos niveles educativos se introduce una estadística elemental y

todavía no se puede profundizar en estos detalles.

 Histograma de frecuencias relativas

Representa la frecuencia relativa mediante la altura de las barras. Igual que en el

caso anterior se usa mucho en educación no universitaria. La elaboración del gráfico

es más complicada pues los números ya no son enteros. Como en el caso anterior

sólo se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las

alturas y las superficies son proporcionales.

 Histograma

Representa la frecuencia relativa mediante la superficie de las barras. Aunque esto

sea cierto en todos los histogramas, cuando se agrupan los datos en intervalos

desiguales hay que atender a la superficie de las barras, que no se corresponderá con

la altura como ocurría en los casos anteriores. Es el que se suele usar en educación

universitaria. Para su elaboración debe introducirse el concepto de altura de

histograma, que es un concepto equivalente al de densidad de probabilidad, y que se

calcula dividiendo la frecuencia relativa de ese intervalo (o sea la superficie que

queremos darle) entre la anchura del intervalo (la base del rectángulo). Ahora las

barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas

esas superficies (de todas las barras) será 1, o sea el 100%.

 Función densidad
Representa la probabilidad mediante la superficie de las barras. Es un gráfico

idéntico al histograma pero aplicado a distribuciones teóricas. El concepto de

frecuencia relativa se cambia por el de probabilidad, pero también se representa por

superficies y la suma de todas esas superficies (de todas las barras) será 1, como en

el histograma, o sea el 100% de probabilidad.

 Curva acumulativa u ojiva

Es un gráfico acumulativo (véase Función_de_distribución) que representa la

frecuencia relativa acumulada hasta cada valor de la variable. Si el rango es finito el

primer valor del rango tiene frecuencia acumulada (anterior) cero y el último tiene

frecuencia acumulada 1 (100%). Así el eje vertical siempre toma valores de cero a

uno y representa frecuencias relativas (o probabilidades si se trata de distribuciones

teóricas). Se utiliza para introducir el concepto y el cálculo de la mediana, los

cuartiles, los deciles y en general los parámetros llamados de posición. Si el rango

es infinito, como suele ocurrir en las distribuciones teóricas (Normal, student, chi-

cuadrado, etc,) el cero puede no alcanzarse y será el valor asintótico por la

izquierda, si tampoco se alcanza el uno también será el valor asintótico derecho, y

en muchos casos no se alcanza ni uno ni otro, teniendo dos asintotas. Este gráfico es

la integral del histograma (cuando trabajamos con distribuciones reales) o de la

función densidad (cuando trabajamos con distribuciones teóricas).

 Curva acumulativa de frecuencias absolutas

Es un gráfico acumulativo que representa la frecuencia absoluta acumulada hasta

cada valor de la variable. Realmente no es un gráfico relacionado con el histograma,

pero es muy parecido a la curva acumulativa y a la función de distribución. Se usa

mucho en enseñanza no universitaria por su sencillez, ya que permite trabajar con


números enteros (frecuencias absolutas) y, como la anterior, permite introducir y

calcular mediana, cuartiles, etc. Esta curva no irá entre cero y uno sino entre cero y

el total de individuos de la muestra.

 Nota

En todos estos diagramas la muestra o la población se divide en intervalos (del

parámetro a estudiar, por ejemplo estatura) y aparece el dilema de si incluir el

extremo del intervalo (por ejemplo 180 cm) en el primer o en el segundo intervalo

en los que aparece. Tradicionalmente se incluye en el segundo y los intervalos

quedan abiertos por la derecha: [170, 180) y [180,190). Sin embargo, dependiendo

del problema a estudiar (problemas en que los extremos salen con mucha frecuencia

frente a otros en que no salen nunca) y de la costumbre, se pueden encontrar otras

elecciones.
3ra. Semana:

1.2.2.4 POLÍGONO DE FRECUENCIAS

Polígono de frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de

un histograma de frecuencia. Estos histogramas emplean columnas verticales para reflejar

frecuencias): el polígono de frecuencia es realizado uniendo los puntos de mayor altura de

estas columnas.

Es decir, por tanto, podríamos establecer que un polígono de frecuencia es aquel que se

forma a partir de la unión de los distintos puntos medios de las cimas de las columnas que

configuran lo que es un histograma de frecuencia. Este se caracteriza porque utiliza siempre

lo que son columnas de tipo vertical y porque nunca debe haber espacios entre lo que son

unas y otras.

En las ciencias sociales, en las ciencias naturales y también en las económicas es donde con

más frecuencia se hace uso de estos mencionados histogramas ya que se emplean para

llevar a cabo lo que es la comparación de los resultados de un proceso determinado.

Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se desarrollan

mediante la marca de clase que tiene coincidencia con el punto medio de las distintas

columnas del histograma. En el momento de la representación de todas las frecuencias que

forman parte de una tabla de datos agrupados, se genera el histograma de frecuencias

acumuladas que posibilita la diagramación del polígono correspondiente.

Un polígono de frecuencia, por ejemplo, permite reflejar las temperaturas máximas

promedio de una ciudad en un determinado periodo temporal. En el eje X (horizontal),

deben indicarse los meses del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical),

en cambio, se registran las temperaturas más altas promedio de cada mes (28º, 26º, 22º…).
El polígono de frecuencia se creará al unir, mediante un segmento, las diversas

temperaturas más elevadas promedio.

Los polígonos de frecuencia se suelen usar cuando se pretende retratar varias distribuciones

distintas o la clasificación cruzada de una variable cuantitativa continua con una cualitativa

o cuantitativa discreta en el mismo dibujo.

El punto de más altura de un polígono de frecuencia equivale a la mayor frecuencia,

mientras que el área que se sitúa debajo de la curva incluye todos los datos que existen.

Cabe recordar que la frecuencia es la repetición mayor o menor de un evento, o el número

de veces que un acontecimiento periódico se reitera en una unidad temporal.

Dado el valor y la utilidad que tienen los citados polígonos hay que resaltar que estos se

pueden confeccionar de una manera muy sencilla y rápida. En concreto, se da la

oportunidad de acometerlos mediante un programa informático que se ha convertido en uno

de los ejes claves del funcionamiento de cualquier empresa. Nos estamos refiriendo al

software conocido como Excel.

Este es un programa, de Microsoft Office, que se confeccionó con el claro objetivo de que

sus usuarios pudieran trabajar con lo que son hojas de cálculo. Por tal motivo, es lógico que

también permita la posibilidad de crear polígonos de frecuencia a la hora de comparar cifras

y tomar decisiones en base a las mismas.


1.2.2.5 OJIVA

En estadística la ojiva es un polígono frecuencial acumulado, es decir, que permite ver

cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de

solo exhibir los números asignados a cada intervalo.

La ojiva apropiada para información que presente frecuencias mayores que el dato que se

está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la

que se asigna a valores menores, tendrá una pendiente positiva.

Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar

parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas,

existen las ojivas "mayor que" y las ojivas "menor que".

Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por

esto la aplicación de la técnica es parcial):

 Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor que"

sucede con el extremo izquierdo; para la ojiva "menor que", con el derecho.

 En el eje horizontal, en lugar de colocar las marcas de clase, se colocan las fronteras

de clase. Para el caso de la ojiva "mayor que" es la frontera menor; para la ojiva

menor que, la mayor.

La ojiva "mayor que" se le denomina de esta manera porque viendo el aspire que está sobre

el límite superior se ven las frecuencias que tienen por encima de ese límite superior. De

forma análoga, en la ojiva "menor que" la frecuencia que se representa en cada frontera de

clase son el número de observaciones menores que la frontera señalada (en caso de tiempos

sería el número de observaciones antes de la hora que señala la frontera).


1.2.2.6 GRÁFICAS LINEALES

El gráfico lineal (gráfico de líneas o diagrama lineal) se compone de una serie de datos

representados por puntos, unidos por segmentos lineales. Mediante este gráfico se puede

comprobar rápidamente el cambio de tendencia de los datos.

El diagrama lineal se suele utilizar con variables cuantitativas, para ver su

comportamiento en el transcurso del tiempo. Por ejemplo, en las series temporales

mensuales, anuales, trimestrales, etc.

Los pasos para construir el gráfico de líneas son los siguientes:

 En el eje horizontal (eje de abcisas) se colocan los períodos de tiempo (meses,

años, trimestres,…)

 En el eje vertical (eje de coordenadas) se colocan las frecuencias absolutas o

relativas.

 Se señalan los puntos. A cada período de tiempo le corresponde un punto en el

valor de su frecuencia.

 Se unen mediante segmentos lineales los puntos consecutivos.


 Se quiere comparar la deuda pública en el año 2012 de ocho paises: España,

México, Ecuador, Guatemala, Estados Unidos, Colombia, Perú y Argentina. Para

ello, se obtienen los datos de la deuda pública de los paises y se divide por el PIB

(Producto Interior Bruto) de cada uno de ellos. Los porcentajes de deuda respecto

PIB son los siguientes:

 A partir de estos datos, se construye el gráfico lineal.


1.2.2.7 Gráficas de puntos

Los gráficos de puntos son útiles para mostrar datos cuantitativos de una forma organizada.

Los gráficos de puntos usan varios puntos para trazar datos a lo largo de un eje ordinal. Un

gráfico de puntos es similar a un gráfico de líneas, pero sin las líneas. Solamente se

muestran los puntos de datos.

En el ejemplo siguiente se muestran los ingresos de cada línea de producto.

Figura 1. Ejemplo de gráfico de puntos


4ta. Semana:

1.3 Análisis descriptivo de datos de una sola variable

1.3.1 Medidas de tendencia central


Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son:
media, mediana y moda. Las medidas de dispersión en cambio miden el grado de
dispersión de los valores de la variable. Dicho en otros términos las medidas de dispersión
pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de
medidas usadas en conjunto permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo
de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una
tabla estadística diremos que se encuentran “agrupados” y si los datos no están en una tabla
hablaremos de datos “no agrupados”.

Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no
agrupados y luego para datos agrupados.

Medidas estadísticas en datos no agrupado


Medidas de tendencia central

Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o promedio
aritmético. Se representa por la letra griega µ cuando se trata del promedio del universo o
población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es
importante destacar que µ es una cantidad fija mientras que el promedio de la muestra es
variable puesto que diferentes muestras extraídas de la misma población tienden a tener
diferentes medias. La media se expresa en la misma unidad que los datos originales:
centímetros, horas, gramos, etc.

Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:


Estos cálculos se pueden simbolizar:
Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda
observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor
de la i-ésima observación. En este caso el promedio está dado por
De aquí se desprende la fórmula definitiva del promedio:
Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del
dato y la media:

Ejemplo de desviaciones:
Una propiedad interesante de la media aritmética es que la suma de las desviaciones es
cero.
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que
ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el
50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene
valores iguales o superiores a la mediana.

Si el número de observaciones es par, la mediana corresponde al promedio de los dos


valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

Moda
La moda de una distribución se define como el valor de la variable que más se repite. En un
polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto
más alto del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.

Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la
variable.
La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz cuadrada, la
desviación estándar. La varianza se representa con el símbolo σ² (sigma cuadrado) para el
universo o población y con el símbolo s2 (s cuadrado), cuando se trata de la muestra. La
desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma)
cuando pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ
son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores
que cambian de muestra en muestra dentro de una misma población. La varianza se expresa
en unidades de variable al cuadrado y la desviación estándar simplemente en unidades de
variable.
Fórmulas
Donde µ es el promedio de la población.
Donde Ȳ es el promedio de la muestra.

Consideremos a modo de ejemplo una muestra de 4 observaciones


Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas de
dispersión:
s2 = 34 / 3 = 11,33 Varianza de la muestra

La desviación estándar de la muestra (s) será la raíz cuadrada de 11,33 = 3,4.

Interpretación de la varianza (válida también para la desviación estándar): un alto valor de


la varianza indica que los datos están alejados del promedio. Es difícil hacer una
interpretación de la varianza teniendo un solo valor de ella. La situación es más clara si se
comparan las varianzas de dos muestras, por ejemplo varianza de la muestra igual 18 y
varianza de la muestra b igual 25. En este caso diremos que los datos de la muestra b tienen
mayor dispersión que los datos de la muestra a. esto significa que en la muestra a los datos
están más cerca del promedio y en cambio en la muestra b los datos están más alejados del
promedio.

Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar
de la muestra expresada como porcentaje de la media muestral.
Es de particular utilidad para comparar la dispersión entre variables con distintas unidades
de medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar,
es independiente de la unidad de medida de la variable de estudio.
Medidas de tendencia central y de dispersión en datos agrupados
Se identifica como datos agrupados a los datos dispuestos en una distribución de
frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, modo, varianza
y desviación estándar deben incluir una leve modificación. A continuación se entregan los
detalles para cada una de las medidas.

Promedio en datos agrupados


La fórmula es la siguiente:
Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores
de Yi.
Consideremos como ejemplo una distribución de frecuencia de madres que asisten a un
programa de lactancia materna, clasificadas según el número de partos. Por tratarse de una
variable en escala discreta, las clases o categorías asumen sólo ciertos valores: 1, 2, 3, 4, 5.
Entonces las 42 madres han tenido, en promedio, 2,78 partos.

Si la variable de interés es de tipo continuo será necesario determinar, para cada intervalo,
un valor medio que lo represente. Este valor se llama marca de clase (Yc) y se calcula
dividiendo por 2 la suma de los límites reales del intervalo de clase. De ahí en adelante se
procede del mismo modo que en el ejercicio anterior, reemplazando, en la formula de
promedio, Yi por Yc.

Mediana en datos agrupados


Si la variable es de tipo discreto la mediana será el valor de la variable que corresponda a la
frecuencia acumulada que supere inmediatamente a n/2. En los datos de la tabla 1 Me=3, ya
que 42/2 es igual a 21 y la frecuencia acumulada que supera inmediatamente a 21 es 33,
que corresponde a un valor de variable (Yi) igual a 3.

Si la variable es de tipo continuo es necesario, primero, identificar la frecuencia acumulada


que supere en forma inmediata a n/2, y luego aplicar la siguiente fórmula:
Donde:

Moda en datos agrupados


Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi) que tenga
la mayor frecuencia absoluta ( ). En los datos de la tabla 1 el valor de la moda es 3 ya que
este valor de variable corresponde a la mayor frecuencia absoluta =16.
Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza y
desviación estándar en datos agrupados con intervalos.

Varianza en datos agrupados


Para el cálculo de varianza en datos agrupados se utiliza la fórmula
Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78 partos por
madre,
Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca de clase
(Yc), de tal modo que la fórmula queda:
Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo

Yc= (Límite inferior del intervalo + limite superior del intervalo)/2.


Percentiles
Los percentiles son valores de la variable que dividen la distribución en 100 partes iguales.
De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa que el 80% de
los casos tiene edad igual o inferior a 35 años.

Su procedimiento de cálculo es relativamente simple en datos agrupados sin intervalos.

Retomemos el ejemplo de la variable número de partos:


El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada
supera inmediatamente al “j” % de los casos (jxn/100).

El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).

El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el valor 4.
Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que un
80% de las madres estudiadas han tenido 4 partos o menos.
Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente más
complejo ya que se hace necesaria la aplicación de una fórmula.
Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente
superior al “j” % de los casos (jxn/100).

En la siguiente tabla se muestra la distribución de 40 familias según su ingreso mensual en


miles de pesos. Nótese que para calcular el centro de clase se usaron los límites reales de
cada intervalo.
1.3.1.1 MEDIA ARITMÉTICA

La media aritmética es la suma de todos los datos dividida entre el número total de datos.

Se calculan dependiendo de cómo vengan ordenados los datos.

Ejemplo:

¿Cuál es la media de las edades de Andrea y sus primos?

La media aritmética de un grupo de datos se calcula así:

Se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos productos, y

el resultado dividirlo por la suma de los datos.

Ejemplo:

Se ha anotado el número de hermanos que tiene un grupo de amigos. Los datos obtenidos

son los siguientes:

Hermanos: 1, 1, 1, 1, 2, 2, 2, 3, 3, 4

Si hacemos el recuento de los datos y seguimos los pasos anteriormente descritos,

tenemos:
2- Moda

La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel que

tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos valores de la

variable que tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún

valor, no existe moda.

- Ejemplo1:

¿Cuál es el dato que más se repite en el ejemplo anterior?

El dato que más se repite es el 1, es el que tiene mayor frecuencia absoluta (4 veces).

La moda del número de hermanos es 1

- Ejemplo 2:

2, 3, 4, 5 , 6 , 9

En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto

de valores no tiene moda.

- Ejemplo 3:

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es

la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.


- Ejemplo 4:

0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio

de las dos puntuaciones adyacentes.

3- La mediana

La mediana es el valor que ocupa el lugar central entre todos los valores del conjunto de

datos, cuando estos están ordenados en forma creciente o decreciente.

La mediana se representa por Me.

Calculo de la mediana:

1° Ordenamos los datos de menor a mayor.

- La mediana de un conjunto con un número impar de datos es, una vez ordenados los

datos, el dato que ocupa el lugar central.

Ejemplo:

Calcular la mediana del conjunto de datos:

- También podemos usar la siguiente fórmula para determinar la posición del dato central:

(n + 1) /2 = mediana datos impares.


- La mediana de un conjunto con un número par de datos es, una vez ordenados, la

media de los dos datos centrales.

Ejemplo:

Calcular la mediana del conjunto de datos:

4- Rango

El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato

menor al dato mayor.

Este dato permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango,

más dispersos están los datos de un conjunto.

Ejemplo:

Se preguntó a 9 familias cuántas bicicletas tenían en total, dieron las respuestas ordenadas

en la siguiente tabla:
- ¿Cómo hallarías el rango?

Se resta el dato mayor al dato menor: 3 - 0 = 3; Por lo tanto el rango sería 3 en este caso.

Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango es muy

amplio, es conveniente agruparlos y ordenarlos en intervalos o clases.

La amplitud o tamaño de cada intervalo se puede calcular dividiendo el valor del rango

por la cantidad de intervalos que se desean obtener.

4- Ejercicios:

1- Se le pregunta a un grupo de personas acerca de la cantidad de libros que leyó durante el

año 2015, y las respuestas son: 4; 3; 2; 7; 10; 8; 2; 9; 3; 6; 8; 1; 1; 9; 2. La moda de la

muestra es:

a) 2 b) 3 c) 4 d) 5 e) 9

2- Halla la mediana de las siguientes series estadísticas.

a) 1, 7, 3, 2, 4, 6, 2, 5, 6

b) 4, 2, 1, 3, 8, 5, 3, 1, 6, 7

3- Se tienen dos distribuciones cuyos datos son los siguientes:

Distribución A: 9, 5, 3, 2, 1, 2, 6, 4, 9, 8, 1, 3, 5, 4, 2, 6, 3, 2, 5, 6, 7

Distribución B: 1, 1, 3, 2, 5, 6, 7, 2, 5, 4, 3, 1, 2, 1, 5, 7, 8, 9, 9, 2, 1

a) Halla el rango de ambas distribuciones.

4- Se tiene el siguiente conjunto de datos:

10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18

a) Obtén la mediana
Respuestas:

1- a

2- a) 1, 2, 2, 3, 4, 5, 6, 6, 7 M=4

b) 1, 1, 2, 3, 3, 4, 5, 6, 7, 8; La mediana es la media aritmética de los dos valores centrales,

M = 3,5.

3- Rango de A: 9 - 1 = 8

Rango de B: 9 - 1 = 8

4- a) Ordenamos los datos de menor a mayor:

3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20

Como hay 26 valores, la mediana es la media de los dos valores centrales: M= 10 + 10 / 2

= 10
1.3.1.2 MEDIA PONDERADA

La media ponderada (MP) es una medida de centralización. Consiste en otorgar a cada

observación del conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN) según la

importancia de cada elemento.

Cuanto más grande sea el peso de un elemento, más importante se considera que es éste.

La media ponderada tiene numerosas aplicaciones, por ejemplo, la nota de una

asignatura donde el examen final tiene un peso mayor al de un trabajo. O en el cálculo del

IPC (Índice de Precios de Consumo). El IPC es un indicador de los precios de los bienes y

servicios básicos que consume la población. Para calcularlo, se otorga pesos a los diferentes

bienes (pan, fruta, vivienda,…) y se calcula la media ponderada.

La media aritmética es un caso particular de media ponderada, en la que todos los pesos

son uno, ya que a todos los elementos se les otorga la misma importancia.

Ejercicio

La nota final de una asignatura es una media ponderada de las notas que han obtenido los

alumnos en los cuatro elementos evaluables que determina el profesor. El responsable de la

asignatura otorga un peso de 3 al examen inicial, de 1 al trabajo entregable, 2 al trabajo

final y 4 al examen final. Las notas de un alumno han sido las siguientes:
Se hace la suma de los productos de las notas por el peso de cada nota y se divide por la

suma de los pesos.

La nota final del alumno en esta asignatura es de 6,14. Se puede ver en el siguiente gráfico

como la nota es muy próxima a las notas sacadas en los exámenes. Esto es a causa de que

los exámenes eran más importantes y tenían unos pesos mucho mayores que los de los

trabajos.
1.3.1.3 MEDIA GEOMÉTRICA

La media geométrica (MG) de un conjunto de números estrictamente positivos (X1,

X2,…,XN) es la raíz N-ésima del producto de los N elementos.

Todos los elementos del conjunto tienen que ser mayores que cero. Si algún elemento fuese

cero (Xi=0), entonces la MG sería 0 aunque todos los demás valores estuviesen alejados del

cero.

La media geométrica es útil para calcular medias de porcentajes, tantos por uno,

puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a los

valores extremos.

Ejercicios

Ejercicio 1

En una empresa quieren saber la proporción media de mujeres en los diferentes

departamentos. Para ello, se recoge el porcentaje de mujeres en los cinco principales

departamentos.
Como es la media de porcentajes, calculamos la media geométrica que es más

representativa.

Ejercicio 2

Una aldea sufre un proceso rápido de envejecimiento. El primer año aumentan los mayores

de 65 años un 10%, el segundo año, un 20%, el tercer año un 30% y el cuarto año, un 40%.

Si la población de inicial es de 100 mayores de 65 años, ¿cuál será un mejor indicador para

caracterizar ese envejecimiento: la media aritmética o la media geométrica?


Solución:

Sabemos que para llegar a la cifra final al cabo de los cuatro años, debemos acumular

sucesivamente los porcentajes anuales:

Tras el cuarto año, en la aldea hay 240 personas con más de 65 años.

Si calculamos la media aritmética de los porcentajes de incremento anual, obtendremos:

Si esta media aritmética la acumulamos a los cuatro años:

El resultado obtenido excede a la realidad.

Pero si hubiésemos empleado la media geométrica de los incrementos anuales:

Llegamos a un porcentaje anual obtenido con la media geométrica del 24,02%.

Calculamos la población final a partir de este último indicador, acumulándolo a los cuatro

años.
Obtenemos el resultado final exacto. Por lo que resulta más representativa, trabajando con

porcentajes, la media geométrica que la aritmética:

Relación entre medias

Existe una relación de orden entre cuatro tipos de media. En esta relación se excluye la

media ponderada porque depende de los pesos. Sean:

 H la media armónica

 MG la media geométrica

 x la media aritmética

 RMS la media cuadrática

Entonces:

En esta relación, solamente se cumple la igualdad cuando todos los datos sean iguales, es

decir si: x1 = x2 = x3 = … = xN.

Se da la siguiente relación, en el caso de distribuciones de solamente dos datos, sean estos

los que sean:

Cuando en la distribución hay solamente dos datos, la media geométrica es la media

geométrica entre la media aritmética y la media armónica.

Esta relación se convierte en una aproximación, cuando, habiendo múltiples valores, estos

están muy agrupados en torno a la media.


5ta. Semana:

1.3.1.4 MEDIANA

La mediana de un conjunto de datos

La mediana de un conjunto de números es el número medio en el conjunto (después que los

números han sido arreglados del menor al mayor) -- o, si hay un número par de datos, la

mediana es el promedio de los dos números medios.

Ejemplo 1 :

Encuentre la mediana del conjunto {2, 5, 8, 11, 16, 21, 30}.

Hay 7 números en el conjunto, y estos están acomodados en orden ascendente. El número

medio (el cuarto en la lista) es 11. Así, la mediana es 11.

Ejemplo 2 :

Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.

Primero, arregle los números en orden ascendente.

{3, 5, 8, 10, 24, 36, 79, 255}

Hay 8 números en el conjunto -- un número par. Así, encuentre el promedio de los dos

números medios, 10 y 24.

(10 + 24)/2 = 34/2 = 17

Así, la mediana es 17.

1.3.1.5 MODA

La moda de un conjunto de datos

La moda de un conjunto de números es el número que aparece más a menudo.

Ejemplo 1 :

Encuentre la moda del conjunto {2, 3, 5, 5, 7, 9, 9, 9, 10, 12}.

El 2, 3, 7, 10 y 12 aparecen una vez cada uno.


El 5 aparece dos veces y el 9 aparece tres veces.

Así, el 9 es la moda.

Ejemplo 2 :

Encuentre la moda del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.

En este caso, hay dos modas -- el 5 y el 8 ambos aparecen dos veces, mientras que los otros

números solo aparecen una vez.


https://www.sangakoo.com/es/temas/conceptos-basicos-estadisticos

https://www.monografias.com/trabajos89/estadistica-clasificacion/estadistica-

clasificacion.shtml

https://www.tiposde.org/general/35-tipos-de-variables/

http://www.eumed.net/libros-gratis/2006c/203/1v.htm

http://www.fao.org/docrep/005/x2465s/x2465s08.htm

https://prezi.com/oenoqibrflcn/presentacion-de-datos-de-una-sola-variable/

https://www.uv.es/webgid/Descriptiva/3_distribucin_de_frecuencias.html

http://recursostic.educacion.es/descartes/web/materiales_didacticos/Estadistica_3eso/grafic

os_estadisticos_mgc.html

https://www.ibm.com/support/knowledgecenter/es/SSQP76_8.5.1/com.ibm.odm.dcenter.bu

.events/charts_topics/tsk_dse_barchart.html

https://es.wikipedia.org/wiki/Gráfico_circular

https://es.wikipedia.org/wiki/Histograma

https://definicion.de/poligono-de-frecuencia/

https://es.wikipedia.org/wiki/Ojiva_(estad%C3%ADstica)

https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934

http://www.universoformulas.com/estadistica/descriptiva/media-ponderada/

http://www.universoformulas.com/estadistica/descriptiva/media-geometrica/

https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/mean-median-mode

S-ar putea să vă placă și