Sunteți pe pagina 1din 16

UNIDAD I: ESTADSTICA DESCRIPTIVA

3
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013




C CO ON NC CE EP PT TO OS S B B S SI IC CO OS S









1 1. .1 1. . I IN NT TR RO OD DU UC CC CI I N N

A lo largo de la Unidad I, se darn los primeros pasos en el manejo de datos, se identificarn y
clasificarn caractersticas medibles en unidades de naturaleza fsica, se organizarn conjuntos de datos
para su anlisis descriptivo, se realizar el anlisis de muestras de variables observadas, se elaborarn
tabulaciones y representaciones grficas, y se iniciar la capacitacin en la redaccin de sntesis que
informen sobre resultados estadsticos tanto en el contexto de la especialidad como de la problemtica.

El primer captulo presenta los conceptos bsicos, que son pilares de la construccin del
conocimiento de la temtica que se desarrollar a lo largo de todo el curso. Particularmente, en esta
Unidad se aprendern los conceptos necesarios para el abordaje de los diferentes temas que se
desarrollarn a lo largo del curso de Estadstica. Tambin se presentarn los criterios a utilizar para
decidir acerca de las herramientas estadsticas a utilizar para describir muestras de datos de variables
observadas.

En general el cabal entendimiento de los conceptos bsicos en su presentacin inicial, suele
ofrecer dificultades y requiere de un estudio detenido. Particularmente se reconoce esta situacin en el
caso de los conceptos de poblacin, unidad de anlisis y variables.

1 1. .2 2. . M M T TO OD DO OS S E ES ST TA AD D S ST TI IC CO OS S

Los mtodos estadsticos pueden clasificarse en dos clases: mtodos descriptivos y mtodos
inferenciales. Estos se diferencian en los objetivos perseguidos, los procedimientos utilizados y los
alcances que tienen los resultados. Estas son:

a) Estadstica Descriptiva o Estadstica Deductiva.

Definicin 1.1. La Estadstica Descriptiva en principio tiene por objeto poner de manifiesto la
estructura y regularidades existentes en la coleccin de datos que se somete a estudio (patrn de
comportamiento de los datos). Se refiere a aquella parte de la Estadstica que se ocupa de la
obtencin, organizacin, y anlisis de conjuntos de datos de variables que han sido medidas, as
como de la presentacin de la informacin de modo que resulte de manera objetiva.

b) Inferencia Estadstica o Estadstica Inductiva.

Definicin 1.2.La Inferencia Estadstica comprende un conjunto de mtodos mediante los cuales
se obtienen generalizaciones o se toman decisiones sobre la base de una informacin parcial o
incompleta (datos muestrales), que ha sido obtenida previamente por medio de tcnicas descriptivas.
Vale adelantar que el anlisis inferencial no excluye al anlisis descriptivo, el cual se llevar a cabo
en alguna etapa del estudio.

En comn ambas ramas tienen por objetivo la comprensin general de las propiedades de una
masa de datos referida a una variable o sea que, en ninguno de los dos casos, interesa un dato
particular sino la comprensin del total de los datos. En la jerga estadstica esto se traduce en que la
atencin se focaliza en conocer un patrn de comportamiento general de los datos, que en Estadstica
Descriptiva corresponder a una a muestra (estudio parcial) y en el caso de la Estadstica Inferencial
corresponder a todo el universo (estudio general).
Contenidos

1.1. Introduccin
1.2. Mtodos estadsticos
1.3. Poblacin
1.4. Censo, Muestra, Muestreo, Azar
1.5. Unidad de muestra y Unidad de anlisis
1.6. Variable estadstica
1.7. Escalas de medicin
1.8. Parmetros y Estadgrafos
TEMA
UNIDAD I: ESTADSTICA DESCRIPTIVA

4
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013

Por tanto, la Estadstica Descriptiva no permite extraer conclusiones cuyo alcance vaya ms all
de la extensin que tienen los datos conocidos, mientras que la Estadstica Inferencial s lo permite. Por
ejemplo:
a) un peridico local informa acerca de los volmenes de vino producidos en Mendoza para
exportacin durante los ltimos dos aos, y comenta acerca del incremento porcentual del 2010
por sobre lo producido el ao anterior. Nada se podr decir, a partir de esta informacin acerca
de las exportaciones de vinos sanjuaninos.
b) para diagnosticar la formacin previa que tienen los alumnos que ingresan a la universidad en la
interpretacin de textos, se puede proceder a tomar una evaluacin. Los resultados pueden ser
analizados de dos formas, considerando a todas las evaluaciones o bien, tomando un
subconjunto representativo que incluye solo un 20% de las mismas. Aplicando las herramientas
del anlisis estadstico descriptivo al primer caso, se tendr informacin para diagnosticar la
capacidad comprensiva de todo el alumnado universitario ingresante, en tanto que en el segundo
la informacin obtenida solo dar cuenta de los estudiantes que conformaron el 20% de los
exmenes evaluados. Si en este ltimo caso existiera inters en generalizar los datos a todo el
alumnado, habr que recurrir a los mtodos que proporciona la Estadstica Inferencial.
c) de un caballete con ajo en proceso de secado, se toman 100 bulbos de ajo (entre los miles
existentes) y se pesan obteniendo lo siguiente: 90, 80, y 130 gramos. La aplicacin del anlisis
estadstico, podra arrojar las siguientes conclusiones: El peso promedio de los tres bulbos es de
l00 gramos y, Con alta confianza puede decirse que el peso promedio de los bulbos del
caballete puede encontrarse entre los 99,1 y 150,2 gramos. Fcilmente, se podr identificar que
la primera conclusin caracteriza con confiabilidad solamente al grupo de los tres bulbos
medidos, mientras que la segunda es aplicable a todo el ajo estibado.

De los ejemplos ilustrativos es importante que quede en claro lo siguiente: las conclusiones a
partir de la informacin que se desprende de un anlisis estadstico descriptivo, basado en un
subconjunto representativo del conjunto completo de todos los posibles datos referidos a algn problema
de inters, nunca debe ser directamente atribuida al conjunto mayor.

Mtodo descriptivo

Los mtodos que utilizan ambas ramas de la Estadstica son diferentes. En el caso de la
Estadstica Descriptiva un esquema conceptual simplificado, indica que se reconocen cuatro etapas a
cumplimentar: 1) Planificar o disear el anlisis, 2) Recolectar datos, 3) Aplicar el anlisis de los datos
en s y, 4) Elaborar una comunicacin sobre los resultados obtenidos (Figura 1.1).


Figura 1.1. Etapas de la Estadstica descriptiva

Mtodo inferencial

En la bsqueda a soluciones de problemas reales, la Estadstica descriptiva suele constituir el
primer paso del anlisis estadstico, ya que por lo general siempre interesan conclusiones con mayor
alcance que al del conjunto de datos utilizados para el anlisis. Por ejemplo, si una empresa lctea
A AN N L LI IS SI IS S

Proceso de:


P P
L L
A A
N N
I I
F F
I
C
A
C
I

N


RECOLECCIN
DE DATOS

(Obtencin de
registros por
observacin,
medicin,
entrevista, etc)

Organizacin
y
anlisis
exploratorio


(Preparacin y
depuracin de los
datos)




Clasificacin
(1 reduccin)



(Distribuciones de
frecuencias)


A An n l li is si is s
tradicional
(2 reduccin)

A A. . n nu um m r ri ic co o
+
A. grfico

(Descripcin de
las propiedades
del patrn de
datos)


C C
O
M
U
N
I
C
A
C
I

N
3
ESTADSTICA DESCRIPTIVA
4
2
1
UNIDAD I: ESTADSTICA DESCRIPTIVA

5
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
quisiera predecir la vida til de un nuevo tipo de yogur, hara un seguimiento de la cantidad de das que
el producto no presenta deterioro de la calidad utilizando unos pocos potes de yogur, dado que sera
imprctico y muy costoso someter a estudio a una cantidad grande de envases. Aplicando el mtodo
descriptivo se tendra informacin sobre el conjunto de yogures analizados. Del estudio surgiran
diversos datos sobre este grupo particular de potes de yogur. Sin embargo, el objetivo final de la
empresa consistir en lograr la mayor vida til de toda la produccin posible de yogures. Obviamente,
pretender este alcance basndose directamente en el conjunto de datos conocidos conllevar al
generalizar o extender la conclusin, a una situacin de incertidumbre con cierto riesgo de cometer un
error, porque la informacin disponible ha sido de tipo parcial o incompleta. Con ayuda de los mtodos
estadsticos inferenciales se podrn juzgar los mritos de los resultados, o en otras palabras, la
confiabilidad a tener en la conclusin ampliada.

Oportunamente al promediar el cursado, y para no complicar el captulo introductorio, al iniciar el
estudio de los mtodos inferenciales, se presentar el esquema conceptual correspondiente al mtodo
inferencial, por ahora las representaciones de conjuntos pueden resultar aclaratorias (Figura 1.2).



















Figura 1.2. Conclusiones particulares versus conclusiones generales

Como se ver en la Unidad II, la Teora de la probabilidad servir de nexo entre ambas ramas
estadsticas, y permitir resolver aquellas situaciones que de alguna forma impliquen incertidumbre por
no poseer un conocimiento objetivo completo, esto es, una coleccin de datos observados
exhaustivamente. Se aprender que con sustento probabilstico, la Estadstica inferencial permitir
enunciar conclusiones generales del tipo como las que siguen:

a) Puede esperarse, con una confianza del 95 %, que el monte frutal de cerezos de inters,
presente un porcentaje entre 80 a 85% de plantas sin problemas de incompatibilidad injerto-pie.
b) Se puede esperar, con un nivel de significancia de 0,05, que la poda tipo B permitir un
rendimiento significativamente mayor al que se lograra con la poda tipo A.

En el estudio de la Estadstica Inferencial, se ver que los problemas a resolver son de dos tipos.
El primero de ellos implica una estimacin de un valor general, y el otro, un estudio comparativo a partir
de una suposicin o hiptesis. A modo de anticipo estas dos situaciones podran responder,
respectivamente, a los siguientes planteos:

a) Un fruticultor desea implantar un monte de cerezos. Ha elegido una cierta variedad injertada
sobre un cierto pie, pero para tomar la decisin final desea conocer cul es el porcentaje de
plantas de cerezo de estas caractersticas, que puede esperar sobrevivan sin presentar
problemas de incompatibilidad.
b) Un fruticultor ensaya un nuevo tipo de poda diferente a la tradicional, porque supone que
conduce a obtener mejores rendimientos. Selecciona dos grupos de plantas de un monte frutal
de plantas semejantes, en todos los aspectos que no son la poda. En cosecha pesar las frutas
producidas por las plantas de cada grupo y sobre la base del rendimiento promedio logrado por
cada sistema de poda, decidir cual poda adoptar.

En ambos casos los resultados se darn acompaados con una medida de la incertidumbre que
encierra tomar tales conclusiones como verdaderas, cuando en realidad se trata de una conclusin
general que no se basa en datos completos. Reforzando la idea, ambos casos tienen en comn la
propiedad de que nunca se podr tener una seguridad del 100% o sea una certeza absoluta sobre el
cumplimiento de la proposicin, pero con ayuda de un enunciado probabilstico se tendr idea acerca de
cuan confiables son las conclusiones. La importancia de las conclusiones generales es que presentan
menor variabilidad que las conclusiones particulares, cuando se repiten los ensayos o experimentos.
Conclusin
particular

M TODO
DESCRIPTIVO
Anlisis
Conjunto menor de
datos recolectados
Conjunto completo
de datos posibles
Conclusin
general

M TODO
INFERENCIAL
UNIDAD I: ESTADSTICA DESCRIPTIVA

6
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
Dada las explicaciones previas, se puede presentar una definicin de la Estadstica Aplicada.

Definicin 1.3: La Estadstica aplicada, que cuando se refiere a problemas de ndole biolgico
suele denominarse Bioestadstica, tiene por objeto la aplicacin de los mtodos de la ciencia
Estadstica para describir la realidad, explicarla y predecir resultados que no han sido observados..
Se ocupa de disear la recoleccin de datos acerca de algn fenmeno de inters que tiene
ocurrencia en el mundo real, realizar la aplicacin de herramientas de anlisis estadstico apropiadas
al caso, y enunciar conclusiones con diferente grado de alcance, que permitan alcanzar un
conocimiento objetivo con fundamentacin probabilstica que resulta muy til para la toma de
decisiones en el ejercicio profesional.


1 1. .3 3. . P PO OB BL LA AC CI I N N

El concepto de poblacin es de principal importancia para la Estadstica, y uno de los que
presenta mayor dificultad a la hora de su entendimiento. Esto en gran parte se debe al acotado concepto
que se deriva de la acepcin vulgar utilizada en el lenguaje cotidiano, donde el trmino poblacin se
aplica generalmente a un conjunto total o exhaustivo de entes concretos referido a alguna condicin o
problemtica de inters relacionada con elementos de existencia fsica (personas, estudiantes, rboles,
animales, envases, productos, etc.). Pero en estadstica el alcance del concepto es mucho ms amplio,
y se lo encuentra aplicado a hechos (granizadas, accidentes automovilsticos, inundaciones, mortalidad
infantil, etc.) y tambin a situaciones experimentales imaginarias.

Pero, cualquiera sea el caso, el significado del trmino poblacin se deriva de definir un problema
de inters para investigar y los aspectos o propiedades acerca de los cuales se quiere tener
informacin, por ejemplo: conocer el porcentaje de mortandad de plantas de un cultivo atacado por una
plaga, conocer la recuperacin de praderas naturales sometidas al pastoreo de ganado caprino, conocer
los grados Brix de la fruta de un monte frutal para decidir la cosecha, etc. Cualquiera sea el caso,
inmediatamente se pensar cul es el colectivo o conjunto de elementos que proporcionarn los datos
necesarios. Es decir, aparece inmediatamente la idea de delimitar el conjunto de todos los elementos
que proporcionarn un dato pertinente.

1.3.1. Tipos de poblacin

Aunando lo expuesto, el concepto de poblacin en Estadstica implica que se requiere identificar
perfectamente cules son los elementos que se someten a estudio (conjunto de elementos) o que
aportan datos tiles (conjunto de datos) para comprender y poder explicar la problemtica. Esto lleva a
identificar dos tipos de poblaciones en senda relacin:

Poblacin real o fsica. Es el conjunto completo
1
de unidades con existencia fsica o sea que
pertenecen al mundo real, sobre la que existe inters porque sus elementos tienen alguna
propiedad observable o mensurable en comn respecto a un problema definido. Son ejemplo de
poblaciones reales o fsicas: la poblacin de alumnos de la Facultad de Ciencias Agrarias, la
formada por todos los panes de 1 kilo que produce una panadera en un da, la poblacin de rboles
de la calle San Martn de la Ciudad de Mendoza o bien de peces de la Laguna Diamante. En este
contexto cabe aclarar que una modificacin en el alcance del estudio determina otras poblaciones
diferentes, como respectivamente podran ser: la poblacin de alumnos de la Universidad Nacional
de Cuyo, la formada por todos los panes de 1 kilo que produce una panadera en un ao, la
poblacin de rboles del arbolado urbano de la Ciudad de Mendoza o de peces de las lagunas
andinas mendocinas. Este concepto de poblacin real es muy amplio, tal sera el caso si se pensara
en observar los nmeros obtenidos con el lanzamiento de un dado de seis caras 100 veces,
entonces la poblacin estara referida a las 100 tiradas con el dado.
Cabe aclarar que existen autores que usan el trmino universo
2
para referirse a la poblacin real,
pero en este curso se reserva universo para indicar el conjunto conformado por todas las unidades
que han existido, que existen y que existirn.
Poblacin estadstica. Es el conjunto o coleccin exhaustivos de datos de naturaleza cualitativa
(clases o categoras) o bien cuantitativa (nmeros), o sea que se hace referencia a los resultados
que se tendran al observar o medir
3
a todas las unidades que conforman a la poblacin real de
inters. Bajo esta concepcin, las poblaciones estadsticas pueden ser de dos tipos:

1
En matemtica existen varios conjuntos de tipo numrico, entre los cuales estn el conjunto de los nmeros
naturales, = {1, 2, 3, } , o bien
*
= {0,1, 2, 3, }, el conjunto de los nmeros enteros, = { , -3,-2,-1, 0,1,
2, 3, } y el conjunto de los nmeros reales, . Con relacin, se dice que el conjunto de los nmeros reales es un
conjunto completo porque los anteriores conjuntos y son subconjuntos de l, y adems porque dos puntos
adyacentes en la recta numrica siempre existe al menos otro punto que tambin es un nmero real.
2
En la teora matemtica conjuntista, el conjunto universo o universal es el conjunto que contiene a todos los
elementos del discurso o elementos a los que se refiere la problemtica.
3
Una medicin se define como el conjunto de operaciones que tiene por objeto determinar el valor de una
magnitud.
UNIDAD I: ESTADSTICA DESCRIPTIVA

7
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
a) caso cualitativo: los resultados se vinculan con clases o categoras, como por ejemplo las
poblaciones formadas todos los nombres de los establecimientos escolares de procedencia de
nivel medio de los alumnos que ingresaron a la Facultad de Ciencias Agrarias (Escuela 4-001
Jos Vicente Zapata, Escuela 4-007 Miguel A. Pouget, Escuela 4-046 Ing. Julio Krause, etc.)
o bien por los nombres de todas las variedades de vid cultivadas en Mendoza (Malbec, Cabernet,
Pinot gris, Sauvignon blanc, Torronts, etc.).
b) caso cuantitativo: los resultados se vinculan con mediciones numricas, como acontece en las
poblaciones conformadas por los nmeros que corresponden a todas las edades de los alumnos
de la Facultad de Ciencias Agrarias, o por todas las notas del primer parcial de estadstica, o por
todos los promedios de los egresados de la carrera de agronoma, o bien por los pesos de todos
los panes de 1 kg (expresados con precisin a tres decimales) producidos diariamente de un kg,
o por todos los resultados obtenidos al lanzar 200 veces un dado de seis caras.

En la Unidad II se introducirn los conceptos probabilsticos, y el fundamental concepto de variable
aleatoria. Entonces se ampliar y profundizar la conceptualizacin acerca de poblacin: se definir la
poblacin terica conformada por elementos que son exclusivamente de naturaleza numrica (conjunto
de todos los posibles valores de la variable aleatoria). Esto implicar que una poblacin estadstica
pueda corresponder a un conjunto de finito o bien a uno infinito.

Definicin 1.5. Una poblacin fsica es el conjunto formado por todas las unidades de observacin
con existencia real, que pueden proporcionar datos con relacin al fenmeno de inters. En notacin
conjuntista se la representar como el conjunto c cc c A AA A

Definicin 1.6. Se llama poblacin estadstica, a aquella en la cual los elementos que la conforman
slo tienen una "existencia" conceptual, tal el caso de la poblacin formada por todos los resultados
que se producen al observarlas o medirlas. Por tanto pueden resultar poblaciones formadas por
clases o categoras, o bien por nmeros, que constituyen los datos que se someten a los mtodos de
anlisis estadstico. Para representarla se usar la notacin c cc c A AA A

Se ilustrarn estos ltimos conceptos aplicndolos a un problemtica de inters. Un olivicultor
quiere comprar un monte de olivos ubicado en el Departamento de Maip (Mendoza), y conoce a travs
de la bibliografa que existe una relacin directa entre el grosor del tronco frutal y el rendimiento en
frutos. De modo que le interesa averiguar cul es el dimetro medio de los troncos a la altura de pecho
(DAP, en cm). Luego, todas las plantas de olivo del monte componen la poblacin fsica, mientras que
las mediciones del DAP de los olivos proporcionarn los datos que componen a la poblacin estadstica
(Poblacin 1 de Figura 1.3). Podra estar interesado tambin en el estado general que presentan las
plantas, considerndo las categoras: muy buena, buena, regular y mala. En este caso la poblacin fsica
sigue siendo la misma, pero se tiene otra poblacin estadstica formada por las categoras que se
asignan a los olivos (Poblacin 2 de Figura 1.3). Se desprende que en el primer caso, la poblacin
estadstica es de naturaleza cuantitativa (datos numricos), mientras que en el segundo lo es de
naturaleza cualitativa (datos categricos).

















Figura 1.3. Diagrama ilustrativo de conceptos poblacionales
Poblacin real, c cc c
C CC C

Es el conjunto formado por
todos los olivos del monte
ubicado en Maip
Observacin= Medicin
81,2 cm

57,9 cm

45,5 cm

72,5 cm, etc
Regular
Bueno
M. bueno
Bueno
Regular
Malo
M. bueno, etc
Poblacin estadstica 2,
c c c c
E E E E
: Es el conjunto cuyos
elementos son el estado de
condicin observado en los
olivos
(naturaleza cualitativa)
Poblacin estadstica 1,
c c c c
D DD D
: Es el conjunto cuyos
elementos son los datos del
DAP medidos en los olivos.
(naturaleza numrico)

UNIDAD I: ESTADSTICA DESCRIPTIVA

8
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
Con relacin a la poblacin real, que siempre est formada por un conjunto finito de elementos, hay que
introducir otra forma de clasificar las poblaciones:

Poblacin objetivo. Es la poblacin completa de unidades o elementos que se quiere estudiar, y a
partir de la cual se obtendrn los datos que se sometern al anlisis estadstico. Tambin recibe el
nombre de poblacin marco.
Poblacin de trabajo. Es la poblacin integrada por todas las unidades que realmente se han
podido medir. A veces, por impedimentos que se presentan accidentalmente, no es posible observar
o medir a todo el colectivo de elementos de inters existentes. Por ejemplo, se lleva a cabo un
censo agrcola e interesa el dato sobre la cantidad de tractores por explotacin pero, acontece que
en algunos casos no se puede acceder al dato porque no estaban presentes los propietarios o
encargados responsables. En otras palabras, la poblacin efectivamente censada puede o no,
coincidir con la poblacin objetivo a censar. Lo mismo podra ocurrir si se estudiara la flora nativa de
un rea y de pronto el investigador se encontrara con un caadn que le resulta inaccesible, en
consecuencia el rea realmente barrida en el estudio tendra una superficie menor a la del rea
objetivo, luego es esta ltima rea la que se podr describir estadsticamente.


1.3.2. Tamao poblacional

El tamao poblacional est dado por la cantidad de elementos. Por ejemplo, si se mide la altura de 500
algarrobos de una reserva natural, la poblacin fsica y la estadstica estarn formadas,
respectivamente, por 500 rboles y 500 mediciones de altura, anlogamente si en un da se han
fraccionado 1500 botellas de vino y luego se las ha clasificado en unidad conforme o unidad no
conforme, de acuerdo a si cumplieron, o no las especificaciones establecidas, las poblaciones estn
constitudas por 1500 unidades y datos de condicin.
Definicin 1.7. El tamao poblacional, se refiere al nmero de unidades que tiene la poblacin. Se
lo simboliza con la letra ene mayscula, N.

Las poblaciones fsicas siempre tienen tamao finito (N = #

c c c c )
4
, pero cuando su tamao es muy grande,
como sera el caso de la poblacin formada por todos los olivos del Departamento de Maip o bien todas
las aceitunas producidas los olivos de un monte frutal, se las considera en la prctica como de tamao
infinito (N ). En la problemtica de inters, resulta que las tres poblaciones tienen la misma cantidad
de unidades, dado que cada planta proporciona un dato de DAP y otro de estado (c cc c
0
, c cc c
1
, c cc c
2
).
La simbologa que se da a continuacin, representa en notacin conjuntista estos dos tipos de
poblaciones.

Poblacin finita c cc c = { U
1,
U
2
, ... , U
i
, ... , U
N-1
, U
N
}
Poblacin infinita c cc c = { U
1,
U
2
, ... , U
i
, U
J
, ...

}
En el primer caso se trata de un conjunto numerable o contable. El segundo se trata de un conjunto
infinito y por tanto no numerable, cuyas unidades se pueden poner en correspondencia con un conjunto
infinito contable como es el conjunto de los nmeros naturales (poblacin infinita contable),o bien con
uno infinito no numerable como lo es el conjunto de los nmeros reales (poblacin infinita no
contable). Algo anlogo ocurre con las poblaciones tericas.
Finalmente, resulta conveniente una sntesis que destaque los siguientes aspectos:

a) La poblacin fsica es el conjunto completo de unidades reales que tienen alguna propiedad
observable o mensurable en comn, que interesa respecto a un problema de inters.
b) La poblacin estadstica se origina cuando se realiza la observacin y medicin de las unidades de
la poblacin fsica, y es el conjunto completo de datos (clases o categoras o bien de nmeros).
c) Es necesario definir perfectamente la poblacin fsica en el tiempo y en el espacio, de modo que ante
la presencia de cualquier unidad se pueda decidir si forma parte o no de la poblacin que est bajo
estudio. En otras palabras, definir una poblacin fsica significa dejar perfectamente delimitado las
unidades que la conformarn. Aplicada la idea a la problemtica del monte de olivos, significa
establecer de antemano si se considerarn, por ejemplo, todos los olivos sin importar la edad de las
plantas, o de que ellas sean de diferente variedad, etc.
d) Debe quedar muy claro si efectivamente se estudi la poblacin fsica definida (poblacin objeto) o
si se trat de otra (poblacin de trabajo).

4
Se lee el numeral del conjunto poblacin, es decir la cantidad de elementos que forma la poblacin
UNIDAD I: ESTADSTICA DESCRIPTIVA

9
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
e) Debe notarse que a partir de una misma poblacin fsica se pueden generar diferentes poblaciones
tericas, midiendo diferentes aspectos en diferentes momentos (medicin unidimensional), o bien se
pueden originar poblaciones tericas midiendo varios aspectos al mismo tiempo sobre la misma
unidad de observacin (medicin bidimensional, tridimensional o multidimensional).


1 1. .4 4. . C CE EN NS SO O, , M MU UE ES ST TR RA A, , M MU UE ES ST TR RE EO O Y Y A AZ ZA AR R

Hasta ahora se ha sealado que la Estadstica tiene por objeto el estudio de los colectivos o
fenmenos de masa, tratando de descubrir las regularidades del comportamiento que tienen ciertos
aspectos de inters, como pueden ser la cantidad de frutos de tamao comercial que produce una planta
de tomate o el nmero de huevos que pueden empollar aves de la fauna nativa, o bien comprender las
relaciones existentes entre dos o ms aspectos de inters, como por ejemplo, el efecto del agregado de
diferentes dosis de un fertilizante nitrogenado en el crecimiento de un cultivo hortcola o, de la edad de
los viedos en la calidad del vino obtenido a partir de sus uvas.

La forma de reolectar la informacin bsica (datos) para hacer un anlisis estadstico es a travs
de un censo o de un muestreo. El censo es un mtodo de recoleccin de datos que consiste en el
relevamiento o la captura de datos (expresin de uso cuando el relevamiento est automatizado) a partir
de la totalidad de los elementos que componen la poblacin bajo estudio. Un censo debe cumplir las
condiciones de universalidad que significa observar o medir a todos los elementos de la poblacin, y
simultaneidad que consiste en la realizacin en un momento determinado como si se tratara de una foto
instantnea.

Por otra parte se ha visto que cuando se seleccionan algunos de los elementos de una poblacin
con la intencin de alcanzar en la mayora de los casos, un conocimiento general acerca de la misma,
ese grupo de elementos conforma una muestra. Tambin en este caso, existen varias interpretaciones
del trmino:

a) Vulgarmente se habla de muestra con relacin a cualquier conjunto de observaciones tomado a
partir de una poblacin, es decir, una muestra es cualquier subconjunto de elementos poblacionales.

b) En Estadstica adems est involucrado el pensamiento acerca de la particular forma en que se
deben seleccionar las unidades, de modo que el subconjunto de unidades "sirva" para representar a
la poblacin total. En efecto, cun confiable ser la informacin que resulte del anlisis de la muestra
con relacin a la que se lograra a travs de un censo poblacional, depende en gran manera de la
forma en que sea obtenida la muestra. Al respecto, en el captulo destinado al tema del muestreo
estadstico se presentarn las diferentes tcnicas y condiciones para su aplicacin.

La utilizacin de la muestra descansa en el principio de que las partes representan al todo, es
decir que las muestras reflejan las caractersticas que definen la poblacin de la cual fueron extradas,
de ah que se piense en una muestra representativa. Es decir, que el logro de una buena informacin
general acerca de una poblacin a partir de los datos muestrales, es decir sin estudiarla completamente
mediante un censo, depende del mtodo de seleccin de las unidades muestrales y del tamao de la
muestra.

Definicin 1.8. Las unidades que conforman las muestras se denominan unidades muestrales o
unidades muestra. El tamao muestral est dado por la cantidad de unidades muestra o nmero de
unidades poblacionales seleccionadas para conformar la muestra estadstica. El tamao muestral se
representa con la letra ene minscula, n.

El tipo de muestra que resulta de principal inters para los estadsticos es aquel que se conoce
como muestra aleatoria o muestra al azar. Anlogamente, siendo el muestreo el proceso por el cual
se selecciona un nmero prefijado de elementos de la poblacin (poblacin madre), este tipo de
muestras se generar con un muestreo aleatorio o muestreo al azar. Los mtodos de muestreo sern
desarrollado en el captulo destinado al muestreo, por ahora se tratar de entender el concepto de
aleatoriedad.

Qu es el azar?. En principio, se puede cecir que simplemente es un concepto que permite
encubrir falta de conocimiento acerca de cmo ocurren en realidad los hecho. Por ejemplo, sea el
lanzamiento conceptual de un dado al aire, es decir sin que se produzca la realizacin fsica del
lanzamiento. Se sabe que el resultado de la tirada puede arrojar un nmero entero entre 1 y 6, pero se
tiene la seguridad de que aparecer un nmero determinado de los seis posibles?. La respuesta es no,
porque se trata de una experiencia aleatoria. Pero, por qu no se puede acertar con seguridad el
resultado de la tirada del dado?. Es realmente impredecible?. Por supuesto que no, el resultado est
perfectamente determinado por el estado de la naturaleza, lo que sucede es que intervienen fuerzas que
son imposibles de controlar a voluntad y este conocimiento incompleto de las leyes de nuestro mundo es
lo que lleva a buscar una justificacin, a esconder en el azar la ignorancia o despreocupacin por
averiguar la verdad.
UNIDAD I: ESTADSTICA DESCRIPTIVA

10
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
Muchas veces se informa sobre resultados basados en el anlisis de una muestra de datos, pero
en muchos casos se trata de muestras que no cumplen con las condiciones requeridas, para que la
aplicacin del anlisis estadstico arroje resultados vlidos. La Estadstica requiere muestras tomadas al
azar, es decir, muestras cuyas unidades se han obtenido mediante algn procedimiento aleatorio, es
decir, con total prescindencia de la voluntad personal. El caso se ilustrar con los siguientes ejemplos:

a) Sea una situacin de examen final de una materia cuyo programa tiene 15 captulos. El docente
coloca quince bolillas idnticas solamente diferenciadas por el nmero que tienen marcado (1 al 15)
en un bolillero. Acto seguido el alumno procede a mezclarlas muy bien, y luego extrae dos bolillas,
que indican los captulos acerca de los cuales ser interrogado. Se puede decir que el proceso del
sorteo ha originado una muestra conformada por dos unidades de muestra (n=2) que se
corresponden con los captulos del programa cuyos nmeros coinciden con los de las bolillas
extradas.

b) Sea ahora un surco que tiene 50 plantas de ajo y se desea seleccionar aleatoriamente una muestra
de n=10. Se puede dar un nmero corrido a las plantas, segn la ubicacin en el surco y
posteriormente se pueden preparar 50 tarjetas idnticas, numeradas del 1 al 50. Las tarjetas se
barajan concienzudamente, se extrae una tarjeta y se anota el nmero. La tarjeta se devuelve al
grupo, y se extraen cuatro ms, procediendo de manera similar. Las cinco plantas a las cuales les
corresponden los nmeros extrados conformarn la muestra aleatoria a estudiar.

Es claro que en ninguno de los dos ejemplos resultaron muestras conformadas por unidades que fueron
elegidas a voluntad, sino que respondieron a un proceso de seleccin mediante sorteo. Algo muy
diferente se da en el caso de las entrevistas periodsticas que se realizan en el kilmetro cero de la
Ciudad de Mendoza para conocer la opinin acerca de algn tema, o cuando en una finca se eligen las
plantas que estn al lado de los callejones o en una fbrica se toman las cajas de latas que estn en la
parte superior de una estiba. Es claro que las muestras en estos ltimos casos responden a un muestreo
con eleccin dirigida o muestreo no aleatorio.

La seleccin aleatoria se producir cuando se obtengan las muestras ajustndose a
procedimientos que no dejen librado ningn aspecto a la voluntad del observador. Es condicin para la
aplicacin de los mtodos estadsticos que la muestra representativa de la poblacin se obtenga
mediante seleccin aleatoria. Un tipo de muestreo fundamental a tal fin es el muestreo aleatorio simple
que fue aplicado en los ejemplos del sorteo de bolillas y de plantas de ajo.

A modo de sntesis, se tiene lo siguiente:

a) La primera preocupacin frente a una situacin problmatica es identificar si se trata de un
conjunto de datos que es una coleccin exhaustiva, o sea, si contiene a todos los posibles datos
relacionados con el fenmeno de inters, o si slo se tiene un subconjunto de datos entre los
posibles. El primer conjunto corresponder a datos poblacionales y el segundo, a datos
muestrales.
b) Las poblaciones se conceptualizan como el todo y una muestra como una fraccin
representativa del todo.
c) Para medir al todo se recurre a estudios censales (censo) y para medir a la muestra estudios
muestrales (muestreo).
d) En Estadstica descriptiva la situacin ms comn es la aplicacin de herramientas a los datos de
una muestra o unas pocas muestras. A partir de los datos muestrales y mediante la Estadstica
Inferencial se puede obtener informacin poblacional, acompaando el anlisis con un enunciado
en trminos probabilsticos dado que se aplica el mtodo inductivo incompleto
5
.
e) El tamao muestral es determinante en la eleccin de los mtodos estadsticos descriptivos e
inferenciales.


1 1. .5 5. . U UN NI ID DA AD D D DE E M MU UE ES ST TR RA A Y Y U UN NI ID DA AD D D DE E A AN N L LI IS SI IS S

Se ha definido el concepto de unidad de observacin en relacin a cada uno de los elementos
que componen la poblacin y que pueden proporcionar los datos para el anlisis. Por su importancia
fundamental, se profundizar y ampliar el concepto de unidad que se manejar en este curso.

El mtodo de muestreo, por razones que sern vistas en el captulo destinado particularmente al
muestreo, constituye la forma ms utilizada en el mbito cientfico para obtener informacin emprica. La
unidad de muestreo es la entidad bsica mediante la cual, aplicando un procedimiento aleatorio de
seleccin, se accede a la unidad de observacin.


5
Mtodo inductivo incompleto: mtodo que parte de un conocimiento que no es completo y concluye con enunciados que van
ms all del alcance de los datos disponibles.
UNIDAD I: ESTADSTICA DESCRIPTIVA

11
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
En algunos casos, hay coincidencia entre la unidad de observacin y la unidad de muestreo. Por
ejemplo, con el objetivo de conocer el rendimiento acadmico de los alumnos que iniciaron el cursado de
Estadstica, en la primera clase se selecciona una muestra al azar del 10% y a los seleccionados se les
pregunta el promedio de notas. La unidad de muestreo coincide con la unidad de observacin: un
alumno que cursa Estadstica. Pero muchas veces no ocurre esto.

En el mbito del control alimentario, el anlisis en laboratorio de muestras de alimento es una
tarea rutinaria. Por ejemplo, se quiere tomar la decisin acerca del momento oportuno para cosechar los
duraznos de un monte frutal, que se usarn como materia prima en un proceso productivo de
mermelada. A tal efecto se har un seguimiento del grado de madurez de los frutos, a travs de los
grados Brix que miden el % de sacarosa presente en una solucin acuosa. El muestreo para recolectar
las muestras de fruta a evaluar, requerir dos etapas a campo que consistirn: la primera en hacer un
sorteo de los durazneros, y la segunda en una seleccin al azar de duraznos en los rboles que
resultaron sorteados. En una tercera etapa, utilizando un refractmetro porttil manual me medir en el
laboratorio una muestra analtica consistente en una alcuota (gota) del jugo de los duraznos
seleccionados en las diferentes plantas, y finalmente de estos resultados se obtendr el tenor zucarino
promedio que presentan los duraznos. En este caso hay que reconocer tres etapas de muestreo y en
cada caso una unidad diferente de muestreo (rbol-fruto-jugo). La ltima unidad o sea la utilizada para el
anlisis con el refractmetro adems de haber constituido una unidad de muestra, es una unidad de
anlisis. Esta es la unidad directamente relacionada con el objeto de inters en la investigacin y la que
aportar un dato ( Brix ledo mediante el refractmetro). Si hubiera interesado medir el peso de la fruta,
la unidad de anlisis habra sido un durazno, mientras que si hubiera interesado la variedad de fruta la
unidad de anlisis podra haber sido el duraznero o el durazno.

Por otra parte en los estudios ecolgicos, que constituyen un caso particular de investigacin,
suele interesar el estudio de agregados poblaciones, generalmente comunidades completas, que se
ubican espacialmente en un lugar definido, y esto va acompaado de otra problemtica en la definicin
de las unidad. Significa entonces que el tipo de anlisis al que se someter la unidad de observacin
define la unidad de anlisis, por lo cual es necesario plantearse en la planificacin de una investigacin
la clara identificacin de la unidad de observacin fsica, la unidad de muestreo y finalmente, si habr
coincidencia entre estas y la unidad de anlisis.

Definicin 1.9. La unidad de anlisis, es el objeto ltimo de observacin o medicin, sobre el cual se
desea obtener informacin estadstica. Cada unidad de anlisis arroja un dato para el anlisis
estadstico, y en forma conjunta constituyen la masa de datos.

La unidad de anlisis debe estar definida con absoluta precisin, evitando todo posible tipo de
ambigedad o confusin tanto con relacin a quien har la observacin o medicin, como para quienes
procesen esos datos o quienes sean, posteriormente, los usuarios de los resultados.

Los elementos o unidades de anlisis pueden ser de diferente naturaleza. Siguiendo normativa
de aplicacin en el mbito de los sistemas de calidad
6
, se considerarn tres tipos de unidades:

a) Unidad aislada: es una unidad en s, de modo que cuando es fsicamente fraccionada o
desarmada no conserva su forma ni cumple con su finalidad original. Ejemplo: un meln, una
botella, un tornillo, etc.

b) Unidad continua: es una unidad que se define en funcin de un patrn de medicin o de un
artefacto fsico, tal el caso de longitudes o reas. Ejemplo: 1 m o una pulgada de alambre, 1 m
2

de terreno, etc.

c) Unidad a granel: es una unidad que corresponde a porciones de peso o volumen especificado
que se toma como unidad a partir del material que se encuentra a granel, basndose en criterios
de uniformidad. Ejemplo: 500 g de semilla, 100 cc de aceite de oliva, etc. (masa y volumen).

En cualquier caso, el inters se centra en observar o medir algn o algunos aspectos de tales
unidades, a los que se hace referencia como caractersticas o propiedades, y que pueden ser de
naturaleza cualitativa o cuantitativa. Para este fin habr que determinar el tamao de la unidad de
anlisis en cada situacin particular, en ningn caso deber decidirse de manera arbitraria y tiene mucha
importancia.

Las unidades aisladas son fciles de reconocer, pero en los otros dos casos se requiere
establecer criterios de acuerdo al caso, que permitan identificar fsicamente la unidad de anlisis. En
cualquier caso, interesa observar o medir ciertas caractersticas en tales unidades, conocidas a veces
como caracteres o propiedades, que por ahora anticiparemos pueden ser de naturaleza cualitativa o

6
Norma UNIT 472-75 Inspeccion por atributos. Planes de muestra unica, doble y multiple con rechazo
UNIDAD I: ESTADSTICA DESCRIPTIVA

12
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
cuantitativa. Para este fin habr que determinar el tamao de la unidad de anlisis en cada situacin
particular, en ningn caso deber decidirse de manera arbitraria y tiene mucha importancia.


1 1. .6 6. . V VA AR RI IA AB BL LE ES S E ES ST TA AD D S ST TI IC CA AS S

Los elementos o unidades de anlisis de una poblacin poseen una serie de cualidades, rasgos,
caractersticas o propiedades comunes, que suelen presentar cambios en su estado o expresin de
unidad de anlisis a unidad de anlisis cuando se hace una observacin o medicin sobre ellos. Algo
anlogo ocurre en la muestra. Estas caractersticas son variables, en tanto que aquellas caractersticas
que no cumplen con esta condicin son llamadas constantes.

Definicin 1.10. En general, en el contexto estadstico, una variable es una propiedad o atributo
comn a todas las unidades de anlisis de anlisis o los elementos de una poblacin o una muestra,
con respecto a la cual ellas difieren de alguna forma entre s.


A lo largo del curso de Estadstica, se presentarn diferentes clasificaciones de las variables
estadsticas.

a) En la Unidad I, destinada al desarrollo de la descripcin estadstica de conjuntos de datos
muestrales, se plantea la situacin de que se ha realizado el proceso de medicin y estn
disponibles n datos. Con relacin a esto, se hablar de variable estadstica observada y se la
representar con letras minsculas: variable x, variable y, etc.
b) En las restantes unidades temticas, tambin se involucrar el tratamiento de una variable que
an no ha sido medida. En este caso se hablar de variable estadstica aleatoria y se la
representar con letras maysculas: variable X, variable Y, etc.

Dado que los conceptos correspondientes a estas denominaciones son muy diferentes, se recomienda
ser muy cuidadoso en utilizar la simbologa en forma apropiada.



Si se considera el alumnado de la Facultad de Ciencias Agrarias, los siguientes son ejemplos de
variables estadsticas: nacionalidad, ttulo secundario, carrera cursada, rendimiento acadmico, edad,
etc.
Bsicamente, existen dos tipos de caracteres en los elementos, aquellos que se asocian con
valores numricos y aquellos que no. Por tal razn, se considerarn dos tipos de variables estadsticas:
variables cualitativas y variables cuantitativas. Las variables cualitativas darn origen a datos
categricos y las variables cuantitativas darn origen a datos numricos. Ilustraremos estos nuevos
conceptos con dos interrogantes:

a) Usted es alumno de la carrera Licenciatura en Bromatologa?
b) Cuntas materias le falta para alcanzar el ttulo?

En el primer caso, la respuesta a la pregunta se da entre estas dos alternativas: "S" - "No". Se trata
entonces de una variable cualitativa, "carrera cursada en la Facultad" con dos modalidades de
respuesta, que son datos categricos. En el segundo interrogante, la respuesta ser algn nmero, por
tanto se trata de una variable cuantitativa, "cantidad de materias faltantes para obtener el ttulo de
Licenciado en Bromatologa", y la respuesta ser un dato numrico.


Definicin 1.11. Una variable estadstica cualitativa es aquella que por su propia naturaleza no se
puede cuantificar (o no hay inters justificado en hacerlo) y sus estados, observados en los elementos
poblacionales o bien muestrales, son descriptos mediante trminos calificativos o etiquetas.

Definicin 1.12. Una variable estadstica cuantitativa es aquella que por su propia naturaleza
admite que sus variaciones en los elementos poblacionales o muestrales, sean susceptibles de
cuantificacin o medicin numrica propiamente dicha. El conjunto de datos de una variable numrica
puede representarse como

a) x
1,
x
2
, ..., x
i
,... , x
n-1
, x
n
en el caso de corresponder a una muestra de tamao n
b) x
1,
x
2
, ..., x
i
,... , x
n-1
, x
N
en el caso de corresponder a una poblacin de tamao N


UNIDAD I: ESTADSTICA DESCRIPTIVA

13
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
Antes de avanzar en otros aspectos, destacaremos algunos comentarios importantes:
1) Al estudiar un fenmeno real, hemos visto que se pueden tener datos categricos o bien numricos.
En Estadstica descriptiva podemos trabajar con ambos tipos de datos sin modificarlos, pero en
Estadstica Inferencial aparecer un nuevo concepto que es el de variable aleatoria, y que slo hace
referencia a datos que pertenecen al conjunto de nmeros reales (). En este caso, se adoptarn
criterios para transformar datos categricos en datos numricos.

2) Con relacin a las variables cuantitativas, es importante entender que se puede esperar casos en que
el proceso de medicin de las unidades de anlisis arroje magnitudes diferentes, casos en que cada
elemento poblacional obtiene diferente valor en su medicin. Sin embargo, los instrumentos de medicin
son suficientemente precisos para registrar valores hasta cierto punto y tambin la capacidad de quien
hace la lectura es limitada. En consecuencia cuando se realizan mediciones, que por lo general son
mediciones muestrales, es frecuente encontrar valores iguales o que se repiten, en especial si el tamao
muestral es grande.


Definicin 1.13. Se llama variable discreta a aquella, que dado un intervalo en la recta numrica, solo
toma un nmero finito o infinito numerable de valores de l.

Definicin 1.14. Se llama variable continua a aquella, que dado un intervalo en la recta numrica,
toma cualquier valor de los infinitos posibles valores de l.


Resumiendo, los dos tipos de variables estadsticas presentadas admiten a su vez una clasificacin en
los tipos de datos que les corresponde (Cuadro 1.1).


Cuadro 1.1. Clasificacin de las variables
Naturaleza de
la variable
Naturaleza de
los datos
Proceso utilizado para generar los datos
Cualitativa Categricos
Observacin (color de ojos, variedades, productos)
Observacin con ordenamiento (suelos: muy salinos-salinos-
normales-no salinos)
Medicin y posterior codificacin (alturas arbreas en metros
rbol: muy alto-alto-mediano-bajo-muy bajo)

Cuantitativa

Numricos
Recuento o conteo: datos discretos
Medicin instrumental: datos continuos


Por lo general el tema de clasificar variables tambin presenta dificultades a la hora de identificar el tipo
de variable en una situacin problema particular. Puede contribuir al esclarecimiento, tener en cuenta las
caractersticas de los procesos de medicin de los datos numricos:

a) el conteo o enumeracin, origina datos cuantitativos de naturaleza discreta. A modo de
ilustracin daremos los siguientes ejemplos de variables discretas: nmero de das hasta el 80%
de brotacin de las plantas de ajo, nmero de pulgones por hoja, nmero de tomates con
podredumbre apical. Tambin se pueden considerar como tales a las calificaciones asignadas en
una evaluacin sensorial: 0, 1, 2, , 10 o mejor 1, 2, 3, ..., 9, pero en este caso no se trata de
"verdaderos nmeros" porque las calificaciones suelen asignarse a travs de una medicin
sensorial (sabor, aroma, olor, etc.) y en tal caso cada persona puede responder en forma
diferente (medicin subjetiva).
b) la medicin instrumental, contrariamente, suele dar origen a datos cuantitativos de naturaleza
continua. Son ejemplos de variables continuas: el peso en gramos de races de plantas
cultivadas in vitro, las temperaturas medias diarias en C, la cantidad en ml de reactivo gastado
en una titulacin, etc.

Desde el punto de vista de la notacin simblica, en general, se suelen utilizar las primeras letras del
alfabeto latino en mayscula (A, B, C, etc.) para representar variables cualitativas y las ltimas letras (X,
Y, Z) para las variables cuantitativas. Para referirse a la observacin o medicin de un elemento en
particular se utiliza la correspondiente letra en minscula acompaada de un subndice cuyo trmino
general es la letra i. Por ejemplo:

dos modalidades de una variable cualitativa A se indicarn como a
1
y a
2

tres valores de una variable discreta observada x se indicarn como x
1
, x
2
, x
3

infinitos valores de una variable continua observada x se indicarn como x
1
, x
2
, ... , x
i
, ...
una serie de n de valores de una variable discreta o continua, se indicarn
como x
1
, x
2
, ... , x
i
, ... , x
n

UNIDAD I: ESTADSTICA DESCRIPTIVA

14
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013

En el penltimo caso se est indicando que la variable x toma infinitos valores y en el segundo
que la variable toma un nmero n de valores. Adems se suele indicar cul es la variacin o por cuales
valores pasa el trmino genrico, por ejemplo:
a) la serie x
1
, x
2
, x
3
x
4
, x
5
, x
6
se la indica como x
i
, i=1,2,...,6, lo que se lee como valores de x sub
i donde i vara desde 1 hasta 6.
b) la serie x
1
, x
2
, ... , x
i
, ... se la indica resumidamente como x
i
, i= 1,2,... , lo que se lee como:
valores de x sub i, donde i vara desde 1 hasta .

En forma anloga, relacionando con el concepto de tamao poblacional, no confundir la forma de
expresar simblicamente al conjunto de datos observados en una poblacin fsica, que siempre ser
finito (N), con el del conjunto que datos que tericamente pueden observarse, y que podra ser infinito.

Para finalizar, resulta conveniente presentar una integracin aplicada de los ltimos conceptos
dados (Cuadro 1.2.)


Cuadro 1.2.: Ejemplos de los conceptos de unidad de anlisis, poblacin fsica y variable
Unidad de
Anlisis
Poblacin Fsica
Variable
Nombre Tipo Dato
Un Tomate
(unidad aislada)
Conjunto de todos los tomates que
conforman un lote (Ej: carga de un
camin)
Tamao poblacional: N desconocido
A los efectos prcticos N
Color del fruto Cualitativo
(categrico)
verde, rojo
100g de triturado
de tomate
(unidad a granel)
Conjunto de todas las porciones
posibles de triturado que conforman
un lote (Ej: un tanque)
Tamao poblacional: N=10000 kg
(%) lectura
refractomtrica
Cuantitativa
continua
(numrico)
1,2%

1 tetra de jugo de
tomate
(unidad aislada)
Conjunto de todos los tetra que
componen un lote.
Tamao poblacional: N=50000
envases tetra
Recuento de
mohos
(en 75 campos)
Cuantitativa
discreta
(numrico)
20
1 lata de tomate
pelado en
conserva
(unidad aislada)
Conjunto de todos frascos que
produce un establecimiento/da.
Tamao poblacional: N=10000
frascos
Grado de
seleccin
Cualitativa
(categrico)
comn, elegido



1 1. .7 7. . E ES SC CA AL LA AS S D DE E M ME ED DI IC CI I N N

La medicin de las variables es un problema fundamental en todas las ciencias, y en trminos generales
se la puede definir como la accin que consiste en clasificar o bien medir asignando nmeros a las
unidades de anlisis para representar la modalidad o la magnitud en que se presenta en ellas una
variable de inters. Bajo esta concepcin la medicin en las ciencias fsicas y naturales generalmente
resulta objetiva, contrariamente a lo que ocurre en las ciencias sociales y del comportamiento: si se dice
que la hoja de un rbol tiene una longitud de 2,54 cm, habr coincidencia en lo que interpreten varias
personas, pero si se dice que un alumno obtuvo una buena calificacin en su examen resultar difcil
que un grupo de personas coincidan en la interpretacin del juicio emitido. Significa que a la hora de
obtener datos acerca de un problema de inters, se puede disponer de diferentes formas de medir o
mejor an, de diferentes escalas de medicin. De acuerdo al tipo de datos, se tendr la naturaleza de la
variable medida, y de acuerdo al tipo de variable sern las herramientas de anlisis estadstico que se
deben aplicar. De otra forma, el nivel de medicin de la variable condiciona el mtodo de anlisis
estadstico. Los cuatro niveles de medicin ampliamente reconocidos son (del ms dbil al ms fuerte):

escala nominal, escala ordinal, escala de intervalo y escala de razn.

1 1. .7 7. .1 1. . E Es sc ca al la a n no om mi in na al l y y e es sc ca al la a o or rd di in na al l

Cuando la medicin de las variables arroja datos que no son de naturaleza numrica, significa que el
nivel de la medicin corresponde a una escala nominal o bien a una ordinal. La medicin de estas
variables origina registros que respectivamente son: clases y categoras.

Escala nominal

Es la forma ms simple de medicin, los datos son clases que equivalen a un otorgamiento de
etiquetas. Las categoras nominales ms sencillas corresponden a una clasificacin dicotmica: la
unidad pertenece a una clase A o bien a una clase B, tal como podran ser: planta sana-planta
enferma, insecto vivo-insecto muerto, "artculo conforme-artculo no conforme", etc. Tambin puede
UNIDAD I: ESTADSTICA DESCRIPTIVA

15
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
tratarse de una clasificacin multinomial, tal el caso de calificar el color de ojos en: negro-castao-
azul-verde-otro. Por razones computacionales, las categoras suelen ser codificadas mediante nmeros
que no tienen valor cuantitativo alguno, solamente identifican una clase, por ejemplo: a hembra se
codifica con 0 y a macho con 1. Los smbolos (letras o nmeros) que designan a los diferentes grupos
o clases en una escala nominal pueden intercambiarse sin alterar la informacin esencial de la escala.
Propiedad: los datos medidos en una escala nominal presentan la propiedad es la de igualdad dentro de
una misma clase. En consecuencia el conjunto de clases admite el ordenamiento de acuerdo a
diferentes criterios (orden alfabtico, orden de gusto personal, etc.). Estas propiedades pueden
formularse de un modo ms formal, mediante un conjunto de axiomas aplicables a las operaciones que
permiten elaborar las escalas y las relaciones entre las unidades de anlisis a que se aplican. As: a) la
operacin de escalamiento, para las variables que se miden utilizando una escala nominal, consiste en
identificar la caracterstica de inters y formar un subconjunto de clases que se excluyen mutuamente y
b) la nica relacin implicada entre las clases es la de equivalencia, que implica que para el conjunto de
clases C se cumple para las unidades clasificadas en una clase cualquiera se cumplen las propiedades
reflexiva (toda clase pertenece a C), la simtrica (si una unidad pertenece a una clase a y otra unidad es
igual a esa unidad, luego la segunda unidad tambin pertenece a la misma clase) y la transitiva (si una
unidad pertenece a una clase a, y otra unidad tambin pero adems sta es igual a una tercera unidad,
significa que las tres unidades se clasifican en la misma clase). El conjunto de todas las clases que
cumplen con esto forman una particin del conjunto C, es decir, son subconjuntos disyuntos del
conjunto C.
Cuadro 1.3: Ejemplos de escala nominal
Variable cualitativa Categora
Reaccin a un estmulo

Tipo de aditivos permitidos por el Cdigo Alimentario
Argentino

Variedades de vid utilizadas para elaborar vino
espumante

positivo-negativo

cido ascrbico, cido benzoico, aspartamo


Pinot noire, Chenin, Chardonnay


Observacin: la forma de reconocer este tipo de datos se debe cumplir que: a) los datos se obtuvieron
simplemente observando y clasificando cualitativamente las unidades, y b) no tiene sentido el
ordenamiento de las clases.

Escala ordinal
La escala ordinal es una escala de ordenamiento jerrquico, porque se puede establecer que un dato
observado que se clasifica en una categora posee ms fuerte o ms dbil la propiedad que presenta
otro dato observado clasificado en otra categora. Es decir, que se pueden establecer posiciones
relativas de las diferentes modalidades de la variable observada de inters, sin que esto implique
distancias entre ellas. Como en el caso de los numerales empleados en las escalas ordinales no son
cuantitativos, sino que indican exclusivamente la posicin en la serie ordenada y no "cual es" la
diferencia entre posiciones sucesivas de la escala.
En esta escala se puede establecer cul categora es mayor, mejor o preferida, es decir dar una
direccin de ordenamiento, sin embargo como en el caso de la nominal no se puede decir cunto
mayor, mejor o ms preferida es. Por tanto tambin la escala ordinal pertenece a niveles bajos de
medicin, ya que no se pueden hacer planteamientos numricos significativos con respecto a las
diferencias entre las categoras. Solamente tiene sentido hacer un ordenamiento de mayor a menor o
viceversa, pero aunque existe un orden entre categoras, la diferencia entre dos adyacentes
cualesquiera no es la misma a lo largo de la escala. Esto quiere decir que si las categoras se
codificaran con nmeros, es muy probable que la diferencia entre la categora 8 y la 10 no sea de la
misma magnitud que entre la 0 y la 2.

Propiedades formales: los datos medidos en una escala ordinal presentan dos propiedades: 1) de
igualdad dentro de una misma categora y, 2) entre las categoras se puede establecer una relacin > y
< (mayor que, menor que).
Las relaciones entre los elementos en clasificacin, pueden formularse con el signo >, mayor que, o sea
que axiomticamente la diferencia fundamental entre una escala nominal y una ordinal es que esta
ltima incorpora no solamente la relacin de equivalencia (=) sino tambin la relacin "mas grande que"
(>). Esta relacin es irreflexiva (no es verdad para ninguna x tal que x > x), asimtrica ( x > y luego x < y
) y transitiva (x > y et y > z luego x > z ).
UNIDAD I: ESTADSTICA DESCRIPTIVA

16
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
Puesto que cualquier transformacin tendiente a conservar el orden no altera la informacin contenida
en una escala ordinal, se dice que la escala es "nica hasta una transformacin monotnica". Esto es,
no importa que nmeros se den a una pareja de clases o a los miembros de esas clases, siempre que el
nmero mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden
usarse nmeros menores para grados ms preferidos (...de primera clase, de segunda clase, etc.); en
tanto se sea consecuente, es indiferente el uso del nmero mayor o menor para denotar "mayor" o "mas
preferido". Fundamentalmente, las escalas ordinales se estudian en Estadstica, con base en las
llamadas "estadsticas de orden" o "estadsticas de rango".
E Ej je em mp pl lo o: : S Su up po on ng ga a q qu ue e a a l lo os s c cl li ie en nt te es s e en n u un n a al lm ma ac ce en n s se e l le es s h ha ac ce e u un na as s p pr re eg gu un nt ta as s p pa ar ra a v va al lo or ra ar r l la a c ca al li id da ad d
d de el l s se er rv vi ic ci io o. . L Lo os s c cl li ie en nt te es s v va al lo or ra an n l la a c ca al li id da ad d d de e a ac cu ue er rd do o a a l la as s s si ig gu ui ie en nt te es s r re es sp pu ue es st ta as s: : 1 1 ( (e ex xc ce el le en nt te e) ), , 2 2
( (b bu ue en no o) ), , 3 3 ( (r re eg gu ul la ar r) ), , 3 3 ( (m ma al lo o) ) 4 4 ( (p p s si im mo o) ). . E Es st to os s d da at to os s s so on n o or rd di in na al le es s. . N No ot te e q qu ue e u un na a v va al lo or ra ac ci i n n d de e 1 1 n no o
i in nd di ic ca a q qu ue e e el l s se er rv vi ic ci io o e es s d do os s v ve ec ce es s m me ej jo or r q qu ue e c cu ua an nd do o s se e d da a u un na a v va al lo or ra ac ci i n n d de e 2 2. . S Si in n e em mb ba ar rg go o p po od de em mo os s
d de ec ci ir r q qu ue e l la a v va al lo or ra ac ci i n n d de e 1 1 e es s p pr re ef fe er ri ib bl le em me en nt te e m me ej jo or r q qu ue e 2 2, , y y a as s e en n l lo os s d de em m s s c ca as so os s. .


Cuadro 1.4. Ejemplos de escala ordinal
Variable cualitativa Categora
Grado de aceptacin de un producto
Me disgusta, Me gusta poco, Me gusta, Me gusta
mucho
Tolerancia de grupos de cultivos al sodio
intercambiable, bajo condiciones de salinidad
Extremadamente Sensible, Sensible, Moderadamente
Tolerante, Tolerante

Observacin: la forma de reconocer este tipo de datos se debe cumplir que: a) los datos se obtuvieron
simplemente observando y clasificando cualitativamente las unidades, y b) tiene sentido el ordenamiento
de las clases de mayor a menor o viceversa.


1 1. .7 7. .2 2. . E Es sc ca al la a d de e i in nt te er rv va al lo o y y e es sc ca al la a d de e r ra az z n n

Cuando la medicin de las variables arroja datos de naturaleza numrica, significa que el nivel de
la medicin corresponde a una escala de intervalos o bien a una de razn. La medicin de estas
variables origina registros que son nmeros que pertenecen a los conjunto de los nmeros naturales,


, o de los reales,

.

Una escala numrica es una escala ordenada en la cual, la diferencia entre dos
nmeros sucesivos cualesquiera es una cantidad significativa (diferente a cero) que adems se
mantiene constante en cualquier parte de la escala. En otras palabras, la distancia entre pares de
valores numricos del conjunto ordenado es constante Por ejemplo, una persona que mide 1,65 metros
es 5 centmetros ms alta que otra que mide 1,60 metros, lo mismo acontece entre dos personas que
miden 1,80 metros y 1,85 metros, o bien considerando el tiempo cronolgico: 100 aos a.C. se distancia
del ao 0 tanto como 100 aos d.C.

Escala de intervalos

La escala de intervalos se caracteriza porque dado el conjunto ordenado de mediciones, las distancias
numricas iguales entre dos nmeros, representan distancias iguales empricas en la variable medida
pero, con relacin al 0 u origen de la escala numrica ocurre que no se trata de un cero real o
verdadero. Si, adems de que las diferencias son significativas e iguales en todos los puntos de la
escala, existe un cero real que permita considerar cocientes de mediciones, entonces la escala es una
escala de razn. Una persona que mide 1,80 metros tiene el doble de la estatura de alguien que mide
90 centmetros; en general, entonces, las mediciones de longitud estn dadas en escala de razn. La
temperatura es un caso especial: las escalas Fahrenheit y la Celsius (centgrada) son de intervalo pero
no de razn; el establecimiento del cero es arbitrario, no real. Nadie podra decir que 40 C sealan el
doble de temperatura que 20 C. Pero cuando se mide a partir del cero absoluto, como en la escala de
Kelvin, la temperatura est dada en una escala de razn, puesto que, si se duplica la temperatura, en
realidad se duplica la velocidad promedio de las molculas que componen la substancia. En las
siguientes figuras se presentan ejemplos de variables dadas en escalas de intervalo y de razn.

Cuadro 1.5. Ejemplos de escalas de intervalo y de razn.
Variable cuantitativa Niveles de medicin
Temperatura en (en grados Centgrados o Fahrenheit)
Tiempo calendario(gregoriano, hebreo o islmico)
Estatura (en metros o centmetros)
Peso (en libras o kilogramos)
Edad (en aos o das)
De intervalo
De intervalo
De razn
De razn
De razn

Por lo general, se supone que los datos que se obtienen para una variable cuantitativa se miden
en escalas de intervalo o de razn. Estas escalas constituyen los niveles ms elevados de medicin.
UNIDAD I: ESTADSTICA DESCRIPTIVA

17
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
Son formas ms fuertes de medicin que la escala ordinal, porque permiten discernir no slo cul de los
valores es el mayor, sino por cunto.

Una escala de intervalos se caracteriza por una unidad de medicin comn y constante, que asigna un
nmero real a todos los pares de objetos del conjunto ordenado.

Hay dos clases de escalas numricas:

a) Escala continua: tiene valores continuos. Por ejemplo, la temperatura, porcentaje de saturacin
del colesterol en bilis.
b) Escala discreta: es igual a nmeros enteros. Cuando una observacin slo puede medirse en
valores enteros, se utiliza esta escala de medicin. Por ejemplo, nmero de fracturas,
embarazos, operaciones previas, ataques isqumicos transitorios (AIT) antes de un ataque
apopljico.


Algunos estadgrafos diferencian las escalas de intervalos (con un punto cero arbitrario) de las
escalas de proporcin (con un punto cero absoluto); ejemplos son la temperatura en una escala Celsius
o centgrada (intervalo) y la temperatura en una escala Kelvin (proporcin o razn).
Puede as demostrarse que las relaciones de las diferencias de temperatura (o sea de intervalos)
son independientes de la unidad de medicin y del punto 0.
Se pueden ejemplificar algunos puntos en las 2 escalas:

C 0 10 30 100
F 32 50 86 212



Escala de cocientes o razones

Cuando una escala tiene todas las caractersticas de una escala de intervalos iguales y, adems,
tiene un punto 0 verdadero en su orgen, tenemos una escala de cocientes.
En una escala de cocientes la relacin o cociente entre dos puntos cualesquiera de la escala es
independiente de la unidad de medida (decimos dos puntos y no dos intervalos o diferencia entre dos
puntos).

Pese a que las diferencias entre datos nominales, ordinales, intervlicas y proporcionales se
presentan de manera natural sobre el papel, las lneas que las delimitan son a veces muy borrosas.
Pese a esto las diferencias entre variables nominales, ordinales, intervlicas y proporcionales son
importantes hasta el punto de que hay que tenerlas en la mente, puesto que establecen los tipos de test
estadsticos que debemos aplicar a cada una de ellas. Como veremos en unidades posteriores, algn
tipo de grfico y lo que se denomina test paramtrico se pueden usar con datos intervlicos y
proporcionales, pero no con datos nominales y ordinales. Estos ltimos estn restringidos a la
estadstica no paramtrica.



1 1. .8 8. . P PA AR R M ME ET TR RO OS S Y Y E ES ST TA AD D G GR RA AF FO OS S

Cuando un problema pueda ser resuelto con ayuda de datos numricos, nuestro primer paso es
definir estadsticamente el problema, es decir, definir la poblacin estadstica y especificar los
parmetros. Hemos tratado los aspectos para definir una poblacin estadstica, y en este momento solo
comentaremos brevemente el problema de especificar parmetros.
Los valores de las variables que se estudian tienen una distribucin determinada en los
individuos que constituyen la poblacin.

Definicin 1.15. Los parmetros son funciones que resumen una propiedad del conjunto completo
de posibles datos poblacionales. Caracterizan a la poblacin y se representan con letras griegas
minsculas. Por ejemplo: la media poblacional se representa con la letra .

Un parmetro es un solo valor obtenido para describir en forma sumaria las caractersticas
pertinentes a un estado de naturaleza acerca de una poblacin. Una poblacin puede que tenga muchas
caractersticas y, por consiguiente, tambin muchos parmetros; a menudo, tiene un valor mnimo, un
valor mximo, una media, una amplitud, un valor total de todos los valores individuales, etc. Sin duda, no
todos los parmetros de una poblacin son necesarios en una situacin problemtica dada; su eleccin
depende de la naturaleza del problema.

UNIDAD I: ESTADSTICA DESCRIPTIVA

18
Ctedra de Clculo Estadstico y Biometra Facultad de Ciencias Agrarias UNCUYO / Ao 2013
Los valores de los parmetros por lo comn se consideran valores verdaderos. Para una mejor
comprensin, sea el siguiente ejemplo: el dimetro promedio de los rboles de una plantacin es una
caracterstica mensurable (por lo tanto un parmetro) de la poblacin formada por dimetros de todos
los rboles de una determinada poblacin. Es el verdadero promedio de los dimetros. De manera
semejante, la proporcin de todos los telespectadores que ven un cierto programa a cierta hora es un
parmetro de la poblacin de telespectadores; es la verdadera proporcin o proporcin de la poblacin.
Es imposible calcular el valor verdadero de cualquier parmetro de una poblacin infinita. En la mayor
parte de los casos, tampoco resulta prctico calcular el valor verdadero de cualquier parmetro de una
poblacin finita. Debido a esto, resulta necesario realizar inferencias acerca de los parmetros de la
poblacin a partir de la informacin contenida en una pequea parte o muestra de la poblacin.


Definicin 1.16. Un estadgrafo (tambin llamado un estadstico variable, aunque este trmino resulta
confuso) es cualquier funcin calculada a partir de los valores de una variable observada en una
muestra.

Definicin 1.17. Los estimadores son aquellos estadgrafos que toman valores prximos a los
parmetros de la poblacin de la que proceden.

Los estimadores son tiles si se desea inferir los parmetros de la poblacin y slo se dispone
de muestras (Figura 1.4)





















Figura 1.4: El mtodo inductivo incompleto: estadgrafos, estimadores y parmetros




POBLACIN


MUESTRA

Estadstica Descriptiva

Estadstica Inferencial
Parmetro
(valor constante)
Estadgrafo
(valor variable)
Estimador
(valor variable)

S-ar putea să vă placă și