Sunteți pe pagina 1din 20

1

ESTADISTICA DESCRIPTIVA

I UNIDAD. INTRODUCCION A LA ESTADISTICA.


Iniciamos este captulo con la definicin de algunos conceptos elementales y bsicos, y
sin embargo pilares, para una comprensin intuitiva y real de lo que es la Bioestadstica.
En esta unidad se pretende introducir los conceptos basicos de la Estadistica que permitan
fundamentar en la siguiente unidad el uso y manejos de datos numricos: distinguir y
clasificar las caractersticas en estudio, organizar y tabular las medidas obtenidas
mediante la construccin de tablas de frecuencia y por ltimo los mtodos para elaborar
una imagen que sea capaz de mostrar grficamente unos resultados.
Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos
numricos presentada de forma ordenada y sistemtica. Esta idea es la consecuencia del
concepto popular que existe sobre el trmino y que cada vez est ms extendido debido a
la influencia de nuestro entorno, ya que hoy da es casi imposible que cualquier medio de
difusin, peridico, radio, televisin, etc, no nos aborde diariamente con cualquier tipo de
informacin estadstica sobre accidentes de trfico, ndices de crecimiento de poblacin,
turismo, tendencias polticas, etc.
Slo cuando nos adentramos en un mundo ms especfico como es el campo de la
investigacin de las Ciencias Sociales: Medicina, Biologa, Psicologa, ... empezamos a
percibir que la Estadstica no slo es algo ms, sino que se convierte en la nica
herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto
beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su
variabilidad intrnseca, no puedan ser abordadas desde la perspectiva de las leyes
determistas. Podramos, desde un punto de vista ms amplio, definir la estadstica como
la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de
accin en situaciones prcticas que entraan incertidumbre.
La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar,
resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e
incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a
partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular
predicciones.
La bioestadstica, de forma general, es la aplicacin de la estadstica a la biologa.
Debido a que las cuestiones a investigar en biologa son de naturaleza muy variada, por
ejemplo, la medicina, ciencias agropecuarias y forestales, la bioestadstica ha expandido
sus dominios para incluir cualquier modelo cuantitativo, no slo estadstico, que pueda
ser usado para responder a estas necesidades.

2
La bioestadstica puede ser considerada como una rama, altamente especializada, de la
informtica mdica que puede ser, a su vez, complementada por la bioinformtica.
Se define la bioestadstica como la aplicacin de mtodos estadsticos a la solucin de
problemas biolgicos. Tambien se le llama estadstica biolgica o biometra.
El razonamiento y la modelizacin bioestadsticas fueron fundamentales en la fundacin
de la Sntesis Moderna de la evolucin. A principios de los aos noventa, despus del
redescubrimiento de la obra de Mendel, los problemas conceptuales ligados a la
comprensin de la relacin entre la gentica y el darwinismo condujeron a un acalorado
debate entre biomtricos (Weldon, Pearson) y mendelianos (Davenport, Bateson). En los
aos 30, tres grandes estadistas (Ronald Fisher, Sewall G. Wright y J. B. S. Haldane)
lograron resolver el conflicto e introdujeron la bioestadstica y, en particular, la gentica
de poblaciones, como una de las ramas esenciales de la Sntesis evolutiva moderna.
La aplicacin resulta hoy en da necesaria, en los campos: Salud publica, que incluye
epidemiologia, nutricion, salud ambiental y en investigacion de servicios sanitarios,
Medicina, Ecologia, Bioensayos, etc.
La colaboracin de la bioestadstica ha sido clave en el desarrollo de nuevos frmacos, en
el entendimiento de enfermedades crnicas como el cncer y el sida, y estos son algunos
de los miles de ejemplos posibles.
La estrecha relacin de la Estadstica con el mtodo cientfico hace de la Bioestadstica
una disciplina imprescindible en la mayora de los proyectos en el rea tecnolgica.
El pensamiento estadstico no slo resuelve y entiende compleja metodologa para dar
respuesta a hiptesis, sino que es capaz de organizar el sistema que involucra la
investigacin desde el diseo general, diseo de muestreo, control de calidad de la
informacin, anlisis y presentacin de resultados.

CAMPO DE ESTUDIO DE LA ESTADISTICA


La estadstica, o mtodos estadsticos como a veces se llama, est desempeando un
importante papel ascendente en casi todas las facetas del progreso humano.
Anteriormente solo era aplicada a asuntos de estado, de donde viene su nombre, pero
ahora la influencia de la estadstica se extiende a la agricultura, biologa, negocios,
qumica, comunicaciones, economa, enseanza, electrnica, medicina, fsica, ciencias
polticas, psicologa, sociologa y otros muchos campos de la ciencia e ingeniera.

3
IMPORTANCIA DEL ESTUDIO DE LA ESTADISTICA
La Estadstica puede dar respuesta a muchas de las necesidades que la sociedad
actual nos plantea. Su tarea fundamental es la reduccin de datos, con el objetivo de
representar la realidad y transformarla, predecir su futuro o simplemente conocerla.
La Estadstica responde a las necesidades blicas y fiscales de los gobernantes. Esto se
puede conseguir con un conocimiento claro de la poblacin con la que se cuenta. La
herramienta para conseguirlo es el CENSO DE POBLACIN.
La prctica del recuento de la poblacin y de algunas caractersticas de esta por los
Estados es muy antigua (se remonta a 3000 aos antes de Cristo en Egipto y
Mesopotamia). En palabras de Bielfed, la Estadstica es la ciencia que nos ensea el
ordenamiento poltico de todos los estados del mundo conocido, es decir, est al servicio
del Estado, de hecho, la palabra Estadstica deriva de Estado.

La Estadstica responde a la actividad planificadora de la sociedad. Con la Revolucin


Industrial aparecen nuevos problemas, sobre todo de desigualdades sociales. La
Estadstica es un instrumento para identificar estas injusticias y para producir
informacin en el llamado Estado del Bienestar.

La Estadstica responde a nuevas demandas sociales. Para realizar investigaciones


exhaustivas sobre temas sociales surgen tres problemas bsicos a la hora del trabajo de
campo, como el tiempo que tardaramos en entrevistar a toda la poblacin y el costo
econmico y de personal de estas entrevistas. Con las tcnicas de MUESTREO se
consigue hacer buenas investigaciones sobre una pequea parte de esa poblacin,
obteniendo resultados vlidos para toda ella.
La Estadstica responde a las necesidades del desarrollo cientfico y tecnolgico de la
sociedad. Tras la Revolucin Industrial se produce un desarrollo de la sociedad en todos
sus mbitos y, en particular, en el Cientfico y Tecnolgico. Las Comunicaciones, la
Industria, la Agricultura, la Salud... se desarrollan rpidamente y se exige el mximo
rendimiento y la mejor utilizacin de estos sectores.
Las tcnicas de Investigacin de Mercados permiten saber si un producto cualquiera
ser bien acogido en el mercado antes de su salida a este, o bien medir la audiencia en
Televisin y Radio.
El Control de Calidad permite medir las caractersticas de la calidad de un producto,
compararlas con ciertos requisitos y tomar decisiones correctivas si hay diferencias entre
el funcionamiento real y el esperado. Con estudios estadsticos aplicados a la Agricultura

4
y a la Pesca podemos estimar los rendimientos obtenidos en una cosecha, o encontrar
bancos de peces...
En Medicina e Investigacin farmacolgica es imprescindible la Estadstica, probando
nuevos tratamientos en grupos de pacientes o bien, obteniendo conclusiones sobre ciertas
enfermedades observando durante un tiempo un grupo de pacientes (saber si para el
tratamiento de cierto tipo de cncer es ms efectiva la ciruga, la radioterapia o la
quimioterapia, sin ms que observar un grupo de pacientes tratados con estas tcnicas).
Con el estudio de los Procesos Estocsticos se puede tener una mejor comprensin de
fenmenos de comportamiento aleatorio como meteorologa, fsica nuclear, campaas de
seguridad, etcetera.
Existen bsicamente cuatro razones para estudiar estadstica, ya que al hacerlo seremos
capaces de:
1. Aprender las reglas y mtodos para tratar informacin estadstica.
2. Evaluar y cuantificar la importancia de los resultados estadsticos publicados.
3. Conocer los aspectos del pensamiento estadstico como un componente esencial de
una educacin humanstica.
4. Entender mejor el mundo real de nuestro entorno.
Quiz una de las razones ms importantes para estudiar estadstica en este nivel, sea
que nos permite tomar crticamente la informacin estadstica proporcionada por los
medios de comunicacin, por ejemplo:

La llanta marca X frena un 35% ms rpido. (Ms rpido que qu?)


Cuatro de cada dentistas interrogados declararon preferir la pasa dentfrica X.
(Cuntos dentistas fueron interrogados? Cmo fueron escogidos?).

Como somos consumidores de informacin estadstica, podemos usar la estadstica


para estudiar y entender mejor muchos sucesos cambiantes que contribuirn a nuestra
comprensin del mundo. Estudiar estadstica nos permitir dar una interpretacin
razonable a los ejemplos anteriores.
Como usuarios potenciales de los mtodos y tcnicas estadsticos. Necesitamos estar
familiarizados con el quehacer de la investigacin estadstica bsica, con la descripcin
de los resultados de nuestra bsqueda cientfica, con la toma de decisiones basadas en
sta y con la estimacin de cantidades desconocidas.
IMPORTANCIA DE LA ESTADISTICA EN LA BIOLOGIA
La estadstica estudia los fenmenos aleatorios. Los fenmenos aleatorios son aquellos
cuyo resultado depende del azar y no es posible efectuar una prediccin exacta del estado
final del fenmeno, aunque se cuente con mucha informacin sobre el estado inicial. En
Biologa abundan los fenmenos aleatorios, lo cual se debe al desconocimiento del
mecanismo de accin especfico de un estmulo o factor (un organismo, calor, fri, etc.)

5
sobre los seres vivos y la forma en que ese mecanismo se modifica de acuerdo con las
caractersticas especificas del individuo. La tasa reproductiva de una bacteria, el nmero
de insectos en una hectrea determinada de bosque, la biomasa que podr tener un nicho
ecolgico al llegar a su vegetacin clmax, etc.
Para poder describir, comparar y predecir la evolucin de diversos grupos de seres
vivos ante determinados estmulos (luz, agua, temperatura y otros aspectos del hbitat),
es necesario emplear la estadstica.
Por lo anterior, se justifica plenamente de que la estadstica es una herramienta
indispensable en la biologa.
EJEMPLOS BIOLOGICOS EN LOS CUALES SE APLICA LA ESTADISTICA
En la Genetica y Evolucion la estadistica ha jugado, y sigue jugando, un papel
fundamental, porque las leyes de la herencia son de tipo estadistico. Asimismo, la
evolucion se estudia considerando poblaciones de individuos y postulando modelos de
tipo probabilistico para explicar los cambios en frecuencias de genes de la poblacion
como efecto de la seleccion, la mutacion o cambios aleatorias. El mejoramiento de
especies vegetales y animales es auxiliado por la estadistica tanto para postular los
programas de fecundaciones y seleccion de descendientes con base en los modelos de la
genetica cuantitativa, como para establecer experimentos para constatar, evaluar y
optimizar las mejorias logradas en caracteristicas cuantitativas, como produccion de
granos, frutos, leche, huevo, etc., asi como para el estudio de las interacciones entre el
genotipo y el medio ambiente.
En Fisiologia es importante cuantificar aspectos como la fotosintesis, respiracion,
crecimiento y diferenciacion, y encontrar modelos que describan como dichos aspectos se
modifican en funcion de variables ambientales para postular hipotesis que, a su vez,
expliquen los mecanismos fisiologicos. Tambien esos modelos pueden usarse para
encontrar condiciones en que los procesos son optimos de acuerdo con los objetivos
buscados, por ejemplo, que condiciones ambientales producen mayor concentracion de
proteina en un producto comestible de origen animal o vegetal.
En la Morfologia, la estadistica sirve para evaluar tamao y forma, usando
metodos multivariados, asi como para tener, tambien, idea de la variacion en tamao,
forma y disposicion de organos, tejidos, celulas y organelos. El muestreo permite
cuantificar el numero y volumen de tipos de celulas dentro de lo tejidos o de organelos
dentro de celulas.
En Taxonomia, la estadistica permite usar muchas variables simultaneamente,
tanto para caracterizar las clasificaciones establecidas por otros medios (familias,
generos, especies y variedades), como para sugerir nuevos criterios de clasificacion. Otro
aspecto importante es la asociacion entre las clasificaciones y el desarrollo filogenetico
de las mismas, busacando dendogramas y su concordancia en dicho desarrollo.

6
En la Ecologia intervienen muchas variables como son las caracteristicas del
medio ambiente y las de la diversidad y distribucion de las especies. La estadistica auxilia
en la concentracion de informacion y la busqueda de relaciones entre esos aspectos; asi,
en habitats acuaticos hay que considerar aspectos como sales en el agua, temperatura y
sus cambios, microorganismos, etc., y en habitats terrestres, aspectos climatologicos,
edaficos y bioticos. En un habitat dado interesa determinar, usualmente mediante
muestreos seguidos de analisis descriptivos uni y multivariados, la densidad de cada
especie, frecuencia de ocurrencia, distribucion espacial, biomasa total y por especies,
cobertura y otros aspectos.
A la descripcion sigue la busqueda de asociaciones para sugerir o contrastar
hipotesis de causalidad probabilistica. En el analisis de poblaciones es importante
considerar estructura de edades, nacimientos, tasas de mortalidad, crecimiento de
poblaciones, dispersion de estas y competencia intra e interespecifica.
A un nivel de agregacion mayor, interesan aspectos como el de la eficiencia
fotosisntetica global de un habitat acuatico o terrestre, la similaridad de comunidades, la
estructura y diversidad de especies relacionadas con el habitat, y la sucesion ecologica
que se presenta al cambiar un habitat por efecto de la comunidad que lo habita hasta
llegar a su climax. En todos los procesos sealados, por su complejidad y gran numero de
variables involucradas, es indispensable la estadistica para buscar y describir
regularidades en los procesos.
ANTECEDENTES HISTORICOS DE LA ESTADISTICA
A continuacin se describen los hechos histricos ms relevantes de la estadstica en su
relacin con la biologa.
El desarrollo de la estadstica moderna ha sido influenciado profundamente por las
necesidades concretas para llegar a la solucin de problemas en biologa y medicina.
Halley en 1693 produjo una tabla de mortalidad de humanos con probabilidades de
fallecimiento por edades. Durante los 50 aos siguientes, los matemticos: Huygens,
DeMorvre, Fourier y Bernoulli se involucraron en la construccin de tablas de
mortalidad, adems de hacer grandes contribuciones muy importantes en estadstica
matemtica. A principios del siglo XIX, la Laplace y Gauss desarrollaron el modelo
gaussiano, al que se denomin Curva Normal, creada por Francis Galton en el ultimo
tercio de ese siglo, al encontrar que era til para describir las frecuencias de muchas
mediciones numricas en biologa.
Un antecesor de importancia par la bioestadstica moderna lo fue el mdico francs
Pierre Charles-Alexandre Louis (1787-1872), quien inicio la bioestadstica mdica
alrededor de 1830 y estableci criterios para los estudios observacionales.
Louis tuvo muchos alumnos, entre los que destacan William Farr (1807.1883), creador
de las ideas de epidemiologa y actuara.
Kart Pearson (1857-1936), quien hizo notables contribuciones a la estadstica, como son
las pruebas de ji cuadrada, coeficientes de correlacin, y tipos de curvas y sus
aplicaciones a la biologa, as como por sus estudios sobre evolucin, medicina y
antropologa.
A fines del siglo XIX y principios del XX, se produjo el choque de ideas entre bilogos
y matemticos, cuya resultante fue la Biometra.

7
En 1894 se cre una camisn para el desarrollo de la Royal Society, que tuvo como
propsito el conducir a la investigacin estadstica sobre la variabilidad de los
organismos. Esto gener una pugna entre el biologo Bateson y los matemticos K.
Pearson, F. Galton y Weldon, debido a la cual la comisn no funcion y en1900 fue
disuelta. Eso condujo a los matemticos involucrados a editar en 1901 la revista
Biomtrica, dedicada a difundir las aplicaciones de la estadstica en la biologa;
publicacin que actualmente goza de reconocido prestigio.
G:S: Gosset (1876-1937), quien escribiera bajo el seudnimo de Student, estuvo en
contacto con Pearson y en 1910 desarroll la llamada distribucin t, adems promovi
loas ideas bsicas para el anlisis de experimentos agrcolas.
En 1889, F. Galton postulo la idea de regresin. Treinta aos despus, R: A:
Fshier(1890.1962) concibi los modelos y desarroll las tcnicas para un uso cabal de la
regresin. Fisher elabor los modelos lineales, en general, y su procedimiento de anlisis,
lo que comprende los modelos de regresin, de diseo de experimentos y de covariacin,
que han tenido un impacto muy fuerte en la biologa.
Adems, aport valiosas contribuciones en: la teora matemtica de la evolucin, la del
anlisis discriminante, la de la teora estadstica en general y la de las aplicaciones a la
agricultura.
Publico dos libros, uno sobre Mtodos estadsticos y Diseo de
experimentos, dirigidos principalmente a bilogos, mdicos y agrnomos. Muchos de sus
discpulos, entre ellos D. Finney en Inglaterra, difundi y ampli las ideas de Fisher
desarrollando las tcnicas de bionesayo. EN Estados Unidos la influencia de Fisher
propici la integracin de dos departamentos de estadstica experimental con enfoque a la
biologa y agronoma.
Los alumnos de Fisher, conjuntamente con otras personas, fundaron en 1945 la revista
Biometrics, dedicada tambin a las aplicaciones de la estadstica en la biologa, en la
medicina y en la agronoma.
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con
exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y
fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el
proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad
ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos
se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones
probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos.
La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para
predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico.
MAL USO DE LA ESTADISTICA
Hay un viejo refran que dice: Las cifras no mienten, pero los mentirosos hacen
las cifras. De hecho, el primer ministro britanico Disraeli estaba tan desencantado con la
estadistica que clasifico las falsedades en orden creciente de ignominia como mentiras,
malditas mentiras y estadisticas.

8
Como muchos otros procedimientos utiles y eficaces, la estadistica puede ser,
efectivamente, mal usada. Por ejemplo, hay numerosos casos del mal uso intencionado de
la estadistica por aquellos que emplean sus habilidades en el campo para servir intereses
particulares, distorsionando y falsificando los datos. Las campaas publicitarias
exageradas o claramente fraudulentas son ejemplos demasiado corrientes de tales trucos
estadisticos. Los discursos de campaa de los politicos estan a menudo adornados
intencionadamente de una evidencia estadistica unilateral y distorsionada, diseada
para favorecer su propia fortuna politica.
Por otro lado, el mal uso de la estadistica no siempre proviene del trabajo de un
inescrupuloso. Algunas veces tienen dificultades investigadores bien intencionados y, por
lo demas, competentes, por que o no conocen lo suficiente acerca de lo conceptos y
metodos estadisticos o conocen demasiado que no es cierto.
La mayoria de las personas creen que los cientificos son honestos, razonables,
objetivos, modestos, decentes, autocriticos y sobretodo llenos de un fervor religioso en
busca de la verdad, sin importarles a donde les conducira el intento. Afortunadamente,
esto ocurre la mayoria de las veces. En cambio, creer que todos esos atributos se cumplen
seimpre equivale a suponer que los cientificos son o menos o mas que seres humanos.
Solo el ingenuo podria pensar que los cientificos son inmunes a la debilidad humana.
Esto significa, que en muchos casos hay presiones para producir, para publicar y para
ganar mas recursos para la investigacion ya que sobre esto se construye la reputacion
propia. Por lo que, no es de sorprenderse que algunos investigadores sean conocidos por
publicar prematuramente y hacer afirmaciones no justificadas completamente por sus
datos.
Ejemplos del uso impropio de datos que habran de alertar sobre ciertos errores comunes
en el uso de la estadistica:

Las estadisticas muestran que casi todos los accidentes de circulacion se


producen entre vehiculos que ruedan a velocidad moderada. Muy pocos
ocurren a mas de 150 km/h. Significa esto que resulta mas seguro conducir
a gran velocidad? No, de ninguna manera. Con frecuencia, las correlaciones
estadisticas no reflejan causas y efectos. Casi todo el mundo circula a velocidad
moderada, y como es natural, la mayoria de los accidentes se producen a estas
velocidades.
Si las estadisticas mostrasen que la mortalidad por tuberculosis es mayor en
Segovia que en otras provincias, significaria esto que el clima segoviano
favorece el contagio tuberculoso? Todo lo contrario. El clima segoviano es tan
beneficioso para los tuberculosos que muchos acuden alli para restablecerse.
Naturalmente, esta es la causa de que aumenten alli los fallecimientos provocados
por el mal.
Un reciente estudio psicopedagogico ha demostrado que los nios de pie
grande saben leer mejor que los de pie pequeo. Permitira el tamao del pie
medir la capacidad de lectura de los nios? No, desde luego. El estudio se hizo
sobre escolares que estan en crecimiento. Todo cuanto se demostro en el es que
los nios mayorcitos, cuyos pies son mas grandes, leen mejor que los pequeines.

CONCEPTOS BASICOS
Poblacin: conjunto de individuos o elementos que cumplen ciertas propiedades
comunes.
En relacin al tamao de la poblacin, sta puede ser:

Finita, como es el caso del nmero de personas que llegan al servicio de urgencia
de un hospital en un da;
Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la
secuencia de caras y cruces obtenida en el lanzamiento repetido de una moneda al
aire.
Muestra:

subconjunto

representativo

de

una

poblacin.

Parmetro: funcin definida sobre los valores numricos de caractersticas


medibles
de
una
poblacin.
Estadstico: funcin definida sobre los valores numricos de una muestra.
Ejemplo: Consideremos la poblacin formada por todos los estudiantes de la Universidad
Autonoma de Sinaloa (finita). La altura media de todos los estudiantes es el parmetro .
El conjunto formado por los alumnos de la Facultad de Medicina es una muestra de dicha
poblacin y la altura media de esta muestra, , es un estadstico.
LA ESTADISTICA EN EL METODO CIENTIFICO
El uso de la estadistica como herramienta de la investigacion no puede separarse
del planeamiento general del proyecto de investigacion. Si un proyecto de investigacion
debe producir datos que van a ser tratados estadisticamente, entonces un metodo
estadistico apropiado debe formar parte del diseo total. Nada contribuye mas a la
angustia de un estadistico que el investigador ingenuo que obtiene datos con la
conviccion alegre de que un metodo estadistico estara automaticamente disponible para
analizarlos.
El enfoque experimental de la busqueda de la informacion en relacion con un
problema biologico debe implicar mucha atencion y una planeacion previa. Es decir, un
proyecto de investigacion debe ser diseado y planificado antes de efectuarse.
Etapas de una investigacion estadistica:

10

1. Formulacion o definicion del problema. La primera tarea es conocer


exactamente que ha de ser investigado, es decir, formular el problema o pregunta
lo mas precisamente posible. Para investigar con exito un problema dado,
tenemos en cuenta el tiempo y dinero disponibles y la experiencia de los
investigadores.
2. Diseo del experimento. Una vez formulado con precision el problema que
requiere analisis estadistico, el investigador debe decidir si estudiar toda la
poblacion o solo una muestra extraida de ella. La idea es obtener un maximo de
informacion empleando un minimo de costo y tiempo. Esto implica, entre otras
cosas, que debemos determinar el tamao de la muestra o la cantidad y tipo de
datos que resolveran mas eficientemente el problema.
3. Experimentacion o coleccion de datos. La compilacion de datos se refiere a los
metodos usados para obtener informacion pertinente de las unidades elementales
introducidas en una muestra (o poblacion). En general, esta parte es la que
consume mas tiempo en toda investigacion que sea realizada. Esta debe sujetarse
a reglas estrictas. De hecho, cuanto menos opiniones sujetarse a reglas estrictas.
De hecho, cuanto menos opiniones impongamos, seran mejores los resultados.
4. Tabulacion y descripcion de los resultados. En esta etapa los datos
experimentales se ordenan o se ponen en forma legible y se ilustran con
representaciones graficas (tablas, diagramas, graficas de barras, etc.); ademas se
calculan medidas descriptivas para el tamao promedio y la separacion o
dispersion de los valores de la muestra.
5. Inferencia estadistica y formulacion de la respuesta. Al aplicar el metodo
estadistico seleccionado en la etapa 2, obtenemos conclusiones a partir de la
muestra, acerca de la poblacion correspondiente (inferencia estadistica) y
formulamos la respuesta a nuestro problema.
No existe una formula magica en estadistica matematica que tome en cuenta
todas situaciones practicas concebibles. Por lo cual es necesario adquirir
conocimientos generales de los metodos mas importantes que sean utiles para hacer
inferencias. En cada caso practico debe estudiarse con cuidado la naturaleza del
problema especifico, para estar seguros de que sera escogido el metodo mas
apropiado.
CLASIFICACION DE LA ESTADISTICA
Los procedimientos y analisis que aparecen en estadistica caen en dos categorias
generales, descriptiva e inferencial, dependiendo del proposito de estudio.
La estadistica descriptiva comprende aquellos metodos usados para organizar y
describir la informacion recabada. Estos metodos se usan para analizar la informacion
y desplegarla en forma grafica tal, que permita interpretaciones con significado. Los
metodos de la estadistica descriptiva nos ayudan a describir el mundo en torno
nuestro. Usamos estadistica descriptiva cuando recolectamos: como la produccion de
trigo por hectarea en una cierta region agricola, el numero de personas con distintos

10

11
niveles de ingresos, o el promedio de puntos obtenidos por un equipo de futbol
americano durante la primera mitad del juego o de la temporada, etc.
Ejemplo: Las situaciones siguientes utilizan estadistica descriptiva.
1. Un jugador de boliche quiere conocer su promedio de anotaciones en los pasados
12 juegos.
2. Una mujer dedicad a la politica desea saber el porcentaje exacto de votos que
obtuvo en la ultima eleccion.
3. Maria quiere describir la variacion que hay en las cinco calificaciones de
examenes que comprenden la primera cuarta parte de su curso de calculo.
4. Al seor Perez le interesa determinar el promedio semanal total de sus gastos en
comestibles durante los ultimos tres meses.
Por otro lado, la estadistica inferencial involucra teoria de la probabilidad.
Comprende aquellos metodos y tecnicas usadas para hacer generalizaciones,
predicciones o estimaciones sobre poblaciones a partir de una muestra.
La habilidad para hacer generalizaciones sobre la poblacion a partir de una
muestra es un aspecto importante en estadistica. Rara vez tenemos la informacion
completa que necesitamos para llegar a la verdad absoluta sobre algun evento total.
Las decisiones e inferencias se basan en informacion limitada e incompleta; los
metodos de la estadistica inferencial y el conocimiento obtenido al usarlos, nos
permiten utilizar informacion disponible limitada para entender y tratar con las
incertidumbres de este mundo cambiante y azaroso. Por ejemplo, podemos predecir el
trigo que se producira el ao entrante si nos basamos en las producciones de los aos
proximos pasados; estimar el crecimiento del ingreso promedio de un periodo de
cinco aos con base en el conocimiento del promedio de ingresos en el pasado y de
otros estadisticos descriptivos; etc. Con estadistica inferencial establecemos como
seran las cosas probablemente o a veces solo como pueden ser. Usando metodos de
probabilidad, intentaremos medir el grado de incertidumbre asociado con una
inferencia.
Ejemplos. Las situaciones siguientes, que son paralelas a las situaciones descriptivas
dadas en los ejemplos anteriores, requieren estadistica inferencial.
1. Un jugador de boliche quiere estimar la oportunidad que tiene de ganar un torneo
proximo con base en su promedio de la temporada actual y en los promedios de
sus futuros contrincantes.
2. Con base en una encuesta de opinion, a un politico le gustaria calcular la
oportunidad de reelegirse en las proximas elecciones.
3. Con apoyo en la variacion de sus calificaciones de examenes en la primera cuarta
parte del curso de calculo, Maria desea predecir la que tendra en las calificaciones
de examentes de la segunda cuarta del curso de calculo.
4. El seor Perez desea calcular el monto semanal promedio que gastara en
comestibles el ao proximo, tomando como base sus facturas de comestibles del
ultimo ao.

11

12
La estadistica puede clasificarse tambien como: estadistica parametrica y
estadistica no-parametrica, esto en funcion de que las poblaciones estudiadas cumplan
o no los supuestos en que se basan los diferentes procedimientos estadisticos.
Los procedimientos no parametricos se usan, en su mayor parte, cuando los
supuestos en que se basan otras pruebas no son satisfechos y se requiere de una analisis
de datos. En general, los metodos no parametricos no presuponen conocimiento alguno
sobre la razon, en ocasiones se les llama metodos de distribucion libre. En el caso de la
estadistica parametrica las pruebas de t y de F presuponen que las muestras proceden d
poblaciones normales, es decir, no son metodos libres de distribucion.
Desventajas de los metodos no parametricos:
Son metodos eficientes y poco sensitivos para detectar diferencias reales aunque
existan, particularmente cuando las muestras proceden de poblaciones normales.
Son menos eficientes porque desperdician informacion contenida en una muestra.
La falta de sensibilidad a diferencias reales da lugar generalmente a una mayor
probabilidad de cometer errores del tipo II y a una reduccion de la potencia
estadistica.
Ventajas de los metodos no parametricos:
Son de distribucion libre.
Son rapidas y sencillas de realizar.
Pueden usarse con datos cualitativos.
No son necesario tantas suposiciones.
TIPOS DE VARIABLES
No existe poblacion biologica alguna, en que todos los individuos sean identicos
entre si. Esto se cumple tanto para un bosque de arboles, como para las hojas de un
mismo arbol, como para los cloroplastos que pueden identificarse a partir de una hoja.
Cuando se analizan los fenomenos biologicos, se constata que la prediccion exacta de lo
que sucedera en un ensayo dado resulta imposible. El caso del sexo de un hijo es el
ejemplo tipico.
En esto los fenomenos biologicos se comportan como otros hechos de la vida real;
es imposible predecir exactamente de que cara caera una moneda arrojada al aire.
La imposibilidad de prediccion exacta en un ensayo biologico dado expresa la
variabilidad interindividual y permite asimilar a las variables biologicas con las variables
aleatorias.
Una variable aleatoria se llama asi porque sus valores fluctuan al azar en torno a un
supuesto valor verdadero.
En estadistica en general se manejan variables cualitativas y variables cuantitativas. Las
cuantitativas son aquellas que pueden medirse en forma usual; mientras que, las
cualitativas no es posible.
Dentro de las variables cuantitativas se ubican las variables aleatorias, las que a su vez se
clasifican en discretas y continuas.
Las variables aleatorias continuas son aquellas variables que pueden tomar cualquier
valor en un intervalo, o sea son variables cuyos valores provienen de mediciones. Por

12

13
otro lado, las discretas se caracterizan por saltos o interrupciones en los valores que est
puede tener, es decir, sus valores provienen de conteos.
MUESTREO Y TECNICAS DE MUESTREO
El muestreo es una herramienta de la investigacin cientifica. Su funcion basica es
determinar que parte de una realidad en estudio (poblacin o universo) debe examinarse
con la finalidad de hacer inferencias sobre dicha poblacin. El error que se comete debido
al hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observacin
de solo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada
significa lograr una versin simplificada de la poblacin, que reproduzca de algun modo
sus rasgos bsicos.
Las ventajas de estudiar una poblacin a partir de sus muestras son principalmente:
Coste reducido:
Si los datos que buscamos los podemos obtener a partir de una pequea parte del
total de la poblacin, los gastos de recogida y tratamiento de los datos sern
menores. Por ejemplo, cuando se realizan encuestas previas a un referndum, es
ms barato preguntar a 4.000 personas su intencin de voto, que a 30,000,000.
Mayor rapidez:
Estamos acostumbrados a ver cmo con los resultados del escrutinio de las
primeras mesas electorales, se obtiene una aproximacin bastante buena del
resultado final de unas elecciones, muchas horas antes de que el recuento final de
votos haya finalizado;
Ms posibilidades:
Para hacer cierto tipo de estudios, por ejemplo el de duracin de cierto tipo de
bombillas, no es posible en la prctica destruirlas todas para conocer su vida
media, ya que no quedara nada que vender. Es mejor destruir slo una pequea
parte de ellas y sacar conclusiones sobre las dems.
De este modo se ve que al hacer estadstica inferencial debemos enfrentarnos con dos
problemas:

Eleccin de la muestra (muestreo).


Extrapolacin de las conclusiones obtenidas sobre la muestra, al resto de la
poblacin (inferencia).

El tipo de muestreo ms importante es el muestreo aleatorio, en el que todos los


elementos de la poblacin tienen la misma probabilidad de ser extrados; Aunque
dependiendo del problema y con el objetivo de reducir los costos o aumentar la precisin,
otros tipos de muestreo pueden ser considerados como veremos ms adelante: muestreo
sistemtico, estratificado y por conglomerados.

13

14

*Muestreo aleatorio simple


Consideremos una poblacin finita, de la que deseamos extraer una muestra. Cuando el
proceso de extraccin es tal que garantiza a cada uno de los elementos de la poblacin la
misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de
seleccin muestreo aleatorio.
El muestreo aleatorio simple se puede plantear bajo dos puntos de vista:

Sin reposicin de los elementos;


Con reposicin.

El muestreo aleatorio simple se caracteriza por que:

cada elemento de la poblacin tiene la misma probabilidad de ser elegido, y


las observaciones se realizan con reemplazamiento. De este modo, cada
observacin es realizada sobre la misma poblacin (no disminuye con las
extracciones sucesivas).

Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la


extraccin de nmeros aleatorios mediante computadoras, calculadoras o tablas
construidas para tal efecto.
Un ejemplo de una tabla de nmeros aleatorios consiste en la lista de los nmeros de
Lotera Nacional premiados a lo largo de su historia, pues se caracterizan por que cada
dgito tiene la misma probabilidad de ser elegido, y su eleccin es independiente de las
dems extracciones.
Cuando una poblacin es infinita, la tarea de numerar cada elemento de la poblacin es
imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son
necesarias. El muestreo aleatorio simple es un procedimiento practico si la poblacin no
es grande y si es relativamente fcil y barato encontrar las unidades de muestreo.
Tambin seria un mtodo prctico para poblaciones grandes cuyos elementos estn
concentrados dentro de un rea pequea. Los tipos ms comunes de muestreo aleatorio
modificado son sistemtico, estratificado y de conglomerados.

*Muestreo estratificado.
Si la poblacin es muy heterognea y las consideraciones de costo limitan el
tamao de la muestra, podra ser imposible obtener un estimador lo suficientemente
preciso tomando una muestra aleatoria simple de toda la poblacin. En la prctica las
poblaciones con que se trabaja son por lo general muy heterogneas, cualquier estimacin
hecha con base en una muestra aleatoria directa estar sometida a fluctuaciones muy
grandes de muestreo.

14

15
El proceso de estratificacin requiere que la poblacin sea dividida en grupos o
clases llamados estratos. Entonces, se toma una muestra de cada estrato por mtodos
simples al azar o aleatorios simples y la muestra resultante se llama muestra estratificada.
En el muestreo por estratificacin es mas eficaz si: 1) dentro de cada estrato haya la
mayor uniformidad posible, y 2) entre los distintos estratos las diferencias sean lo ms
grandes posibles.

*Muestreo agrupado o por conglomerados.


El muestreo agrupado o por conglomerados es el procedimiento de dividir la
poblacin en grupos o regiones y extraer una muestra de ellos para representar la
poblacin. Cuando los grupos o regiones que son las unidades primarias, son extrados,
podemos incluir en la muestra todas las unidades elementales de las regiones escogidas o
tomar una muestra de unidades primarias ms pequeas o unidades elementales de las
regiones escogidas. Cuando se han observado todas las unidades elementales de las
regiones, tenemos lo que se conoce como muestreo de una sola etapa. Cuando se extrae
una muestra de unidades elementales de las regiones, tenemos un tipo de diseo llamado
muestreo en dos etapas o submuestreo. En ambas etapas se escoge una muestra simple al
azar. Cuando el muestreo por agrupacin supone ms de dos etapas para escoger la
muestra final, se llama muestreo en mltiples etapas.
En el muestreo por conglomerados es eficiente tener: 1) diferencias entre las unidades
elementales del mismo grupo lo mas grandes posibles, y 2) diferencias entre los grupos lo
mas pequeas posibles.

*Muestreo sistemtico.
Es otro tipo de diseo al azar que frecuentemente es utilizado. Para obtener una muestra
sistemtica al azar podemos enumerar tambin las unidades de muestreo de la poblacin
serialmente de 1 a N y determinar primero lo que se conoce por intervalo de muestreo,
k=N/n, luego, se escoge al azar un nmero del primer intervalo de muestreo. Si este
nmero es, por ejemplo, a, con a k, entonces la muestra con tamao n tendra como sus
miembros las unidades de muestreo cuyos nmeros de serie corresponden a:
a , a + k, a + 2k, a + 3k, . . . .
Ejemplo: supngase que deseamos tomar una muestra sistemtica de 200 de una
poblacin de 100,000 miembros. Determinamos primero el intervalo de muestreo, que es,
k=100,000/200 = 500. Despus escogemos un nmero al azar de 001 a 500. Suponiendo
que este nmero es 253; entonces, comenzaramos con el miembro 253 de la poblacin
numerada y escogeramos cada 500 un nuevo miembro, el 753, el 1253, etc.

15

16
ESCALAS DE MEDICION
El aspecto fundamental de la estadstica es la informacin que contiene; sin informacin
que recabar, organizar, analizar e interpretar, no habra razn para usar o estudiar
estadstica se le llama datos. Para que sea til dicha informacin en la toma de decisiones,
debe organizarse y mostrarse apropiadamente, El tipo de datos indicar los mtodos a
usar su anlisis.
Dato es una porcin de informacin. Datos es sinnimo de muestra. Los datos
pueden clasificarse en dos categoras generales: cuantitativos y cualitativos.
Los datos cuantitativos se refieren a informacin numrica, como cundo o cuntos, y
se mide en una escala numrica. Ejemplos: el peso de kilos, la edad en aos, la longitud
en centmetros, el precio en pesos.
Los datos cualitativos representan categora o atributos que pueden clasificarse segn
un criterio o cualidad. Ejemplos: el sexo (hombre-mujer); el color (rojo, verde, azul), la
religin (catlica, protestante, juda); el tipo de sangre (A,B,AB,O), etc.
Los datos consisten en nmeros se pueden clasificar en trminos cualitativos,
dependiendo de cmo se usen. Si se usa como una etiqueta para propsitos de
identificacin, son cualitativos; en otro caso, son cuantitativos. Ejemplo: Si un nmero de
serie de un radio se usa para identificar el nmero de radios fabricados hasta ese
momento, ser una medida cuantitativa, pero si se usa solo para propsitos de
identificacin, es un elemento de informacin cualitativa. Sin embargo, algunas
mediciones pueden hacerse mediante escalas cuantitativas o cualitativas. Ejemplo: Si la
estatura de un individuo se mide en metros y centmetros, entonces la informacin es
cuantitativa; pero si se mide como bajo, medio o alto, es cuantitativa.
Los datos cuantitativos pueden clasificarse como discretos o continuos, Los datos
obtenidos pueden clasificarse como discretos o continuos. Los datos obtenidos de un
proceso de medicin, donde la caracterstica que se mide puede tomar cualquier valor
numrico en un intervalo, son datos continuos.
Ejemplos de datos discretos: numero de nios en una familia, la cantidad de autos en un
estacionamiento el salario de un individuo, el nmero de pulsaciones del corazn por
minuto.
Ejemplos de datos continuos: el peso en kilogramos, la estatura en metros, el tiempo en
minutos, la presin baromtrica, etc.
El propsito general al analizar los datos es efectuar una interpretacin que tenga
sentido. Como regla general. La cantidad de informacin contenida en los datos depende
de su naturaleza. Los datos tambin pueden ser clasificados segn la escala de medicin
o el proceso que los gener.
Ejemplo: considere el dgito 4 en las siguientes situaciones.
a) El nmero de la camiseta de ftbol de Juan es el 4.
b) Juan esta en el 4to. grado
c) Juan registro la temperatura como 4 grados Celsius.

16

17
d) Juan cultivo un pepino que midi 4 pulgada de largo.
Estas situaciones representan cuatro niveles distintos de informacin, resultantes del uso
de escalas diferentes de medicin. La medida en la situacin del inciso (a), por ejemplo,
se usa solo para identificar o clasificar a Juan como el jugador de ftbol numero 4; al
4to. Grado en el inciso (b), tambin es una clasificacin, pero da ms informacin
porque nos da el nivel del grado. En el inciso (c), de nuevo vemos niveles de
comparacin, pues 4 indica que la temperatura es ms alta que una temperatura de 2
grados Celsius y ms baja que una temperatura de 7 grados Celsius. Aunque una
temperatura de 4 grados Celsius es 1.5 grados ms alta que una de 2.5 grados; pero, una
temperatura de 4 grados Celsius no es el doble de caliente que una temperatura de 2
grados Celsius.
Finalmente, en el inciso (d), la medida 4 identifica al pepino como miembro de una
clase de pepinos que miden 4 pulgadas de largo, sabemos que este pepino es ms largo
que uno de 3 pulgadas de longitud y que es el doble de largo de un pepino de 2 pulgadas
de longitud.
Las situaciones vistas de (a) a (d) son representativas de cuatro tipo de escalas de
medicin, por el tipo de escala de medida usada determina la cantidad de informacin
contenida en cualquier dato proporcionado.
Medicin: Es la asignatura de nmeros a objetivos o eventos de acuerdo con un conjunto
de reglas. Las diversas escalas de medicin son consecuencias del hecho de que la
medicin puede llevarse a cabo segn diferentes conjuntos de reglas.
Escala nominal: Es la escala de medicin ms baja. Como su nombre lo indica, consiste
en nombrar las observaciones o calificarlas en varias categoras mutuamente
excluyentes y colectivamente exhaustivas. La prctica de utilizar nmeros para distinguir
diversas categoras constituye una medicin sobre una escala nominal.
Ejemplos: diversos diagnsticos mdicos, sexo, estado de salud, estado civil, profesin,
ocupacin, nacionalidad, reinos del mundo vivo, color de las hojas de los arboles, etc.
Escala ordinal: Siempre que las observaciones no solo difieran de categora a categora,
sino que puedan clasificarse por rango de acuerdo con algn criterio, se miden sobre una
escala ordinal. Ejemplos: los pacientes convalecientes pueden clasificarse como: no
mejorados, mejorados y bastante mejorados. Las personas de acuerdo a su estado
socioeconmico se clasifican: pobres, de medida clase o ricos. La funcin de los nmeros
asignados a datos ordinales es la de ordenar (o asignar una categora segn el rango) las
observaciones desde las mas bajas hasta las mas altas, de aqu el termino ordinal. Otros
ejemplos: clase social, lugar en la clase, preferencia a productos de consumo, Etapa de
desarrollo de un ser vivo, clasificacin de pelculas por una comisin especializada,
madurez de una fruta al momento de comprarla.
Escala de intervalos: La escala de intervalos es una escala mas especializada que la
nominal o la ordinaria en el sentido de que, con esta escala, no solo es posible ordenar las

17

18
mediciones , sino que se conoce tambin la distancia entre dos mediciones cualesquiera.
La escala de intervalos, a diferencia de las escalas nominal y ordinal, es una escala
realmente cuantitativa. Una escala de intervalo no siempre tiene un punto cero, que
indique la ausencia de lo que se quiere medir. Cuando se logra la escala de intervalos para
la medicin y se satisfacen las suposiciones del modelo, pueden utilizarse los
procedimientos usuales de estadsticas parametricas, como las pruebas t y la prueba F.
Ejemplo: Puntuajes en las pruebas de inteligencia. Un puntuaje de inteligencia de 110 es
cinco puntos superior a uno de 105 (datos ordinales). En este caso, no solo podemos decir
que un puntuaje de 110 es superior a uno de 105 sino que tambin podemos decir que es
cinco puntos mas alto; pero no podemos decir que una persona con un puntuaje de
inteligencia de 180 es doblemente lista que una persona que tiene uno de 90, y una
determinada diferencia entre dos puntuajes de inteligencia no siempre tiene el mismo
significado: por ejemplo, las diferencias entre 100 y 90 y entre 150 y 140, puede tener
interpretaciones distintas aunque ambas sean igualmente a 10. Aunque una persona con
140 es ms inteligente de acuerdo con la prueba de inteligencia que una persona con 100,
no podemos decir que quien tiene un puntuaje de 150 es tanto mas inteligente que una
persona con 140, o que lo es una persona con un cociente de inteligencia de 100 respecto
a una personaron uno de 90.
Una persona que en un examen de matemticas que obtiene una puntuacin de cero no
significa que carezca de conocimientos, el punto cero es arbitrario por que sigue
existiendo la caracterstica medida.
Una variable de intervalo es discreta cuando slo puede tomar un valor entero o bien es
continua si puede tomar cualquier valor en un intervalo. Otros ejemplos: peso, talla,
ndice de masa corporal, Temperatura de una persona, ubicacin en una carretera respecto
de un punto de referencia (Kilmetro 85 Ruta 5), sobrepeso respecto de un patrn de
comparacin, nivel de aceite en el motor de un automvil medido con una vara graduada,
etc.
Escala de razones: Es el nivel ms alto de medicin. Esta escala se caracteriza por el
hecho de que puede determinarse la igualdad de las razones, as como la igualada de los
intervalos. Y para esta escala es fundamental un punto cero verdadero, que significa
ninguno. Con datos medidos en una escala de razn, podemos determinar cuantas
veces es mayor una medida que otra. Ejemplo: La medicin de rasgos tan familiares
como altura, peso y longitud, hacen uso de este tipo de escala. Cuando se ha logrado la
escala de razones para la medicin, puede utilizarse cualquier procedimiento estadstico
siempre que se cumplan las suposiciones especficas del modelo que se utiliza.
Ejemplos: costo por atencin, Altura de personas, cantidad de litros de agua consumido
por una persona en un da, velocidad de un auto en la carretera, nmero de goles
marcados por un jugador de bsquetbol en un partido, etc.
DATOS ESTADISTICOS Y SU NATURALEZA
Los datos estadsticos pueden consistir de nmeros arreglados en forma tabular o
grfica. Pueden surgir de diferentes campos:
- Problemas de trnsito.

18

19
-

Experimentos mdicos encaminados a determinar el efecto de una nueva


droga.
El control de calidad de productos industriales elaborados en una fbrica.
Medida de la opinin pblica y preferencias del elector.
Etcetera.

Sin embargo, todos tiene un rasgo comn que se deriva de circunstancias que estn
afectadas por la casualidad, es decir sobre tales situaciones influye la presencia de
efectos que no podemos presidir, porque son resultado de factores que no pueden ser
controlados ni enumerados.

Al arrojar un dado, sabemos que debe aparecer hacia arriba uno de los nmeros 1,
2, 3, 4, 5, 6, pero no podemos presidir el resultado en la realizacin de este
experimento aleatorio. Ahora que, si el dado es legal (geomtricamente regular
y hecho de material homogneo) observamos a lo largo de las tiradas que cada
uno de los seis nmeros cae hacia arriba el mismo nmero de veces ms o menos.
El experimento de un nio se puede considerar como un experimento aleatorio
con los dos resultados posibles, nio o nia. De nuevo, no podemos hacer
predicciones en cualquier caso particular, pero la experiencia nos muestra que en
una gran poblacin (en una gran ciudad) cada uno de los dos anteriores resultados
aparecen ms o menos con la misma frecuencia.
No podemos predecir a que edad morir una cierta persona, pero si podemos
obtener tablas de esperanza de vida, si consideramos una gran poblaciones y
poblacin y podemos usas tablas para calcular el costo de las primas de los
seguros de vida.
De estos ejemplos, el ltimo caso presenta irregularidad aleatoria que hace
imposible predecir resultados, pero
un gran nmero de casos exhiben
regularidad estadstica.
Los datos estadsticos se obtienen mediante la observacin o medicin de las
caractersticas de las unidades elementales de una muestra. Para seleccionar un
procedimiento estadstico a utilizar es necesario conocer que tipo de datos
tenemos, estos pueden continuos, discretos, ordinales u nominales.
Algunas poblaciones pueden proporcionar los cuatro tipos de datos. Por ejemplo:

Poblacin
Ratas
laboratorio

Continuos
de Peso
Edad

Automviles

Peso
Longitud

Discretos

Nominales

Ordinales

Nmero
de Color: negro, Calidad
del
cras por rata
blanco, gris.
nido: excelente,
bueno, regular,
malo.
Nmero
de Colores:
Tamao:
defectos
por blanco,
azul, grande,
auto
rojo, negro, etc. mediano, chico

19

20

ESTADISTICA Y COMPUTACION
La computacion juega un papel esencial en la Estadistica. Particularmente cuando
el volumen de la informacion con la que se trabaja es grande. Esta herramienta es de gran
ayuda al investigador desde la simple ordenacion alfabetica o numerica de los datos. Es
eficaz en el calculo de diversos parametros claves de la estadistica que indican de buena
manera la conducta del conjunto de datos. De la misma forma, hoy en dia, existe una
amplia gama de programas de computo (software) que apoyan fuertemente el analisis
estadistico y la elaboracion de informes mas adecuados y presentables por medio de
graficas, tablas, diagramas, entre otros elementos descriptivos.
Sin embargo, no debemos de perder de vista que la computadora no piensa por cuenta
propia sino que es el investigador y su experiencia la base para interpretar e inferir los
resultados obtenidos. Esto equivale a decir que la tecnologia de la computadora no puede
sustituir al aprendizaje de teorias y metodos estadisticos por quien la acciona.
Algunos de los paquetes estadsticos ms importantes y utilizados son:
SAS: Planificacin, visualizacin, gestin de datos, anlisis estadstico, grficos y
presentacin de resultados. Usa un avanzado lenguaje de programacin.
SPSS: Gestin de datos, anlisis estadstico, grficos y presentacin de resultados. Puede
calcular el tamao muestral de una investigacin.
STATISTICA: Planificacin, visualizacin, gestin de datos, anlisis estadstico, grficos
y presentacin de resultados. Alto rendimiento, aplicaciones flexibles.
STATGRAPHICS: Paquete de anlisis interactivo y sistema grfico desarrollado en APL,
esencial en la enseanza.

Culiacan, Sin., septiembre de 2014

Elaboro: M. En C. Carmen Alicia Guerrero Ontiveros


Maestra de Estadistica y Probabilidad

20

S-ar putea să vă placă și