Sunteți pe pagina 1din 13

1

ESTADISTICA DESCRIPTIVA

Qu es la Estadstica? La Estadstica es una ciencia que consta de un conjunto de procedimientos, que nos permite recoger informacin, analizarla y posteriormente extraer conclusiones, ayudndonos a comprender y modelar el comportamiento de una situacin real. Aunque la palabra Estadstica tiene un significado particular dependiendo del rea que uno se desarrolle, en general se le asocia a informacin, o ms bien a un conjunto de cifras. Por ejemplo: Periodista deportivo .............goles, tiros arco etc. Director escuela ...................ausentismo escolar Investigador mdico.............consecuencia de una droga Todas estas personas estn usando correctamente la palabra estadstica, sin embargo, cada una le da un significado ligeramente diferente y lo usa para un propsito un poco distinto. Pero por Estadstica debe entenderse algo mucho ms elaborado, por una parte y ms susceptible de tratamiento cientfico por otra. Se observa en las cifras del consumo de combustible de los buses intercomunales es muy parecido da tras da. Tambin se mantiene la relacin de automviles y buses que transitan por una calle, o la carga transportada por ferrocarril presenta valores de similar magnitud. Pese a que existen algunas variaciones en las cifras, estas se mantienen dentro de ciertos rangos que permiten mantener alguna uniformidad en algunas oportunidades, o al menos estos se repiten con cierta periodicidad. Los mtodos estadsticos nos ayudan a tomar decisiones respecto de un conjunto grande de elementos, en base a la informacin recopilada en un grupo ms pequeo, que pertenece a este grupo mayor. En la empresa moderna, los gerentes aplican algunas tcnicas estadsticas prcticamente en todas las ramas de su organizacin, los cientficos necesitan de esta ciencia para probar sus hiptesis, y nosotros mismos en la vida diaria sin darnos cuenta estamos ocupando algunas tcnicas estadsticas. Estas tcnicas son tan diversas que suelen agruparse en dos categoras generales: Estadstica Descriptiva y Estadstica Inferencial. Estadstica Descriptiva. Consiste en la recopilacin de datos a partir de la observacin de muestras con el propsito de descubrir las caractersticas del fenmeno estudiado. Los datos se resumen y se analizan sobre la base de tablas y grficos, sin pretender sacar conclusiones de tipo mas general.

Estadstica Inferencial. Consiste en aplicar resultados de estudios de una muestra a la poblacin y emitir juicios y conclusiones sobre la poblacin en general. La Estadstica, el mtodo cientfico. El mtodo de investigacin para el conocimiento de la realidad observable, que consiste en formularse interrogantes sobre esa realidad, con base en la teora ya existente, tratando de hallar soluciones a los problemas planteados. El mtodo cientfico (mtc) se basa en la recopilacin de datos, su ordenamiento y su posterior anlisis. Pasos del Mtodo Cientfico: Observacin: el primer paso es la observacin de una parte limitada del universo o poblacin que constituye la muestra. Anotacin de lo observable, posterior ordenamiento, tabulacin y seleccin de los datos obtenidos, para quedarse con los ms representativos. Hiptesis: se desarrolla en esta etapa, el planteamiento de las hiptesis que expliquen los hechos ocurridos (observados). Este paso intenta explicar la relacin causa efecto entre los hechos. Para buscar la relacin causa efecto se utiliza la analoga y el mtodo inductivo. La HP debe estar de acuerdo con lo que se pretende explicar (atingencia) y no se debe contraponer a otras HP generales ya aceptadas. La HP debe tener matices predictivos, si es posible. Cuanto ms simple sea, mas fcilmente demostrable (las HP complejas, generalmente son reformulables a dos o ms HP simples). La HP debe poder ser comprobable experimentalmente por otros investigadores, o sea ser reproducible. Experimentacin: la hiptesis debe ser comprobada en estudios controlados, con autentica veracidad. Hiptesis en Investigacin: Hiptesis significa literalmente lo que se supone. Est compuesta por enunciados tericos probables, referentes a variables o relaciones entre ellas. En el campo de la investigacin, la hiptesis, supone soluciones probables al problema de estudio. El proceso estadstico se basa en la comprobacin de hiptesis (HP). Existen dos tipos de HP, a saber: HP. Alterna o Cientfica: es la HP que pretende comprobar el investigador en su muestra de pacientes. Bsicamente significa que la media de una caracterstica o propiedad de un grupo es diferente a la media del otro grupo o grupos, o que la distribucin y frecuencia de un evento en un grupo es diferente del otro. H1 : grupo 1 grupo 2 HP. Nula: es lo contrario de la anterior, o sea que no existen diferencias entre dos o ms grupos o muestras. H0 : grupo 1 = grupo 2 El valor de p es entonces la medida de la evidencia contra la H0.Cuanto menor sea el valor de p, menor ser la posibilidad de que la HP. Nula sea cierta, por lo cual se rechazar, aceptando a la HP. Cientfica como verdadera.

Los datos son colecciones de un nmero cualquiera de observaciones relacionadas entre s. Podemos reunir la cantidad de telfonos que varios trabajadores instalan en un da determinado o que uno de ellos instala por da durante un perodo de varios das; a los resultados podemos llamarlos datos. Una coleccin de varios datos recibe el nombre de conjunto de datos, y se da el nombre de punto de datos a una sola observacin. Los datos ayudan en la toma de decisiones, a hacer conjeturas bien fundamentadas acerca de las causas, y por tanto, sobre los efectos probables de ciertas caractersticas en algunas ocasiones. Por lo dems, el conocimiento de las tendencias adquirido con la experiencia permite conocer los posibles resultados y planear con anticipacin. Nuestra investigacin del mercado quizs revele que producto es preferido por mujeres mayores de 35 aos. Entonces el mensaje publicitario deber dirigirse a esta audiencia neta. Cuando los datos se organizan en forma compacta y til, los encargados de la toma de decisiones consiguen informacin confiable del medio en que se desenvuelven, y se valen de ella para llegar a decisiones inteligentes. En el momento actual las computadoras permiten reunir enormes volmenes de observaciones y condensarlas instantneamente en tablas, grficas nmeros, pero se debe tener mucho cuidado y asegurarse que los datos que se estn utilizando se basan en suposiciones e interpretaciones correctas. Para poder confiar en la interpretacin de unos datos cualesquiera, antes se prueban formulando las siguientes preguntas. De dnde proceden los datos? Apoya o contradicen los datos la otra evidencia con que contamos? Existen datos que ignoramos y que nos haran llegar a una conclusin diferente? Representan a todos los grupos que queremos estudiar? Es lgica la conclusin? Hemos sacado conclusiones en base solamente de los datos obtenidos? Poblacin y Muestra La poblacin(o universo) es una coleccin de todos los elementos que estamos estudiando de los cuales intentamos extraer conclusiones. Debemos definirla, de manera que quede claro si un elemento es o no miembro de ella. La muestra es una coleccin de algunos de los elementos que componen una poblacin.

Es muy comn observar en los supermercados, secciones en donde se realicen degustaciones de los productos que all se venden. Generalmente se prueba un trozo de queso, por ejemplo antes de adquirirlo, del cual se deducen todos los parmetros de gusto del trozo mayor. De igual forma un catador prueba solamente una copa de vino para poder medir el sabor del tonel completo. Si el catador tuviera que tomarse todo el tonel o el comprador se comiera todo el queso no quedara nada para venderse. El tiempo es a menudo otro factor importante cuando se desea tomar alguna decisin rpida. Pongamos el caso de una mquina, que automticamente clasifica miles de cartas. Para qu tener que esperar todo el proceso de un da para verificar si la mquina est funcionando bien? En este caso se toman muestras a distintos horarios para verificar si la mquina est funcionando correctamente. Desde el punto de vista matemtico, podemos obtener de la poblacin y de la muestra las diferentes medidas definidas previamente como el promedio, la mediana, la varianza, etc. Cuando estos trminos se refieren a la poblacin se denominan parmetros y cuando se refieren a la muestra se denominan estadsticos.
MUESTRA Estadsticos

POBLACION Parmetros

Censo y Encuesta El censo es examinar a todas las personas o miembros de la poblacin que queremos estudiar La encuesta es el mtodo que se utiliza para conocer el estado de opinin sobre un determinado tema y que consiste en realizar una serie de preguntas a una poblacin o a una muestra representativa de la misma. Es una tcnica muy utilizada para obtener informacin sobre algn aspecto de la realidad social y determinadas opiniones o reacciones individuales. Suele realizarse mediante un cuestionario escrito, al que debe responder un grupo de personas escogido al azar o seleccionado segn ciertos criterios.

Parmetros y Estadsticos Parmetro: Es una medida descriptiva de la poblacin total de todas las observaciones de inters para el investigador. Estadstico: Es una medida descriptiva de una muestra y sirve como estimacin del parmetro de la poblacin correspondiente.

ATRIBUTOS Y VARIABLES
Tipos de variables El conjunto de todos los valores que puede tomar la caracterstica o fenmeno observado recibe el nombre de variable. Estadsticamente, estas se pueden agrupar en dos tipos, la Variable Cualitativa y Cuantitativa. Variable Cualitativa Cuando la observacin se refiere a los atributos de un conjunto, por ejemplo: Estado Civil (soltero-casado-separado-viudo), Profesin (ingenierocontador-tcnico-secretaria), Sexo (masculino-femenino), etc. Variable Cuantitativa Cuando la observacin tiene un valor expresado por un nmero, por ejemplo: Numero de hijos (0,1,2,3,....), IPC (0,1-0,5), Peso en kilos (58-65,7), Altura de un adulto (1,65-1,80), etc. Una variable cuantitativa puede ser Discreta o Continua. Variable Continua: Son aquellas que pueden tomar cualquier valor real dentro de cierto rango. Variable Discreta: Son aquellas que slo toma valores enteros. Variable Cuantitativa Discreta Es aquella que consta de un nmero finito o infinito de valores, ejemplo nmero de empleados de una fbrica, nmero de hijos por familia. Generalmente se trata de nmeros enteros y positivos, por ejemplo, una familia puede tener 0,1,2,... hijos, pero no un valor intermedio. Variable Cuantitativa Continua Es aquella que puede tener infinitos valores, por ejemplo Peso de una persona, Cantidad de agua cada en el mes, estatura, carga transportada, etc.

Esta diferencia que presenta la variable cuantitativa, discreta de la continua es ms bien terica que real. Cuando medimos una variable, resulta ser siempre discreta, pues todas las mediciones se expresan solamente en las unidades que realmente se pueden medir. Por ejemplo, es posible que una persona mida 1,6537446 mts, pero para cualquier fin prctico su estatura se considera solamente como 1,65 mts.

Datos cronolgicos y no cronolgicos Cuando el tiempo de ocurrencia de la caracterstica en estudio constituye un elemento importante se dice que el conjunto de datos es una serie cronolgica. En cambio, si en el estudio estadstico no interesa el momento en que se produjeron las observaciones se dice que los datos forman una serie No Cronolgica.

Series de datos Unidimensionales y Bidimensionales Unidimensionales: Cuando se estudia solamente el comportamiento de una variable o atributo se dice que la serie de datos es unidimensional. Bidimensionales: Cuando se estudian dos variables o dos atributos, o una variable y un atributo se dice que la serie de datos es bidimensional.

ESTUDIO DESCRIPTIVO DE LA INFORMACIN Puede decirse que la estadstica descriptiva es un conjunto de mtodos y procedimientos para obtener, describir e interpretar los datos de la observacin de un fenmeno que se produce en los numerosos elementos de un conjunto y de tal manera dar una apreciacin correcta de dicho fenmeno. Arreglo bsico de datos Una vez recolectado los datos de las diversas medidas efectuadas, se obtiene un conjunto desordenado de valores que no son susceptibles de interpretacin inmediata, por esto, se procede a su ordenacin, de tal forma que se facilite su comprensin y posterior anlisis. El arreglo de datos de forma ascendente o descendente es una de las formas ms sencillas de presentar informacin, y ofrecen ciertas ventajas sobre la presentacin de los datos "brutos" Por ejemplo, si se dispone de cargas transportada por camiones, se puede obtener la siguiente informacin: 1.- Podemos describir rpidamente los valores mximos y mnimos. 2.- Podemos dividir fcilmente los datos en secciones. 3.- Podemos darnos cuenta si algunos valores aparecen ms de una vez en el arreglo. 4.- Podemos observar la distancia entre valores consecutivos de la tabla. Pese a las ventajas que acabamos de comentar, algunas veces un arreglo de datos de este tipo no resulta prctico, puesto que al contener todas las observaciones, resulta engorroso resumir la informacin y hacerla til para una posterior interpretacin. Es cmodo por lo sencillo que resulta su interpretacin, distribuir las observaciones en cuadros o tablas de manera que permitan una rpida apreciacin de los datos reunidos.

Confeccin de una Tabla de Frecuencias Un jefe de personal de una empresa de bancaria, ha registrado en 30 das los atrasos del personal a su cargo. Designaremos por xi el nmero de atrasos del da i , en este caso i = 1,2,3,4,,30.

X1= 0 X7 = 4 X 13 = 5 X 19 = 8 X 25 = 6

X2 = 2 X8= 4 X 14 = 1 X 20 = 5 X 26 = 4

X3= 0 X9= 1 X 15 = 1 X 21 = 1 X 27 = 5

X4 = 0 X 10 = 3 X 16 = 4 X 22 = 2 X 28 = 3

X5= 3 X 11 = 1 X 17 = 3 X 23 = 3 X 29 = 4

X6= 0 X 12 = 2 X 18 = 7 X 24 =3 X 30 = 7

Los valores de la variable la designaremos por Y i Definicin de Trminos: Frecuencia Absoluta (n i ) = Es el nmero de veces que se repite un determinado valor de la variable.
n

n
i 1

= n 1 + n2  n3  ..............  nn = N en nuestro ejemplo N=30

Tamao de la Poblacin

Frecuencia Absoluta Acumulada Ascendente (N ia ) = Es el nmero de observaciones menores o iguales que un determinado valor de la variable. Frecuencia Absoluta Acumulada Descendente (N id ) = Es el nmero de observaciones mayores o iguales que un determinado valor de la variable. Frecuencia Relativa (h i ) = Es el cuociente entre la frecuencia absoluta y el nmero total de observaciones. Es decir
n

ni = hi N

0 d hi d 1

h
i 1

Frecuencia Relativa Porcentual o Porcentaje = Es la frecuencia relativa u 100 Frecuencia Relativa Porcentual Acumulada Ascendente = Es el porcentaje de observaciones menores o iguales a un determinado valor de la variable. Frecuencia Relativa Porcentual Acumulada Descendente = Es el porcentaje de observaciones mayores o iguales a un determinado valor de la variable.

Atrasos Personal Valores de la variable Das Frecue ncia Absolu ta ni 4 5 3 6 5 3 1 2 1 Frecuenci a Absoluta Acu. Ascen. N ia 4 9 12 18 23 26 27 29 30 Frecuenci a Absoluta Acu. Desce. N id 30 26 21 18 12 7 4 3 1 Frecue ncia Relativ a hi 0,13 0,17 0,10 0,20 0,17 0,10 0,03 0,07 0,03 Frec.Rel a. Acu.Asc e. h ia 0,13 0,30 0,40 0,60 0,77 0,87 0,90 0,97 1,0 Frec.Rel a. Acu.Des c. h id 1,0 0,87 0,70 0,60 0,40 0,23 0,13 0,10 0,03 Frec.Rel Frec.Rela. Por.Acu.As a. Porcenta c.. je h i u 100 h i u 100(A) 13 13 17 30 10 40 20 17 10 3 7 3 60 77 87 90 97 100

Yi Y1 0 Y2 = 1 Y3= 2 Y4 = 3 Y5= 4 Y6= 5 Y7 = 6 Y8= 7 Y9= 8

Por ejemplo, podramos decir que hubieron 6 das del mes, en donde hubo 3 personas atrasadas.

TOTALES

ni
i 1

30

h
i 1

10

Distribucin de Frecuencia

La distribucin de frecuencia es una tabla que organiza los datos en clases o categoras y muestra el nmero de observaciones provenientes del conjunto de datos que caen dentro de cada una de las clases.
Construccin de una tabla de distribucin de frecuencia

Para construir una tabla de distribucin de frecuencia se deben seguir los siguientes pasos:
1.Escoger el nmero de clases en los cuales se clasifican las observaciones.

El nmero de clases o intervalo se eligen de acuerdo al nmero de observaciones que se disponga. Aunque no existe una regla para definir el nmero de intervalos, nunca es menor que 6 ni mayor que 15. Cuanto ms sean las observaciones o ms amplia la gama, ms clases se necesitarn, para representarlos. Desde luego, si tenemos solamente 10 datos, sera absurdo tener tambin 10 clases.
2.Determinar el ancho de los intervalos de clase

Dado que necesitamos tomar los intervalos de clase de igual tamao, el nmero de clases determina el ancho de cada uno de ellos. Se define Rango = Mximo valor - Mnimo Valor As, el ancho del intervalo de clase se determinar como Ancho I.C. = Rango + 1 unidad significativa N de intervalos de clase Ejemplo 1:Supongamos que queremos tener 6 intervalos de un grupo de observaciones, de las cuales se extrajo la siguiente informacin Mximo Valor : 169 Mnimo Valor : 152 Ancho I.C. = 17 + 1 = 3 6 Rango : 169 - 152 = 17

11

Los intervalos seran entonces 152 - 154 155 - 157 158 - 160 161 - 163 164 - 166 167 -169 Existen variadas formas de construir tablas de distribucin de frecuencias y que podemos encontrar en algn texto de estudio, como el que a continuacin se muestra, con los mismos datos anteriores: [152 - 155) [155 - 158) [158 - 161) [161 - 164) [164 - 167) [167 170) [152 (152+3)) [155 (155+3)) [158 (158+3)) [161 (161+3)) [164 (164+3)) [167 (167+3))

[ ]= Significa que se considera desde y hasta esa cifra. ( )= Significa que se considera hasta el valor anterior Pero, que pasar si el cuociente para determinar el ancho del intervalo no entrega un residuo igual a cero?
Ejemplo 2 : Veamos ahora el siguiente ejemplo, para 8 intervalos

Mximo Valor : 121 Mnimo Valor : 46

Rango : 121 - 46 = 75

Ancho I.C. = 75 + 1 8

76 : 8 = 9,5 --> Ancho del intervalo 4 Ampliar los intervalos a (9) 76 + 5 = 81 : 9 = 9 Ancho del intervalo intervalo 0 Distribucin del resto con 8 intervalos 76 + 4 = 80 :8 = 10 Ancho del 0

12

Luego repartimos los complementos en el intervalo mnimo y mximo Luego los intervalos quedarn de la siguiente manera (9) Intervalos con Ancho (9) (1) (2) (3) (4) (5) (6) (7) (8) (9) 44 - 52 53 - 61 62 - 70 71 - 79 80 88 89 97 98 106 107 115 116 124 (8) Intervalos con Ancho (10) (1) 44 - 53 (2) 54 - 63 (3) 64 - 73 (4) 74 - 83 (5) 84 - 93 (6) 94 - 103 (7) 104 - 113 (8) 114 - 123

Aqu se puede notar que se sacrific el nmero de intervalos aumentando a nueve y en el otro caso disminuyendo a ocho. Normalmente este tipo de situaciones no reviste demasiada importancia ya que no influir en las conclusiones finales que se puedan extraer de la variable bajo estudio.

Ejemplo 3 : Supongamos ahora que tenemos la siguiente informacin para 9 intervalos

Mximo Valor : 0.59 Mnimo Valor : 0.15 Ancho I.C. = 0.44 + 0.01 = 0.05 9 Rango : 0.59 - 0.15 = 0.44

13

3.- Clasificar los puntos de datos en clases y contar el nmero de puntos en cada clase.

Toda observacin debe pertenecer a una y solamente una clase, si existiera alguna duda respecto a la clasificacin de algn dato, significa que los intervalos estn mal construidos.
Ejemplo : El Presidente del banco Express, est tratando de estimar cuanto han sido los tiempos de demora en das en aprobar los crditos hipotecarios. Sus asesores han reunido los siguientes tiempos de espera de las solicitudes presentadas en el ao anterior. Los datos se dan en das a contar desde la fecha de solicitud hasta el dictamen del banco.

Construir una distribucin de frecuencia usando 10 intervalos igualmente espaciados. Qu intervalo ocurre con mayor frecuencia? 32 45 30 23 34 38 35 41 45 22 26 40 39 39 37 29 30 38 37 43 32 31 33 38 52 41 40 35 36 32 28 27 31 33 35 31 33 36 35 30 45 28 37 42 46 36 30 32 38 36

Mximo Valor : 52 Mnimo Valor : 22

Rango = 52 22 = 30 Ancho I.C. = 30 + 1 = 31 10 10 En este caso como el complemento es solo una unidad, esta unidad puede ser despreciable para el investigador, por lo tanto se le suma al ultimo intervalo, por lo que se puede apreciar, todos los valores igual se encuentran dentro de los intervalos. Marca de Clase: Se define como el valor medio del Intervalo de Clase Intervalo de Clase 22 - 24 25 - 27 28 - 30 31 - 33 34 - 36 37 - 39 40 - 42 43 - 45 46 - 48 49 - 52 Marca Frecuencia de Clase absoluta 23 26 29 32 35 38 41 44 47 50.5 Total 2 2 7 10 9 9 5 4 1 1 50 Frecuencia Absoluta Acum. Asc. 2 4 11 21 30 39 44 48 49 50 Frecuencia relativa 0.04 0.04 0.14 0.2 0.18 0.18 0.1 0.08 0.02 0.02 1 Frecue. Relat. (%) 4 4 14 20 18 18 10 8 2 2 100 Frec. Relat. Acum. (%) ascendente 4 8 22 42 60 78 88 96 98 100

S-ar putea să vă placă și