Sunteți pe pagina 1din 17

UNIVERS

U SIDAD NA
ACIONAL
L EXPERIIMENTAL
L SUR DE
EL
LAGO
“Jeesús Maríía Semprrum”
L Universidad Productiva a C
La Cielo Abierrto

Programa: Inngeniería de Alimentos


A Periodo: U-2013
U Seccciones: Todaas
Unidad curriicular: Estadísstica I Docente: Lic.
L María V. León Esttadística desccriptiva
 
Universo: e
es un conjuunto de sere
es vivos, animales o co
osas que po
oseen caraccterísticas que
son de inte
erés estudia
ar.

Población:: es el conjuunto de toddas las posibbles mediciiones que sse hacen sobre una
característicca de estud
dio. Esta puede ser finiita o infinita
a.

El número d
de elementtos que con
nforman una población
n se denom
mina tamaño
o de la
población y lo denota
aremos conn la letra N.

Muestra: es
e un subconjunto de la población
n. El númerro de eleme
entos que constituye u
una
muestra se denomina tamaño dee la muestra os a denotar con la letrra n.
a y lo vamo

Veamos
V alg
gunos ejem
mplos:

Se desea an nalizar un estudio


e acerca de la esstructura po
or edades d
de los habita
antes de unna
ciudad.
Característiica de estud
dio: edadess de los habbitantes.
Universo: Todos
T los ha
abitantes de la ciudad
Población: Todas las edades
e indivviduales de
e cada uno de los habitantes de laa ciudad.
Muestra: las edades co orrespondie entes a los habitantes de un sector determin nado de la
ciudad.

Se dese invvestigar sob bre el tamañ


ño promedio de las finncas agropeecuarias de un país.
Característiica de estuddio: Tamañoo de la finca.
Universo: Todas
T las fin
ncas agropeecuarias que existen en el país.
Población: Los tamaño os de cada una de las fincas agro
opecuarias qque constitu
uyen el
universo.
Muestra: Loos tamañoss de las fincas que se encuentran
e en una región determminada del país.
p

Clasificació
C ón de la esstadística:

Estadística
a descriptivva: Consiste
e en organizar, resumir, simplifica
ar, presenta
ar los datos en
cuadros y gráficos,
g y del d medidass numéricass que permiten destaccar los aspectos
d cálculo de
más importtantes de loos datos.

Puede realiizarse sobre


e una muesstra o sobre
e toda la po
oblación.

1
Inferencia estadística
Es la encargada de estudiar las características y leyes propias de una población mediante el
análisis e interpretación de una muestra seleccionada de ella.

Variable: es una característica que poseen los elementos del universo. Existen dos tipos de
variables, cualitativas y cuantitativas.

Las variables cualitativas son aquellas cuyos valores son expresados mediante una
categoría. Ejemplo: color de un vegetal, origen, etc.

Las variables cuantitativas son aquellas que toman valores numéricos. Ejemplos: nivel de
PH, peso, grado brix de una fruta, cantidad de sabores de una bebida, entre otros.

Las variables cuantitativas pueden ser discretas o continuas. Discretas cuando los posibles
valores que puede tomar la variable son finitos o infinito numerable. Continuas cuando
esta puede tomar valores dentro de un intervalo determinado.

Al conjunto de las modalidades de una variable se les denomina Escalas de


Medida. Esta a su vez se divide en cinco tipos, Escala Nominal, Ordinal, De Intervalos, De
Razón y Absolutas. Estas pueden diferenciarse por el tipo de variable a utilizar, y las
relaciones y operaciones que se pueden realizar sobre estas.

Las escalas donde intervienen las variables cualitativas son: Nominal y ordinal

Escala Nominal: las únicas operaciones que se pueden hacer sobre estas son la igualdad y
diferencia.

Ejemplos: color, origen, variedad de una fruta, estado civil de una persona, sexo, etc.

Escala Ordinal: además de las operaciones de igualdad y diferencia, en esta se pude


establecer una relación de orden (de manera creciente o decreciente).

Ejemplos: sabor de una fruta, desempeño de un operador de maquina: (5) optimo, (4)
bueno, (3) regular, (2) malo, (1) pésimo.

Las escalas donde intervienen las variables cuantitativas son: de intervalos, de razón y
absolutas.

Escala de intervalos: las operaciones a utilizar son igualdad, diferencia, de orden y


distancias. Su principal característica es que posee el elemento neutro para la suma 0 u
origen.

Ejemplos: nivel de pH del agua, temperatura de una reacción química, etc.


 
Escala de razón: las operaciones a utilizar son, igualdad, diferencia, orden distancia y se
define operaciones aritméticas como la suma, diferencia y múltiplos.

Ejemplo: Consideremos una colección de tres manzanas, cuyos pesos son 185 gr, 200gr,
250gr. La variación respecto al peso de la manzana de 185gr a 200gr es de 15 gramos. Las
tres manzanas hacen un total de 635 gr. Obsérvese que existe un peso 0gr.

Escala absoluta: los valores que toma la variable son números enteros positivos. Las
operaciones a utilizar son, igualdad, diferencia, orden distancia y se define operaciones
aritméticas como la suma, diferencia y múltiplos.

Ejemplos: números de bacterias observadas en un cultivo, número de accidentes en un


periodo determinado.

Censo
Se dice que se ha realizado un Censo cuando una investigación es exhaustiva en el sentido
de analizar toda la población.

Muestreo
Cuando el estudio se hace sobre la base de una muestra de la población, se habla de un
muestreo.

El estudio estadístico se inicia con la selección de partes de una población, llamada


muestra, constituida por n observaciones y la cual debe tener las mismas características de
la población. Este proceso se llama muestreo, el cual comprende por lo menos dos etapas:
la selección de las unidades y el registro de las observaciones. Clases de muestreo:

Muestreo aleatorio simple


Proceso de selección de una muestra de una población en la cual cada observación tiene la
misma posibilidad (chance) de ser seleccionado.

Una muestra aleatoria simple puede obtenerse simplemente enumerando las


observaciones sobre pedazos idénticos de papel, colocándolos en un sombrero y sacando
el número deseado. Otro caso es generar los valores mediante números aleatorios.

Muestreo sistemático
Una muestra es sistemática cuando la toma de las unidades de observación se hace
obedeciendo a un periodo, siendo calculado el intervalo de selección para una población
finita, por medio de la división del tamaño de la población por el tamaño de la muestra
que va a ser seleccionada.

Ejemplo: Si se determina que el periodo es 10, entonces una muestra sistemática consta de
cada décima observación de la población.


 
Muestreo estratificado
Consiste en la separación de las observaciones de la población en grupos distintos
(llamados estratos) pero homogéneo en su interior

Ejemplo: considerar la producción de leche en el país nos lleva a dividir en sectores la


nación, occidente, centro y llano.

Estadística Descriptiva. Organización y presentación de los datos.

Organización de datos cualitativos

La organización se hace de acuerdo a las modalidades que presente la variable de estudio.

Ejemplo: en un estudio sobre las personas que ejercen cargos directivos en una empresa,
se realizaron 15 entrevistas y en relación al sexo se obtuvo la siguiente información.

F F M F M
M M M F M
F M M F F

Clasificación del personal directivo de acuerdo al sexo

Sexo Personas

Femenino

Masculino

Total

Organización de datos cuantitativos

Elementos de una distribución de frecuencias

Intervalo de clase o clase: consisten en intervalos de valores ordenados en forma


ascendente y que cubren todos los datos posibles.

Límites de la clase: Son los extremos del intervalo de clase. Se denota LI al límite inferior
y Ls al límite superior.


 
Amplitud de la clase: Se denota Ci y se define como la diferencia entre el límite superior
de la clase i y el límite inferior de la clase i . (Ci  Lsi  LIi )

Frecuencia absoluta de clase: es el conjunto de observaciones contenidas o incluidas en


la clase. Se denota fi .

Frecuencia Relativa de clase: representa la proporción de los datos contenidas en esa


clase. Se denota f ri

fi
f ri  , donde n es el número total de observaciones
n
Frecuencia acumulada de una clase: se interpreta como el número de datos que estaría
por debajo o que son inferiores al valor representado por el límite superior de la clase
considerada. Se denota por Fi .

F1  f1 , F2  f1  f 2  F1  f 2 , F3  f1  f 2  f3  F2  f3 ,  , Fk  Fk 1  f k

Frecuencia Relativa acumulada: representa la proporción de los datos que son menores

que el límite superior de la clase considerada. Se denota por Fri .


Fi
Fri 
n

Si multiplicamos Fri por 100 se obtiene el porcentaje con respecto del total de datos que
son menores que el límite superior de la clase.

Marca de clase: Se define como el punto medio de esa clase. Se denota por mi

mi 
 LIi  LSi 
2
Recorrido: es la diferencia entre el valor máximo y valor mínimo de todas las
observaciones. Se denota por R

R
Denotaremos por K el número de clases, entonces K 
Ci

Existen algunas formulas matemáticas que se han desarrollado con la finalidad de


determinar un número aproximado de K .

Reglas de Sturges: K  1  (3,3  log(n))



 
Reglas y recomendaciones generales para construir una distribución de frecuencias

i. Determinar el valor máximo y valor mínimo de los datos. Calcular el recorrido


ii. Determinar el número de clases y las amplitudes de clases.
iii. Construir los intervalos de clase, eligiendo como límite inferior de la primera clase
el valor mínimo de los datos o cualquier otro menor pero no muy alejado de este.
Una vez fijado Li1 se le suma C1 y se obtiene Ls1.
iv. Determinar el número de observaciones o datos contenidos en cada clase,
frecuencia absoluta y después los otros tipos de frecuencias.

El contenido de nicotina, en miligramos, en 40 cigarrillos de cierta marca se registraron


como sigue:

0,72  1,58 1,70 1,86 2,09

0,85  1,63 1,74 1,88 2,11

1,09  1,64 1,75 1,90 2,17

1,24  1,64 1,75 1,92 2,28

1,37  1,67 1,79 1,93 2,31

1,40  1,68 1,79 1,97 2,37

1,47  1,69 1,82 2,03 2,46

1,51  1,69 1,85 2,08 2,55

Realice una distribución de frecuencias.

i. Calcular el recorrido

Valor máximo: 2,55 R  2,55  0, 72


Valor mínimo: 0,72
R  1,83
ii. Calcular el número de clases y la amplitud
n  40 R 1,83
K  1  3,3(log(40)) Ci    0,2911  0,3
K 6, 2868
K  6,2868

“Se tendrán de 6 a 7 clases”


 
iii. Hallar los límites de las clases

Límite inferior de la primera clase: LI 1  0.7


Limite superior de la primera clase: LS 1  1, 0

Límites de clases

[0.70 - 1,00)
[1,00 - 1,30)
[1,30 - 1,60)
[1,60 - 1,90)
[1,90 - 2,20)
[2,20 - 2,50)
[2,50 - 2,80)

Observe que, todos los valores de las observaciones están incluidos en una de las clases.

iv. Distribución de frecuencias

Clases fi f ri Fi Fri mi
[0.70 - 1,00) 2  0,05 2 0,05 0,85 

[1,00 - 1,30) 2  0,05 4 0,1 1,15 

[1,30 - 1,60) 5  0,125 9 0,225 1,45 

[1,60 - 1,90) 17  0,425 26 0,65 1,75 

[1,90 - 2,20) 9  0,225 35 0,875 2,05 

[2,20 2,50) 4  0,1 39 0,975 2,35 

[2,50 - 2,80) 1  0,025 40 1 2,65 

Medidas de tendencia central

Los números están propensos a reunirse alrededor de un punto central denominado


medida de tendencia central. Una medida de tendencia central ubica e identifica el punto
alrededor del cual se concentran los datos


 
Media aritmética
Representa el centro de gravedad o el punto de equilibrio de los datos.

Media poblacional: se denota (se lee miu). Si se tienen N observaciones en el conjunto


de datos de la población, se tiene que
+ + ⋯+
=
Media muestral: se denota ̅ . Si se tienen n observaciones en el conjunto de datos de la
muestra, se tiene que
+ + ⋯+
̅=

Ejemplo (Datos no agrupados)

Veinte adultos hombres de entre 30 y 40 años de edad participaron en un estudio para


evaluar el efecto de cierto régimen de salud, que incluye dieta y ejercicios, en el colesterol
sanguíneo. Se eligieron diez aleatoriamente para el grupo control y los otros diez se
asignaron para tomar parte en el régimen como grupo de tratamiento durante un periodo
de seis meses. Los siguientes datos muestran la reducción en el colesterol que
experimentaron en ese periodo los 20 sujetos:

7 3 -4 14 2
Grupo de control
5 22 -7 9 5
-6 5 9 4 4
Grupo de tratamiento
12 37 5 3 3
Las medias para las muestras son:

7+3+(  4)+14+2+5+22+(  7)+9+5


x  Grupo control  
10
x  Grupo Control   5, 6

6+5+9+4+4+12+37+5+3+3
x  Grupo de tratamiento  
10
x  Grupo de tratamiento   7, 6

Media para datos agrupados


Cuando las clases de una distribución de frecuencias son intervalos la media


+ + ⋯+ ̅=
̅=

+ + ⋯+


 
Clases fi mi fi .mi
[0.70 - 1,00) 2  0,85  1,7

[1,00 - 1,30) 2  1,15  2,3

[1,30 - 1,60) 5  1,45  7,25


k
[1,60 - 1,90) 17  1,75  29,75 mi fi 71,5
[1,90 - 2,20) 9  2,05  18,45 x i 1
  1, 7875
n 40
[2,20 - 2,50) 4  2,35  9,4

[2,50 - 2,80) 1  2,65  2,65

La mediana de una serie de datos que previamente han sido ordenados en forma
creciente o decreciente es aquel valor que ocupa la posición central de los datos. Se
denota .

Mediana para datos no agrupados


,

= +
,
2

Ejemplo:
Primero ordenemos los datos de ambas muestras en orden creciente

Como n  10 es par, debemos tomar el promedio entre los valores de las muestras
centrales, es decir, aquellos que toman las posiciones 5 y 6 respectivamente.

Grupo de control -7 -4 2 3 5 5 9 7 14 22
Grupo de tratamiento -6 3 3 4 4 5 5 9 12 37

55 4+5
M d  Grupo control   M d  Grupo de tratamiento  
2 2
M d  Grupo Control   5 M d  Grupo de tratamiento   4,5

Observación: La diferencia entre las medias es de 2,0 mientras que la diferencia entre las
medianas es de 0,5, esto se debe a la presencia de los valores extremos, en particular el
valor 37.


 
Mediana para datos agrupados
Sera un valor comprendido entre los límites de la clase medianal, esta es la clase que
contiene la frecuencia acumulada .

= + 2 ×

Dónde:

:= límite inferior de la clase medianal.

: Frecuencia acumulada de la clase anterior de la clase medianal.

:=Frecuencia absoluta de la clase medianal

:= Amplitud de la clase medianal.

Ejemplo

Nº Clases fi Fi Luego:
3  [1,30 - 1,60) 5  9 = 1,60
=9
4  [1,60 - 1,90) 17  26 = 17
= 0,3
5  [1,90 - 2,20) 9  35


La clase medianal es la cuarta clase, ya = + 2 ×
que es la primera que contiene en su
frecuencia acumulada el valor 20 − 9
= 1,60 + × (0,3)
n 40 17
  20 = 1,7941
2 2

Moda: se define como aquel valor que se repite más, es decir aquel valor que ocurre con
mayor frecuencia

Ejemplo

En el caso del grupo control la moda toma valor 5, mientras que el grupo tratamiento es
polimodal dado que se tienen tres modas, las cuales son 3, 4 y 5.

10 
 
Moda para datos agrupados
Se determina la clase modal, es decir, la clase que tiene mayor frecuencia absoluta.

= + ×
+

Donde
:= limite inferior de la clase modal.

: Diferencia entre la frecuencia absoluta de la clase modal y la clase que le antecede.

: Diferencia entre la frecuencia absoluta de la clase modal y la clase que le sigue.

:= Amplitud de la clase modal.

Ejemplo

Nº Clases fi = 1,60
3  [1,30 - 1,60) 5 = 17 − 5 = 12
= 17 − 9 = 8
4  [1,60 - 1,90) 17
= 0,3
5  [1,90 - 2,20) 9

= + ×
+
La clase modal es la cuarta clase, ya que 12
ésta presenta la mayor frecuencia = 1,60 + × (0,3)
12 + 8
f 4  17 = 1,78
absoluta.

Medidas de tendencia no centrales

El percentil Ph de un conjunto de datos ordenados es aquel valor que tiene por debajo el
h % de las observaciones y por arriba el (100  h) % de las observaciones.

Cuartiles: son los valores que dividen los datos en cuatro partes iguales.
Q1  P25 , Q2  P50 , Q3  P75

Deciles: son los valores que dividen los datos en diez partes iguales.
D1  P10 , D5  P50 , D9  P90
Percentiles: son los valores que dividen los datos en cien partes iguales.
P1 , , P53 , , P99

11 
 
P7 5 , 75% de los datos son inferiores que P7 5 , y a lo sumo 25% de los datos son

mayores que P7 5 .

Algoritmo para encontrar un percentil, para datos no agrupados

i. Ordenar los datos de menor a mayor.


hn
ii. Calcular t
100
xt  xt 1
iii. Si t es entero, Ph 
2
Si t no es entero, P
h será la el valor de la observación posicionada en el entero
inmediato superior de t.

Ejemplo: Hallar P75

i. Grupo de control -7 -4 2 3 5 5 7 9 14 22
Grupo de tratamiento -6 3 3 4 4 5 5 9 12 37

75  10
ii. t  7,5
100
iii. El entero inmediato de 7,5 es 8, por lo tanto el percentil 75 del grupo de control es
9 y el del grupo de tratamiento es 9.

Observación: Si en el caso anterior t  7 , los percentiles 75 se obtendrían como los


promedios entre los valores que se encuentran en la posición 7 y 8, es decir
97 59
P75   8 para el grupo control y P75   7 para el grupo de tratamiento.
2 2

Percentiles para datos agrupados


Primero se ubica la clase del percentil, esta es la clase cuya frecuencia acumulada es
nh
t o contiene inmediatamente a t .
100

 nh 
 100  Fap  := limite inferior de la clase del
Ph  Lip    Cp percentil.
 fp  : Frecuencia acumulada de la clase
  anterior de la clase del percentil.

12 
 
:=Frecue encia absolu
uta de la cla
ase del := Amplitud de
d la clase del
d percentil.
percentil.

Ejemplo: Ha
allar P7 5
Nº Clases fi Fi = 1,90
4  [[1,60 - 1,90) 1
17  26 = 26
=9
5  [[1,90 - 2,20) 9  35 = 0,3
6  [[2,20 2,50) 4  39
 nh 
  Fap 
Ph  Lip   1000  Cp
 f 
La clase del percentil es
e la quinta
a clase, ya p

que ésta co
ontiene inmmediatamen nte en su  
frecuencia
f acumulada el valor  300  26 
Ph  1,90     (0,30)
(
n  h 40  75  9 
  30
100 1000 = 1,90 + 0,13
333
= 2,0333
Medidas ded dispersióón
Indican
I el punto
p hasta
a el cual las observacio
ones individduales se essparcen alre ededor de su
s
punto central. Miden la dispersió eflejan la tendencia de las
ón o variabilidad de loss datos y re
observaciones individu
uales a desviarse de dicho punto central.

ecorrido: es la diferencia entre la


Rango o re a máxima y mínima observación.

Varianza:
V e
es una medida estadísttica que miide la dispe especto a un
ersión de los valores re
valor
v centra
al (media).
Dado una sserie de dattos x1 , x2 , , xn , cuyya media arritmética ess x , la varia
anza de eso
os
datos está definida co
omo el prom medio de laas desviacio
ones elevada as al cuadra ado.

Varianza
V p
para datos no agrupados

blacional
Caso pob ( x1  x) 2  ( x2  x) 2    ( xn  x) 2
(X1   )  (X 2   )    (X
2
X N  )
2 2 S 
2

2  n 1
N n
N

(X  ) 2  ( x  x)
i
2

i
S2  i 1
 2 i 1
n 1
N
Caso mu
uestral

13
Ejemplo:

(7  5, 6)2  (3  5, 6) 2    (9  5, 6) 2  (5  5, 6)2
S 2 (Grupo control) 
10  1
S (Grupo control)  8,3293
2

(6  7, 6)2  (5  7, 6) 2    (3  7, 6) 2  (3  7, 6) 2
S (Grupo de tratamiento) 
2

10  1
S 2 (Grupo de tratamiento)  11,3157

Varianza para datos agrupados

(m1  x) 2 f1  (m2  x) 2 f 2    (mk  x) 2 f k


S 2

 (m 2
f )  n( x ) 2
i i
S2  i 1

n 1

Ejemplo
k
fi mi fi .mi mi 2 . f i  (m
i 1
2
i i f )  133, 6
2  0,85  1,7  1,445
k
2  1,15  2,3  2,645  (m 2
f )  n( x ) 2
i i
S2  i 1
5  1,45  7,25  10,5125
n 1
17  1,75  29,75  52,0625
133, 6  (40)(1, 7875) 2
9  2,05  18,45  37,8225 S  2

40  1
4  2,35  9,4  22,09

1  2,65  2,65  7,0225 S 2  0,1486

14 
 
Desviación estándar o desviación típica

Viene dada por la raíz cuadrada positiva de la varianza

S  S2
Ejemplo datos no agrupados
S 2 (Grupo de tratamiento)  11,3157
S 2 (Grupo control)  8,3293 S (Grupo de tratamiento)  3,3639
S (Grupo control)  2,8861

Ejemplo datos agrupados

S 2  0,1486
S  0,3855

Coeficiente de variación: determina el grado de dispersión de un conjunto de datos


relativo a su media. Se denota CV
S
CV   100
x

Ejemplo datos agrupados


0, 3855
CV   100
1, 7875
CV  21, 57

Medidas de formas
Viene dada por el aspecto que presenta el gráfico que las representa.

Medida de asimetría: una distribución es simétrica respecto a un punto, cuando las


frecuencias se reparten siguiendo un mismo patrón a ambos lados o cuando la curva que
las representa es exactamente igual a ambos lados del punto de referencia.

Coeficiente de asimetría de Pearson


Pearson presento un coeficiente de asimetría basado en la relación que existe entre la
media y la mediana.

3( x  M d )
Asp 
S

15 
 
Ejemplo datos agrupados

3( x  M d )
Asp 
S
3(1, 7875  1, 7941)
Asp 
0,3855
Asp  0, 0514

Conclusión:

Medidas de apuntamiento: proporciona una idea del grado en que la curva


correspondiente a una distribución de frecuencia es apuntada o achatada.

Coeficiente B2 de Pearson

Datos no agrupados Datos agrupados

 ( xi  x)
4 k

 (m  x)
i 1
i
4
f i 
B2  n
S4 B2  n
S4

16 
 
Ejemplo datos no agrupados


fi mi ( mi  x ) f i
0,85  1,54495239 
4
 (m  x)
i 1
i
4
fi   2,93677207

2  1,15  0,33033208  k

5  1,45  0,06487317   (m  x)


i 1
i
4
fi 
17  1,75  3,3618E‐05  n
B2 
9  2,05  0,04273264  S4
2,93677207
4  2,35  0,40045166 
B2  40
1  2,65  0,55339651 
(0,3855)4
B2  3,3244

 
 

Historigrama 
18
16
14
12
10
8
6
4
2
0
0,85 1,15 1,45 1,75 2,05 2,35 2,65
17 
 

S-ar putea să vă placă și