Sunteți pe pagina 1din 9

2 o E.T.S.Ingenier´ıa de Caminos

Estad´ıstica Descriptiva

Estad´ıstica Aplicada

El porcentaje de algod´on en una tela utilizada para elaborar camisas para hombre se presenta en la siguiente tabla. Calcular los estad´ısticos m´as importantes y real´ıcese el histograma de frecuencias.Caminos Estad´ıstica Descriptiva Estad´ıstica Aplicada   porcentaje de algod´on   32.1 32.5

 

porcentaje de algod´on

 

32.1

32.5

32.6

32.7

32.8

32.9

33.1

33.1

33.4

33.5

33.6

33.6

33.6

33.6

33.6

33.8

33.8

34

34.1

34.1

34.1

34.2

34.3

34.3

34.4

34.5

34.5

34.6

34.6

34.6

34.6

34.6

34.7

34.7

34.7

34.7

34.7

34.7

34.9

35

35

35.1

35.1

35.1

35.2

35.3

35.4

35.4

35.5

35.6

35.7

35.8

35.9

36.2

36.4

36.6

36.8

36.8

36.8

37.1

37.3

37.6

37.8

37.9

(a)

Dise˜nar la distribuci´on de frecuencias con un cambio de variable.

(b)

Calcular los estad´ısticos: media, moda, mediana, Q 1 , Q 3 , c 0.6 , varianza y desviaci´on t´ıpica.

(c)

A partir del diagrama anterior determinar la mediana, el primer cuartil y el tercer cuartil y comp´arese los resultados con los obtenidos a partir de la distribuci´on de frecuencias.

(d)

Representar los histogramas de frecuencias absolutas y acumuladas.

(e)

Representar el diagrama de caja y determinar los valores extremos.

La siguiente tabla registra en diferentes horas la temperatura (T) del agua de un r´ıo y su contenido en ox´ıgeno disuelto (DO):el diagrama de caja y determinar los valores extremos. T DO T DO T DO T

T

DO

T

DO

T

DO

T

DO

T

DO

29,57

9,88

29,48

6,67

28,43

2,90

31,68

13,80

28,51

2,58

29,99

12,14

29,06

5,29

28,64

3,94

31,34

12,32

28,30

2,41

30,58

13,66

28,81

4,23

29,02

5,52

31,00

11,00

28,09

2,51

31,00

14,19

28,60

3,56

29,52

7,83

30,79

10,00

28,00

2,71

31,34

14,50

28,51

2,98

30,07

10,68

30,45

8,45

28,13

3,48

31,26

13,72

28,51

2,58

30,67

12,98

30,07

6,48

28,30

4,36

31,17

12,54

28,43

2,32

31,17

14,26

29,69

4,91

28,72

5,71

30,96

11,48

28,34

2,14

31,55

14,93

29,36

3,89

29,14

7,91

30,50

9,92

28,34

2,09

31,76

14,91

29,02

3,21

29,74

10,61

29,99

8,32

28,26

2,27

31,81

14,61

28,76

2,83

30,37

12,66

Se pide:

(a)

Construir una distribuci´on conjunta de frecuencias para las dos variables T y DO tomando 5 intervalos.

(b)

Dibujar un diagrama de dispersi´on conjunto de las dos variables.

(c)

Hacer un estudio de las distribuciones marginales.

(d)

Calcular la matriz de varianzas-covarianzas.

1

2 o E.T.S.Ingenier´ıa de Caminos

Estad´ıstica Aplicada

3.
3.

Estad´ıstica Descriptiva

En diferentes dias se ha observado el n´umero de veces que ha sonado la alarma en un servicio de bomberos, obteni´endose los siguientes datos:

{5, 3, 1, 5, 3, 6, 4, 2, 5, 6, 3, 6, 5, 2, 6, 7, 3}

Se pide:

(a)

Obtener la moda, la mediana, Q 1 , Q 3 y el cuantil 0. 40.

(b)

Obtener la media y la desviaci´on t´ıpica.

(c)

Efectuar un diagrama apropiado.

Soluci´on

(a)

Para las medidas de posici´on conviene ordenar los datos

{1, 2, 2, 3, 3, 3, 3, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, }

La moda corresponde al valor mas repetido, este caso corresp onde a los tres valores M o = 3, 5, 6. Decimos que es multimodal.

La mediana acumula el 50% de los datos N = 17. Como

0. 5 · (N + 1) = 9

Me = 5

El primer cuartile Q 1 acumula el 25% de los datos N = 17. Como

0. 25 · (N + 1) = 4. 5

Q 1 = 3 + 0. 5(3 3) = 3

El tercer cuartile Q 3 acumula el 75% de los datos N = 17. Como

(b)

(c)

0. 75 · (N + 1) = 13. 5

El cuantil c 0.40 acumula el 40% de los datos N = 17. Como

Q 3 =

6 + 0. 5(6 6) = 6

0. 40 · (N + 1) = 7. 2

c 0.40 = 3 + 0. 2(4 3) = 3.2

C´alculo de la media, varianza y la desviaci´on t´ıpica.

x¯ = n

i=1 x i f i

N

= 17 72 = 4.235

Para el c´aculo de la varianza se aconseja el m´etodo abreviado

S = n

2

x

i=1 x i

2

f

i

N

x 2 = 354

17

4. 235 2 = 2. 89

Efectuar un diagrama apropiado.

S x = S = 2. 89 = 1.70

2

x

2

2 o E.T.S.Ingenier´ıa de Caminos

Estad´ıstica Aplicada

4 3 2 1 0 1 2 3 4 5 6 7 Número de avisos
4
3
2
1
0
1
2
3
4
5
6
7
Número de avisos

3

avisos

2 o E.T.S.Ingenier´ıa de Caminos

Estad´ıstica Aplicada

4.
4.

El porcentaje de algod´on en una tela utilizada para elaborar camisas para hombre se presenta en la siguiente tabla. Calcular los estad´ısticos m´as importantes y real´ıcese el histograma de frecuencias.

 

porcentaje de algod´on

 

32.1

32.5

32.6

32.7

32.8

32.9

33.1

33.1

33.4

33.5

33.6

33.6

33.6

33.6

33.6

33.8

33.8

34

34.1

34.1

34.1

34.2

34.3

34.3

34.4

34.5

34.5

34.6

34.6

34.6

34.6

34.6

34.7

34.7

34.7

34.7

34.7

34.7

34.9

35

35

35.1

35.1

35.1

35.2

35.3

35.4

35.4

35.5

35.6

35.7

35.8

35.9

36.2

36.4

36.6

36.8

36.8

36.8

37.1

37.3

37.6

37.8

37.9

(a)

Dise˜nar la distribuci´on de frecuencias con un cambio de variable.

(b)

Calcular los estad´ısticos: media, moda, mediana, Q 1 , Q 3 , c 0.6 , varianza y desviaci´on t´ıpica.

(c)

Representar el diagrama de tallo y hojas.

(d)

A partir del diagrama anterior determinar la mediana, el primer cuartil y el tercer cuartil y comp´arese los resultados con los obtenidos a partir de la distribuci´on de frecuencias.

(e)

Representar los histogramas de frecuencias absolutas y acumuladas.

(f)

Representar el diagrama de caja y determinar los valores extremos.

Soluci´on

(a)

Tomamos 7 intervalos de longitud 1. Como x max x min = 37. 9 32. 1 = 5. 8 y 7-5.8=1.2, desplazamos el extremo inferior a 32.1-0.6=31.5 y el extremo superior a 37.9+0.6=38.5 . Efectuamos el cambio de variable y i = x i 35 para realizar los c´alculos con la variable y .

Algod´on

x

i

f

i

F

i

y

i

y i f i

y

2

i

f

i

[31. 5, 32. 5) [32. 5, 33. 5) [33. 5, 34. 5) [34. 5, 35. 5) [35. 5, 36. 5) [36. 5, 37. 5) [37. 5, 38. 5)

32 1

 

2

-3

-3

 

9

33 8

10

-2

-16

32

34 16

27

-1

-16

16

35 23

49

0

0

0

36 7

55

1

7

7

37 6

61

2

12

24

38 3

64

3

9

27

   

64

   

-7

 

113

Tabla 1: Distribuci´on de frecuencias

(b)

C´alculo de los estad´ısticos:

y¯ = y i f i

N

7

= 64 = 0. 11

2

i

S = y

2

f

i

y

N

y¯ 2 = 115 0. 11 2 = 1. 78

64

4

2 o E.T.S.Ingenier´ıa de Caminos

x¯ = y¯ + 35 = 34.89 y S x = S y = 1. 78 = 1.336

Estad´ıstica Aplicada

A continuaci´on se explica c´omo calcular la Moda, y los cuartiles Q 1 y Q 3 . Con el mismo m´etodo se hallan los deciles y los cuantiles. Aunque hay f´ormulas expl´ıcitas para ello, dichas expresiones se obtienen por interpolaci´on de los histogramas de frecuencias. Dicha interpolaci´on se basa en la comparaci´on de tri´angulos semejantes.

23 23 16 7 x 34.5 35.5
23 23
16
7
x
34.5
35.5

La Moda Mo, se calcula por interpolaci´on en el intervalo modal. Por semejanza de tri´angulos se

tiene

23 16 = 1 x

x

23

7 x = 7

23

Luego y M o = 34. 5 + x = 34.8

Figure 1: C´aculo de la Moda

El primer cuartil Q 1 acumula N/ 4 = 16, luego

34. 5 33. 5 = 1 16

Q 1 33. 5 = x

7

7

Q 1 = 33. 5 + 16 = 33.94

25 16 9 x 33.5 34.5 Q 1
25
16
9
x
33.5
34.5
Q 1

(c) Gr´afico de tallo y hojas. Obs´ervese el diagrama de este tipo que se obtiene a partir del paquete estad´ıstico Minitab. Es interesante y f´acil de calcular a partir del mismo la Mediana y los cuartiles Q 1 y Q 3 . Comparar los resultados, con los obtenidos por interpolaci´on de la distribuci´on de frecuencias en el apartado anterior.

Diagrama de ´arbol

5

2 o E.T.S.Ingenier´ıa de Caminos

Estad´ıstica Aplicada

x
x

38,4

25

48

El tercer cuartil Q 3 acumula 48, luego Q 3 = 35. 5. El cuantil c 0.60 acumula 0. 6 N = 38. 4, por interpolaci´on de

los tri´angulos semejantes de la figura se tiene

35. 5 34. 5 = 1

c 0.60 34. 5 = x 13. 4

23

34.5

c 0.6

35.5

 

c 0.60 = 34. 5 + 13. 4

23

= 35.08

32

1

5 6 7 8 9

 

6

33

1

1 4 5 6

5

33

6

6 6 6 8 8

6

34

0

1 1

1 2 2 3 3 5 5 6

6 6 6 6 7 7 7 7 7 7 9

22

35

0

0 1

1 1 2 3 4 4 5 6

7 8 9

14

36

2

4 6 8 8 8

6

37

1

3 6 8 9

5

(d)

Con el gr´afico de tallos y hojas, donde los datos est´an ordenados y sin agrupar determi- namos:

La mediana acumula el 50% de los datos N = 64. Como

 

0. 5 · (N + 1) = 32. 5

Me = 34. 6 + 0. 5(34. 7 34. 6) = 34.65

El primer cuartile Q 1 acumula el 25% de los datos N = 64. Como

 

0. 25 · (N + 1) = 16. 25

Q 1 = 33. 8 + 0. 25(0) = 33.8

El tercer cuartile Q 3 acumula el 75% de los datos N = 64. Como

0. 75 · (N + 1) = 48. 75

Q 3 = 35. 4 + 0. 75(0. 1) = 35.475

(e)

A continuaci´on se muestran los Histogramas de frecuenc ias absolutas y acumuladas. El lec- tor puede detallar sobre los mismos, los poligonos de frecuencias, tanto para las frecuencias absolutas como las acumuladas.

(f)

Salida de estad´ısticos con Minitab.

 

Variable

N

Mean

Median TrMean StDev SE Mean

Algodon

64

34,770

34,650

34,738

1,351

0,169

 

Minimum Maximum

Q1

Q3

2,100

37,900

33,800

35,47

(g)

Mostramos el diagrama de caja (Boxplot ) para el c´alculo del rango intercuartil. La medida de variabilidad amplitud intercuartil AIC = Q 3 Q 1 = 1. 67. Si queremos detectar valores extremos en un sentido u otro, se calculan los valores de referencia dados por

Q 1 1. 5 AIC = 31. 295

6

Q 3 + 1. 5 AIC = 37. 975

2 o E.T.S.Ingenier´ıa de Caminos

20 10 0 32 33 34 35 36 37 38 Frecuencias absolutas
20
10
0
32
33
34
35
36
37
38
Frecuencias absolutas

Algodón

Estad´ıstica Aplicada

70 60 50 40 30 20 10 0 31,5 32,5 33,5 34,5 35,5 36,5 37,5
70
60
50
40
30
20
10
0
31,5
32,5
33,5
34,5
35,5
36,5
37,5
38,5
Frecuencias acumuladas

Algodón

Figure 2: Histogramas de frecuencias absolutas y acumuladas

y apreciamos que en nuestra distribuci´on no hay valores extremos en ninguno de los sentidos.

no hay valores extremos en ninguno de los sentidos. La siguiente tabla registra en diferentes horas

La siguiente tabla registra en diferentes horas la temperatura (T) del agua de un r´ıo y su contenido en ox´ıgeno disuelto (DO):

T

DO

T

DO

T

DO

T

DO

T

DO

29,57

9,88

29,48

6,67

28,43

2,90

31,68

13,80

28,51

2,58

29,99

12,14

29,06

5,29

28,64

3,94

31,34

12,32

28,30

2,41

30,58

13,66

28,81

4,23

29,02

5,52

31,00

11,00

28,09

2,51

31,00

14,19

28,60

3,56

29,52

7,83

30,79

10,00

28,00

2,71

31,34

14,50

28,51

2,98

30,07

10,68

30,45

8,45

28,13

3,48

31,26

13,72

28,51

2,58

30,67

12,98

30,07

6,48

28,30

4,36

31,17

12,54

28,43

2,32

31,17

14,26

29,69

4,91

28,72

5,71

30,96

11,48

28,34

2,14

31,55

14,93

29,36

3,89

29,14

7,91

30,50

9,92

28,34

2,09

31,76

14,91

29,02

3,21

29,74

10,61

29,99

8,32

28,26

2,27

31,81

14,61

28,76

2,83

30,37

12,66

Se pide:

(a)

Construir una distribuci´on conjunta de frecuencias para las dos variables T y DO tomando 5 intervalos.

(b)

Dibujar un diagrama de dispersi´on conjunto de las dos variables.

(c)

Hacer un estudio de las distribuciones marginales.

(d)

Calcular la matriz de varianzas-covarianzas.

7

Algodón

2 o E.T.S.Ingenier´ıa de Caminos

Figure 3: Diagrama de Caja. Es un artificio que muestra la mediana, los cuartiles y la ampli- tud, todo en el mismo gr´afico. Muestra que la mayor parte de los datos es menor que 35.47, y que el 50% de los datos estan comprendidos entre 33.8 y 35.47

38

37

36

35

34

33

32

Estad´ıstica Aplicada

Q3=35.47 Me=34.65 Q1=33.8
Q3=35.47
Me=34.65
Q1=33.8

T—DO

2.00-4.59

4.60-7.19

7.20-9.79

9.80-12.39

12.40-15

 

27.90-28.70

 

15

0

0

0

 

0

15

28.71-29.50

 

4

4

1

0

 

0

9

29.51-30.30

 

0

2

2

4

 

0

8

30.31-31.10

 

0

0

1

4

 

4

9

31.11-31.90

 

0

0

0

1

 

8

9

   

19

6

4

9

 

12

50

 

T

f

i

Estad´ısticos de T

27.90-28.70

15

28.71-29.50

9

T

29.

70

29.51-30.30

8

Me T 29. 55

ˆ

 

30.31-31.10

31.11-31.90

9

9

Q

S T

1

1.

28.

20

00

 

50

Q

3

30.

83

DO

g

i

2.00- 4.59

19

4.60- 7.19

6

7.20- 9.79

4

9.80-12.39

9

12.40-15.00

12

 

50

Estad´ısticos de DO

DO

Me DO

ˆ

S DO

Q

Q

1

3

7.

7.

4.

3.

12.

78

25

57

15

37

Se tiene que x i y i = 11806. La matriz de varianzas-covarianzas y coeficiente de cor- relaci´on:

8

2 o E.T.S.Ingenier´ıa de Caminos

Estad´ıstica Aplicada

Figure 4: Diagrama bi- variado. En la parte superior aparece el his- tograma de la variable DO y en la parte lateral el histograma de la vari- able temperatura T

19

12 9 6 4 31,9 9 31,1 9 30,3 8 29,5 9 28,7 27,9 2,0
12
9
6
4
31,9
9
31,1
9
30,3
8
29,5
9
28,7
27,9
2,0
4,6
7,2
9,8
12,4
15,0
Temperatura

Contenido en oxígeno

15

La matriz de varianzas-covarianzas y coeficiente de correlaci ´on:

2

S T Cov (T, DO )

Cov (T, DO ) S

2

DO

=

1.

5. 16 20. 85

43

5. 16

r T,DO = Cov (T, DO )

S T S DO

= 0.944

9