Sunteți pe pagina 1din 207
Guillermo Ayala and Francisco Montes Universidad de Valencia Estadística Básica

Guillermo Ayala and Francisco Montes Universidad de Valencia

Estadística Básica

2

Copyright ©1 de octubre de 2019 Guillermo Ayala Guillermo.Ayala@uv.es This work is free. You can redistribute it and/or modify it under the terms of the Do What The Fuck You Want To Public License, Version 2, as published by Sam Hocevar. See http://www.wtfpl.net/ for more details.

ii

Índice general

1 Datos y R

1

1.1 Bibliografía comentada

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

1

Lo primero

1.2 .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2

1.3 Lectura y escritura de datos .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

3

1.3.1 Con Calc de LibreOffice

.

.

.

.

.

.

.

.

.

.

.

.

.

4

1.3.2 Lectura de un fichero texto

.

.

.

.

.

.

.

.

.

.

.

5

1.4 Sobre lo imprescindible en R

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

5

1.4.1 La función c .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

6

1.4.2 Selección de casos

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

6

1.5 Algunas cosas útiles R

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

8

1.5.1 De cómo guardar un dibujo

.

.

.

.

.

.

.

.

.

.

.

8

1.5.2 De cómo conseguir ayuda con R

.

.

.

.

.

.

.

.

8

1.5.3 De cómo trabajar con R

.

.

.

.

.

.

.

.

.

.

.

.

.

8

1.6 Seguimos con lo básico de R .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

9

1.7 Dato faltante

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

12

1.8 Datos

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

12

1.8.1 Datos de precipitaciones y temperaturas en la

Comunidad Valenciana

 

.

.

.

.

.

.

.

.

.

.

.

.

12

1.8.2 Concentraciones de ozono

 

.

.

.

.

.

.

.

.

.

.

.

.

14

2 Estadística descriptiva

 

15

2.1 Introducción

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

15

2.2 Descriptivas numéricas

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

16

2.2.1 Media muestral

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

16

2.2.2 Media ajustada

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

17

2.2.3 Percentiles

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

18

2.2.4 Varianza y desviación estándar muestrales

 

19

2.2.5 Rango

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

19

2.2.6 Rango intercuartílico

.

.

.

.

.

.

.

.

.

.

.

.

.

.

20

2.2.7 La función genérica summary

.

.

.

.

.

.

.

.

.

.

20

Ejercicios

2.2.8 .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

21

2.3 Descripciones gráficas de los datos

.

.

.

.

.

.

.

.

.

.

.

21

2.3.1 Añadimos variables y seleccionamos casos o va-

riables

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

21

2.3.2 Frecuencias

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

22

2.3.3 Histograma

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

23

2.3.4 Diagramas de cajas .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

23

2.3.5 Estimadores kernel de la densidad

.

.

.

.

.

.

.

24

2.3.6 Función de distribución muestral

 

.

.

.

.

.

.

.

.

25

2.3.7 Buscando datos anómalos

 

.

.

.

.

.

.

.

.

.

.

.

.

25

2.3.8 Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

27

2.4 Un dibujo

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

28

iii

iv

ÍNDICE GENERAL

3 Probabilidad

 

33

3.1 Determinismo e incertidumbre

 

.

.

.

.

.

.

.

.

.

.

.

.

33

3.2 Probabilidad y sus reglas

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

33

3.2.1 Lenguaje y notación

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

34

3.2.2 Reglas de la probabilidad

.

.

.

.

.

.

.

.

.

.

.

.

35

3.3 La fórmula de Laplace

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

38

3.3.1

Un poco de teoría

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

39

3.4 Probabilidad condicional

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

40

3.5 Independencia

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

40

3.6 Una aplicación de la independencia y de la probabilidad

 

condicional: el pueblo contra Collins

 

.

.

.

.

.

.

.

.

.

.

41

3.7 Teorema de la probabilidad total

 

.

.

.

.

.

.

.

.

.

.

.

.

44

3.7.1

Encuesta sobre cuestiones delicadas

 

.

.

.

.

.

44

3.8 Teorema de Bayes

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

45

3.8.1 Padre a cara o cruz .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

46

3.8.2 Filtrado del correo spam

 

.

.

.

.

.

.

.

.

.

.

.

47

3.9 Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

48

3.10 Simulando un experimento con sample

.

.

.

.

.

.

.

.

.

50

3.10.1 Contando: variaciones, permutaciones y combi-

 
 

naciones

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

53

3.10.2 Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

56

4 Variables aleatorias

 

59

4.1 Variable aleatoria .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

60

4.2 La variable aleatoria como modelo probabilístico

.

.

.

60

4.3 Función de distribución de una variable aleatoria

 

62

4.4 Variable aleatoria discreta

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

64

4.4.1 Función de probabilidad o cuantía

.

.

.

.

.

.

.

65

Ejercicios

4.4.2 .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

66

4.4.3 Relación con la función de probabilidad y la de

 
 

distribución

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

66

4.4.4 Media y varianza de una variable aleatoria dis- creta

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

66

4.4.5 Variables aleatorias discretas más notables

 

69

4.4.6 Modelo binomial

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

70

4.4.7 Media y varianza de una variable binomial

.

.

76

Ejercicios

4.4.8 .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

77

4.5 Variable aleatoria continua

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

78

4.5.1 Función de densidad de probabilidad .

.

.

.

.

.

79

4.5.2 Relación entre la función de densidad y la de

 
 

distribución

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

80

4.5.3 Media y varianza de una variable aleatoria con-

 
 

tinua

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

80

4.5.4 Variable aleatoria uniforme

.

.

.

.

.

.

.

.

.

.

.

80

4.6 Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

82

4.6.1

Variable aleatoria normal

.

.

.

.

.

.

.

.

.

.

.

.

83

4.7 Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

89

4.7.1 Aproximación de la binomial mediante la normal 90

5 Distribución muestral

 

93

5.1 Población y muestra aleatoria

.

.

.

.

.

.

.

.

.

.

.

.

.

.

93

5.2 Distribución muestral de una variable binomial

.

.

.

.

93

5.2.1

Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

95

ÍNDICE GENERAL

v

5.3.1

Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

98

5.4

Distribución muestral de la media en poblaciones no

 

normales. Teorema central del límite

 

.

.

.

.

.

.

.

.

.

.

99

5.4.1 Aproximación de la distribución binomial

.

.

.

99

5.4.2 Ilustración del teorema central del límite .

.

.

.

99

5.4.3 Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

100

6 Estimación

101

6.1 Introducción

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

101

La población

6.2 .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

101

6.3 Estimación puntual

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

102

6.4 Algunas definiciones

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

103

6.5 Estimación puntual de la media

 

.

.

.

.

.

.

.

.

.

.

.

104

6.6 Intervalo de confianza para la media

.

.

.

.

.

.

.

.

.

.

104

6.6.1 Asumimos que conocemos la varianza

.

.

.

.

.

104

6.6.2 No asumimos la varianza conocida

 

.

.

.

.

.

.

.

107

6.6.3 Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

113

6.7 Error absoluto y tamaño de la muestra

 

.

.

.

.

.

.

.

113

6.7.1

Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

116

6.8 Estimación de la varianza en poblaciones normales

 

117

6.8.1

Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

118

6.9 Estimación de una proporción

 

.

.

.

.

.

.

.

.

.

.

.

.

118

6.9.1

Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

120

6.10 Tamaño de la muestra en la estimación de una proporción120

6.10.1

Ejercicios

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

121

7 Contraste de hipótesis

 

123

7.1 Introducción

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

123

7.2 Constrastes para una muestra

 

.

.

.

.

.

.

.

.

.

.

.

.

123

7.2.1 Un contraste unilateral

 

.

.

.

.

.

.

.

.

.

.

.

.

.

124

7.2.2 Otro problema de contraste unilateral

.

.

.

.

.

129

7.2.3 Y, finalmente, el contraste bilateral

.

.

.

.

.

.

131

7.3 Intervalo de confianza y contraste de hipótesis

 

132

Ejercicios

7.4 .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

133

7.5 Contraste de normalidad

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

135

7.5.1

Gráficos para evaluar la normalidad

.

.

.

.

.

.

135

7.6 Constrastes de normalidad .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

139

7.6.1 Test de Shapiro–Wilk

.

.

.

.

.

.

.

.

.

.

.

.

.

.

139

7.6.2 Test ji-cuadrado

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

140

7.6.3 Test de Kolmogorov-Smirnov

.

.

.

.

.

.

.

.

.

.

140

Ejercicios

7.7 .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

141

8 Comparación de dos poblaciones normales

 

143

8.1 Introducción

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

143

8.2 Comparación descriptiva de las muestras

 

.

.

.

.

.

.

143

8.3 Comparando las medias de dos poblaciones normales .

147

8.3.1 Estimación de la diferencia de medias

 

.

.

.

.

.

147

8.3.2 Contraste de hipótesis

 

.

.

.

.

.

.

.