Sunteți pe pagina 1din 6

ESTIMACIONES EN LA ESTADÍSTICA

¿QUÉ ES UNA ESTIMACIÓN?


Es una aproximación de los parámetros (sacados de una muestra aleatoria) que debemos
de tener para poder realizar un estudio de una población cualquiera de la que
desconocemos sus parámetros, por ejemplo, su media poblacional o la probabilidad de
éxito
“Además, junto a esa estimación, y dado que muy probablemente no coincida con el
valor real del parámetro, acompañaremos el error aproximado que se comete al
realizarla.”[ CITATION ANG15 \l 10250 ]
ESTIMACIÓN PUNTUAL
“Una estimación puntual del valor de un parámetro poblacional desconocido (como
puede ser la media µ, o la desviación estándar σ), es un número que se utiliza para
aproximar el verdadero valor de dicho parámetro poblacional. “[ CITATION ANG15 \l
10250 ]
Para esto sacaremos una muestra de la población y se calculará el parámetro muestral
asociado (x para la media, s para la desviación estándar, etc.). El valor de este parámetro
muestral será la estimación puntual del parámetro poblacional.
 Insesgado: cuando la media de su distribución muestral asociada coincide con la
media de la población.
 De varianza mínima: La variabilidad de un estimador viene determinada por el
cuadrado de su desviación estándar. En el caso del estimador x, su desviación
estándar es n x σ = σ , también llamada error estándar de µ .
ESTIMACIÓN POR INTERVALOS
Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro
estimado con una cierta probabilidad.
En la estimación por intervalos se usan los siguientes conceptos
 Intervalo de confianza: El intervalo de confianza es una expresión del tipo [θ1,
θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este intervalo contiene al
parámetro estimado con un determinado nivel de confianza. Pero a veces puede
cambiar este intervalo cuando la muestra no garantiza un axioma o un
equivalente circunstancial.
 Variabilidad del Parámetro: Si no se conoce, puede obtenerse una
aproximación en los datos aportados por la literatura científica o en un estudio
piloto. También hay métodos para calcular el tamaño de la muestra que
prescinden de este aspecto. Habitualmente se usa como medida de esta
variabilidad la desviación típica poblacional y se denota σ.
 Error de la estimación: Es una medida de su precisión que se corresponde con
la amplitud del intervalo de confianza. Cuanta más precisión se desee en la
estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y,
si se quiere mantener o disminuir el error, más observaciones deberán incluirse
en la muestra estudiada. En caso de no incluir nuevas observaciones para la
muestra, más error se comete al aumentar la precisión. Se suele llamar E, según
la fórmula E = (θ2 - θ1)/2.
 Límite de Confianza: Es la probabilidad de que el verdadero valor del
parámetro estimado en la población se sitúe en el intervalo de confianza
obtenido. El nivel de confianza se denota por (1-α), aunque habitualmente suele
expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como nivel de
confianza un 95% o un 99%, que se corresponden con valores α de 0,05 y 0,01
respectivamente.
 Valor α: También llamado nivel de significación. Es la probabilidad (en tanto
por uno) de fallar en nuestra estimación, esto es, la diferencia entre la certeza (1)
y el nivel de confianza (1-α). Por ejemplo, en una estimación con un nivel de
confianza del 95%, el valor α es (100-95)/100 = 0,05.
 Valor crítico: Se representa por Zα/2. Es el valor de la abscisa en una
determinada distribución que deja a su derecha un área igual a α/2, siendo 1-α el
nivel de confianza. Normalmente los valores críticos están tabulados o pueden
calcularse en función de la distribución de la población. Por ejemplo, para una
distribución normal, de media 0 y desviación típica 1, el valor crítico para α =
0,1 se calcularía del siguiente modo: se busca en la tabla de la distribución ese
valor (o el más aproximado), bajo la columna "Área"; se observa que se
corresponde con -1,28. Entonces Zα/2 = 1,64. Si la media o desviación típica de
la distribución normal no coinciden con las de la tabla, se puede realizar el
cambio de variable t =(X-μ)/σ para su cálculo.
INTERVALO DE CONFIANZA PARA LA MEDIA µ:
Ésta tiene dos casos que se subdividen a la vez en dos subcasos:
 CON VARIANZA CONOCIDA
 CON POBLACIÓN FINITA

 CON POBLACIÓN INFINITA

 CON VARIANZA NO CONOCIDA


 CON POBLACIÓN NORMAL
 CON POBLACIÓN NO NORMAL

INTERVALO DE CONFIANZA PARA LA VARIANZA:

INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN:


EJEMPLO DE ESTIMADORES PUNTUALES
Se planea hacer un plano topográfico a detalle de la zona de Machupicchu que cuenta
con 385,1Km2, para mostrar a los turistas qué caminos deberán tomar para así tener más
concurrencia respecto al turismo. Se requiere hacer éste plano con la menor demora
posible para lo cual se contrata a 50 topógrafos para terminar el trabajo en menos de un
mes.
Después del primer día el alcalde de la municipalidad manda a investigar al ingeniero
encargado, cuántos metros cuadrados acaban por día en promedio cada topógrafo, y
además tiene la duda si el terreno en el que trabajaron tiene mucha pendiente puesto que
presentaría un problema para el topógrafo.
El ingeniero responsable del plano de zonificación hace una tabla en el primer día de
trabajo para poder ver el promedio de metros cuadrados y de paso preguntarles si se les
presentó dificultades a la hora de levantar su respectiva zona.
NÚMERO DE ¿CUENTA CON MAS DE 5 AÑOS
TOPÓGRAFOS M2/DIA EXPERIENCIA LABORAL?
1 9370 NO
2 12420 SI
3 15590 SI
4 8410 NO
5 10790 NO
6 9590 SI
7 11280 SI
8 7470 NO
9 10480 SI
10 8260 NO
11 15340 SI
12 8790 SI
13 10120 SI
14 9570 NO
15 11210 SI
16 7630 SI
17 10160 SI
18 8260 SI
19 9580 NO
20 12320 SI
21 11450 NO
22 7120 SI
23 10190 SI
24 8820 SI
25 9940 NO
26 12350 SI
27 15740 SI
28 8380 NO
29 10950 SI
30 9480 SI
31 10760 SI
32 9720 NO
33 11620 SI
34 7290 SI
35 10710 NO
36 8450 SI
37 9430 SI
38 12260 SI
39 15160 NO
40 8180 SI
41 10180 SI
42 8450 SI
43 9430 NO
44 12740 SI
45 15620 SI
46 8820 SI
47 10460 SI
48 9940 NO
49 11310 SI
50 7860 NO

Para la resolución de éste problema escogeremos 3 muestras con un tamaño de


población de 5 topógrafos con la ayuda de la tabla de números aleatorios, escogiendo un
número al azar y buscando las dos últimas cifras (menores de 50) de cada número de la
misma columna para abajo hasta completar cinco búsquedas.
PRIMER GRUPO:
20 12320 SI
42 8450 SI
31 10760 SI
35 10710 NO
36 8450 SI
 Del cual sacando cálculos tenemos:

Ῡ=
∑ yi = 50690 =10138 m2
n 5

S=
√ ∑ ( yi−Ῡ )2 =
n−1 √ 11173880
4
=1671.368 m 2

ꝥ=
∑ (SI ) = 4 =0. 8
n 5
SEGUNDO GRUPO:
13 10120 SI
7 11280 SI
42 8450 SI
22 7120 SI
36 8450 SI

 Del cual sacando cálculos tenemos:

Ῡ=
∑ yi = 45420 =9084 m2
n 5

S=
√ ∑ ( yi−Ῡ )2 =
n−1 √ 2639230
4
=1624 . 571 m2

ꝥ=
∑ (SI ) = 5 =1
n 5
PROMEDIO DE LAS DOS MUESTRAS:

Ῡ TOTAL=
∑ Ῡ = 10138+ 9084 =9611 m2
n 2

S TOTAL=
∑ S = 1671.368+1624.571 =1647.970 m2
n 2

ꝥ TOTAL=
∑ ( ꝥ) =0. 9 m2
n
El ingeniero puede estimar que los topógrafos trabajarán 9611 m2 por día y la razón por
la que se demoren es porque estimó también que los terrenos a trabajar presentan una
posibilidad del 90% de tener dificultades (mucha pendiente, vegetación, clima, etc.).

S-ar putea să vă placă și