Sunteți pe pagina 1din 50

PROGRAMAS ANALTICOS

1.- INTRODUCCIN.
1.a. DEFINICIN DE ESTADSTICA:
Rama de las matemticas que se encarga del estudio de series de datos
mediante su coleccin, organizacin, presentacin y anlisis de resultados,
tanto para la toma de decisiones como para la deduccin de concusiones
(Inferencia estadstica), permitiendo evaluar la incertidumbre de inferencias
inductivas, de acuerdo al estudio realizado.
La estadstica ayuda a todas las dems ciencias a generar modelos
matemticos generales donde se haya considerado el componente aleatorio.
-Coleccin de datos
-Organizacin de datos
-Anlisis de datos
-Presentacin de datos.

C
O
A
P

1.b. CLASIFICACIN DE LA ESTADSTICA:


Estadstica DESCRIPTIVA

Clasificacin de la Estadstica
Estadstica INFERENCIAL

Estadstica DESCRIPTIVA es:


Es la parte de la estadstica que estudia desde la coleccin de datos hasta el
anlisis para tratar de extraer conclusiones sobre e comportamiento de sus
variables.
Es la parte de la estadstica (Herramienta) que sirve para analizar series de
datos numricos.
Mediante los 4 pasos que son:
-Coleccin
-Organizacin (Tabulacin)
-Presentacin
-Anlisis
*Es la parte de la Estadstica que da los procedimientos para transformar los
datos del anlisis de un fenmeno colectivo, o sea calcular los valores del
fenmeno.
Los datos se pueden describir en tres formas:
I) Tabular: La utilizaremos mediante la construccin de
tablas.
II)Graficas: La utilizaremos mediante el uso de
grficas(Circulares, barras, lneas, )

III)Aritmtica: La usaremos para calcular determinados


nmeros cuya interpretacin proporciona aspectos de la
naturaleza de los datos.

Estadstica INFERENCIAL(PARAMTRICA) es:


Determina conclusiones, significa que los resultados son inferibles para
toda la poblacin. En si son conclusiones, predicciones, suposiciones y
permite tomar decisiones, va despus del anlisis (UNA INFERENCIA
ESTADSTICA ES UNA SUPOSICIN)
Es la que toma las decisiones.-Elabora Conclusiones.
-Hace Conclusiones.
Trabaja con: suposiciones/ Conclusiones / Pronsticos
Ejemplo del Dr. Dimas:
Una parcela agrcola es = POBLACIN
La parcela tiene una poblacin de 85,000 plantas
Si tomamos una muestra de 100 plantas y la variable analizada es la altura.
Con los datos recabados de la altura de las 100 plantas, podemos inferir que
los datos son representativos de todas las plantas dentro de la parcela.
Resumen:
La estadstica es la disciplina que nos proporciona una metodologa para
recoger, organizar, resumir, analizar datos, interpretar los resultados y hacer
inferencias a partir de ellos-

Que puedo hacer con la estadstica??????????


-Se pueden calcular medias, promedios aritmticos.
-Se puede determinar la variabilidad de las observaciones.
-Se pueden elaborar grficas.
------------------------------------------------------------------------------------------------------------------------------> Material consultado fuera de clase<

1.c. Relacin Estadstica Probabilidad


PROBABILIDAD.La definicin A PRIORI es: La probabilidad de un suceso es el
nmero de casos favorables sobre el nmero de casos totales.
Ejemplo: La probabilidad de caer GUILA en una moneda es la
pues es uno de los posibles resultados.

La definicin A POSTERIORI es: La probabilidad de un suceso es el


lmite (SI EXISTE) de la frecuencia relativa cuando el tamao de la
muestra tiende al infinito.
Ejemplo: La probabilidad de germinar semillas de una
determinada poblacin es 80% (Esto se sabe por una serie de
pruebas donde se obtuvo este porcentaje).

1.d. Muestreo y Diseo de experimentos como tcnicas para obtener


informacin
EL MUESTREO.Muchas veces el universo de estudio de una investigacin consiste en una
poblacin demasiado numerosa, o no se cuenta con los suficientes recursos
para estudiarla en su totalidad. En esos casos es muy frecuente que se recurra
al MUESTREO.
UNIVERSO o POBLACIN es el conjunto de individuos objeto de estudio,
por lo tanto estar en funcin del objetivo de la investigacin.
MUESTRA es un subconjunto de la Poblacin que se pretende represente
a esta.

Casual
-No Probabilsticas o Finalistas

Intencional
Por Cuotas

TIPOS DE MUESTRAS:
Simple al Azar
-Probabilsticas

Sistemtica
Estratificada

Proporcional
No Proporcional

Por Conglomerados

Muestras no Probabilsticas: En las MNP los elementos de la


oblacin tienen una probabilidad desconocida de integrar la
muestra. No tienen valor desde el punto de vista estadstico.
Se dividen en:
MNP-CASUAL: Ejemplo: Una periodista entrevista a 01 de
cada
10 personas que pasan por la calle, aunque
no las elija no
Pasan por la calle todos los integrantes de una
poblacin.
MNP-INTENCIONAL: Ejemplo: Son aquellas en las que
el investigador solo
Entrevista a ciertos informantes claves elegidos
por l.
Tiene utilidad en una investigacin de tipo
exploratorio.
MNP-POR CUOTA: Ejemplo: Utilizadas en investigaciones de
mercado. Se
Asigna a los investigadores la cantidad de
personas a
Entrevistas y sus rangos de edad, sexo, etc.
Muestras Probabilsticas: En las MP cada elemento de la
poblacin tiene una
Probabilidad conocida de integrar la muestra.
Existen 4 tipos y estos son: Simplemente Al Azar, Sistemtica,
Estratificada, por
Conglomerados.

MP-SIMLEMENTE AL AZAR: Es la muestra donde se eligen los


integrantes
Al azar entre el total de la poblacin.
MP-SISTEMTICO: Es el que se sigue cuando se elige un
orden determiNado. Ejemplo: de cada 10 se elije 11, 21, 31, 42.....
MP-ESTRATIFICADA: Cuando la poblacin se divide en
estratos y cada uno
De estos estratos se muestrea por separado.
Hay dos variantes: Proporcional y No Proporcional.

Ejemplo Proporcional: La fraccin del muestreo es igual para


cada estrato.
Ejemplo NO Proporcional:

La fraccin del muestreo no es

igual.
MP-POR CONGLOMERADO: Se usa cuando el universo a
estudiar esta muy
Disperso geogrficamente y se usan conglomerados de
grupos formados.
>> fin material consultado fuera de clase<<
2.- DEFINICIN DE CONCEPTOS
2.a. Poblacin
Conjunto de seres vivos o de objetos que poseen alguna caracterstica en
comn que defina al grupo. (Los animales de una misma raza, Los estudiantes
de la FAZ)
*Es un conjunto de medidas o es el conjunto completo de individuos, objetos o
medidas que poseen alguna caracterstica comn observable.

Posee las siguientes caractersticas:


I- Su Naturaleza (Ejemplo plantas de Maz de la tabla No. 01)
II-Su Magnitud (Ejemplo 120 plantas)
III-El Espacio (Ejemplo La Tabla No. 01 tierra-espacio-)
IV-El Tiempo (Ejemplo Ciclo Primavera- Verano 2009)
FINITA
La POBLACIN puede ser:
INFINITA
EJEMPLO:
La poblacin consistente en todos los candados producidos en la fbrica en UN
DIA determinado es una POBLACIN FINITA.

EJEMPLO:

La poblacin formada por todos los posibles sucesos (GUILA, SOL) en un


tiradas sucesivas de una moneda es poblacin INFINITA.

La ESTADSTICA emplea para su estudio: MUESTRAS

2.b. MUESTRA (Subconjunto).


Es un pequeo grupo o subconjunto de individuos sacado de una poblacin que
posee una caracterstica en comn.
*Es un conjunto de medidas o el recuento de una parte de elementos
pertenecientes a la poblacin.

>>material consultado fuera de clase<<


MUESTRA

POBLACIN
PROBABILSTICA

La Muestra puede ser


NO PROBABILSTICA
MUEST
RA SACA AL AZAR
La MUESTRA PROBABILSTICA PUEDE SER

MUESTRA

ESTRATIFICADA
MUESTRA
SISTEMTICA

Muestra SACADA AL AZAR: El muestreo aleatorio simple permite que


todos los elementos que estn en la POBLACIN tengan la misma
posibilidad de ser incluidos en la muestra. 1)La eleccin de las unidades
se hace por sorteo o utilizando tablas de nmeros aleatorios. 2)Este
mtodo es importante cuando la poblacin NO ES GRANDE.
Muestra ESTRATIFICADA: Es aquel muestreo donde la poblacin SE
ESTRATIFICA, se forman grupos o estratos en tal forma que el elemento
tendr una caracterstica que solo le permita pertenecer al mismo
estrato o grupo.
Muestra SISTEMTICA: Es aquel que usan los contadores para analizar
sumas, restas, etc. Y consiste en determinar, un intervalo igual al valor
obtenido al dividir el tamao de la poblacin
por el de la misma
muestra.

**CARACTERSTICAS DE LA MUESTRA>
>Representativa (debe de ser sacada de grupos distintos o clases en que se
divide la poblacin investigada.
>Que tenga el tamao idneo (Que sea representativa/ el investigador
determian el tamao).
>Que intervenga el AZAR (Que todas las pruebas tengan la misma posibilidad
de ser sacardas).

ESCALA DE MEDICIN:

NOMINAL
ORDINAL
ESCALA DE MEDICIN
DE INTERVALOS
DE RAZONES

ESCALA NOMINAL:
Se utilizan como medidas de identidad. Los nmeros sirven de
indicativos para indicar objetos o clases Ejemplo: Las personas se
pueden clasificar acorde a su sexo, raza, color de piel, color de cabello,
su religin, etc.
ESCALA ORDINAL:
Es donde los nmeros reflejan la orden de objetos o la Jerarqua de
individuos u objetos. Estas medidas se disponen desde la ms alta a la
ms baja o viceversa. Las medidas ordinales revelan que persona u
objeto es de mayor o menor talla. O si es ms duro o suave.
ESCALA DE INTERVALOS:

Proporciona nmeros que reflejan diferencias entre objetos o individuos.


En este tipo las escalas de medicin son iguales: Ejemplo escala Celsius
y escala Fahrenheit.
Los valores estadsticos que usa esta escala son: la media aritmtica, la
desviacin estndar, el coeficiente de correlacin.
ESCALA DE RAZONES:
Son nmeros que indican razones o cocientes entre ciertas magnitudes
de los objetos y los datos obtenidos con estas escalas pueden ser
sometidos a tratamientos estadsticos ms elaborados.
Ejemplo: Un peso de 80 libras es 4 veces mayor que uno de 20 libras.
>>fin de material consultado<<
2.c. LA VARIABLE.
Es la cantidad o cualidad/Caracterstica que varia de un individuo a otro, en
una poblacin. Es una caracterstica que se puede medir a un elemento.
Ejemplo: De un rbol de pino.
- Altura
- Grosor de tallo
- Dimetro de follaje
- rea de la raz
- Nmero de hojas
- Tamao de la apia(Fruto).
Ejemplo: Las jornadas de trabajo con las que puede laborar una fabrica, 1,2 o
3, El precio del producto, etc.
2.d. VARIABLE ALEATORIA.
Es una variable que toma valores al AZAR, es decir que cada valor de la
variable tiene asociada una determinada probabilidad de ocurrir. Por lo tanto
todas las variables aleatorias miden alguna caracterstica de un experimento
aleatorio.
Ejemplo: Si muestreamos de una serie de
estudiantes el coeficiente
intelectual de 1 estudiante tomado al azar es una variable aleatoria.
2.e. CLASIFICACIN DE LAS VARIABLES.
Las letras que se utilizan en las variables son las 3 ltimas letras del alfabeto:
X, Y, Z.
CUANTITATIVAS
Se clasifican las VARIABLES en:

CUALITATIVAS
VARIABLES CUALITATIVAS:
Es una caracterstica que se le mide a un elemento
expresar en CALIDAD O CUALIDAD.

y se tiene que

Sus valores posibles son: CUALIDADES o ATRIBUTOS.


Ejemplo: La estatura de una persona baja, media, alta, color de sus ojos
caf, verde, negro, azul. Su sexo hombre, -mujer.
Dicotmicas
Politmicas
Variables Cualitativas

ORDINALES.

NOMINAL.
Variable Cualitativa DICOTMICA:
Son las variables con dos valores posibles ( Si NO).
Variable Cualitativa POLITMICA:
Son las variables con tres o ms valores posibles.
Variable Cualitativa ORDINALES:
Son las Variables que pueden tomar distintos valores
ordenados, siguiendo una escala establecida, que no es
necesario que el intervalo sea establecido.
Ejemplo: Status Soltero, Casado, Viudo, Divorciado.
Reprobado, aprobado, notable, excelente.
Leve, moderado o Grave.
Deporte: oro, plata , bronce.

Variable Cualitativa NOMINAL:


En esta variable los valores NO pueden ser sometidos a un
criterio de orden.
Ejemplo: Colores, Lugar de residencia.
VARIABLES CUANTITATIVAS:
Es una caracterstica que se le mide a un elemento y se tiene que
expresar en CALIDAD O CUALIDAD Y SE EXPRESA EN FORMA NUMRICA.
Sus valores pueden tomar una expresin numrica.
Ejemplo: El precio del producto, el salario, etc.

Las Variables Cuantitativas pueden ser a su vez:


Discretas..

Continuas y

CONTINUAS.
Variables Cuantitativas
DISCRETAS.
Variable Cuantitativa CONTINUA:
Es aquella sin interrupciones o separaciones, se contabiliza
con fracciones.
Se dan cuando los
valores numricos que forman la
variable en un intervalo cualquiera son infinitos.
*es una variable que puede tomar cualquier valor de una
escala(toma fracciones ).
Ejemplo: el peso de una persona, la altura de una persona,
el tiempo, la velocidad de un caballo.
Variable Cuantitativa DISCRETAS:
Tiene interrupcin o separacin en su intervalo o escala de
valores (NO TOMA VALORES FRACCIONARIOS).
Es la variable cuyos valores numricos se pueden contar o
son finitos en un intervalo cualquiera.
Ejemplo: El nmero de hijos que puede tener una pareja.(se
contabiliza enteros).
El nmero de personas que puede morir en un autobs que
lleva 45 personas.

*Las VARIABLES SEGN SU INFLUENCIA SE CLASIFICAN EN:


DEPENDIENTES.
Las VARIABLES segn su INFLUENCIA
INDEPENDIENTES.
Variables DEPENDIENTES:
Son las variables que son el resultado de un
experimento.
10

Tambin se les conoce como Variables de


Respuesta o Y
Variables INDEPENDIENTES:
Son las variables que el investigador escoge
para establecer agrupaciones.
Tambin se le conoce como Variable X

3.- ANLISIS DE DATOS UNIVARIADOS.


Consiste en el anlisis de cada uno de las variables estudiadas por separado,
es decir el anlisis est basado en una variable.
Las tcnicas ms frecuentes del anlisis univarido son las distribuciones de
frecuencia para una tabla univariada y e anlisis de las medidas de tendencia
central de la variable.
*Herramienta estadstica que nos permite analizar una sola variable.

Anlisis Univariado (1 varable)


ESTADSTICA

Anlisis Bivariado (2 variables)


Anlisis Multivariado (2 ms variables)

Clasificacin del anlisis UNIVARIADO.


*Estimadores estadsticos
Media
Medidas de tendencia Central Moda
Mediana
Mtodo numrico
*Estimadores estadsticos
Desviacin Estndar
Variacin
Anlisis Univariado

Varianza
Medidas de dispersin
Coeficiente

de

11

Histogramas
(columna,barras, 3d)

Mtodo Grfico

Grficas de lneas
Figura de pastel
Figura de burbujas

MEDIDAS DE TENDENCIA CENTRAL APARA DATOS NO AGRUPADOS:

Se asume que el 70-80 % de los valores estn debajo de la campa de la curva


(Alrededor del promedio estn agrupados).
MEDIDA DE TENDENCIA CENTRAL (NO AGRUPADOS).
Datos desordenados sin ningn tratamiento (Datos
3,7,3,3,7,8,3,5,3,4,3, edad de las nias.

no

agrupados)

La edad que ms de repite es la edad de 3 aos de las nias, por lo tanto la


moda es M= 3
Se representa por el simbolo

(MUU).

MEDIA ARITMTICA:( DATOS NO AGRUPADOS)

Simbolo

Formula

Se obtiene al dividir la suma de todos los valores de una variable por la


frecuencia total (No. Datos).
Se representa con el smbolo
12

X1+X2+X3+X4+X5+X6.......

X=

----------------------------N

Ejemplo: Calificaciones 4,7,7,2,5,3


X1+X2+X3+X4+X5+X6.......

X=

4+7+7+2+5+3

-------------------

4.8 Media Aritmtica

25

X= -------- =

x......x =valores de las observaciones


n = cantidad de datos

MODA: ( Para datos no agrupados)


Smbolo

Es el valor ms frecuente de un conjunto de observaciones.

Hay ocasiones que no hay moda


Tambin hay ocasiones que puede tener ms de una.

Ejemplo: Edad de los nios


5,7,3,3,7,8,3,5,9,3,4,3
Por lo tanto la MODA es 3 ( Mo = 3)

MEDIANA: ( Nmeros impares)


Smbolo Md
Es el valor que divide a la distribucin de frecuencias en dos partes iguales
Valor central de un conjunto de observaciones, agrupados de mayor a menor o
de menor a mayor
Ejemplo: 1,2,4,5,8,9,10
Nota:
Es la parte central , debe dividir a la poblacin en 2 grupos iguales. =

MEDIANA: (Nmeros pares)


Smbolo Md
Si la muestra est formada por nmeros pares, la mediana es el valor de la
suma de los dos centrales y su promedio.

13

Ejemplo: 1,2,3, 4,5, 6,7,8


4 y 5 son el centro, por lo tanto se suma 4+5 =9, y despus de saca el
promedio 9/2= 4.5

MEDIA ARITMTICA PONDERADA: (Para datos no agrupados)


Smbolo

Formula
PROBLEMA EJEMPLO:
Un estudiante realiza 3 exmenes, el 1ro lo hizo en 01 hora, el 2do y el 3ro en hr, se
le atribuye ponderacin en 1,2,3, y las calificaciones respectivamente son 5,8, y 7
respectivamente.

Xi

ni

5
8
7

wi

1
1
1
3

xiwi

1
2
3
N=6

5
16
21
42

Pasos para armar la tabla:

Xi = 5,8, y 7
2.-Ponderacin Wi=1,2,3 * este valor lo indica la descripcin del problema.
3.-Veces que se realizo la observacin ni=
1.-Observaciones

4.-Llenar la tabla multiplicando

Xi
5
8
7

ni
1
1
1
3

wi
1
2
3
N=6

Xi *Wi

xiwi
(5*1)
(8*2)16
(7*3)21
(1+16+21)42

14

Ahora hay que sustituir en al frmula:

Xw=

Suma (5*1*1)+(8*1*2*1)+(7*3*1)
Suma (1+2+3)

Xw=

5+16+21
6

Xw= 42
6

Xw= 7

Media Geomtrica: (Para datos no agrupados)


Smbolo

Suele usarse cuando los valores de una variable siguen una progresin
geomtrica, para promediar porcentajes, tazas, ndices.
Ejemplo:

Xi

ni

Log Xi

nilogX1
15

100
120
125
140

10
5
4
3
Suma n=22

2
2.0791
2.0969
2.1461

(2*10)=
(2.0791*5)=
(2.0969*4)=
(2.1461*3)=
Sumatoria

20
10.3955
8.3876
6.4383
45.2214

Xi=Nmero de observaciones
ni= Nmero de repeticiones

Smbolo

Formula

Sustituyendo la formula:
G= antilog 45.2214
22
G=antilog 2.0555

G= 113.63

( oprimir la tecla shift , log en su calculadora).

Pasos:
1.-Anotar Xi
2.-Anotar ni
3.-Sacar el Log de xi
4.-Multiplicar ni *Log Xi
5.-sustituir formula
6.-Sacar anti logaritmo
Media Armnica: (para datos no agrupados)
Es la inversa de la media aritmtica, Se utiliza para promediar velocidades,
tiempos, rendimientos.
Ejemplo:

Xi
100
120
125
140

ni

ni/Xi

10
5
4
3

0.1
0.042
0.032
0.021
16

Sumatoria n=22

Sumatoria 0.196

Xi= Valor de cada observacin ( Ejemplo: altura de planta)

ni= Nmero de veces que se repite la observacin.


Smbolo

Formula:

H=

n
Sumat

H=

ni + n2 + n3+ n4
Xi
X2 X3 X4

22

Sumat (0.01+0.042+0.032+0.021)
H= 112.82

DATOS AGRUPADOS
Cuando no es posible obtener la media aritmtica, porque los datos de las
observaciones se presentan agrupados en una tabla de frecuencias
desconociendo los valores individuales de la variable.
MEDIA ARITMTICA: (datos agrupados)
Smbolo
Se determina obteniendo la sumatoria del producto de la media de cada
intervalo de clase por su frecuencia, y el resultado se divide entre sumatoria de
las frecuencias.
17

Simbolo
Formula:

Xi fi

------------

= Media Aritmtica

M= Se obtiene dividiendo el limite inferior + limite

superior del intervalo entre 2

Xi = Observaciones
n =Nmero total de observaciones
fi = Frecuencia.
= Sumatoria
Datos:
25,12,19,23,28,30,19,9,20,35,27,10,24,24,16,16,18,35,18,17,21,36,17,36,20,1
2,20,21,18,36,18,24,6,24,24,16,10,24,24,35,7,8,7,36,18,
Ejemplo :
Tons/ha
0 10
10 20
20 30
30 - 40

M*

f*m

fm

7
17
14
7
45

5
15
25
35

(7*5)
(17*15)
(14*25)
(7*35)

35
255
350
245
885

885
45

= 19.66
------------------------------------

MODA : ( Datos agrupados)


Smbolo

Mo

18

Formula

Mo = L+(/+)W

L = Limite inferior de la clase con alta frecuencia


d1/1 =Diferencia entre la frecuencia ms alta y la anterior
d2/2 =Diferencia entre la frecuencia ms alta y la posterior
W= Intervalo e clase.
Tons/ha
0 10
10 20
20 30
30 - 40

M*

f*m

fm

7
17
14
7
45

5
15
25
35

(7*5)
(17*15)
(14*25)
(7*35)

35
255
350
245
885

Mo = L+(/+)W
Sustituyendo la formula:
La clase que tiene ms alta frecuencia es la de 10 20 ( 17 datos), y limite
inferior es 10, y 17 el limite superior.

Mo = 10+(/+)W
= Diferencia entre la frecuencia ms alta y la anterior ( 17 7) = 10
= Diferencia entre la frecuencia ms alta y la posterior (17 14) = 3
Mo = 10+(17-7/10+3)W
W= Intervalo de clase.( numero de valores distintos dentro de los lmites del 0
al 10 = 10

Mo
Mo
Mo
Mo
Mo

=
=
=
=
=

10+(17-7/10+3)10
10+(10/13)10
10+(0.76)10
10+7.6
17.6

Termino parcial del 2do repaso grupo A2012-MAOS

19

MEDIANA : ( Datos agrupados)


Es el valor que divide a la distribucin de frecuencias en dos partes iguales.
(Valor central de un conjunto de datos que lo divide en dos partes iguales).
Smbolo

Me Md

Formula:

Me=Mediana
Li=Limite
n=Nmero total de observaciones
Ni=Frecuencia absoluta ms alta.
ai= Valor de intervalo de clase.
Li= Limite inferior de la clase con ms alta frecuencia.

Li-1, Li

20,25

i
100

i
100

25,30

150

250

30,35

200

450

35,40

180

630

40,45

41

671

n 671

Li=mayor cantidad de observaciones (30,35 ) tiene 200 observaciones.


20

n= es 671 ( es la de todas las ni)


N= se obtiene de
Li-1, Li

la siguiente frecuencia.
ni

Ni

20,25

100

100

25,30

150

250

30,35

200

450

35,40

180

630

40,45

41

671

n 671

ni=Sale asi, de la clase que tiene ms observaciones la inmediata anterior.


Ni=

450 es e dato que tiene ms observaciones, y usamos el inmediato


anterior.(Una clase)

Li-1, Li

20,25

i
100

i
100

25,30

150

250

30,35

200

450

35,40

180

630

40,45

41

671

n 671
21

Sustituyendo formula:

MEDIDAS DE DISPERSIN(Datos no agrupados)


Anlisis Univariado
Dispersin

Mtodo Numrico

Med.

Es la que estudia la distribucin d evalores analizados. Si estos se encuentran


ms o menos centrales.

Dispersin absoluta

RANGO

DESVIACIN ESTNDAR*
VARIANZA *
COEFCIENTE DE VARIACIN

RELATIVA -- COEFICIENTE DE VARIACIN*


22

>> MEDIDAS DE DISPERSIN PARA DATOS NO AGRUPADOS <<<


RANGO RECORRIDO:
Es la diferencia entre el valor mayor y el menor del grupo de datos.

DESVIO ( Datos no agrupados)


Es la diferencia entre las observaciones (o el dato) y la media aritmtica.
Simbolo

Formula

d= Xi X

Cinco nios de las edades 2,3,5,7,8 aos, que tienen os siguientes pesos
14,20,32,42,44 kgs

d=2-5
EJEMPLO
1 35
8
2 36
9
3 36
3
4 35

d= -3

d=7-5

d=2

(d)= Xi - X

358 354.17 = 3.83


369 354.17 = 14.83
363 354.17 = 8.83
358 354.17 =

3.83
23

8
5 33
6
6 34
1

336 354.17 = - 18.17


341 354.17 = -13.17

Desviacin media: (Datos no agrupados)


Es la media de los valores absolutos, OBTENIDOS MEDIANTE EL DESVIO d

Smbolo

Frmula

Datos
observados
1
2
3
4
5
6

Valor
Absoluto
d
358
3.83
3.83
369
14.85
14.85
363
8.83
8.83
358
3.83
3.83
336
-18.17
18.17
341
-13.17
13.17
62.66
Si algn valor sale negativo de la resta de (Xi X), se toman siempre
como valores positivos.

24

VARIANZA:
Es la suma de los cuadrados de los desvos (d).

Smbolo

N=

Frmula

Nmero de observaciones.

Xi= Datos del problema


= media aritmtica.

1
2
3
4
5
6

Datos
observados
358
369
363
358
336
341

3.83
14.85
8.83
3.83
-18.17
-13.17

Valor
Absoluto
3.83
14.85
8.83
3.83
18.17
13.17
62.66

Desvio
Cuadrados
14.66
219.92
77.96
14.66
330.14
173.44
830.78

Desviacin Estndar:
Es la raz cuadrada de la varianza

Smbolo

Formula

Sustituyendo valores

25

Coeficiente de Variacin:(Dato no arupados)


Es la desviacin estndar entre su media aritmtica, multiplicada por 100, ya
que se expresa en porcentaje.

Smbolo

C.V.

Frmula

Sustituyendo

MEDIDAS DE DISPERSIN (Datos Agrupados)


Anlisis Bivariado

Deviacin Media:
Smbolo Dm
Formula Dm= f ( X1-X)
N
Varianza:
Simbolo

S = f

( X1-X)
N
Desviacin Estandard:
26

Simbolo

S
S=

Formula

Coeficiente de Variacin
Simbolo

C.V.

Formula
Para poder obtener el coeficiente de variacin hay que
trabajar primero la Varianza, seguida por Desviacin estndar y el desvio .
Datos
resistencia
observados

1
2
3
4
5
6

358
369
363
358
336
341

Valor Absoluto

3.83
14.85
8.83
3.83
-18.17
-13.17

3.83
14.85
8.83
3.83
18.17
13.17
62.66

Desvio
Cuadrados

14.66
219.92
77.96
14.66
330.14
173.44
830.78

X = 354.71

S= s
27

S=(830.78)
6

S=

138.47

S=

11.76 una vez obtenida la desviacin estndar podemos calcular el

sustituyendo

CV

dando

ANLISIS GRAFICO
Es la 3ra etapa de la estadstica, que es la presentacin de datos.

ANLISIS BIVARIADO
Estudio que se centra en estudiar 2 variables.
28

Herramienta estadstica que tiene por objetivo encontrar la


relacin entre una variable independiente (X) y otra
dependiente (Y)
Ejemplo: Peso Estatura.

Correlacin lneal
Es un anlisis estadstico y este puede ser positivo (+) o negativo (--).
La hay de dos tipos:
Puede ser simple (X,Y)
Puede ser multiple
Siempre hay que construir un diagrama de dispersin.

r=+1
Cuando la variables tienden a crecer ( Y aumenta).

r=-1
Cuando la variables tienden a disminuir ( Y dismuye).
Existen algunos casos como los siguientes:

29

COEFICIENTE DE LA CORRELACIN LNEAL:


Indica la fuerza y la direccin de una relacin lineal entre 2 variables aleatorias.
Simbolo

Formula:

Ejemplo:

X
kilogramos

Y
produccin

XY

Y
30

N
4
6
10
14
18
20
72

2
6
14
22
30
34
108

8
36
140
308
540
680
1712

16
36
100
196
324
400
1072

4
36
196
484
900
1156
2776

La grafica muestra que existe una correlacin positiva.

Sustituyendo la formula

Un segundo ejemplo:
31

32

MODELOS DE DISTRIBUCIN DE
PROBABILIDADES
Distribucin normal
Se usa para variables continuas (peso, calificaciones, valores fracciones,
valores enteros).
Simbolo
Formula.

Z= Xi -

Z=Distribucin normal
Xi=

Valor de la primera observacin

=valor de la media de las observaciones


=

desviacin estndar poblacional

Ejemplo:
Se tienen 1000 rboles de durazno y la es de 27 Kgs, una desviacin
estndar de 4 kg sabiendo que es una produccin variable continua y por lo
tanto se distribuye normalmente, encuentre lo siguiente:
a)Cuantos arboles entre 13 y 15 kilogramos y su porcentaje
b)Cuantos arboles producen entre 20 y 30 kilogramos y su porcentaje
c)Cuantos arboles producen arriba de 35 kilogramos y su porcentaje

Xi
13 -- 15

27 es

33

20 -- 30
4

desv

poblacional

estand

> 35

Xi= Observaciones
=

27 (dato proporcionado)

= Desviacin estndar poblacional


Sustituyendo
.

Z= Xi -

Z= 13- 27
4

z= -3.5

Z= 15- 27
4

z= -3

Z= 20- 27
4

z= -1.75

Z= 30- 27
4

z= 0.75

El valor del primer Z


se busca en la
columna Z, y
dependiendo del
nmero de decimales
se usa la columna

Los valores de los


primeros tres Z , son
negativos,
34

Z= 35- 27
4

z= 2

Grafica de distribucin normal ( TABLA E DISTRIBUCION NORMAL Z)

35

Z= 13- 27
4

z= 0.4998

Z= 15- 27
4

z= -0.4987

Z= 20- 27
4

z= 0.4599

Z= 30- 27
4

z= 0.2734

Z= 35- 27
4

z= 0.4772

Siguiente paso:
0.4998 (Valor Z de la tabla correspondiente a limite de los 13
kilos) --3.5
-- 0.4987 (Valor Z de la tabla correspondiente a limite de los 15
kilos) 3.0
0.0011
Se multiplica por 1000 arboles ( Poblacin arboles) ,para sacar el porcentaje , que en
este caso el (0.0011*1000= da cantidad de arboles) (0.0011*100= % de la poblacin)
1.1 arboles los que estn produciendo entre 13 y 15 kilos
.11 % de la poblacin de de arboles que estn entre 13 y 15 kilogramos de produccin.

0.4599
kilos)-1.75
+ 0.2734
kilos) 0.75
0.7333

(Valor Z de la tabla correspondiente a limite de los 20


(Valor Z de la tabla correspondiente a limite de los 30

Se multiplica por 1000 arboles (Poblacin arboles) ,para sacar el porcentaje , que en
este caso el
(0.7333*1000= da la cantidad de arboles ) (0.7333 *100= % de la poblacin )
733.3 rboles los que estn produciendo entre 13 y 15 kilos
73.3 % de la poblacin de de arboles que estn entre 20 y 30 kilogramos de
produccin.

0.4772 (Valor Z de la tabla correspondiente a limite de los 35


kilos) 2
-- 0.5000 (Valor Z de la tabla correspondiente a limite de esta)
0.0228
Se multiplica por 1000 arboles (Poblacin arboles) ,para sacar el porcentaje , que en
este caso el
(0.0228*1000= da la cantidad de arboles) (0.7333 *100= % de la poblacin)

36

22.8 rboles los que estn produciendo ms de 35 kilos


2.28
% de la poblacin de de arboles que producen ms de 35
produccin.

kilogramos de

Graficando en la curva.

Hasta el 22-03-2012

** ++
Prueba t t de student.
Este tipo de estadstico se usa para muestras menores de 30 observaciones, y
se comparan las poblaciones mediante pruebas de hiptesis.
Ho= Hiptesis nula: Es un supuesto que se enuncia con la intencin de ser
rechazada.
Ha= Hiptesis alterna: Es lo opuesto a la hiptesis nula, es importante por 2
razones (Define la direccin de la zona de rechazo, dependiendo del enunciado
la [ Ha se divide en Ha de una cola ][Ha de dos colas].
Hiptesis: Es una suposicin o supuesto a verificar en una poblacin.
La Ha (Hiptesis alterna) Define la direccin de la zona de rechazo ( ,
glibertad)
= nivel de significancia ( los ms usados 0.05, 0.01)
37

gl

= n 1 (Nmero observaciones menos 1).

Smbolo

Formula

= Media aritmtica muestral

= media poblacional
s = Desviacin estndar
n = Nmero total de observaciones

*** Se trabaja con las tablas de valores de la curva de la distribucin t


Ejemplo:
En un distrito de riego se paga el agua en forma volumtrica, los agricultores del
modulo sostienen que el segundo riego de auxilio fue menor de 12 cm, que era la
lmina que se debera aplicar.
El jefe del distrito necesita demostrar que e segundo riego fue cuando menos de 12
cm, por lo que se toma una muestra de 10 observaciones en los predios de 10
agricultores, de la cantidad de agua usada en sus parcelas., a la entrada de cada
parcela.
Observaciones:
12.3, 11.6, 11.9, 12.0, 1.7, 12.2, 11.9, 12.0, 12.0, 11.8

= 11.9
son las siguientes:

n=

10 observaciones

Ho= LR < 12 cm
*Ha=LR>= 12

cm

S=

Se elaboran 2 Hiptesis que

0,744 (desviacin estndar)


=0.05

= 12 (lamina riego)
38

Sustituyendo en la formula

Donde gl = 9
Buscar en la Tabla F Distribucin

39

Esto es T de Tabla = 2.262


Tabla Calculada < Tabla T

Se grafica asi:

40

Si la calculada cae FUERA de la zona de rechazo (Zr) SE RECHAZA la


hiptesis alterna (Ha), y se rechaza la hiptesis nula (Ho).

Si la calculada cae en la zona de rechazo (Zr) NO SE RECHAZA la hiptesis


alterna (Ha), y se rechaza la hiptesis nula (Ho).
Ho= LR < 12 cm
*Ha=LR>= 12

cm

Resumen ( Hiptesis):
Las Hiptesis pueden ser Negativas(-) Positivas(+)
1.- Ho = T1 < T2

Vs

Ha= T1>= T2

2.-Ho = T1 > T2

Vs

Ha = T1 =< T2

3.-Ho = T1 = T2

Vs

Ha = T1 = T2

El signo de la Hiptesis indica en que lado de la curva esta la hiptesis.


41

= Positivo, es una cola


= Negativo, es una cola
= No hay direccin, es de 02 colas.

ZONA DE RECHAZO:
Simbolo Z

Frmula
Ejemplo:
El gerente de la tienda quiere conocer quines de sus vendedores atienden a
mas de 15 clientes por semana, y selecciono a un grupo de 36 vendedores y us
una muestra de 17 prospectos, con una varianza de 9
= 17

n = 36
S= 3

= 15
s= 9
gl = (n -1) 35

Sustituyendo formulas:

Usando las tablas F de distribucin

t
42

El valor cay en la ZONA DE RECHAZO (Z=4), por o tanto se rechaza Ho, y se


acepta Ha

REGRESIN LINEAL SIMPLE


43

La regresin lineal simple, se espera que las variables estn asociadas


linealmente, o sea que los datos se puedan ajustar a una lnea recta.
La REGRESION se usa para hacer predicciones a futuro, las condiciones de
aplicacin deben de ser las mismas que en el modelo generado originalmente.
NOTA
>>>>>>>>
<<<<<<<<<

SIMBOLO

SIEMPRE SE DEBE CONSTRUIR UN DIAGRAMA DE DISPERSIN.

Frmula

= + Xi

Ejemplo:

La variable dependiente es Y (Rendimiento) , siendo la variable X ( Cantidad de


P O aplicada).
Se construye una tabla:

X(PO)

Y
(Rendimiento)

0
10
20
30
40
50
60
70
80
90
100

6.4
6.8
7.0
5.5
7.4
7.7
8.1
8.4
8.2
8.6
8.9

ESTE MODELO SOLO ES APLICABLE A


LA REGIN DONDE FUE CREADO.....

Se construye una grfica de dispersin:

44

Las incgnitas son:

Construimos la tabla de frecuencias:


n

XY

1
2
3
4
5
6
7
8
9
10
11
SUMAS

0
10
20
30
40
50
60
70
80
90
100
550

6.4
6.8
7
7.5
7.4
7.7
8.1
8.4
8.2
8.6
8.9
85

0
100
400
900
1600
2500
3600
4900
6400
8100
10000
38500

0
68
140
225
296
385
486
588
656
774
890
4508

40.96
46.24
49
56.25
54.76
59.29
65.61
70.56
67.24
73.96
79.21
663.26

Las ecuaciones para los estimadores se obtienen despejando y

ECUACIONES ESTIMADORES:

45

46

Ahora ya podemos despejar la frmula para determinar los


valores predichos

= yee predicha
Usando los valores ahora conocidos
= 0.02345
= 6.5547

47

XY

1
2
3
4
5
6
7
8
9
10
11
SUMAS

0
10
20
30
40
50
60
70
80
90
100
550

6.4
6.8
7
7.5
7.4
7.7
8.1
8.4
8.2
8.6
8.9
85

0
100
400
900
1600
2500
3600
4900
6400
8100
10000
38500

0
68
140
225
296
385
486
588
656
774
890
4508

40.96
46.24
49
56.25
54.76
59.29
65.61
70.56
67.24
73.96
79.21
663.26

6.57
6.78
7.02
7.25
7.49
7.72
7.96
8.19
8.43
8.66
8.89

La grafica es la siguiente:

48

ANLISIS DE VARIANZA:
Tambin conocida como ANDEVA
Es una herramienta estadstica
Se prueban hiptesis

F.V.
Regresio
n
MODELO

G.L
.

S.C.

C.M.

F (c )

F(tablas)

ERROR

n-2

TOTALES

n-1

SCTotal
SCR

--

FV=Fuente de variacin G.L.=Grados de lIbertad S.C.= Suma de cuadrados


C.M.=Cuadrado medio F=F calculada para el modelo F(t)=F de tablas
Ejemplo de fertilizante:
49

XY

1
2
3
4
5
6
7
8
9
10
11
SUMAS

0
10
20
30
40
50
60
70
80
90
100
550

6.4
6.8
7
7.5
7.4
7.7
8.1
8.4
8.2
8.6
8.9
85

0
100
400
900
1600
2500
3600
4900
6400
8100
10000
38500

0
68
140
225
296
385
486
588
656
774
890
4508

40.96
46.24
49
56.25
54.76
59.29
65.61
70.56
67.24
73.96
79.21
663.26

6.57
6.78
7.02
7.25
7.49
7.72
7.96
8.19
8.43
8.66
8.89

Sustituyendo MODELO

COEFICIENTE DE DETERMINACIN
Es una medida descriptiva del grado de asociacin entre las variables X,
Y, asi se calcula.
Simbolo

Formula

R=

SC REGRESION/SC TOTAL

50

S-ar putea să vă placă și