Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICA E INGENIERIA LA ESTADSTICA se ha hecho sentir en todos los campos y/o especialidades como
en la ingeniera, en la administracin, y en la industria. Se aplica en la produccin, en el uso de materiales y fuerza de trabajo, en el desarrollo de nuevos productos, etc. LA ESTADSTICA se considera como una herramienta de la ingeniera ya que sin ella no se puede apreciar, entender, comprender o aplicar parte de los trabajos que se realizan en su campo. El mtodo estadstico en ingeniera se puede utilizar de diferentes formas. Como para: estimar el coeficiente de dilatacin trmica de un metal Comparar la resistencia de dos aleaciones. En el control de calidad, con sus respectivos diagramas (medias, desviaciones), calidad de produccin de masa, problemas de inspeccin muestral, etc. En la aplicacin de la confiabilidad de los productos. En el rea de la investigacin de operaciones usan la teora de probabilidad y estadstica en forma general.
ESTADISTICA
Es una ciencia que usa un conjunto de mtodos y/o tcnicas que son necesarias para RECOLECTAR, RESUMIR, CLASIFICAR, ANALIZAR e INTERPRETAR , el comportamiento de los datos con respecto a una caracterstica materia de estudio. Es decir que se encarga de obtener informacin para describirla y luego la usa para predecir "algo" de ella. Divisin de la Estadstica: 1.- Estadstica Descriptiva 2.- Estadstica Inferencial
1.- ESTADISTICA DESCRIPTIVA.Se conoce como el conjunto de mtodos usados para la RECOLECCIN, PRESENTACIN Y CARACTERIZACIN de un conjunto de datos. En conclusin la estadstica descriptiva, ANALIZA Y DESCRIBE los datos.
2.- ESTADISTICA INFERENCIAL.Es la encargada de la PREDICCIN DE ALGO. Es la que posibilita la toma de decisiones en base a una informacin parcial obtenida mediante tcnicas descriptivas. Usa el clculo de la probabilidad, en las decisiones.
La Poblacin puede ser: Finita.- cuando los elementos se pueden contar, o el nmero de elementos que la
conforman se puede determinar. Ejemplo: - Todos los alumnos de la URP - Toda la produccin de tornillos durante un mes Infinita.- cuando el nmero de elementos que la conforman no se puede determinar. Ejemplo: - Todas las estrella del firmamento
2.- MUESTRA.Es una parte relativamente pequea de la poblacin, o tambin se define como un subconjunto de la poblacin. Ejemplo: Un grupo de 500 alumnos de la URP
3.- UNIDAD ESTADISTICA.Es un solo elemento de la poblacin o muestra. Ejemplo: un alumno de la URP
4.-CARACTERISTICA (VARIABLE)
Es lo que le interesa al investigador para su estudio o trabajo La caracterstica es la propiedad de los fenmenos y puede tomar diferentes valores Ejemplo: Edad, sexo, peso, cociente intelectual, ventas. LA VARIABLE.-Esta relacionada con la caractersticas y se denota con letras maysculas del alfabeto, X, Y, Z. Las variables pueden ser: - CUALITATIVA.Se refiere a la cualidad que presenta un fenmeno (se expresa en palabras) - DISCRETA.Son valores enteros. - CONTINUA. Son infinitos valores que se encuentran entre dos nmeros.
La suma de las frecuencias absolutas es igual al nmero total de datos (n) Frecuencias Relativa (hi).- se obtiene usando la operacin de divisin (fi/n) y sus valores son expresados en forma decimal. La suma de las (hi) por definicin es igual a 1.0000. ( hi = 1.0000) Frecuencia Absoluta acumulada (Fi).- se obtiene de sumar las frecuencias absolutas (fi) hasta un determinado valor de la variable. La primera frecuencia absoluta (F1) es igual a la primera frecuencia absoluta simple (f1) La ltima frecuencia absoluta (Fm) es igual al nmero total de datos (n). (Fm = n) Frecuencia Relativa acumulada (Hi).- se obtiene de sumar las frecuencias relativas (hi) hasta un determinado valor de la variable. La primera frecuencia relativa (H1) es igual a la primera frecuencia relativa simple (h1) La ltima frecuencia relativa (Hm) es igual a la unidad. Frecuencia Absoluta acumulada decreciente (Fi).- se obtiene de restar las frecuencias absolutas simples (fi) La primera frecuencia absoluta acumulada (F1) es igual a n (Nmero total de datos) (F1 = n) La ltima frecuencia absoluta acumulada (Fm) es igual a fm Frecuencia Relativa acumulada decreciente (Hi).- se obtiene de restar las frecuencias relativas (hi). La primera frecuencia relativa acumulada (H1) es igual a 1.000 (H1 = 1.0000) La ltima frecuencia relativa acumulada (Hm) es igual a hm
Porcentajes ( % ) % %
fm n = fi
hm 1.0000
% 100%
Ejemplo: Se seleccionan 40 docentes de la facultad de Ingeniera y se le pregunta sobre su condicin de trabajo, las respuestas que se obtienen son las siguientes: C S C S N P H N P H S P S C N C S H S S C C N C S C P N H S S C P S C P P C S N Leyenda: C= Contrato Anual, S= Contrato Semestral, N= Nombrado tiempo completo, P = Nombrado tiempo parcial, H = Honorarios profesionales. a) b) c) d) e) Se pide formar la distribucin de frecuencias. Grafico circular de frecuencia absoluta y frecuencia relativa Dar el valor y significado de f3 y h2 Graficar una barra porcentual Graficar una barra de frecuencia absoluta.
II. DISTRIBUCION DE FRECUENCIAS PARA DATOS CUANTITATIVO DISCRETO.Grficos adecuados: Barras o bastones para (fi y hi) y las escaleras para las acumuladas (Fi, Hi, Fi, Hi) Frec. Absoluta fi f1 f2 f3 Frec. Relativa hi h1 h2 h3
Variable Xi X1 X2 X3
Xm TOTALES
fm n = fi
hm 1.00
Ejemplo.- A un grupo de estudiantes de ingeniera se le pregunta sobre el nmero de cursos aprobados y las respuestas son las siguientes: 3 2 5 1 3 5 3 6 4 4 4 3 6 2 3 1 5 4 3 2 6 2 4 1 4 5 2 6 2 3 4 3 4 6 5 3 1 4 5 2 2 4 3 3 6 4 2 4
a) Se pide formar la distribucin de frecuencias b) Graficar la frecuencia absoluta y frecuencia relativa c) Formar la distribucin de frecuencias relativas.
d) e) f) g) h)
Graficar una escalera porcentual Formar la distribucin de frecuencias absolutas Graficar una escalera decreciente de frecuencia absoluta Dar valor y significado de f2 , h4, F3 , F4. H`3. Graficar la frecuencia absoluta acumulada creciente
III. DISTRIBUCION DE FRECUENCIAS PARA DATOS CUANTITATIVO CONTINUO.Grficos adecuados: 1.-Histogramas, 2.- polgonos de frecuencias. (Para las frecuencias simples (fi y hi)) 3.-Ojivas (Para las frecuencias acumuladas crecientes y decrecientes (Fi , Hi, Fi , Hi )) marca clase Xi Frec. Absoluta fi Frec. Relativa hi
TOTAL
n = fi
1.0000
INTERVALOS Tipos de intervalos: - cerrados [ ] - semicerrados: por la derecha ( ] Por la izquierda [ ) Tipos de Lmites.- Lmites Aparentes (cuando los intervalos son cerrados) - Lmites Reales de Clase (cuando los intervalos son semicerrados) Proceso de obtencin de los intervalos: I.- Determinar: El nmero menor (X min.) El nmero mayor (X mx.) II.- Calcular el Rango o Recorrido ( R ) R = X max - X min III.- Determinar el nmero de intervalos (m ) Regla de Sturgen: m = 1 + 3.322 lg.n Emprico: m = n Propiedad.- m siempre es un nmero entero IV.- Calcular la Amplitud ( C ) de cada intervalo Tambin se le conoce como distancia de cada intervalo C = R m Propiedad.- La magnitud de la amplitud debe de ser igual al de los datos originales. (X min. y X mx.)
V.- Correccin (D) D = (m)*(C) R D > 0. Satisface la amplitud (C) y el numero de intervalos ( m) y la diferencia se reparte equitativamente en los extremos ( X min y X mx.) D < 0. Se tiene que efectuar 2 correcciones. En D1 solo se corrige la amplitud (C corregido) En D2 solo se corrige el nmero de intervalo (m corregido) De los 2 se escoge el que tiene el valor menor. D = 0. Satisface la amplitud (C) y el numero de intervalos ( m) y se forma los intervalos con los X min. y X mx. iniciales. Ejemplo.-Los siguientes datos corresponden a los pesos de 45 alumnos y los resultados se muestran a continuacin: 60 67 72 a) b) c) d) e) f) g) h) 75 53 75 68 68 61 76 72 63 70 89 74 72 75 63 78 79 73 58 87 81 65 83 75 73 85 69 79 69 59 67 69 71 67 72 84 59 79 73 62 71 84
i)
Elaborar la distribucin de frecuencias(usando la regla de sturgen) Graficar un histograma de frecuencia absoluta Graficar un polgono de frecuencia absoluta Graficar un polgono porcentual Formar una distribucin de frecuencias absolutas Graficar una ojiva porcentual creciente Graficar una ojiva de frecuencia relativa decreciente graficar una ojiva de frecuencia absoluta decreciente Dar valor y significado a f3, h5, H4, H2
\ y1 y2
yk f x.
f1k fx 1
...
fjk fxj
Donde: (f x .) Se denota a la marginal de la variable X (f . y) se denota a la marginal de la variable Y n = es el nmero total de pares ordenados 2.- Distribucin Bidimensional de frecuencias relativas (hxy). (Tiene marginales)
Y \ X Y1 Y2
.. .. .. .. .. .. ..
Yk hx.
h1k hx1
3 5 6 2 5 3 4 5 7 2 3 3 Calcular la media aritmtica del nmero de cursos matriculados y de su significado e indique el tipo de variable y el tipo de dato. PARA DATOS TABULADOS.Es la sumatoria del producto de la variable con la frecuencia dividida por el nmero total de datos (n). _ FORMULA: X = Xifi n Ejemplo: En la siguiente distribucin de frecuencias con seis intervalos de clase se muestran las ganancias en miles de soles, de un grupo de empresas de Lima. Ganancias 12.5 - 17 17.5 - 22 22.5 - 27 Empresas 8 12 10 14 18 13 a) Calcule la media aritmtica y exprese su significado
PROPIEDADES P1.- La unidad de medida de la Media Aritmtica es la misma que la unidad de las observaciones. P2.- La Media Aritmtica es influenciada por todos los valores de la serie de datos. P3.- Si a cada valor de los datos, se le suma o resta una constante, la media aritmtica del nuevo conjunto es igual a la media aritmtica original ms menos la constante. _____ __ Es decir: XK = XK P4.- Si a cada valor del conjunto de datos, se le multiplica por una constante, la media aritmtica del nuevo conjunto es igual la Media Aritmtica original multiplicado por la constante. _____ _ Es decir: X*K = K* X P5.- La suma algebraica de las desviaciones de cada valor de la variable con la media aritmtica es igual a cero. _ (Xi - X) = 0 P6.- Dado dos (2) conjuntos de datos, cada uno con un nmero de observaciones, se puede obtener la Media Total, mediante la siguiente formula. _ __ XT = ni* xi. ni 2.- MEDIANA Es un valor central, ya que divide a la distribucin en dos partes iguales, cada parte tiene el valor de 50%. Se denota: Md PARA DATOS NO TABULADOS (pocos datos) Se obtiene de la siguiente forma: 1) Ordenar los valor de menor a mayor 2) Hay que determinar si el nmero de datos es: IMPAR.- ( n = impar). Entonces Md = X(n+1)/2
PAR.-
( n = par )
Ejemplos: los pesos de ciertas cajas de un almacn se detallan a continuacin: 55 62 72.5 48 60 68 Calcule su mediana y dar su significado. PARA DATOS TABULADOS a) 1.2.3.4.5.SIN INTERVALOS Calcular la Frecuencia Acumulada ( FJ ) Posicin de la mediana ( n/2) Hallar el FJ (que es el valor inmediatamente superior a la posicin de la mediana) Hallar el FJ-1 (valor anterior al FJ) Comparar el FJ-1 con n/2 Y se tiene 2 condiciones: (<) o (=) Entonces: Md = X J cuando es FJ-1 < n/2 Entonces: Md = (X J + X J-1) cuando es FJ-1 = n/2 Ejemplo: hoja adicional de problemas b) 1.2.3.4.5.6.7.CON INTERVALOS Calcular la Frecuencia Acumulada (FJ) Posicin de la mediana (n/2) Hallar el FJ Hallar el FJ-1 Hallar el lJ (que es el lmite real inferior de la recta del FJ) Calcular la amplitud ( CJ ) del intervalo de la recta de FJ Aplicar la FORMULA.- Md = lj + (n/2 Fj-1) * Cj 44 82 77.6 64.5 55.3 49.7
( Fj Fj-1 )
Ejemplo: El tiempo que demoran un grupo profesores en llegar a la universidad (en minutos), se muestra en la siguiente distribucin de frecuencia acumulada. Tiempo(mint) 10 14 15 - 20 21 - 28 29 35 36 - 43 Profesores 1.00 0.87 0.52 0.29 0.12. Calcule la mediana y exprese su significado 3.- MODA Se denota Mo y se define de acuerdo ha como se presente los datos: Para DATOS NO TABULADOS Es el valor de la variable que se repite ms veces Ejemplo: Para DATOS TABULADOS: a) SIN INTERVALOS Es el valor de la variable que tiene la frecuencia ms alta Ejemplo: b) CON INTERVALOS Es el valor de la variable donde tiende a concentrarse mas la informacin y se obtiene con la siguiente FORMULA. Mo = lmo + ( 1 ) *Cmo (1 + 2 )
Ejemplo: hoja adicional de problemas 4.- CUANTILAS 4.1- CUARTILES Se denota Qi Son tres ( 3 ) nmeros que dividen a la distribucin en cuatro partes iguales. Valor de cada parte es de 25 %. FORMULA PARA DATOS NOTABULADOS:
Qi = i(n+1)/4
FORMULA PARA DATOS TABULADOS: Para datos tabulados la posicin es: (in/4) donde (i = 1, 2,3) 1.- Tabulados sin Intervalos.-
entonces entonces
Q i = Xj Qi = (Xj + Xj-i)/2
Di = i(n+1)/10
FORMULA PARA DATOS TABULADOS: Para datos tabulados la posicin es: (in / 10) donde ( i = 1,2,......,9) 1.- Tabulados sin Intervalos.-
D i = Xj Di = (Xj + Xj-i)/2
Pi = i(n+1)/100
FORMULA PARA DATOS TABULADOS: Para datos tabulados la posicin es: (in / 100 ) donde ( i= 1,2,....., 99 ) 1.- Tabulados sin Intervalos.-
P i = Xj Pi = (Xj + Xj-i)/2
10
MEDIDAS DE DISPERSION
(Tambin conocida como medidas de Variacin). Tiende a medir el grado en que los datos numricos que se encuentran alrededor de un valor central. I.- VARIANZA Se denota con V(X) se define: COMO LA MEDIA ARITMTICA DEL CUADRADO DE LAS DESVIACIONES DE
LOS DATOS CON RESPECTO A LA MEDIA ARITMTICA DE ESOS DATOS.
Es el grado promedio de dispersin al cuadrado. FORMULAS: 1.- Para DATOS SIN TABULAR __ V(x) = (Xi X)2 n 2.- Para DATOS TABULADOS __ V(x) = (Xi X)2 * fi n Ejemplo: hoja adicional de problemas PROPIEDADES 1.- La varianza siempre es un nmero NO NEGATIVO V (X) 0 2.- La varianza de una constante es igual a cero V (K) = 0 donde K = constante 3.- Si a cada valor de la serie de datos se le SUMA O RESTA una constante; la varianza de la nuevas serie de datos, es igual a la varianza original. V ( Xi K ) = V(X) V (K) = V(X) 4.- Si a cada valor de la serie de datos se le multiplica una constante; la varianza de la nueva serie de datos es igual a la varianza original multiplicado por la constante al cuadrado. V ( Xi *K ) = K2 V(X) 5.- Dado dos series de datos donde se conoce la media aritmtica y la varianza de cada serie se puede calcular la varianza de las dos series mediante la siguiente formula: VT = ni*Vi. ni II.- DESVIACION Estndar Se define como la raz cuadrada positiva de la varianza. Da un grado promedio simple de variacin. La unidad de media es la misma que la de los datos observados FORMULAS: a) DATOS SIN TABULAR __ S(x) = (Xi X)2 n b) DATOS TABULADOS __
11
(Xi X)2 * fi n Ejemplo: Hoja adicional de Problemas S(x) = PROPIEDADES 1.- Es siempre un valor positivo 2.- Es influenciado por todos los valores de la serie de datos. 3.- Mayor influencia ejerce los valores extremos que los que estn cerca del promedio. 4.- Si la distribucin es normal o ligeramente asimtrica se cumple la siguiente relacin: _ X S = 68.23% = 68% _ X 2S = 95.46% = 95% _ X 3S = 99.73% = 99.7 CORRECCION DE SHEPPARD Se usa solo para datos agrupados con intervalos de amplitudes iguales. El factor es (C2 / 12) su frmula V corregida = V(x) C2 12 Ejemplo: Hoja adicional de Problemas III.- RANGO (DESVIACION) SEMIINTERCUARTILICA Mide la dispersin entre el 50% de los valores centrales No esta afectada por los valores extremos Una desviacin semiintercuartilica baja, indica una pequea variacin entre el 50% de los datos centrales Se denota con RS RS = ( Q3 Q1) 2 Ejemplo: Hoja adicional de Problemas IV.- COEFICIENTE DE VARIACIN ( C.V.) SE USA PARA COMPARAR DOS O MS MUESTRAS. Significa el nmero de veces que supone la desviacin tpica (estndar) con respecto a la media aritmtica. Generalmente se expresa en porcentaje Es independiente de la unidad de medida en que estn expresados los datos. Es mejor o aceptable la tiene menor coeficiente de variacin. C.V. = ( S )*100 _ X Ejemplo: Hoja adicional de Problemas
MEDIDAS DE ASIMETRIA
Nos indica la deformacin horizontal de la distribucin
12
La distribucin es simtrica cuando su curva es igual a una campana, la media aritmtica, la mediana y la moda coinciden. Grafico. La distribucin tiene asimetra positiva (a la derecha).- si su ramificacin es extendida hacia la derecha o hacia los valores mayores. Grafico: La distribucin tiene asimetra negativa (a la izquierda) la ramificacin extendida hacia la izquierda o hacia los valores pequeos. Grafico:
I.- PRIMER COEFICIENTE DE PEARSON Se denota A1, nos indica el sesgo de la distribucin Se usa cuando la distribucin es unimodal. Formula: _ A1 = (X Mo) S Propiedades: A1 = 0 la distribucin es simtrica A1 > 0 la distribucin tiene sesgo positivo esta sesgada a la derecha. A1 < 0 la distribucin tiene sesgo negativo est sesgada a la izquierda. Ejemplo: Hoja adicional de Problemas II.- SEGUNDO COEFICIENTE DE PEARSON. Se denota con A2, nos indica el sesgo de la distribucin Se usa cuando se tiene ms de una moda. Formula: _ A2 = 3 * (X Md) S Propiedades: A2 = 0 la distribucin es simtrica A2 > 0 la distribucin tiene sesgo positivo esta sesgada a la derecha. A2 < 0 la distribucin tiene sesgo negativo est sesgada a la izquierda. Ejemplo: Hoja adicional de Problemas III.- MEDIA ASIMETRICA Se denota con Asq Se usa cuando los intervalos no tienen definidos los lmites de los intervalos. Casos especiales de distribuciones. Formula: Asq = Q1 + Q3 2*Q2 Q3 Q1 Propiedades: Asq. = 0 la distribucin es simtrica
13
Asq. > 0 la distribucin tiene sesgo positivo esta sesgada a la derecha. Asq. < 0 la distribucin tiene sesgo negativo est sesgada a la izquierda. Ejemplo: Hoja adicional de Problemas
b) Relacin Inversa A medida que los valores de x son pequeos los valores de y son grandes y viceversa. (Su forma es descendente).Grfico:
c) Relacin nula Cuando los valores de X e Y estn dispersos sin coordinacin. Grfico:
d) Relacin Directa Perfecta Cuando los valores de X e Y todos caen en una recta ascendente. Grfico
e) Relacin Inversa Perfecta Cuando los valores de X e Y todos caen en una recta descendente. Grfico:
II. COEFICIENTE DE CORRELACION Es el estadgrafo que mide el grado de relacin que existe entre dos variables que estn relacionadas entre si, se denota por r
14
-1 r +1
PROPIEDADES: a) Si b) Si c) Si d) Si e) Si r>0 r<0 r=0 r=1 r = -1 existe relacin directa existe relacin inversa existe relacin nula existe relacin directa perfecta existe relacin inversa perfecta
C(X , Y)
V(x) V(y)
donde
C(X,Y) = XY
n
- XY
Donde C (X,Y) ES LA COVARIANZA LA COVARIANZA, mide el grado de dispersin o variacin cuando se trabaja con 2 variables (X,Y)que estn relacionadas. Sus valores pueden ser positivos, negativos o cero FORMULA PARA DATOS TABULADOS ___
C(X,Y) = XYfxy n
- XY
Ejemplo: Hoja adicional de Problemas III.-RECTA DE REGRESION DE MINIMOS CUADRADOS Nos permite estimar o predecir valores futuros o anteriores o aquellos valores que no estn definidos dentro de la serie de datos. Existen dos rectas de regresin: 1.- Recta de Regresin de Y sobre X
2.- Recta de Regresin de X sobre Y a) Recta de Regresin de Y sobre X La ecuacin es Donde: b =. nXY - XY Lic. Amrica Paula Campomanes Morn 15 = a + b (x)
[nX2 (X)2]
a = Y (b ) X O tambin b = C(X , Y)
S(x)
X* = a + b (y)
ESTIMAR DATOS QUE SIGUEN SERIE DE TIEMPO Se tiene que cambiar las variables tiempos (aos, meses o das) por nmeros naturales en forma consecutiva. (Ejem: 1, 2, 3, 4,, etc.). La variable tiempo se considera como variable independiente(X). Ejemplo: la siguiente tabla nos muestra las ventas de equipos mecnicos durante 6 aos Aos Ventas a) b) c) d) e) f) 2009 3.3 2007 3.7 2008 4.8 2009 4.3 2010 4.9 2011 5.5
Estime la produccin para el ao 2012 Estime en que ao la venta ser de 6.8 miles de dolares. Grafique las 2 rectas. Sobre el diagrama de dispersin. Grado de relacin que existe entre los aos y la venta Calcular el valor promedio de la venta Use el diagrama de dispersin, para determinar la relacin existe entre los aos y la venta
16