Sunteți pe pagina 1din 8

UNIVERSIDAD DE LIMA

FACULTAD DE INGENIERÍA DE SISTEMAS


DEPARTAMENTO ACADÉMICO DE INGENIERÍA DE SISTEMAS

Curso : Probabilidades
Profesor : Jorge Chue Gallardo

ORIGEN DE LA ESTADÍSTICA

La idea original de la "estadística" era la colección de información sobre y


para el "Estado". El nacimiento de la estadística ocurrió a mediados del siglo
XVII. Un plebeyo, John Graunt, nativo de Londres, analizó una publicación
semanal de la iglesia emitida por el empleado de la parroquia local quien
registró el número de nacimientos, bautizos, y muertes en cada parroquia.

Graunt que era un tendero organizó estos datos en las formas que se conocen
como estadísticas descriptivas que se publicaron en la obra “Natural and
Political Observation Made upon the Bills of Mortality”. En un plazo muy
breve, Graunt fue elegido como miembro de Sociedad Real. Por esta razón, la
estadística tiene prestado algunos conceptos de la sociología como el concepto
de "Población". También se ha argumentado que como la estadística
normalmente involucra el estudio de la conducta humana no se le puede exigir
la precisión de las ciencias físicas.

La probabilidad tiene una historia más antigua que se origina del estudio de
los juegos de azar en el siglo XVI. La Teoría de Probabilidad como una rama
de la matemática fue desarrollada por Blaise Pascal y Pierre de Fermat en el
siglo XVII. En el presente siglo, la probabilidad es utilizada en muchos
campos; por ejemplo, para controlar el flujo de tráfico a través de un sistema
de carreteras, en una central telefónica, o una computadora; así como para el
hallazgo y la composición genética de individuos o poblaciones, el control de
calidad, seguros, inversión, y otros sectores de la economía como el comercio
y la industria.

¿QUÉ ES LA ESTADÍSTICA?

En este mundo tan diverso, no existen dos cosas que sean exactamente iguales.
Un estadístico está interesado en ambos; es decir, en sus diferencias y
similitudes, i.e., los patrones que se repiten y las desviaciones que han
ocurrido.
Las tablas actuariales publicadas por las compañías de seguros reflejan el
análisis estadístico de la esperanza promedio de vida de hombres y mujeres de
cualquier edad. De estos números, las compañías de seguros calculan los
valores de las pólizas apropiados para un individuo en particular.

El análisis exploratorio hace uso de técnicas numéricas y gráficas para


estudiar patrones y desviaciones de patrones. Las técnicas estadísticas
descriptivas ampliamente usadas son: distribución de frecuencias, histograma
de la distribución, caja y diagramas de dispersión, ploteos de normales,
residuales, curvas ROC, etc.

El modelamiento gráfico es una colección de técnicas poderosas y prácticas


para simplificar y describir interrelaciones entre muchas variables, basadas en
la fundamental correspondencia entre el concepto estadístico de independencia
condicional y el concepto gráfico-teórico de separación.

Cuando se examinan distribuciones de datos, usted debe ser capaz de


descubrir características importantes, tales como forma, posición, variabilidad
y valores extremos. También de la observación cuidadosa de patrones en los
datos, usted puede formular afirmaciones acerca de las relaciones entre las
variables. La noción de cómo una variable puede asociarse con otras se
presenta en casi todas las técnicas estadísticas, desde simples comparaciones
de proporciones hasta regresión lineal. La diferencia entre asociación y
causalidad debe acompañar este desarrollo conceptual.

Los datos deben ser recolectados de acuerdo a un plan bien formulado si se


desean realizar conjeturas válidas. El plan debe identificar variables
importantes relacionadas a la conjetura y debe especificar cómo ellas serán
medidas. Del plan de colección de datos, un modelo puede formularse
respecto al cual se pueden realizar inferencias.

El objetivo principal de la estadística es realizar inferencia (predicción, toma


de decisiones) sobre ciertas características de una población basada en
información contenida en una muestra del azar de la población entera.

La estadística es la ciencia de la “buena decisión” en condiciones de


incertidumbre y se usa en muchas disciplinas como análisis financiero,
econometría, producción y operaciones que incluyen mejora de servicios,
comercialización e investigación. La estadística proporciona conocimientos y
técnicas útiles para interpretar datos que se presentan en una amplia variedad
de aplicaciones prácticas. Un típico curso de estadística busca desarrollar la
capacidad del estudiante para tomar buenas decisiones. y cubre los siguientes
tópicos: estadísticas descriptivas (colección, descripción, análisis, y resumen
de datos), probabilidad, distribuciones binomial y normal, prueba de hipótesis
e intervalos de confianza, regresión lineal y correlación.

En síntesis, se puede afirmar que la estadística es la ciencia de la toma de


decisiones con respecto a las características de un grupo de personas u objetos
en base a la información numérica obtenida de una muestra al azar
seleccionada del grupo.

Población: Una población es cualquier colección entera de las personas,


animales, plantas o cosas de quienes se puedan coleccionar datos. Es el grupo
entero que se desea estudiar, describir o extraer conclusiones.

EXPERIMENTO ESTADÍSTICO

Para hacer cualquier generalización sobre una población, una muestra del azar
de la población es extraida y analizada. Para cada población hay muchas
posibles muestras. Una estadística de la muestra da información sobre un
parámetro de la población correspondiente. Es importante que el investigador
defina la población cuidadosa y completamente antes de recolectar la muestra,
incluso una descripción de los miembros que serán incluidos.

Ejemplo: La población para un estudio de salud infantil podría ser todos los
niños nacidos en el Perú en la decada de los 90. La muestra podría ser todos
los bebés nacidos el 7 mayo en cualquiera de los años.

Un experimento es cualquier proceso o estudio que produce la recolección de


datos. En estadística, el término se restringe normalmente a situaciones en las
que el investigador tiene control de algunas de las condiciones bajo las cuales
el experimento tiene lugar.

Ejemplo: Antes de introducir un tratamiento con una nueva droga para reducir
la presión alta, el fabricante lleva a cabo un experimento para comparar la
efectividad de la nueva droga con respecto al que se usa actualmente. Se
registran datos de aquellos que fueron escogidos al azar para recibir la nueva
droga y de aquellos que recibieron la droga antigua. El investigador debe
tener control de la manera en la que ellos se asignan al tratamiento.
Unidad Experimental: Una unidad es una persona, animal, planta o cosa que
es estudiada por el investigador; los objetos básicos en que el estudio o el
experimento se lleva a cabo. Por ejemplo: un persona, un árbol, una muestra
de tierra, una bolsa de semillas, etc.

El plan del experimento es una herramienta importante por aumentar la


proporción de adquirir nuevo conocimiento que a su vez puede usarse para
ganar ventaja competitiva, acortar el ciclo de desarrollo del producto, producir
nuevos productos y procesos que satisfagan las expectativas del cliente.

La tarea mayor de las estadísticas es estudiar las características de las


poblaciones. Por dos razones principales, es a menudo imposible estudiar la
población entera:

 El proceso podría ser demasiado caro o consumir demasiado tiempo.


 El proceso podría ser destructivo.

En cualquier caso, se debe seleccionar una muestra de la población para


intentar inferir sobre la población entera. Muy a menudo los números que
interesan en el estudio de las poblaciones son el promedio poblacional µ y la
desviación estándar poblacional . Cualquier número, como la desviación
estándar poblacional  que se calcula de una población entera es denominado
Parámetro. Si los mismos números sólo se derivan de los datos de una
muestra, entonces los valores resultantes se denominan Estadísticas.
Frecuentemente, los parámetros son representados por letras griegas y las
estadísticas por letras latinas. La función paso es denominada Función de la
Distribución empírica (EDF), también conocido como Ojiva. Una EDF es
construida colocando un punto que corresponde al punto medio de cada clase
a una altura igual a la frecuencia cumulativa de la clase. EDF representa la
función de distribución F(x).

PARÁMETRO

Un parámetro es un valor, normalmente desconocido (y qué por consiguiente


tiene que ser estimado), que se usa para representar una cierta característica de
la población. Por ejemplo, el parámetro poblacional µ es usado para indicar el
valor medio de una cantidad.

Dentro de una población, un parámetro es un valor fijo que no varía. Cada


muestra extraida de la población genera un valor de cualquier estadística que
se use para estimar este parámetro. Por ejemplo, el promedio de los datos en
una muestra se usa para estimar el promedio poblacional µ.

Estadística: Una estadística es una cantidad que se calcula de una muestra de


datos. Se usa para estimar los valores desconocidos en la población
correspondiente. Por ejemplo, el promedio de los datos en una muestra se usa
para estimar el promedio global en la población de la cual la muestra fue
extraída.

Es posible obtener más de una muestra de la misma población y el valor de


una estadística varía en general de muestra a muestra. Por ejemplo, el
promedio en una muestra es un estadística. Los promedios de varias muestras,
de una misma población, no son necesariamente iguales.

Una estimación es una indicación del valor de una cantidad desconocida


basado en datos observados. Más formalmente, una estimación es el valor
particular de un estimador que se obtiene de una muestra en particular de
datos y es usado para estimar el valor de un parámetro.

Ejemplo: Suponga que la gerente de una tienda quiere conocer µ, el gasto


promedio de clientes, en su tienda en el último año. Ella podría calcular el
gasto promedio de los cientos (o quizás los miles) de clientes que compraron
en su tienda, es decir, el promedio poblacional µ. En cambio, ella podría
estimar este promedio poblacional µ calculando el promedio de una muestra
representativa de clientes. Si este valor fuera $25, entonces $25 sería su
estimación.

Hay dos subdivisiones de la estadística: estadística descriptiva y estadística


Inferencial.

La cantidad descriptiva principal derivada de los datos de la muestra es el


promedio que se define como el promedio aritmético de los datos de la
muestra. Este promedio sirve como la medida más fiable del valor de un típico
miembro de la muestra. Si la muestra contiene unos valores que son tan
grandes o tan pequeños tal que ellos tenga un efecto exagerado en el valor del
promedio, la muestra se representa mejor por la mediana, que se define como
el valor que tiene a la mitad de los datos por debajo y la otra mitad por
encima.
Como medidas de la dispersión de los valores respecto al promedio, las
cantidades que la mayoría normalmente usa es la variancia muestral s 2 y su
raíz cuadrada, la desviación estándar s. La variancia se calcula determinando
el valor del promedio muestral, para luego substraerlo de cada uno de los
valores de la muestra (produciendo la desviación de los datos muestrales), y
promediando los cuadrados de estas desviaciones. El promedio y la desviación
estándar de la muestra se usan como estimaciones de las características
correspondientes del grupo entero del cual la muestra fue seleccionada.

La inferencia estadística se refiere a extender el conocimiento obtenido de una


muestra del azar a la población entera. Esto es conocido en matemática como
Razonamiento Inductivo. Es decir, conocimiento del todo a partir de algo en
particular. Su aplicación principal son las pruebas de hipótesis sobre una
población dada.

La inferencia estadística se ocupa de realizar inferencias a partir de las


muestras con respecto a las poblaciones de las cuales fueron seleccionadas. En
otras palabras, si se encuentra una diferencia entre dos muestras, es importante
conocer, si esta diferencia es "real" (i.e. está presente en las poblaciones) o
simplemente es una diferencia debida al "azar" (i.e. podría ser simplemente el
resultado del error del muestreo aleatorio). Esto es lo que hace toda prueba
estadística.

La inferencia estadística guía la selección de modelos estadísticos apropiados.


Modelos y datos actúan recíprocamente en el trabajo estadístico. Los modelos
son usados para deducir conclusiones de los datos, mientras que los datos son
usados para criticar e incluso desmentir al modelo a través de métodos de
inferencia y de diagnóstico. La inferencia de los datos puede pensarse como el
proceso de seleccionar a un modelo razonable, incluso se pueden realizar
afirmaciones en términos de probabilidad de la confianza de haber realizado
dicha selección.

Inferencias basadas en estadísticas son de dos tipos. El primero es la


“estimación” que involucra la determinación, con un error posible debido a la
muestra, del valor desconocido de un parámetro, tal como la proporción que
tiene un atributo específico o el promedio µ de alguna medida numérica. Para
expresar que tan exactos son las estimaciones de los parámetros de la
población, también se deben calcular los "errores estándares" de las
estimaciones; éstos son los márgenes que determinan los posibles errores que
se presentan del hecho de que las estimaciones están basadas en muestras al
azar de la población entera y no en un censo de la población completa.

El segundo tipo de inferencia es la prueba de hipótesis. Esta involucra la


definición de una "hipótesis nula" como un conjunto posible de valores
poblacionales y una "alternativa", un conjunto diferente de valores. Hay
muchos procedimientos estadísticos para determinar en base a una muestra si
la verdadera característica poblacional pertenece al conjunto de valores de la
hipótesis nula o la hipótesis alternativa.

La inferencia estadística se fundamenta en probabilidad y en conceptos


idealizados del grupo bajo estudio, denominado población, y la muestra. El
estadístico visualiza la población como un conjunto de objetos de las cuales la
muestra es seleccionada al azar, de tal manera que cada objeto tiene la misma
oportunidad como cualquier otra de ser incluída en la muestra.

Note que para ser capaz de estimar los parámetros de la población, el tamaño
de la muestra n debe ser mayor que uno. Por ejemplo, con una muestra de
tamaño uno la variancia s2 es 0/1 = 0.

La probabilidad es la herramienta usada para anticipar lo que la distribución


de los datos debería ser bajo un modelo dado. Los fenómenos aleatorios no
son casuales: ellos tienen un orden que sólo surge en grandes trayectorias y es
descrito por una distribución. La descripción matemática de la variancia es
fundamental en estadística. La probabilidad requerida para la inferencia
estadística no es principalmente axiomática o combinatoria, pero se orienta
hacia la descripción de las distribuciones de los datos.

La estadística es una herramienta que permite imponer orden en el mundo real


desorganizado de la sociedad moderna. El mundo comercial ha crecido en
tamaño y competitividad. Las empresas deben realizar negocios arriesgados,
el crecimiento en popularidad requiere del uso correcto de la estadística.

¡La estadística ha crecido fuertemente y no sólo se limita a construir gráficos y


tablas!. Es una ciencia de toma de decisiones basada en datos numéricos en
condiciones de incertidumbre.
La estadística es una aproximación científica para tomar decisiones bajo
riesgo. En estadística aplicada, se busca una solución que satisfaga todas las
condiciones con el nivel más bajo de riesgo.

Mientras las estadísticas no pueden reemplazar el conocimiento y experiencia


del responsable de tomar la decisión, esta es una valiosa herramienta que el
gerente puede emplear para ayudarse en el proceso de toma de decisiones para
reducir el riesgo inherente.

Los gerentes, administradores e ingenieros más exitosos son aquellos que


pueden entender la información y usarla eficazmente.

S-ar putea să vă placă și