Sunteți pe pagina 1din 29

UNIVERSIDAD DE EL SALVADOR EN LÍNEA

FACULTAD DE INGENIERÍA Y ARQUITECTURA


PROBABILIDAD Y ESTADÍSTICA
Página 1 de 29

PROBABILIDAD Y ESTADÍSTICA
UNIDAD I: ESTADÍSTICA DESCRIPTIVA
Temas:
1.1 Elementos y definiciones básicas de estadística descriptiva.
1.2 Análisis descriptivo de datos empleando herramientas
informáticas.
1.3 Elementos de muestreo.

OBJETIVO DE LA UNIDAD
Aplicar el análisis descriptivo a un conjunto de datos usando una herramienta
informática.

INTRODUCCIÓN
Los temas a desarrollar en esta unidad son los siguientes:

1.1. Elementos y definiciones básicas de estadística descriptiva.


1.2. Análisis descriptivo de datos empleando herramientas informáticas.
1.3. Elementos de muestreo.
1.4. Análisis exploratorio de datos parte gráfica.
1.5. Análisis exploratorio de datos parte tabular.
1.6. Medidas de Tendencia Central.
1.7. Medidas de dispersión y forma.

Estudiaremos estos contenidos en tres semanas. La primera semana estudiamos


los numerales 1.1 a 1.3, los numerales 1.4 y 1.5 en la segunda semana y finalmente en la
tercera semana los numerales 1.6 y 1.7.

1.1. ELEMENTOS Y DEFINICIONES BÁSICAS DE ESTADÍSTICA DESCRIPTIVA


Mostramos la importancia de la estadística, simplemente haciendo un recorrido
por lo que uno puede apreciar en los noticieros televisivos, la prensa escrita, los informes

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 2 de 29

que ofrecen las diferentes instancias y organizaciones tanto locales como mundiales en
revistas científicas y a través de Internet.

Nos muestran casos como, por ejemplo, el del control epidemiológico de


enfermedades que nos afectan no solo como país, sino que también como región, tales
como la del Zika y el dengue, por mencionar algunas. Lo mismo sucede al escuchar las
estadísticas provenientes de organizaciones que se encargan de observar los cambios
atmosféricos para elaborar sus pronósticos del tiempo. También los informes de las
instituciones financieras que se encargan de observar el movimiento del flujo de valores.
Así como también el de las empresas que se interesan por los pronósticos de demanda y
venta de los productos que ofrecen. Sin dejar de mencionar el interés de los institutos
políticos por las encuestas de opinión que les ayudan a descifrar sus oportunidades de
nominación en próximas elecciones. Y estoy seguro que el lector será capaz de
incrementar este listado de casos en los que la estadística hace su aparición en escena,
en temas de educación, seguridad, violencia, trabajo infantil, etc.

Vale la pena mencionar que, como un valor agregado como parte de nuestro
estudio de esta asignatura, está el de entender lo que otros publican en lo que a
estadísticas se refiere, o al menos, tener un sano juicio para realizar una evaluación
objetiva a de los resultados estadísticos que otros ofrecen.

Hay que tomar en cuenta que cuando uno habla de estadística, inmediatamente
viene a nuestra mente que es algo que tiene que ver con datos o información numérica,
y que los resultados expuestos están sujetos a error.

Entonces vamos a proceder a definir lo que entenderemos por la disciplina


científica denominada “Estadística”. Existen varias definiciones, como era de esperarse.
Así como también hay toda una historia relacionada con su nombre, su procedencia, su
primer uso y sus principales impulsadores puede leer (Levin & Rubin,2004) para encontrar
algo al respecto. No nos vamos a enfocar en esta historia, ni vamos a dedicar mucho
esfuerzo a comparar las distintas definiciones, sin embargo, mencionaremos las que a
nuestro juicio son las que mejor identifican el concepto y que resultan ser las de mayor
aceptación.

Definición 1: Es la ciencia que se encarga del diseño de estudios o experimentos,


la colección de datos y el modelaje/análisis de dichos datos para el propósito de tomar
decisiones y hacer descubrimientos científicos cuando la información disponible es tanto

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 3 de 29

limitada como variable. Por ello la estadística es la ciencia del aprendizaje a partir de los
datos. (Ott & Longnecker, 2010).

Definición 2: Rama de la matemática que tiene que ver con la colección, análisis,
interpretación y presentación de masas de datos numéricos. (Diccionario Merrian-
Webster, 2017).

Definición 3: Rama de la matemática que tiene que ver con la colección, análisis,
interpretación, presentación y organización de datos. (Dodge, 2006; Romijn,2014).

Según Ott & Longnecker (2010), un enfoque para el estudio de la estadística y


lograr el aprendizaje a partir de los datos es la realización de los siguientes cuatro pasos:

• Definir el problema.
• Colectar los datos.
• Resumir los datos.
• Analizar los datos, interpretar el análisis y comunicar los resultados.

Vale la pena aclarar que la realización de estos cuatro pasos de una manera correcta es
importante para lograr el aprendizaje a partir de los datos. Ya que, si el problema bajo
consideración no se define claramente, y los datos no se colectan apropiadamente, la
interpretación de los resultados del análisis nos conducirá a conclusiones equivocadas. Esto
debido a que el análisis se basó en datos que no respondían al problema o que estaban
incompletos o contenían información impropia.

Para contextualizar los siguientes conceptos, lo haremos a través de la


presentación de tres ejemplos, de donde veremos la importancia y uso de los mismos.

Ejemplo 1: Considere el caso de una fábrica, que produce en un día un promedio


de 10,000 artículos suponga, además, que se desea saber cuál es la tasa de artículos
defectuosos. Un procedimiento podría ser examinar todos los artículos uno por uno.
Aunque este método con seguridad sería el más tardado, elevaría los costos de
producción lo que lo hace inviable. Como una alternativa, se propone obtener una
muestra aleatoria de los elementos producidos, digamos de unos 100 artículos. Y la
fracción de los artículos defectuosos en los 100 resultados podría usarse para estimar la
fracción de defectuosos en toda la producción diaria.

Ejemplo 2: Todos hemos escuchado de las encuestas que se realizan por empresas
especializadas e instituciones en períodos previos a las elecciones. Resulta bastante claro,
que es poco probable que para dichos estudios ellos entrevisten a toda la población de
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 4 de 29

votantes. Porque resultaría extremadamente caro realizar esta actividad, y siempre


habría oportunidad de error, debido a que durante el tiempo en el que se desarrolle dicha
actividad, muchos de los entrevistados ya no estarán para las votaciones (por muerte o
migración). Además del riesgo que correrían los entrevistadores en algunos lugares de
nuestro país, lo cual podría hacer que dichos votantes no se incluyan en la población de
votantes total. En este caso el procedimiento que ellos utilizan es, por ejemplo, elegir a
unos 1000 habitantes de la población activa para votar, para estimar las preferencias de
los votantes en todo el país. Lo que resulta sorprendente en este tipo de casos, es que, si
las personas se eligen apropiadamente, y las preguntas se les hacen evitando la
ambigüedad y no son preguntas orientadas a obtener respuestas prefijadas, entonces la
fracción de personas que comparten una opinión particular será muy próxima a la
fracción de personas de toda la población de votantes que comparten dicha opinión.

Ejemplo 3: Suponga que una empresa de fabricación de productos farmacéuticos


está tratando de probar el efecto que un nuevo medicamento tendrá en pacientes de
cierta patología. Para ello, luego de superar todos los aspectos relativos al protocolo de
aplicación en pacientes humanos, decide aplicar el medicamento a un cierto grupo de
pacientes, digamos unos 250 pacientes. Y con los resultados observados en ellos, hacer
una inferencia a cerca del efecto que este nuevo medicamento tendrá en todos los
futuros pacientes que tengan esta patología.

Ahora trataremos de identificar los conceptos básicos que son comunes o afines
en estos tres ejemplos. En primer lugar, debemos tomar en cuenta que existe algo que
no se puede determinar con anticipación en cada caso, y eso es debido a la presencia de
azar o aleatoriedad en los procesos. Sabemos que los artículos producidos pueden estar
en buen estado o dañados, pero no sabremos antes de la observación del artículo, si está
bueno o dañado. Sabemos las posibilidades de votación que tienen las personas antes de
la votación, sin embargo, no podemos predecir con certeza por quién votará cada una. Y
como el voto en general en un sufragio es secreto, incluso luego de la votación no
sabremos en realidad por quién votó, a menos que vayamos a revisar papeleta por
papeleta y verifiquemos con los respectivos números de identificación personal. Pero eso
es un privilegio que solo lo tienen las instituciones a cargo de las elecciones y no es de
conocimiento común. Para el último caso, la aplicación del medicamento puede ser que
en algunos pacientes funcione y en otros no funcione, esto debido a otras características
de las personas aparte de la patología. Así que, se sabe que puede tener un efecto positivo
o no, pero no se puede apreciar sino hasta después de haber realizado el experimento y
tomado la observación.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 5 de 29

En todos los ejemplos podemos también notar que hay un grupo mayor y un grupo
menor de objetos o personas observadas. Al grupo mayor se le denomina “población” y
al grupo menor se le llama “muestra”. La muestra es entonces una parte de la población.
Para elegir a la muestra de la población se usa una metodología llamada “muestreo”
(“sampling” en inglés), hablaremos de este tema un poco más adelante. Así, podemos
identificar la población del primer ejemplo, como la producción total de un día de trabajo
de la fábrica, las 10,000 unidades producidas. Para el segundo ejemplo, la población está
formada por todas las personas en edad de votar de un país o región. Y en el último
ejemplo, la población es indeterminada, pero consiste de todas las personas que
poseerán la patología que se está tratando con el nuevo medicamento.

Otro elemento a tomar en cuenta es que todos tienen que ver con la recopilación
de datos o mediciones. Se toma una medición para cada elemento de la muestra. Estas
observaciones en ocasiones son datos cuantitativos (cuando se registran edades, niveles
de ingresos, pesos, tallas, etc.). Pero en ocasiones son datos cualitativos como el género,
el sexo, la preferencia política, estado operacional, etc.). Generalmente lo que se hace es
asignar un equivalente numérico a las categorías cualitativas de la variable. Por ejemplo,
al sexo se le puede asignar el valor -1 para hembra y un 1 para macho, o un 0 para el
género femenino y un 1 para el masculino o viceversa, basta definirlo y ser consistente
con dicha definición. Otro elemento a considerar en la toma de las observaciones es que
a veces para caracterizar mejor a los sujetos bajo observación habrá necesidad de tomar
otros datos que son propios de los objetos o personas investigadas tales como sexo, edad,
talla, peso, nivel educativo, etc. Para que al comparar las respuestas de la variable
principal de observación se pueda hacer contrastes de opiniones con diferentes grupos
de sujetos, por ejemplo, si se diferencian entre hombres y mujeres, o por ciertas edades,
o si hay diferencias para ciertas tallas, o por cierto nivel educativo, o de ciertas zonas
geográficas, etc.

Finalmente, un cuarto aspecto a considerar es el objetivo que se pretende con


este estudio, y es el de obtener a partir de la muestra observada conclusiones para el total
de la población, este procedimiento se llama “inferencia estadística”. Para ello será
necesario hacer un análisis de los datos obtenidos, interpretar dicho análisis y comunicar
adecuadamente los resultados obtenidos.

Ahora procedemos a concretizar las definiciones anteriores. Pero ampliaremos


dichos conceptos en el numeral 1.3, cuando veamos los elementos del muestreo.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 6 de 29

1.1.1. DEFINICIÓN DE POBLACIÓN


Cualquier colección finita o infinita de “unidades”, las cuales suelen ser personas,
pero pueden ser cualquier cosa. Por ejemplo: instituciones, eventos, llamadas telefónicas,
artículos producidos, etc. (Everitt & Skrondal, 2010).

1.1.2. DEFINICIÓN DE MUESTRA


Un subconjunto seleccionado de una población, escogidos por algún proceso,
usualmente con el objetivo de investigar propiedades particulares de la población padre.
(Everitt & Skrondal, 2010).

1.1.3. DEFINICIÓN DE DATO


Observaciones y medidas tomadas durante cualquier tipo de investigación
científica. (Everitt & Skrondal, 2010).

1.1.4. PROPÓSITO PRINCIPAL DE LA ESTADÍSTICA


Realizar inferencia estadística a partir de los datos tomados de una muestra
durante la investigación científica hacia toda la población. Teniendo el cuidado de analizar
los datos, interpretar dicho análisis y saber comunicar los resultados obtenidos. (Ott &
Longnecker, 2010).

1.1.5. SECCIÓN DE EJERCICIOS.


1. Seleccionar la dieta apropiada para los camarones en una granja oceánica es un aspecto
importante para los encargados. Un investigador desea estimar el peso promedio de
los camarones mantenidos bajo una dieta específica, por un período de seis meses. 100
camarones se seleccionaron aleatoriamente de un estanque artificial y fueron pesados.
a. Identifique la población de mediciones que son de interés para el investigador.
b. Identifique la muestra.
c. ¿Cuál son las características de la población que son de interés para el
investigador?
d. Si las mediciones de la muestra se usan para hacer inferencia, acerca de cierta
característica de la población, ¿Por qué sería importante una medida de la
confiabilidad de la inferencia?
2. Un empresario tiene una granja acuícola y está interesado en mejorar la producción de
tilapias para lo cual intenta probar un nuevo concentrado para alimentar los peces. El
productor del concentrado le sugiere alimentarlos por un período de tres meses para
comenzar a ver resultados en el incremento de su peso y tamaño. El productor no confía
del todo en la palabra del vendedor y decide realizar una prueba antes de alimentar a
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 7 de 29

toda la población de peces, y selecciona una cantidad de 50 tilapias del total que se
encuentra en un criadero, para alimentarlas con el concentrado.
a. Identifique la población de mediciones que son de interés para el empresario.
b. Identifique la muestra.
c. ¿Cuáles son las características de la población que son de interés para el
empresario?
d. Si las mediciones de la muestra se usan para hacer inferencia, acerca de cierta
característica de la población, ¿Por qué sería importante una medida de la
confiabilidad de la inferencia?

1.2. ANÁLISIS DESCRIPTIVO DE DATOS USANDO HERRAMIENTAS


INFORMÁTICAS
La herramienta informática a usar se llama Scilab 6.0.01©. Scilab, es un software
en la categoría de open source distribuido gratuitamente bajo la licencia GNU GPL 2.0 y
puede descargarse libremente del sitio http://www.scilab.org.
Existen versiones para diferentes sistemas operativos, del sitio oficial,
específicamente del área de descarga: http://www.scilab.org/download, se puede
descargar para sistemas de 32 y 64 bits tanto bajo Linux, Mac o Windows.

UN VISTAZO DE SCILAB

Scilab es un lenguaje de programación asociado con una rica colección de

algoritmos numéricos cubriendo muchos aspectos de problemas de cálculo científico.

Desde el punto de vista del software, Scilab es un lenguaje interpretado. Esto

generalmente permite tener desarrollo de procesos más rápidos, porque el usuario

accede directamente a un lenguaje de alto nivel, con un rico conjunto de características

provistas por la librería. El lenguaje Scilab está pensado para que sea extendido de tal

1
Scilab es publicado bajo los términos de la licencia de GNU General Public License 2.0.
Anterior a esta versión, Scilab se licenció bajo los términos de Cecill v. 2.1
Y continúa siendo disponible bajo dichos términos.
Copyright 2011-2017 Scilab Enterprises, 1989-2012 Inria, 1989-2007 ENPC.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 8 de 29

forma que los tipos de datos definidos por el usuario puedan ser definidos posiblemente

con operaciones sobrecargadas. Los usuarios Scilab, pueden desarrollar sus propios

módulos, de tal forma que ellos puedan resolver sus problemas particulares. El lenguaje

Scilab permite compilar dinámicamente y enlazar otros lenguajes tales como Fortran y C:

De esta manera las librerías externas se pueden usar como si fueran parte de las

características internas de Scilab. Scilab también tiene interface con LabVIEW, una

plataforma y ambiente de desarrollo para lenguajes de programación visual de National

Instruments.

Desde el punto de vista del licenciamiento, Scilab es un software libre, en el

sentido de que el usuario no tiene que pagar por él y Scilab es un software open source,

provisto bajo la licencia GNU GPL v2.0. El software se distribuye con código fuente, de tal

forma que los usuarios tienen acceso a los aspectos más internos de Scilab. La mayor

parte de las veces, los usuarios descargan e instalan una versión binaria de Scilab puesto

que el consorcio Scilab provee versiones ejecutables para los sistemas operativos

Windows, Linux y Mac. La ayuda en línea se provee en muchos idiomas.

Desde el punto de vista científico, Scilab viene con muchas características. Desde

los orígenes de Scilab, las características se enfocaron en álgebra lineal. Pero,

rápidamente, el número de características se extendió hasta cubrir muchas áreas del

cálculo científico. La siguiente es una corta lista de sus capacidades:

• Algebra lineal, Matrices espaciadas.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 9 de 29

• Funciones Polinomiales y racionales.

• Interpolación, aproximación.

• Optimización lineal, cuadrática y no lineal.

• Solución de ecuaciones diferenciales ordinarias y solución de ecuaciones

diferenciales algebraicas.

• Control clásico y robusto, optimización de inecuaciones matriciales lineales.

• Optimización diferenciable y no diferenciable.

• Procesamiento de señales.

• Estadística.

Scilab provee muchas características gráficas, incluyendo un conjunto de

funciones de ploteo, las cuales permiten crear gráficos en 2D y 3D, así como también

interfaces gráficas de usuario. El ambiente Xcos provee un modelador y simulador de

sistemas dinámicos híbridos. (Baudin, 2010, p. 5-6).

Una vez instalado Scilab en su ordenador, Ud. Podrá realizar el video tutorial, el
cual le mostrará cómo usarlo para realizar el ingreso de datos, obtener representaciones
gráficas de ellos, y resúmenes estadísticos de las variables.

La pantalla principal al activar Scilab, es la que se muestra en la siguiente figura:

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 10 de 29

3
2 5

Fig. 1. Pantalla principal de Scilab.

Podemos notar que hay secciones y ventanas identificadas que tienen funciones
muy particulares. En el identificador numerado 1, se tiene el menú principal y la barra de
iconos. Estos cambiarán dependiendo de la ventana que se encuentre activa. Las ventanas
están numeradas con los identificadores 2 a 6. En la figura 1, la ventana activa es la
número 3, que es la consola de Scilab. Por lo tanto, el menú principal y la barra de iconos
corresponden a la consola. La ventana activa se identifica por el color celeste en la barra
de título de la ventana.
Las otras ventanas son:

• La número 2, el navegador de archivos, una especie de browser para


navegar entre las carpetas del computador.
• La número 4, el explorador de variables, aquí se mostrará el registro de toda
variable que se cree durante una sesión de Scilab. Este espacio conservará
las variables únicamente durante la sesión activa, al cerrar la sesión y salir
de Scilab se eliminarán.
• La número 5, el historial de comandos, guarda un registro de todos los
comandos emitidos durante las sesiones de Scilab, los va identificando por
fecha y hora, desde el momento que se instaló el software. Esta ventana
puede ser borrada con una instrucción de parte del usuario. Pero siempre
es buena práctica dejarla sin modificar, por si alguna vez se quiere repetir
un comando ya emitido en alguna sesión anterior.
• La número 6, es una novedad de esta versión, si Ud. cuenta con conexión a
Internet, le mostrará noticias de los desarrolladores de Scilab, es como un

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 11 de 29

canal de noticias en línea, conectado directamente a la página principal del


consorcio Scilab.
• La número 3, es la consola de Scilab. Funciona al estilo de una ventana de
comandos del sistema de Windows o una ventana de terminal de Linux. En
ella se le dan órdenes al compilador de Scilab para que las ejecute y muestre
los resultados en la misma consola. El prompt de la ventana es (--> ) Indica
el punto de inserción del siguiente comando. Intente escribir el comando
--> help y presione la tecla “Enter”. Obtendrá una nueva ventana de
ayuda como la de la Figura 2. Note que en la ventana que se le muestra ya
se ha activado la ayuda para la sección de estadística. Intente reproducir la
imagen de la Figura 2. Luego, comience a desplazarse por todos los temas
de la ayuda, que tienen que ver con Estadística. Ponga especial énfasis a las
medidas de tendencia central (Central Tendency), estadística descriptiva
(Descriptive Statistics), medidas de dispersión (Measures of Dispersion) y
medidas de forma (Measures of shape). Serán de las que haremos mayor
uso en este curso.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 12 de 29

Fig. 2. Ventana de Ayuda de Scilab.

Ahora incorporaremos la ventana de ayuda a la ventana de consola de comandos


de Scilab, de tal forma que luzca como la Figura 3.

Para lograrlo nos ubicamos en la venta de ayuda de Scilab, y manteniendo


presionado el botón izquierdo del mouse sobre la barra de título de la ventana de
ayuda, la arrastramos hacia la ventana de consola (Note que puede ubicarse de
diferentes formas dentro de la consola, trate de reproducir la mostrada en la Fig.
3). Una vez la silueta de la ventana de ayuda se encuentra en la posición deseada,
se deja de presionar el botón izquierdo del mouse y la ventana se incrustará en la
ventana de la consola de comandos.

Fig. 3. Consola de Scilab con ventana de ayuda incorporada.

Ahora procederemos a realizar algunos ajustes de propiedades de Scilab para que


se comporte como nos gusta. Primero cambiaremos el idioma para que nos muestre todo
en español (en el caso que no lo esté todavía). Para ello, desde el menú de la consola
elegimos del menú principal la opción “Editar” y luego “Preferencias”.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 13 de 29

Fig. 4. Ventana Consola/Editar/Preferences

Nos aparecerá una ventana similar a la siguiente figura:

Fig. 5. Ventana Preferencias de Scilab.

En esta ventana se controlan las opciones de Presentación tanto de la Consola, el


Scinotes (El editor de programas de Scilab) y el Xcos (el ambiente para realizar modelaje
y simulación de sistemas híbridos).
Tiene varias secciones, en la parte izquierda se muestran todas opciones que se
pueden ajustar (General, Web, Preferences, Fonts, Colors, Console, Command History,
Scinotes y Xcos) y en la parte derecha, se van mostrando los parámetros que se pueden
cambiar.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 14 de 29

Para cambiar el idioma, en la opción “General” se elige el idioma deseado, en


nuestro caso “español” (Spanish, en inglés). Como lo muestra la siguiente figura:

Note que al cambiar esta opción el sistema Scilab debe reiniciarse para que el
cambio surta efecto.

Fig. 6. Cambio de preferencias de Idioma, a Idioma español (Spanish).

Como un ejercicio adicional, retorne a la ventana “Preferencias de Scilab” y


modifique las fuentes (Fonts, en inglés) y los colores (colors, en inglés). Modifique las
fuentes del Desktop (escritorio), use Monospaced 18 bold. Use este mismo tipo de fuente,
para la Consola y el editor Scinotes.
Ahora hablaremos un poco sobre el editor de programas de Scilab, denominado
Scinotes. Es una ventana similar a la siguiente figura:
Al examinar la estructura de la ventana es muy similar a las otras ventanas vistas
anteriormente. Excepto que se van agregando pestañas por cada código que se agregue
al editor (en la figura están identificadas por los nombres “Restore”, “*Sin Título 1” hasta
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 15 de 29

“*Sin Título 4”, observe además que la pestaña activa, es “*Sin Título 4”). Note que las
líneas de código están numeradas y que un número está de color rojo, indicando que es
la línea de edición activa, estas líneas son parte del ambiente editor, pero no son parte
del código. La ventana Scinotes, también se puede incrustar en la ventana principal de
Scilab, ¡Inténtelo! Haga un recorrido por todas las opciones del menú principal del editor.

Fig. 7. El editor de programas y funciones llamado Scinotes.

Siempre puede regresar a la presentación original de pantallas, en el caso que


quiera eliminar algunas pantallas de la presentación integrada. En el menú principal de la
ventana de consola, al Editar/Preferencias, en la opción “General”, se encuentra la opción
Desktop Layout. Asegúrese que se encuentran seleccionadas las opciones: Select Layout
(Integrado), Save layout on exiting. Y al presionar el botón “Reset Layout”, Scilab restaura
la presentación original de ventanas, en el siguiente reinicio de Scilab.

1.3. ELEMENTOS DE MUESTREO


“Al hablar de métodos de muestreo nos referimos al conjunto de técnicas

estadísticas que estudian la forma de seleccionar una muestra lo suficientemente


Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 16 de 29

representativa de una población cuya información permita inferir propiedades o

características de toda la población cometiendo un error medible y acotable”. (Pérez,

2005 p. 3).

La siguiente secuencia muestra los pasos a realizar durante la fase de planeación


del muestreo:
PASO 1:
DEFINIR LA POBLACIÓN

PASO 2:
IDENTIFICAR EL MARCO
MUESTRAL

PASO 3:
DETERMINAR EL TAMAÑO
DE LA MUESTRA

PASO 4:
ELEGIR EL MÉTODO DE
MUESTREO

PASO 5:
OBTENER LA MUESTRA

Los pasos posteriores a la obtención de una muestra consisten en resumir los


datos, analizarlos, interpretarlos y comunicar los resultados.

Ya hemos hablado un poco acerca del concepto de población y muestra, en el


numeral 1.1. Necesitamos profundizar un poco en dichos conceptos, para formalizar los

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 17 de 29

conceptos del procedimiento de muestreo. Lo haremos mencionado una serie de


características que se requieren en este contexto.

Pero antes, solo mencionaremos el caso cuando el estudio se hace tomando en


cuenta a todos los objetos que forman una población, en este caso al estudio se define
como “censo”. En algunos casos el censo es recomendable, especialmente si el número
de objetos a considerar como población de estudio no supera las 50 unidades.

Unidades elementales (o elementos): Se definen como las unidades acerca de las


cuales se quiere realizar una investigación o investigar características de ellas. Son las
que suministran la base del análisis.

“Son las unidades que representan las partes más pequeñas de los elementos
capaces de presentar una característica particular” (Organización de las Naciones Unidas
[ONU], (1957)).

Se denota por 𝑢1 un elemento (o unidad) sobre la cual se realiza una medición de


una variable bajo estudio 𝑋, Sea 𝑋1 el valor que toma la característica 𝑋 sobre la unidad
𝑢1 .

Ejemplo: Se desea realizar un estudio sobre el consumo de leche en polvo de las


familias del país. En este caso, los elementos de muestreo (o unidades elementales) son
las familias del país. Y para cualquier familia elegida del país, el gasto aproximado en
leche de dicha familia, será la medición para este estudio.

Unidades de muestreo: Son las unidades que sirven de base para las operaciones
de muestreo, pueden ser: (i) las mismas unidades elementales o (ii) grupos de elementos
que conforman un conglomerado de unidades elementales. (ONU, 1957).

Como bien lo dice la definición, en ocasiones los mismos elementos son las
unidades de muestreo, pero existen casos en los que las unidades de muestreo son
grupos de estos elementos.

Ejemplo: Siguiendo el ejemplo anterior, ya se identificó que los elementos del


muestreo son las familias del país, sin embargo, hay casos en donde la única persona
que habita en la vivienda es soltera, entonces se reúnen a los habitantes solteros en
grupos y se les considera como una familia. Otro caso sería lo contrario, que en una
misma casa habiten varias familias, entonces se identifica a los habitantes de la casa
como si fueran una sola familia.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 18 de 29

Marco de muestreo: Es una lista de las unidades de muestreo, es el listado de


todos los elementos que participarán en el proceso de muestreo, es decir a los que se
les aplicará el método elegido de muestreo y de donde se obtendrá la muestra.

Ejemplo: Se desea estudiar la proporción de votantes que estarán a favor del


partido político X, en las próximas elecciones para diputados y alcaldes. En este caso, el
marco de muestreo lo constituye el padrón electoral, que es donde se encuentran todas
las personas que tienen la facultad de poder emitir su voto, si una persona, aunque
tenga la edad y tenga todos los atributos de persona requeridos, no se encuentra en el
padrón electoral, entonces no puede emitir el sufragio.

Muestra: Bajo este contexto, una muestra es el conjunto de unidades de muestreo


obtenidas a partir del marco de muestreo.

En general, se usa la muestra para inferir a partir de ella una serie de parámetros
poblacionales tales como la media aritmética, la varianza, la desviación estándar,
percentiles, cantiles, moda, etc. los cuales aprenderemos a calcular en breve.
Dado que los valores de estos parámetros, se calculan a partir de la muestra y no
son los de toda la población, reciben el nombre de “estimadores de los parámetros
poblacionales”. Y resulta claro que, si se obtiene una nueva muestra y se vuelven a
calcular los valores de estos estimadores de los parámetros, los valores obtenidos
basados en la nueva muestra, casi que con seguridad no serán exactamente iguales a los
de la primera muestra. Esto es debido al efecto de la aleatoriedad en los elementos de
la muestra. Entonces estos estimadores son variables aleatorias (un término que
explicaremos con mayor detalle en la siguiente unidad) y se pueden tratar
probabilísticamente.
Para que los resultados del estudio sean válidos, la muestra debe de estar libre de
sesgos o tendencias (bias, en inglés). Esto se logra asegurándonos que todas las
muestras posibles tengan la misma probabilidad de ser seleccionadas para el estudio.
De esto se encarga el muestreo probabilístico, de generar muestras aleatorias
representativas de toda la población.
Por lo tanto, será importante asignarle al muestreo, está característica
probabilística, y poder determinar la probabilidad que tiene cada muestra posible, de
ser elegida. Lo que se intuye, en todo esto es que, todas las muestras posibles tengan la
misma probabilidad de ser elegidas. Para que el resultado sea aleatorio y no tenga
ningún sesgo o preferencia pre-establecida.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 19 de 29

Aunque también el muestreo puede hacerse sin incluir este concepto de


aleatoriedad, como en los casos de muestras auto-seleccionables (por selección
razonada), o seleccionadas por conveniencia, o por simple juicio u opinión (opinático),
o el muestreo por cuotas, donde al entrevistador se le han dado cuotas (o un número
predeterminado de formularios que llenar) para sub-grupos especificados de población.
Esto por supuesto tiene sus debilidades, ya que puede generar sesgo en la investigación
e incluso, darse el caso que los datos obtenidos no sean representativos de toda la
población.
Para que el muestreo sea aleatorio, se requiere un procedimiento de
aleatorización de los objetos a muestrear. Es decir, un mecanismo que les otorga a los
objetos a muestrear la misma probabilidad de ser tomados como parte de la muestra.
Aquí se puede usar un procedimiento de generación de números aleatorios, ya sea con
el apoyo de tablas de números aleatorios pre-existentes o con el uso de programas que
generan números aleatorios (o pseudoaleatorios, propiamente dicho).

1.3.1. ELECCIÓN DEL TAMAÑO DE LA MUESTRA


La elección del tamaño de la muestra es un tema de mucho interés. La lógica nos
indica que, a mayor tamaño de muestra, más confianza en la exactitud de los resultados.
Lo contrario también es cierto, a menor tamaño de muestra, menos confianza en la
exactitud de los resultados. Aún más, el mayor tamaño que la muestra podría llegar a
tomar es el tamaño mismo que el de toda la población. Lo que significaría un costo muy
elevado para el estudio y en ocasiones imposible de realizar. Por el otro lado, lo menos
que se puede llegar a elegir en el tamaño de la muestra es “no elegir a nadie”, en cuyo
caso no tiene sentido el experimento. Esto nos induce a que haya que pensar en un
balance, pero eso no significa el punto medio, sino un balance razonado en términos de
los parámetros estadísticos que se desea calcular y de los niveles de confianza que se
desea tener en los resultados, y del error admisible en el método de muestreo usado.

En general, el tamaño de la muestra, dependerá de varios factores, tales como: La


estabilidad de la población (¿qué tan variable resulta ser con respecto a la variable de
observación?, la lógica y la observación juegan un papel esencial en todo esto: Por
ejemplo, si se quiere estimar la estura promedio de un grupo de habitantes de una región
y cierta edad, y se observa que toda la población tiene aproximadamente la misma
estatura, entonces un solo miembro será representativo de toda la población para tomar
dicha medición), requerimientos estadísticos (el grado de confianza o exactitud con los
que se quieren obtener los resultados y el margen de error permitido), factores
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 20 de 29

económicos (de que tanto presupuesto se cuenta para la realización del experimento), la
disponibilidad de los elementos a muestrear y por supuesto la importancia que pueda
tener el problema (o la necesidad de resolverse).

Introducimos un par de conceptos antes de ver las fórmulas más comunes para
calcular el tamaño de la muestra. Lo haremos a través de analizar el siguiente caso:
Suponga que se tomará una muestra de un Centro Escolar (CE) en el que hay 560
estudiantes. Se tomará una muestra de 28 alumnos. Lo que se quiere investigar es la
proporción de estudiantes que cuentan con el servicio de internet en sus casas, con el
propósito de iniciar un plan de refuerzo académico usando recursos de internet. Pero,
¿Qué significa elegir a 28 de 560? ¿Qué proporción de la población se entrevistará? Y a la
hora de obtener conclusiones sobre la población ¿a cuántos alumnos de la población total
representa cada uno de los estudiantes de la muestra?
Para calcular la proporción de estudiantes que se entrevistará, se divide el tamaño
de la muestra entre el tamaño de la población: 28/560 = 0.05, eso quiere decir que se está
considerando al 5% de la población.
Para calcular a cuántos estudiantes representa cada uno de los elementos de la
muestra. Se hace la división contraria, se divide el tamaño de la población entre el tamaño
de la muestra: 560/28 = 20, lo que significa que cada uno de los elementos de la muestra
representa a 20 de la población.
Los dos conceptos que acabamos de ver tienen la siguiente definición formal:
Definición de Factor de elevación: Es el cociente entre el tamaño de la población
(N) y el tamaño de la muestra (n), es decir: Factor de elevación = N / n. Y representa el
número de elementos de la población representado por cada elemento de la muestra.
Definición de Factor de muestreo: Es el cociente entre el tamaño de la muestra
(n) y el tamaño de la población (N), es decir: Factor de muestreo = n / N. Y si se multiplica
por 100, obtenemos el porcentaje de la población que se representa en la muestra.
Error de muestreo: Es el error admisible en el muestreo, se comete por el hecho
de sacar conclusiones sobre cierta realidad a partir de la observación de solo una parte
de ella, establecido por el investigador, se presenta por E y se expresa por lo general en
porcentaje (algunos textos lo identifican por e, pero aquí usamos ese símbolo para
identificar el error de estimación, que también se suele expresar en porcentaje).
Error de estimación: Originado por los errores que se puedan dar en el proceso
de estimación de los parámetros, su valor viene dado por el cálculo: 𝑒 = 𝑍𝛼 ∗ 𝐸 , donde
𝐸 es el Error de muestreo y 𝑍𝛼 es el valor en tablas de la distribución normal asociado al
nivel de significancia deseado en el cálculo.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 21 de 29

A continuación, se presentan algunas fórmulas para el cálculo del tamaño de la


muestra, se debe tener el cuidado que estas fórmulas no son aplicable siempre y a
cualquier caso. Como todo teorema en matemática, se deben respetar las condiciones
previas para que el resultado esté garantizado. Del mismo modo aquí, se tienen que
cumplir las condiciones para que la fórmula sea aplicable. Hay fórmulas para diferentes
cálculos de parámetros estadísticos (o estimadores de dichos parámetros). Hay fórmulas
para cuando se quieren estimar promedios (más usadas para variables cuantitativas o que
provienen de mediciones) y para cuando se quieren estimar proporciones (más usadas en
casos de variables cualitativas o categóricas) y también cambian dependiendo si las
poblaciones son finitas o infinitas (para muchos casos prácticos, se limita la población
como finita si N≤100,000 y en caso contrario se identifica como infinita).

Los componentes a considerar en las fórmulas para obtener el tamaño de la


muestra son los siguientes:
Proporción del resultado que se investiga p (por complemento q=1-p)
Coeficiente de confianza Pz
Error de muestreo E%
Error de estimación e%
Nivel de significación Pα
Intervalo de confianza (-z*E, z*E)
Universo Finito N<=100,000
Universo Infinito N > 100,000

Fórmulas usadas para calcular tamaños de muestra y errores de estimación:


Fórmula caso
4∗𝑝∗𝑞 Tamaño de muestra para el caso de
𝑛=
𝑒2 proporción en población infinita
𝑝∗𝑞 Error de estimación en proporciones
e% = 2 ∗ √ para una población infinita
𝑛
2 Tamaño de muestra para el caso de
4∗𝑆
𝑛= promedios en población infinita
𝑒2
4∗𝑝∗𝑞∗𝑁 Tamaño de muestra para el caso de
𝑛= 2
𝑒 ∗ (𝑁 − 1) + (4 ∗ 𝑝 ∗ 𝑞) proporción en población finita
𝑝∗𝑞 𝑁−𝑛 Error de estimación de proporción para
𝑒% = 2 ∗ √ ∗ una población finita
𝑛 𝑁−1
𝑁 ∗ 4 ∗ 𝑆2 Tamaño de muestra para el caso de
𝑛= 2
𝑒 ∗ (𝑁 − 1) + (4 ∗ 𝑝 ∗ 𝑞) promedios en población finita
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 22 de 29

Las fórmulas está calculadas para un nivel de confianza de 2σ, que corresponde a
un intervalo de confianza del Pz=95.5%. Y los símbolos significan:
* Simboliza multiplicación
n Tamaño de la muestra
N Tamaño de la Población
Cuadrado del puntaje de z, equivale a 2σ
4≈ 𝑍𝛼2
para un intervalo de confianza del 95.5%
𝑒2 Cuadrado del error de estimación
Error de estimación= (z)*(error de
𝑒%
muestreo) en porcentaje.
Proporción del resultado que se investiga
p
(0.5 si se desconoce p)
q El complemento de p
𝑝∗𝑞
𝐸% Error de muestreo = √ en porcentaje
𝑛
Factor de corrección. Utilizado para
N-1 reducir el error estándar de la muestra
𝐸% por tratarse de una población finita.

He aquí algunas sugerencias en cuanto a la aplicación de estas fórmulas:


Si en lo que estamos es haciendo estudios para estimar parámetros y queremos,
por ejemplo, estimar una proporción, primero identificamos la población como finita o
infinita (esto ya nos define un tipo de fórmula a usar). Luego se busca el tipo de datos de
entrada que se nos ofrece o tenemos en el problema:
• El nivel de confianza (1-α), esto generalmente viene dado en un porcentaje,
que bien puede ser 95%, eso significa que al buscar en la Tabla de la
distribución normal el valor 𝑍𝛼 se encontrará que es 1.96. Para cuando el
nivel de confianza o seguridad es del 99% el valor en tablas es 2.58. Otros
valores frecuentes son: para el 90% es 1.645; para el 97.5% es 2.24.
• Identificar el nivel de precisión que se desea en el estudio, igual que el
anterior, casi siempre viene dado en porcentaje (aunque no es obligación).
• Una idea del valor aproximado de la varianza 𝑆 2 de la variable cuantitativa
que se supone existe en la población.
• Una idea del valor aproximado del parámetro que se quiere medir (para
este ejemplo se trataría de una proporción), si no se tiene este dato, se
asume el valor p=0.5, que establece una especie de cota al tamaño

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 23 de 29

muestral, esto hace que q=1-p=0.5, lo que conlleva al mayor cálculo que se
puede obtener del producto p*q, lo que generaría un tamaño mayor de
muestra, algo que es aceptado sin problema.

Si nuestro caso es el de estimar una media, identificamos la población como finita


o infinita (esto ya nos define un tipo de fórmula a usar). Luego se busca el tipo de datos
de entrada que se nos ofrece o tenemos en el problema:
• El nivel de confianza (1-α), esto generalmente viene dado en un porcentaje,
que bien puede ser 95%, eso significa que al buscar en la Tabla de la
distribución normal el valor 𝑍𝛼 se encontrará que es 1.96. Para cuando el
nivel de confianza o seguridad es del 99% el valor en tablas es 2.58. Otros
valores frecuentes son: para el 90% es 1.645; para el 97.5% es 2.24.
• Identificar el nivel de precisión que se desea en el estudio, el valor máximo
que se obtiene de amplitud del intervalo de confianza alrededor de la
media es 2*(la precisión).

1.3.2. MUESTREO ALEATORIO SIMPLE


Muestreo aleatorio simple: Es aquel donde cada miembro de la población tiene la
misma probabilidad de ser elegido al momento de obtener la muestra.

Previo a la definición del Muestreo Aleatorio Simple, es necesario recalcar que


la población de esta investigación es finita; ya que conocemos el total de elementos o
entes a investigar.

Una muestra aleatoria simple tomada de una población finita, se selecciona de


tal manera que cada muestra posible del mismo tamaño tenga igual probabilidad de ser
seleccionada en el estudio. Para obtener una muestra aleatoria simple, cada elemento
en la población debe tener la misma probabilidad de ser seleccionado.

El objetivo fundamental de este tipo de muestreo es tratar de eliminar la


predisposición con la que los elementos de la muestra podrían ser elegidos. El método
más fácil que se utiliza para lograr extraer la muestra es enumerar todos los N
elementos, luego fijamos el tamaño n de la muestra y empezamos a tomar al azar los n
números. Para ello se puede hacer uso de una tabla de números aleatorios, o de un
software que indique aleatoriamente los elementos a considerar.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 24 de 29

1.3.3. OTROS METODOS DE MUESTREO


El muestreo aleatorio, también llamado probabilístico, puede ser de varios tipos:
Muestreo aleatorio sistemático o secuencial: Es un muestreo aleatorio simple
realizado de una forma sistemática, por ejemplo, incluir en la muestra cada tercer
elemento seleccionado, o cada quinto, o cada décimo, etc. Estos procedimientos exigen
que se tenga una lista de todos los miembros del marco muestral numerados. Se hará
una extracción uno a uno de los elementos de la muestra, partiendo del encontrado en
la posición “k”, siendo “k” un valor elegido aleatoriamente (usando la tabla de números
aleatorios o un programa que haga lo mismo, puede usar sitios en línea como:
http://www.random.org/integers). Luego a partir de allí se empiezan a elegir de “m” en
“m” los siguientes elementos hasta completar el tamaño deseado de la muestra. Este
valor de “m” debe ser tal que la selección no se salga del listado del marco muestral,
para ello, se debe cumplir que: m=N/n. Donde N es el tamaño del marco muestral y n el
tamaño elegido de muestra.

Muestreo aleatorio estratificado: La población está dividida en varios grupos o


estratos diferentes y mutuamente excluyentes (es decir, un objeto a muestrear no
puede estar en dos estratos diferentes), y la muestra se obtiene seleccionando
aleatoriamente miembros de cada grupo.

Para obtener una muestra aleatoria estratificada, primero se divide la población


de N individuos en H grupos, llamados estratos, cada uno de ellos con sus propias
características, esto es son heterogéneos entre sí, pero en su interior son lo más
homogéneos posible y en conjunto abarcan en su totalidad a la población, esto es:

N = N1 + N 2 + N 3 + N 4 + ... + N H

Donde N1, N2, N3, N4, …, NH son los tamaños de cada uno de los estratos.

Definido cada estrato y cumpliendo la homogeneidad en el interior de ellos, se


extrae una muestra aleatoria simple de cada uno de ellos, dichas extracciones deben
realizarse en forma independiente en cada uno de los estratos. Los tamaños de cada
uno de los estratos son representados por:

n  n1  n 2  n 3  n 4  ...  n H
El tamaño de las muestras de los H estratos pueden ser de igual o diferente
tamaño, esto varía de acuerdo al tamaño de cada estrato. Este tipo de asignación se lo

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 25 de 29

conoce con el nombre de afijación proporcional. Cuando a cada estrato le corresponde


un mismo número de elementos se denomina afijación “simple”; y, se le llama afijación
óptima, cuando se tiene en cuenta la previsible dispersión de los resultados, de modo
que se considera la proporción y desviación típica. Se aplica muy poco debido al
desconocimiento de la desviación.

Muestreo aleatorio por conglomerados (o clusters, en inglés): La población está


dividida en conglomerados o clusters, y a continuación, se seleccionan aleatoriamente
algunos conglomerados y luego dentro de ellos se eligen los miembros a considerar en
la muestra usando muestreo aleatorio simple.

En este tipo de muestreo, las unidades muestrales son grupos de elementos, esto
puede llevarnos a ciertas particularidades, como que no todos los grupos sean del
mismo tamaño, y a diferencia del estratificado donde los estratos eran diferentes pero
los miembros de cada estrato eran homogéneos, aquí, los conglomerados pueden ser
diferentes y también ser diferentes los elementos de cada grupo o conglomerado.

Otro detalle es que no es preciso tener el listado de toda la población, sino que
solo el de las unidades primarias del muestreo (los grupos). En realidad, este método
resulta ser bastante eficiente cuando la población es grande y dispersa. Para aplicarlo se
necesita realizar varias fases de muestreo sucesivo, convirtiéndose en polietápico,
donde las unidades de una etapa se limitan a las unidades de muestreo seleccionadas
en la etapa anterior.

La dificultad de este método es que el error estándar es mayor que en el


muestreo estratificado y es mucho más complejo de calcular.

1.4. ENLACES SUGERIDOS


http://www.scilab.org

http://www.scilab.org/download

http://www.scilab.org/product/man

http://www.random.org/integers

http://www.merriam-webster.com
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 26 de 29

http://creativecommons.org/licenses/by-sa/3.0

http://forge.scilab.org/index.php/p/docintrotoscilab/

http://www.cecill.info/licenses/Licence_CeCILL_v2-en.txt

https://www.netquest.com/calculadora-tamano-muestra?hsCtaTracking=65584ab8-
63f1-475a-b3a4-cebab42a8dca%7Cd38f94ed-3e7e-4292-83e3-dcea5f61389e

1.5. BIBLIOGRAFÍA
1. Anderson, T., (1974) Introductory statistical analysis Chicago, U.S.A. University of Illinois.
2. Baudin, M., (2010) Introduction to Scilab, France, The Scilab Consortium – Digiteo.
3. Canavos, G., (1998), Probabilidad y estadística: Aplicaciones y métodos, Mexico, D.F.,
McGraw-Hill/Interamericana de Mexico S.A. de C.V.
4. Devore, J., (2008). Probabilidad y estadística: Para ingeniería y ciencias (7ª. ed.) Mexico,
D.F., Cengage Learning Editores S.A de C.V.
5. Diccionario Merrian-Webster Retomado de: http://www.merriam-webster.com (2017).
6. Dodge, Y. (2006) Diccionario Oxford de términos estadísticos.
7. Dunn, O., Clark, V., (1974) Applied Statistics: Analysis of variance and regression New York,
U.S.A., John Wiley and Sons, Inc.
8. Everitt, B., Skrondal, A., (2010) The cambridge dictionary of statistics (4ª. ed.) New York,
U.S.A. Cambridge University Press.
9. Hines, W., Montgomery, D. (1993). Probabilidad y estadística: Para ingeniería y
administración (3er ed.) Mexico, D.F., CECSA.
10. Johnson, R., (1998) Probabilidad y estadística: Para ingenieros de Miller y Freund (5ª ed.)
Mexico, D.F., Prentice-Hall Hispanoamericana.
11. Lagares, P., Puerto, J., (2001) Población y muestra: Técnicas de muestreo Retomado de:
http://www.mathematik.uni-kl.de/~ mamaeusch.
12. Levin, R., Rubin, D., (2004) Estadística para administración y economía (7ª ed.) Mexico,
D.F., Pearson Education
13. Mendenhall, W., Beaver, R., Beaver, B., (2010). Introducción a la probabilidad y estadística
(13ª ed.) Mexico, D.F., Cengage Learning Editores S.A de C.V.
14. Neter, J., Wasserman, W., Withmore, G., (1982) Applied statistics (2nd ed.) Boston, U.S.A.
Allyn and Bacon, Inc.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 27 de 29

15. Organización de las Naciones Unidas. (1957). Preparación de informes sobre encuestas a
base de muestras, Informes estadísticos, Serie C, N.º 1.
16. Ott, R., Longnecker, M., (2010) An introduction to statistical methods and data analysis
(6ª ed.) Canadá, Brooks/Cole, Cengage Learning.
17. Pérez, C., (2005), Muestreo estadístico: Conceptos y problemas resueltos Mexico, D.F.,
Pearson Prentice Hall.
18. Romijn, J.-W., (2014) Philosophy of statistics Stanford Enyclopedia of Philosophy.
19. Spiegel, M., (1991) Estadística (2ª ed.) Santiago, Chile, McGraw-Hill Interamericana de
España S.A.
20. Yamane, T., (1979). Estadística (3er ed.) Mexico, D.F., Harla.

GLOSARIO
Censo: Cuando las unidades a considerar para el muestreo son todas las de la
población.

Consola: Ventana de Scilab, para interactuar emitiendo comandos y recibiendo en


ella los resultados de dichas ejecuciones, funciona de forma similar a una ventana de
terminal de Linux.

Dato: Observaciones y medidas tomadas durante cualquier tipo de investigación


científica.

Estadística: Rama de la matemática que tiene que ver con la colección, análisis,
interpretación, presentación y organización de datos.

Error de estimación: Originado por los errores que se puedan dar en el proceso
de estimación de los parámetros, su valor viene dado por el cálculo: 𝑒 = 𝑍𝛼 ∗ 𝐸 , donde
𝐸 es el Error de muestreo y 𝑍𝛼 es el valor en tablas de la distribución normal asociado al
nivel de significancia deseado en el cálculo.

Error de muestreo: Es el error admisible en el muestreo, se comete por el hecho


de sacar conclusiones sobre cierta realidad a partir de la observación de solo una parte
de ella, establecido por el investigador, se presenta por E y se expresa por lo general en
porcentaje.

Factor de elevación: Indica el número de elementos de la población representado


por cada elemento de la muestra. Factor de elevación = N / n.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 28 de 29

Factor de muestreo: multiplicado por 100 indica el porcentaje de la población que


se representa en la muestra. Factor de muestreo = n / N.

Marco de muestreo: Es una lista de las unidades de muestreo, es el listado de


todos los elementos que participarán en el proceso de muestreo, es decir a los que se les
aplicará el método elegido de muestreo y de donde se obtendrá la muestra.

Muestra: Un subconjunto de la población, más específicamente del marco


muestral, que se usará para representarla en la realización de un experimento.

Muestreo: Técnica para seleccionar una parte que sea representativa de la


población para la realización de un experimento que ofrezca resultados que sean
comparables a los de toda la población.

Muestreo Aleatorio Simple: Método de selección de una muestra en el que se


garantiza que cada miembro de la población tendrá la misma oportunidad de ser incluido
en la muestra.

Muestreo aleatorio estratificado: La población está dividida en varios grupos o


estratos diferentes y mutuamente excluyentes (es decir, un objeto a muestrear no puede
estar en dos estratos diferentes), y la muestra se obtiene seleccionando aleatoriamente
miembros de cada grupo.

Muestreo aleatorio por conglomerados (o clusters, en inglés): La población está


dividida, por lo general geográficamente, en conglomerados o clusters, se seleccionan
aleatoriamente algunos conglomerados y luego dentro de ellos se eligen los miembros a
considerar en la muestra usando muestreo aleatorio simple

Muestreo aleatorio sistemático o secuencial: Es un muestreo aleatorio simple


realizado de una forma sistemática, es decir, cada 3º o cada 5º, etc. Dentro del marco
muestral.

Población: Cualquier colección finita o infinita de “unidades”, las cuales suelen ser
personas, pero pueden ser cualquier cosa. Por ejemplo: instituciones, eventos, llamadas
telefónicas, artículos producidos, etc.

Scilab: Software para el tratamiento numérico de datos en la categoría de open


source distribuido gratuitamente bajo la licencia GNU GPL 2.0.

Scinotes: Ventana de Scilab, con el ambiente integrado para el desarrollo de


programas y funciones definidas por el usuario.
Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.
UNIVERSIDAD DE EL SALVADOR EN LÍNEA
FACULTAD DE INGENIERÍA Y ARQUITECTURA
PROBABILIDAD Y ESTADÍSTICA
Página 29 de 29

Tamaño de la muestra: Es el número elegido de unidades muestrales a considerar


en la muestra. Depende de varios factores: la estabilidad de la población, requerimientos
estadísticos, factores económicos, disponibilidad de los elementos a muestrear y la
importancia del problema.

Unidades elementales (o elementos): Son las unidades acerca de las cuales se


quiere realizar una investigación o investigar características de ellas. Son las que
suministran la base del análisis.

Unidades de muestreo: Son las unidades que sirven de base para las operaciones
de muestreo, pueden ser: (i) las mismas unidades elementales o (ii) grupos de elementos
que conforman un conglomerado de unidades elementales.

Este material ha sido proporcionado al estudiante en el marco de su formación a través de una carrera en
línea en la Universidad de El Salvador. Se han respetado los derechos de autor para su elaboración. El debido uso del
mismo es responsabilidad del estudiante.

S-ar putea să vă placă și