Sunteți pe pagina 1din 32

informatica

DEDICATORIO
Abuela de pioln

informatica

Este trabajo est dedicado a


nuestros queridos padres por
brindarnos
su
apoyo
incondicional da a da y al
docente por educarnos con
esfuerzo y entusiasmo para
lograr nuestros objetivos y
agradecerle por su dedicacin.

INDICE

Abuela de pioln

informatica

RESUMEN

Abuela de pioln

informatica

ABSTRACT

Abuela de pioln

informatica

INTRODUCCION

Abuela de pioln

informatica

CAPITULO I
MARCO CONPEPCTUAL
1.1.1. Poblacin infinita:
A este tipo de poblacin se le denomina
infinita porque el nmero de elementos que la
integran es desconocido o no se tiene la
Abuela de pioln

informatica

seguridad de tener el tamao exacto o real de


la poblacin.
Ejemplo
Finita: Poblacin de una ciudad, poblacin de
aves, una escuela de nios.
1.1.2. Poblacin finita:
Es la poblacin de la que s se conoce el
tamao, es decir que la cantidad de
elementos que integran la poblacin con la
que trabajamos es la cantidad real y no una
aproximacin.
Ejemplo
Infinita: las estrellas, granos de arena, una
poblacin de hormigas.
1.2.

LA MUESTRA

La muestra es importante para poder realizar


la recopilacin de informacin que
necesitamos para nuestro trabajo. Viene a ser
la representacin de la poblacin que
estudiaremos, es decir es solo una parte de
ella y no toda la poblacin. Para encontrar la
muestra necesitamos de un mtodo que nos
ayude a determinarla.
El Muestreo
Es el procedimiento que se emplea para poder
obtener la muestra de una poblacin
Abuela de pioln

informatica

determinada. Para poder determinar la


muestra se pueden hacer uso de uno de los
siguientes mtodos:
1.2.1. Muestreo probabilstico
Este mtodo se basa en que todos los
elementos que conforman nuestra poblacin
tengas las mismas posibilidades de ser
elegidos para la muestra. Algunos de los tipos
de este mtodo probabilstico estn:
Muestreo aleatorio simple:
Consiste en asignar un nmero a cada
elemento que conforma la poblacin, para que
luego mediante algn mtodo de seleccin, se
pueda elegir a una cantidad de elementos que
formarn parte de la muestra. Debeos saber
que el nmero de la muestra ya ha sido
establecido antes de realizar la seleccin.
Muestreo aleatorio sistemtico:
Al igual que el muestreo aleatorio simple, se le
asigna un nmero a cada elemento de la
poblacin, pero con la diferencia que la
seleccin los elementos que conformarn la
muestra es distinta; solo se elige a un nmero
de forma aleatoria, para que a partir de ese
nmero se haga una suma sucesiva, de tal
Abuela de pioln

informatica

forma que se van seleccionando a los dems


elementos de la muestra, la suma sera de la
siguiente forma:
Elementos de la muestra = i, i + k, i + 2k,
i + 3k,, i + (n-1) k
Donde:
i = nmero seleccionado al azar.
k = Tamao de la poblacin sobre el
tamao de la muestra(N/n).

Muestreo aleatorio
estratificado:
Consiste en que cada estrato de nuestro
inters sea incluido en los elementos de la
muestra, de tal forma que participen y puedan
tener las mismas oportunidades. Se puede
estratificar segn su profesin, el sexo, el
estado civil, etc.
Cuando hacemos uso de este tipo de
muestreo para incluirlo en la muestra se llama
afijacin, que es la obtencin de la muestra en
funcin de diferentes estratos.

Abuela de pioln

informatica

Muestreo aleatorio por


conglomerados:
Consiste en la seleccin aleatoria de los
conglomerados que formarn parte de la
muestra, para luego investigar los elementos
que pertenecen a los conglomerados que
fueron elegidos para formar parte de la
muestra.
1.2.2. Muestreo no probabilstico:
Con esta forma de muestreo no se puede
asegurar que se trabajar sobre la poblacin,
por eso decimos que la muestra no
necesariamente son representativas de la
poblacin. En el muestreo no probabilstico no
todos los elementos de nuestra poblacin
tienen las mismas posibilidades que en el
muestreo probabilstico.
Muestreo por cuotas:
Consiste en fijar cuotas, es decir fijar ciertas
caractersticas que harn que todos aquellos
elementos de la poblacin que las cumplan
pasen a formar parte de los elementos que
conformarn la muestra.
Abuela de pioln

informatica

En este tipo de muestreo la eleccin es de


forma aleatoria, en otras palabras se elegir a
cada persona que se encuentre en la cuota
asignada.

Muestreo intencional o de
conveniencia:
Este tipo de muestreo consiste en la eleccin
de la muestra de forma que la seleccin de los
elementos de la muestra depende de los que
estn estudiando una determinada poblacin.
Normalmente la eleccin que hacen los
investigadores es de aquellos elementos a los
que se tienen fcil acceso.
Bola de nieve:
Es cuando la muestra se consigue completar a
travs de cada elemento de muestra que se
va integrando. Es decir que del primer
integrante que forma parte de la muestra que
encontramos, este nos conducir al siguiente
integrante de la muestra, y as sucesivamente
llegar a completar todos y cada uno de los
elementos de la muestra establecida.
Abuela de pioln

informatica

Muestreo discrecional:
Es simplemente la decisin de investigador la
importa en este tipo de muestreo, ya que el
tendr el poder de decidir sobre quines son
los que pueden aportar al estudio que se
realiza.
1.3.

VARIABLE ESTADSTICA:

Es una propiedad que puede cambiar cuya


variacin es susceptible de adoptar diferentes
valores, los cuales pueden medirse, es cada
una de las caractersticas o cualidades que
poseen los individuos de una poblacin.
Las variables son un conjunto de
caractersticas que poseen los individuos que
integran la poblacin, estas variables pueden
ser de dos tipos:

1.3.1. Variables cualitativas:


Es un smbolo que puede aparecer en una
funcin, un algoritmo, una proposicin o una
frmula, adoptando distintos valores, son
aquellas que permiten la expresin de una

Abuela de pioln

informatica

caracterstica, una categora, un atributo o


una cualidad.
Nominal:
Presenta modalidades no numricas que no
admiten un criterio de orden.
Ejemplos
El estado civil, con las siguientes modalidades:
soltero, casado, separado, divorciado y viudo,
etc
Ordinal:
La variable puede tomar distintos valores
ordenados siguiendo una escala establecida,
aunque no es necesario que el intervalo entre
mediciones sea uniforme.
Ejemplo:
La nota en un examen: suspenso, aprobado,
notable, sobresaliente.
Puesto conseguido en una prueba deportiva:
1, 2, 3, etc
1.3.2. Variables cuantitativas
Es la que se expresa mediante un nmero, por
tanto se pueden realizar operaciones
aritmticas con ella. , que expresan
cualidades, atributos, categoras o
caractersticas.
Abuela de pioln

informatica

Intervalo:
Se emplean si las variables toman un nmero
grande de valores o la variable es continua, se
agrupan los valores en intervalos que tengan
la misma amplitud denominados clases. A
cada clase se le asigna su frecuencia
correspondiente
Ejemplos
Temperaturas de las regiones del Per [-10C5C]
Razn:
Indica las proporciones de los datos de una
poblacin
Ejemplos
Alexandra tiene 30 aos
Axell tiene 80 aos
1.3.3. Variables aleatoria:
Una variable aleatoria puede concebirse como
un valor numrico que est afectado por el
azar, a la funcin que adjudica eventos
posibles a nmeros reales, cuyos valores se
miden en experimentos de tipo aleatorio

Abuela de pioln

informatica

1.3.4. Variables aleatoria discreta:


Es aquella que slo puede tomar valores
enteros, aquellas cuyo rango est formado por
una cantidad finita de elementos o que sus
elementos pueden enumerarse de manera
secuencial.
Ejemplos
El nmero de hijos de una familia, la
puntuacin obtenida al lanzar un dado.
1.3.5. Variables aleatoria discreta
continua:
Es aquella que puede tomar todos los valores
posibles dentro de un cierto intervalo de la
recta real, se vincula con un recorrido que
abarca la totalidad de los nmeros reales.
1.4.

TABULACIN DE DATOS

El proceso de tabulacin consiste en el


recuento de los datos que estn contenidos en
los cuestionarios. En este proceso incluimos
todas aquellas operaciones encaminadas a la
obtencin de resultados numricos relativos a
los temas de estudio que se tratan en los
cuestionarios. Se requiere una previa
codificacin de las respuestas obtenidas en los
cuestionarios. Realizamos tabulacin,
Abuela de pioln

informatica

codificacin y diseo de grficos con datos


biogrficos, de consumo o de opinin. Los
resultados sern presentados en tablas y/o
mapas grficos que expliquen las relaciones
existentes entre las diversas variables
analizadas.
1.4.1. Variables Cualitativas:
Las variables cualitativas (ordinales o no)
toman valores no numricos. Para tener una
idea de los datos recogidos, pueden
contabilizarse las diferentes ocurrencias de los
distintos valores, dando lugar a los tres
conceptos siguientes.
Frecuencia absoluta:
La frecuencia absoluta es el nmero de veces
que aparece un determinado valor en un
estudio estadstico.
Se representa por fi.
La suma de frecuencia absoluta es igual al
nmero total de datos, que se representa por
N.

Para indicar resumidamente estas sumas se


utiliza la letra griega (sigma mayscula)
Que se lee suma o sumatoria.

Abuela de pioln

informatica

Frecuencia relativa:
Frecuencia relativa es la divisin entre la
frecuencia absoluta y el tamao de la muestra
(N).

Porcentajes:
Para obtener el porcentaje se multiplica la
frecuencia relativa por cien (tanto por cien%)
1.4.2. Variables cualitativas ordinales:
En las variables cualitativas ordinales se
pueden utilizar los mismos conceptos de
frecuencia absoluta, relativa o porcentajes,
pero adems se pueden utilizar tres conceptos
relacionados que incluyen una acumulacin.
La frecuencia absoluta acumulada
La frecuencia absoluta acumulada es la suma
de frecuencias absolutas de todos los valores
iguales o inferiores al valor considerado, se
representa por Fi.

Abuela de pioln

informatica

La frecuencia relativa acumulada


La frecuencia relativa acumulada es el
resultado de dividir la frecuencia acumulada
entre el nmero total de datos, se representa
por Ni.

Las frecuencias relativas acumuladas se


pueden calcular alternativamente a partir de
las frecuencias absolutas acumuladas:

1.4.3. Variable cuantitativa contina


Aunque los datos de las variables
cuantitativas continuas se pueden tabular al
igual que en los casos anteriores, el gran
nmero de valores posibles que suelen tener
aconseja agruparlas en intervalos contiguos
denominados intervalos de clase. Cada
intervalo de clase tiene un valor
representativo, que es el valor intermedio, al
que se denomina marca de clase
Intervalo de clase

Abuela de pioln

informatica

Para agrupar los datos es necesario definir el


lmite inferior y superior de la clase, la
diferencia entre los lmites determina el
intervalo.
Una de las tcnicas es la regla de Sturges,
que calcula
el nmero de
intervalos
por la siguiente
frmula.
Marca de clase
La marca de clase es el punto medio de cada
intervalo esto se obtiene sumando los limites
inferior y superior y dividiendo por 2.
1.5.
DISTRIBUCIONES DE FRECUENCIAS
PARA DATOS CUANTITATIVOS
1.5.1.

HISTOGRAMA:

Es una representacin grfica de


una variable en forma de barras, donde la
superficie de cada barra es proporcional a
la frecuencia de los valores representados, ya
sea en forma diferencial o acumulada. Sirven
para obtener una "primera vista" general, o
panorama, de la distribucin de la poblacin, o
la muestra, respecto a una caracterstica,
cuantitativa y continua, de la misma y que es
de inters para el observador (como la
longitud o la masa).
Ejemplo:
Abuela de pioln

informatica

1.5.2.
POLIGONOS DE FRECUENCIAS:
Es el nombre que recibe una clase de
grfico que se crea a partir de
un histograma de frecuencia. Estos
histogramas emplean columnas verticales
para reflejar frecuencias): el polgono de
frecuencia es realizado uniendo los puntos de
mayor altura de estas columnas.
Ejemplo:

Abuela de pioln

informatica

1.5.3.

CURVAS DE TENDENCIA:

Las curvas de tendencia son una de las


herramientas ms simples, y a la vez una de
las ms valiosas, dentro del anlisis grfico.
Una curva o lnea de tendencia al alza es una
lnea recta que une los mnimos sucesivos de
una tendencia alcista, y por lo tanto aumenta
su valor conforme se extiende a la derecha.
Una lnea de tendencia a la baja es una lnea
recta que une mximos sucesivos dentro de
una tendencia a la baja, por lo que disminuye
su valor conforme se desplaza a la derecha.
Ejemplo:

Abuela de pioln

informatica

1.5.4.

OJIVAS:

Es el polgono frecuencial acumulado, es decir,


que permite ver cuntas observaciones se
encuentran por encima o debajo de ciertos
valores, en lugar de solo exhibir los nmeros
asignados a cada intervalo.
Ejemplo:

1.5.5. DIAGRAMA DE TALLO Y HOJAS:


permite obtener simultneamente una
Abuela de pioln

informatica

distribucin de frecuencias de la variable y


su representacin grfica. Para construirlo
basta separar en cada dato el ltimo dgito
de la derecha (que constituye la hoja) del
bloque de cifras restantes (que formar
el tallo).
Ejemplo:

1.5.6.

DIAGRAMAS DE CAJA:

Es un grfico, basado en cuartiles, mediante el


cual se visualiza un conjunto de datos. Est
compuesto por un rectngulo, la "caja", y dos
brazos, los "bigotes. Es un grfico que
suministra informacin sobre los valores
mnimo y mximo, los cuartiles Q1, Q2
o mediana y Q3, y sobre la existencia de
valores atpicos y la simetra de la distribucin.
Primero es necesario encontrar la mediana
para luego encontrar los 2 cuartiles restantes.
Ejemplo:

Abuela de pioln

informatica

1.6.

MEDIDAS DE TENDENCIA CENTRAL

Son medidas estadsticas que pretenden


resumir en un solo valor a un conjunto de
valores.
1.6.1. Mediana
Es el valor que ocupa el lugar central de todos
los datos cuando estn ordenados de menor a
mayor, se representa por Me y se puede hallar
slo para variables cuantitativas.
1.6.2.

El promedio

Se vincula con la media aritmtica, consiste


en el resultado que se obtiene al generar la
divisin con la sumatoria en diversas

Abuela de pioln

informatica

cantidades por el digito que les representes


total.
1.6.3.

Curvas de tendencia

Las curvas representan la distribucin de los


puntos del conjunto de datos de la muestra o
poblacin.
Se debe de considerar que no siempre los
datos se encuentran distribuidos de manera
uniforme, por lo que las curvas pueden ser
simtricas o sesgadas.

1.6.4.

La Moda

En estadstica, la moda es el valor con una


mayor frecuencia en una distribucin de
datos.
Se hablar de una distribucin bimodal de los
datos adquiridos en una columna cuando
Abuela de pioln

informatica

encontremos dos modas, es decir, dos datos


que tengan la misma frecuencia absoluta
mxima. Una distribucin trimodal de los
datos es en la que encontramos tres modas. Si
todas las variables tienen la misma frecuencia
diremos que no hay moda.
Moda de datos agrupados
Para obtener la moda en datos agrupados se
usa la siguiente frmula:

Donde:
=

-inferior de la clase modal

= es el delta de frecuencia absoluta modal


y la frecuencia absoluta premodal.
= es el delta de frecuencia absoluta modal
y la frecuencia absoluta postmodal.
= Amplitud del intervalo modal

1.6.5. Cuartil
Los cuartiles son los tres valores que dividen
al conjunto de datos ordenados en cuatro
partes porcentualmente iguales.
La diferencia entre el tercer cuartil y el
primero se conoce como rango intercuartlico.
Abuela de pioln

informatica

Se representa grficamente como la anchura


de las cajas en los llamados diagramas de
cajas.
Dada una serie
de valores X1,X2,X3 ...Xn ordenados en forma
creciente, podemos pensar que su clculo
podra efectuarse:
Primer cuartil (Q1) como la mediana de
la primera mitad de valores;
Segundo cuartil (Q2) como la propia
mediana de la serie;
Tercer cuartil (Q3) como la mediana de
la segunda mitad de valores.
Clculo con datos no agrupados
No hay uniformidad sobre su clculo. En la
bibliografa se encuentran hasta cinco
mtodos que dan resultados diferentes.2 Uno
de los mtodos es el siguiente: dados n datos
ordenados:
Para el primer cuartil:

Para el tercer cuartil:

Abuela de pioln

informatica

1.6.6. Decil
En estadstica descriptiva, el concepto decil se
refiere a cada uno de los 9 valores que dividen
un grupo de datos (clasificados con una
relacin de orden) en diez partes iguales, y de
manera que cada parte representa un dcimo
de la poblacin. En resumen, los deciles son
cada uno de los nueve valores que dividen un
conjunto de datos en diez grupos con iguales
efectivos.
Los deciles se calculan como si fueran 10cuartiles, o sea de manera que:
El primer decil separe el juego de datos
entre el 10% de los valores inferiores, y el
resto de los datos.
Y el noveno decil separe los datos entre
el 90% de los valores inferiores y el 10%
de los valores superiores.
El trmino decil tambin se usa para designar
cada uno de los diez grupos de valores (de la
poblacin o de una muestra) y, tambin, a los
diez intervalos que contienen el mismo
nmero de datos: el decil n-simo, es el
intervalo entre el decil-nmero (n-1) y el decilnmero n (desde n=1 hasta n=10)
1.6.7. Percentil
Abuela de pioln

informatica

Los percentiles son los 99 valores que dividen


la serie de datos en 100 partes iguales.
Los percentiles dan los valores
correspondientes al 1%, al 2%... y al 99% de
los datos.
P50 coincide con la mediana.
P50 coincide con D5.
En primer lugar buscamos
la
clase donde se encuentra, en la tabla de las
frecuencias acumuladas.

Li es el lmite inferior de la clase donde se


encuentra el percentil.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la
clase del percentil.
ai es la amplitud de la clase.
1.7.

MEDIDAS DE VARIABILIDAD

1.7.1. Rango o amplitud:


Es el intervalo entre el valor mximo y el
valor mnimo; por ello, comparte unidades con
Abuela de pioln

informatica

los datos. Permite obtener una idea de


la dispersin de los datos, cuanto mayor es el
rango, ms dispersos estn los datos de un
conjunto.
Por ejemplo, para una serie de datos de
carcter cuantitativo, como lo es la estatura
medida en centmetros, tendramos:
155, 165, 170, 182,185.
En nuestro ejemplo, con cinco valores, nos da
que R = 185-155 = 30.
1.7.2. Varianza:
que se representarse como , es una medida
de dispersin definida como la esperanza del
cuadrado de la desviacin de dicha variable
respecto a su media.
Por ejemplo, un dado de seis caras puede
representarse como una variable aleatoria
discreta que toma, valores del 1 al 6 con
probabilidad igual a 1/6. El valor esperado es
(1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su
varianza es:

1.7.3. DESVIACIN ESTANDAR

Abuela de pioln

informatica

Esta es una medida de dispersin que es


aplicada sobre los datos cuantitativos y de
intervalo. Es necesario conocer la desviacin
para de esta forma tener ms aspectos que
observar sobre los datos que fueron
recolectados al ser comparados y tambin las
conclusiones respectivas de cada aspecto
tratado.
Para encontrar la desviacin estndar,
aplicamos la siguiente formula:
x
n

( ix )2
i=1

n1
=S x =
x
k

f i ( i x )2
i=1

N1
S x =

1.7.4. COEFICIENTE DE VARIACIN


El coeficiente de variacin estndar expresa la
deviacin estndar como porcentaje de la
media aritmtica. Normalmente es utilizado
cuando se quiere comparar o uniformizar
medidas de datos y expresarlos en diferentes
unidades de medida.
Frmula del coeficiente de variacin:
C v=

| x|

100

Abuela de pioln

informatica

1.7.5. COEFICIENTE ESTANDAR


Es utilizado para estandarizar cualquier tipo
de dato, para posteriormente hacer
comparaciones en caso que los datos estn
expresados en diferentes unidades de medida.
Z i=

x i

Abuela de pioln

S-ar putea să vă placă și