Sunteți pe pagina 1din 11

APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS

Página 1 de 11

Normalización de datos
Normalizar datos en una base de datos es el proceso de estandarizar escritura, ordenar y agrupar
los datos en tablas de tal manera que todos los datos estén bien escritos que los resultados al utilizar
la base de datos sean siempre inequívocos y dan el resultado que se pretende.

Errores frecuentes de datos no normalizados,

Casos que se presentan por errores involuntarios de quienes digitan la información.

A primera vista no son muy detectados, pero en la utilización de filtros o tablas dinámicas, se puede
evidenciar que el sistema no realiza la correcta agrupación de datos debido a estos errores.

La normalización de datos se puede aplicar de diferentes formas, entre ellas.


1. Ordene la tabla por la columna que requiere normalizar sus datos
A simple vista se puede detectar errores ortográficos
Opción a.
2. Verifique que la primera palabra este bien escrita, en caso alguno debe corregirla
3. Seleccione todas las celdas que deben tener la misma palabra
4. Presionar las teclas CTRL + J

Opción b.
2. Active la herramienta filtros Automáticos
3. Filtre la columna, y solamente seleccione los datos que se encuentran escritos de formas
diferentes
4. Verifique que la primera palabra este bien escrita
5. Seleccione todas las celdas que deben tener la misma palabra
6. Presione la tecla F2, para editar la celda, si es necesario, corrija la palabra, sin abandonar
la celda.
7. Presione las Teclas CTRL + INTRO

Después de aplicar la opción a, o la opción b, tendremos datos


normalizados, asi:
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 2 de 11

ORDENAR DATOS EN UNA TABLA POR UN CRITERIO O VARIOS CRITERIOS

Seleccione la tabla de datos


Clic en ficha Datos
Clic en Ordenar

1. En Ordenar Por, Seleccione la


columna a ordenar.
2. En Ordenar Según, deje
seleccionado la opción Valores.
3. En Criterios de ordenación,
Seleccione la forma de ordenar,
ascendente A a la Z o
descendente Z a la A.
4. Si requiere ordenar por una segunda o más columnas, Haz clic en Agregar Nivel, y repita los
pasos del 1 al 3.
5. Al finalizar de definir la parametrización del ordenar, clic en Aceptar

TABLAS EN EXCEL
Las tablas son la manera en que Excel identifica un rango de celdas relacionando toda la información
contenida en ella
La primera fila de una tabla siempre contendrá los encabezados de columna y el resto de las filas
contendrán los datos. El utilizar tablas es muy conveniente porque Excel se hará cargo de los detalles
del manejo de las tablas, como facilitar el agregar nuevas filas o eliminarlas, copiar formulas,
permitiendo hacer un análisis más detallado de sus datos.
Convertir datos en una tabla de Excel
2. Seleccione toda la tabla o ubicar cursor en una celda de contenido de la tabla.
3. Clic en Ficha Insertar
4. Clic en Tabla
5. En ¿Dónde están los datos de la tabla? Definir el
rango de datos propuesto por Excel
6. Clic Active esta
opción.
7. Clic en Aceptar

ESTILOS RAPIDOS
es la aplicación de diferentes formatos de presentación a la tabla (Bordes, sombreados, etc)
APLICAR ESTILOS RAPIDOS
1. Ubicar cursor en una celda de la tabla
2. Clic en Ficha Diseño (Herramienta de Tablas)
3. Clic en Estilos Rápidos
4. Seleccione un estilo de su preferencia

CONVERTIR UNA TABLA A DATOS EN EXCEL


APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 3 de 11

1. Ubicar cursor en una celda de la tabla


2. Clic en Ficha Diseño (Herramienta de Tablas)

3. Clic en
4. Clic en Aceptar.

HERRAMIENTA DE ANALISIS DE DATOS


El análisis de datos estadístico es la
ciencia que se encarga de examinar un conjunto de datos con el propósito de sacar
conclusiones sobre la información para poder tomar decisiones, o simplemente ampliar los
conocimientos sobre diversos temas.
Cuando tengas hacer un análisis estadístico, puede ahorrar pasos y tiempo si utiliza las
Herramientas para análisis. Tenga en cuenta que se deberá proporcionar los datos y
parámetros para cada análisis, y la herramienta utilizará las funciones estadísticas para realizar
los cálculos y mostrar los resultados en una tabla de resultados. Algunas herramientas generan
gráficos además de tablas de resultados.
Con base en la clase anterior donde tocamos el tema de estadística, y realizamos algunos cálculos
manuales, ahora veremos como la herramienta de Excel nos colabora mas efectivamente.
ACTIVAR LA HERRAMIENTA DE ANALISIS DE DATOS
1. Clic en Archivo
2. Clic en Opciones
3. Clic en Complementos

4. Clic en
5. Clic en
6. Clic en Aceptar
CREAR UNA ESTADISTICA DESCRIPTIVA UTILIZANDO LA HERRAMIENTA DE ANALISIS DE DATOS
1. Seleccione la hoja donde tiene los datos recopilados que desea analizar
2. Clic en Ficha Datos
3. Clic en Análisis de datos
4. En Funciones para Análisis: seleccione la
función Estadística descriptiva
5. Clic en Aceptar
6. Definir parámetros para el análisis, para
ello tenga en cuenta las siguientes
opciones:
 Rango de entrada: La columna que
contiene los datos numéricos de los cuales
se obtendrán los datos estadísticos.
 Agrupado por: Indica la orientación del
rango de entrada. Para el ejemplo los datos
están en una columna.
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 4 de 11

 Rótulos en la primera columna: Si dentro del rango de entrada está incluida la celda que
contiene el título de la columna, entonces debes marcar esta caja de selección.
 Opciones de salida. Podrás elegir tres posibles opciones de salida: elegir un rango dentro de la
misma hoja donde se colocarán los resultados, o elegir que los resultados se coloquen en una
hoja nueva o en un libro nuevo.
 Resumen de estadísticas. Es necesario que esta opción esté seleccionada para obtener los datos
estadísticos que necesitamos.
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 5 de 11

Ejemplo
Tabla de datos, donde se desea estudiar el comportamiento de los salarios de los empleados

Este
es
el

resultado que nos proporcional Excel sobre estudio


estadístico a los salarios
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 6 de 11

CREAR UN HISTOGRAMA UTILIZANDO LA HERRAMIENTA DE ANALISIS DE DATOS


Un histograma es una representación gráfica de una variable en forma de columnas, donde el
tamaño de cada columna es proporcional a la frecuencia del valor que está representando. El eje
horizontal del histograma tiene los valores de las variables y el eje vertical las frecuencias.
Antes de Iniciar la creación del histograma, es necesario tener los datos recolectados, como también
una columna adicional, donde los datos estén agrupados por clases, esto quiere decir hacer una lista
de datos no repetidos, los cuales servirán para indicar el número de veces que se repitió dentro de
los datos recolectados.
Ejemplo. Tenemos una lista de 100 personas, quienes reportaron el valor de su salario, en la primera
columna esta la lista detallada en la forma como se iba recibiendo los datos. En la siguiente columna
ya se encuentran las clases.
Para hallar estos estos existen varias técnicas o formas, una de ellas es…
Copie los datos en otra columna, recuerda los pasos,
2. seleccionar la columna que contiene los datos
3. Presione las teclas CTRL + C
4. Ubicar el cursor en la columna donde requiere ver los datos
5. Presionar las teclas CTRL + V
Ahora, lo que se puede hacer es Quitar datos duplicados, para ello de realizar los siguientes
pasos.
1. Seleccione los datos copiados
2. Clic en ficha Datos

3. Clic en Quitar datos Duplicados


4. Clic en continuar la selección actual
5. Clic en Quitar Duplicados
6. En la ventana de Quitar Duplicados, clic en Aceptar
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 7 de 11

Ahora ya tenemos las clases, o los datos clasificados donde estos


se repiten un sinnúmero de veces, seria importante ordenar los
datos de menor a mayor, como el ejemplo mostrado a
continuación.

A continuación, procederemos, a trabajar con la herramienta de


histogramas.

1. Seleccione la hoja donde están los datos a


analizar
2. Clic en Ficha Datos
3. Clic en Análisis de datos
4. En Funciones para Análisis: seleccione la
función Histograma
5. Clic en Aceptar
6. Definir parámetros para el análisis, para
ello tenga en cuenta las siguientes
opciones:
 En Rango de entrada: Defina las celdas
que contiene los salarios, de los cuales se
obtendrán los datos estadísticos.
 En rango de Clases: Seleccione las celdas de los
salarios agrupados o de clases previamente creada.
 Active la casilla del Rótulos
 Rótulos en la primera columna: Si dentro del rango
de entrada está incluida la celda que contiene el
título de la columna, entonces debes marcar esta
caja de selección.
 Opciones de salida.
 Selecciona una opción de salida.
 Selecciona un tipo de informe
No olvides seleccionar los diferentes tipos de informe por separado, y genere el análisis respectivo.
7. Clic en Aceptar.
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 8 de 11

Ejemplos
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 9 de 11

FUNCIONES DE ESTADÍSTICA

MEDIA.ACOTADA Descripción
Devuelve la media del interior del conjunto de datos. MEDIA.ACOTADA calcula la media de un
conjunto de datos después de eliminar el porcentaje de los extremos inferior y superior de los puntos
de datos. Puede usar esta función para excluir del análisis los valores extremos.

Sintaxis
MEDIA.ACOTADA(matriz, porcentaje)
Matriz. Es la matriz o el rango de valores que desea acotar y cuya media desea calcular.
Porcentaje. Es el número fraccionario de puntos de datos que se excluyen del cálculo. Por ejemplo, si
porcentaje = 0,2, se eliminarán 4 puntos de un conjunto de datos de 20 puntos (20 x 0,2), 2 de la
parte superior y 2 de la parte inferior.

ERROR TIPICO
El error Típico o Estándar de la media, es el valor que cuantifica cuantos se apartan los valores de la
media de la población. Es decir, el error estándar de la media cuantifica las oscilaciones de la media
muestral alrededor de la media población. ES una medida del error que se comente al tomar la
media calculada en una muestra como estimación correspondiente

A partir del error estándar se construye el intervalo de confianza de la medida correspondiente.

El error estándar de la media estimado en la muestral. Se calcula dividiendo la desviación estándar


por la raíz cuadrada del tamaño muestral
=desviación estándar/√ tamaño de la muestra

FUNCIÓN MEDIANA
La mediana de un conjunto de números es aquel número que está en el medio, esto es, que tiene la
mitad justa de números con un valor superior, la mitad de los números con un valor inferior. No hay
que confundirlo con la Media, que es el valor promedio del conjunto de números.

Sintaxis
MEDIANA(número1;número2; ...)

FUNCIÓN MODA.VARIOS
Devuelve una matriz vertical de los valores que ocurren o se repiten con más frecuencia en una
matriz o rango de datos. Debe utilizarse como una fórmula de matriz.

Sintaxis
MODA.VARIOS((número1;[número2];...)
Los argumentos pueden ser números o nombres, matrices o referencias que contengan números.

FUNCIÓN DESVESTA
La desviación estándar de una variable aleatoria, población estadística, conjunto de datos o
distribución de probabilidad es la raíz cuadrada de su varianza.
Sintaxis
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 10 de 11

DESVESTA(valor1; [valor2]; ...)

FUNCION VAR.S
Calcula la varianza de una muestra (pasa por alto los valores lógicos y el texto de la muestra).

Sintaxis
VAR.S(Numero1; [numero2], ...)

FUNCION CURTOSIS
La curtosis de una variable estadística/aleatoria es una característica de forma de su distribución de
frecuencias/probabilidad.

Sintaxis
CURTOSIS(número1; [número2]; ...)

FUNCION COEFICIENTE.ASIMETRIA
Devuelve la asimetría de una distribución. Esta función caracteriza el grado de asimetría de una
distribución con respecto a su media. La asimetría positiva indica una distribución unilateral que se
extiende hacia valores más positivos. La asimetría negativa indica una distribución unilateral que se
extiende hacia valores más negativos.
Sintaxis COEFICIENTE.ASIMETRIA(número1; [número2]; ...)

RANGO
Equivale al intervalo entre el valor máximo y el valor mínimo. El rango indica la longitud del intervalo
en el que se hallan todos los datos de la distribución
=[valor máximo]-[valor mínimo]

FUNCION MÁXIMO
Calcula el valor más alto en un rango de datos.
Sintaxis: =Max(Número1; Número2; …)

FUNCION MÍNIMO
Calcula el valor más bajo o mínimo en un rango de datos.
Sintaxis: =Min(Número1; Número2; …)

FUNCION CONTAR
Cuenta el número de celdas no vacías y los valores que hay en la lista de argumentos.
Sintaxis: =Contar(Número1; Número2; …)

FUNCION SUMA
Cuenta el número de celdas no vacías y los valores que hay en la lista de argumentos.
Sintaxis: =Suma(Número1; Número2; …)
APOYO TEORICO DE LA GUIA 2 ANALISIS DE DATOS
Página 11 de 11

Ejemplos de las anteriores funciones