Sunteți pe pagina 1din 8

Asignatura:

Teoría de los test y fundamentos de medición

Tema:
Actividad 4

Participante:
Yvelisse Del Orbe

Matricula:
201807507

Facilitadora:

Tomasina Vázquez
En esta semana continuarás con los ejercicios para trabajar en otras
fórmulas estadísticas con el SPSS. Por lo tanto,
1. Ejecute los ejercicios facilitado por el Facilitador en la plataforma y a
través de esta herramienta sobre las diversas actividades estadísticas
proceda a implementar el programa estadístico del SPSS.
SPSS es un programa estadístico informático muy usado en las ciencias
sociales y aplicadas, además de las empresas de investigación de mercado. El
nombre originario correspondía al acrónimo de Statistical Package for the
Social Sciences (SPSS), reflejando la orientación a su mercado original
(ciencias sociales), aunque este programa es también muy utilizado en otros
campos como la mercadotecnia. Sin embargo, en la actualidad la parte SPSS
del nombre completo del software (IBM SPSS) no es acrónimo de nada. 1
Es uno de los programas estadísticos más conocidos teniendo en cuenta su
capacidad para trabajar con grandes bases de datos y una sencilla interfaz
para la mayoría de los análisis. En la versión 12 de SPSS se podían realizar
análisis con dos millones de registros y 250.000 variables. El programa
consiste en un módulo de base y módulos anexos que se han ido actualizando
constantemente con nuevos procedimientos estadísticos. Cada uno de estos
módulos se compra por separado.
Por ejemplo, SPSS puede ser utilizado para evaluar cuestiones educativas.
Actualmente, compite no sólo con programas licenciados como
SAS, MATLAB, Statistical, Stata, sino también con software de código abierto y
libre, de los cuales el más destacado es el Lenguaje R. Recientemente ha sido
desarrollado un paquete libre llamado PSPP, con una interfaz
llamada PSPPire que ha sido compilada para diversos sistemas operativos
como Linux, además de versiones para Windows y macOS. Este último
paquete pretende ser un clon de código abierto que emule todas las
posibilidades del SPSS.

Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent.
Entre 1969 y 1975 la Universidad de Chicago por medio de su Nacional
Opinión Research Center estuvo a cargo del desarrollo, distribución y venta del
programa. A partir de 1975 corresponde a SPSS Inc.
Originalmente el programa fue creado para grandes computadores. En 1970 se
publica el primer manual de usuario del SPSS por Nie y Hall. Este manual
populariza el programa entre las instituciones de educación superior
en Estados Unidos. En 1984 sale la primera versión para computadores
personales.

El sistema de módulos de SPSS, como los de otros programas (similar al de


algunos lenguajes de programación) provee toda una serie de capacidades
adicionales a las existentes en el sistema base. Algunos de los módulos
disponibles son:

 Modelos de Regresión
 Modelos Avanzados

o Reducción de datos: Permite crear variables sintéticas a partir


de variables colineales por medio del Análisis Factorial.

o Clasificación: Permite realizar agrupaciones de observaciones o


de variables (cluster analysis) mediante tres algoritmos distintos.

o Pruebas no paramétricas: Permite realizar distintas pruebas


estadísticas especializadas en distribuciones no normales.

 Tablas: Permite al usuario dar un formato especial a las salidas de los


datos para su uso posterior. Existe una cierta tendencia dentro de los
usuarios y de los desarrolladores del software por dejar de lado el sistema
original de TABLES para hacer uso más extensivo de las llamadas
CUSTOM TABLES.

 Tendencias

 Categorías: Permite realizar análisis multivariados de variables


normalmente categorías. También se pueden usar variables métricas
siempre que se realice el proceso de recodificación adecuado de las
mismas.

 Análisis Conjunto: Permite realizar el análisis de datos recogidos para


este tipo específico de pruebas estadísticas.

 Mapas: Permite la representación geográfica de la información


contenida en un fichero (descontinuado para SPSS 16).

 Pruebas Exactas: permite realizar pruebas estadísticas en muestras


pequeñas.

 Análisis de Valores Perdidos: Regresión simple basada en


imputaciones sobre los valores ausentes.

 Muestras Complejas: permite trabajar para la creación de muestras


estratificadas, por conglomerados u otros tipos de muestras.

 SamplePower (cálculo de tamaños muéstrales)

 Árboles de Clasificación: Permite formular árboles de clasificación y/o


decisión con lo cual se puede identificar la conformación de grupos y
predecir la conducta de sus miembros.

 Validación de Datos: Permite al usuario realizar revisiones lógicas de la


información contenida en un fichero “. sabe" y obtener reportes de los
valores considerados atípicos. Es similar al uso de sintaxis o scripts para
realizar revisiones de los ficheros. De la misma forma que este mecanismo
es posterior a la digitalización de los datos.

 SPSS Programmability Extensión (SPSS 14 en adelante). Permite


utilizar el lenguaje de programación Python para un mejor control de
diversos procesos dentro del programa que hasta ahora eran realizados
principalmente mediante scripts (con el lenguaje SAX Basic). Existe
también la posibilidad de usar las tecnologías .NET de Microsoft para hacer
uso de las librerías del SPSS. Aunque algunos usuarios han cuestionado
sobre la necesidad de incluir otros lenguajes, la empresa no tiene esto entre
sus objetivos inmediatos.
Desde el SPSS/PC hay una versión adjunta denomina SPSS Student que es
un programa completo de la versión correspondiente pero limitada en su
capacidad en cuanto al número de registros y variables que puede procesar.
Esta versión es para fines de enseñanza del manejo del programa.

Se pueden generar estos archivos de sintaxis con la ayuda del programa


mismo, pues en casi todas las ventanas donde se realizan tareas en el SPSS
existe un botón "Pegar". Este botón cierra la ventana en cuestión y guarda la
sintaxis de las acciones seleccionadas en dicha ventana. Una vez salvado este
archivo es susceptible de modificación.
La sintaxis tal cual se presenta a continuación fue producida directamente con
el SPSS. Este programa le da un formato legible a la sintaxis, formato que el
software en algunos casos no requiere para su correcto uso.
Otra peculiaridad de las sintaxis del SPSS es que no son "case sensitive".
Ante lo cual es común ver sintaxis escritas solo en mayúsculas, solo en
minúsculas o bien una combinación propia de cada usuario. Esta situación se
modifica para aquellas personas que hacen uso de Python dentro de sus
sintaxis, pues éste es un lenguaje sensitivo a las variaciones entre mayúsculas
y minúsculas. Esto obliga a estos usuarios a escribir sintaxis con mayor
cuidado.

2. Realizar un resumen informativo sobre los siguientes temas:

Tendencia Central: Definición del concepto.

Definiciones:

Las medidas de tendencia central son valores que se ubican al centro de un


conjunto de datos ordenados según su magnitud. Generalmente se utilizan 4
de estos valores también conocidos como estadígrafos, la media aritmética, la
mediana, la moda y al rango medio.

La media aritmética es la medida de posición utilizada con más frecuencia. Si


se tienen n valores de observaciones, la media aritmética es la suma de todos
y cada uno de los valores dividida entre el total de valores: Lo que indica que
puede ser afectada por los valores extremos, por lo que puede dar una imagen
distorsionada de la información de los datos.

Rango Medio es la media de las observaciones menor y mayor. como


intervienen solamente estas observaciones, si hay valores extremos, se
distorsiona como medida de posición, pero ofrece un valor adecuado, rápido y
sencillo para resumir al conjunto de datos.

. Media y Mediana: Definición de los conceptos estadísticos.

La Mediana, es el valor que ocupa la posición central en un conjunto de datos,


que deben estar ordenados, de esta manera la mitad de las observaciones es
menor que la mediana y la otra mitad es mayor que la mediana, resulta muy
apropiada cuando se poseen observaciones extremas.

La Moda es el valor de un conjunto de datos que aparece con mayor


frecuencia. No depende de valores extremos, pero es más variables que la
media y la mediana.

Variabilidad: Definición y su: Índice de variabilidad simple: Rango.

La variabilidad o dispersión hace referencia al grado de variación que hay en


un conjunto de puntuaciones. Por ejemplo: “entre dos distribuciones que
presentan la misma media aritmética, difieren en la variabilidad de sus
puntuaciones”. Así, cuanto menor es la variabilidad, más homogénea es la
muestra de sujetos en la variable. En el caso de máxima homogeneidad, todos
los valores de la variable serán iguales. De otro modo, cuanto más o menos
dispersión en los datos, la muestra es más o menos heterogénea y las
puntuaciones difieren entre sí.
Para cuantificar la dispersión de los datos, se pueden distinguir dos tipos de
índices: los que miden el grado de semejanza y diferencia de las puntuaciones
entre sí (amplitud total o rango y la amplitud semi-intercuartil), y los que la
dispersión se mide a alguna medida de tendencia central como la media
aritmética (varianza y la desviación típica).

Amplitud total o rango


La amplitud total o rango (A T), de un conjunto de puntuaciones es la distancia
que hay en la escala numérica entre los valores que representan la puntuación
máxima y la puntuación mínima.
AT = Xmáx - Xmín
Uno de los inconvenientes de la amplitud total es su limitación al utilizar
únicamente los valores extremos de la distribución; de esta forma, no recoge la
poca o mucha dispersión que pueda existir entre los restantes valores, que son
la mayoría de las puntuaciones. Aun así se recomienda incluir éste valor como
complementario de otras medidas de dispersión.
. Desviación estándar.

Desviación estándar no corregida de una muestra. es el valor medio de estas


observaciones, mientras que el denominador N representa el tamaño de la
muestra: esta es la raíz cuadrada de la varianza de la muestra, que es el
promedio de las desviaciones al cuadrado respecto a la media maestral.

Varianza.

La varianza es una medida de dispersión que representa la variabilidad de una


serie de datos respecto a su media. Formalmente se calcula como la suma de
los residuos al cuadrado divididos entre el total de observaciones. También se
puede calcular como la desviación típica al cuadrado.

Rango Intercuartílico.

El rango intercuartílico es una medida de variabilidad adecuada cuando la


medida de posición central empleada ha sido la mediana. Se define como la
diferencia entre el tercer cuartil (Q 3) y el primer cuartil (Q1), es decir: RQ = Q3 -
Q1. A la mitad del rango intercuartil se le conoce como desviación cuartil (DQ),
es afectada muy poco por cuentas extremas. Esto lo hace una buena medida
de dispersión para distribuciones sesgadas: DQ = RQ/2= (Q 3 - Q1)/2. Se usa
para construir los diagramas de caja y bigote (box plots) que sirven para
visualizar la variabilidad de una variable y comparar distribuciones de la misma
variable; además de ubicar valores extremos.

. Puntuación Z: Definición y su función.

En estadística, la puntuación Z (o puntuación estándar) de una observación


es el número de desviaciones estándar que hay por encima o por debajo de la
media de población. ... En los casos en los que sea imposible medir cada
observación de una población, puede estimar la desviación estándar mediante
una muestra aleatoria.

. Formas de Distribuciones y sus tipos (curva normal, curtosis, asimetría).

La asimetría es la medida que indica la simetría de la distribución de


una variable respecto a la media aritmética, sin necesidad de hacer la
representación gráfica. Los coeficientes de asimetría indican si hay el mismo
número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
 Asimetría negativa: la cola de la distribución se alarga para valores
inferiores a la media.
 Simétrica: hay el mismo número de elementos a izquierda y derecha de
la media. En este caso, coinciden la media, la mediana y la moda. La
distribución se adapta a la forma de la campana de Gauss, o distribución
normal.
 Asimetría positiva: la cola de la distribución se alarga (a la derecha)
para valores superiores a la media.

Puntuación Natural: Definición del concepto y sus características.

Las puntuaciones directas son el resultado directo e inmediato que se obtiene


a la hora de corregir un test. Gregory las denomina puntuación natural, ya que
es el resultado inicial de la prueba y casi siempre resulta de la suma de los
puntos otorgados a los aciertos del sujeto en un test. Estas puntuaciones no
tienen significado por sí mismas, sino que lo adquieren cuando se comparan
con algo, que puede ser un punto de referencia al criterio y/o a la norma.

Puntuaciones referidas al criterio


Una puntuación referida al criterio, o lo que es lo mismo, al universo de
conductas, se interpreta en función de unos logros u objetivos a cumplir,
arbitrariamente definidos, y que sirven para tomar decisiones. Se trata de una
medida en términos absolutos que se refiere a un determinado grado de
habilidad y a unos contenidos específicos.
Este tipo de puntuaciones nos informan acerca del dominio que tiene un
individuo en una habilidad particular. Desde esta perspectiva se observan
diferencias interindividuales. Se centra en conocer aquello que el sujeto puede
hacer y no en comparar con los niveles de ejecución de otros individuos y así
identifican el dominio absoluto de la persona examinada atendiendo a
conductas específicas.
Una de las principales aplicaciones de la evaluación referida al criterio es
instruccional, se aplica generalmente en la evaluación educativa, y no necesita
transformarse a otra puntuación debido a que tiene sentido en sí misma. Ej:
cuando un sujeto ha acertado el 80% de las preguntas significa que ha
adquirido el 80% de las competencias que se precisaban. Las principales
características de las puntuaciones referidas al criterio son:
 los criterios de superación de la tarea son conocidos por el profesor y el
estudiante y válidos para tomar decisiones,
 la ejecución del individuo se contrasta con la exigencia de la tarea,
 la ejecución provee información tanto de lo que el escolar domina como
de lo que no, y
 la investigación provee la determinación de los puntos de corte en
sujetos que dominan y los que no dominan la tarea.
Con referencia a un criterio, y en particular las pruebas de dominio, las
diferencias individuales entre los examinados en las puntuaciones totales
pueden ser mínimas. Sólo pueden servir en casos en los que pueden
adoptarse estimaciones tradicionales.

Rango Percentiles: Definición de los conceptos.

Un percentil es una medida estadística utilizada para comparar datos.


Consiste en un número de 0 a 100 que indica el porcentaje de datos que son
igual o menor que determinado valor.
Los percentiles son muy conocidos por su uso en los percentiles de
crecimiento. Por ejemplo, si el peso de un bebé está en el percentil 65, quiere
decir que el 65% de los bebés de la misma edad pesan igual o menos.

Puntuaciones Estándar. Puntuaciones T de McCall.

Las puntuaciones directas (puntuaciones de un sujeto en un test, etc.) son los


primeros datos de los que habitualmente disponemos, pero la comparación de
las puntuaciones directas de un mismo sujeto en dos variables puede llevarnos
a confusión. De hecho, conocida una puntuación directa no sabemos si se trata
de un valor alto o bajo porque esto depende del promedio del grupo.
Si a una puntuación directa Xi le restamos la media de su grupo obtenemos
una puntuación diferencial o de diferencia, que representamos por xi
(minúscula):
xi = Xi - X¯
Las puntuaciones diferenciales nos indican si la puntuación coincide con la
media de su grupo, es inferior o es superior a ella. Tienen las siguientes
propiedades:
 Su media es cero: x¯ = 0
 La varianza de las puntuaciones diferenciales es igual a la varianza de
las puntuaciones directas.
Por tanto, al restar a las puntuaciones directas su media hemos obtenido una
nueva escala con media 0 y con idéntica varianza a las puntuaciones directas.
Sin embargo, dos puntuaciones diferenciales idénticas pueden tener un
significado muy diferente en función de la media y de la varianza de las
distribuciones de las que proceden. Para eliminar este inconveniente se utilizan
las puntuaciones típicas que nos permiten no sólo comparar las puntuaciones
de un sujeto en dos variables distintas sino también comparar dos sujetos
distintos en dos pruebas o variables distintas.

S-ar putea să vă placă și