Probabilidad, Estadística y Sus Aplicaciones

|
Probabilidad, Estadística y sus

Aplicaciones
Probabilidad, Estadística y sus
Aplicaciones
Editores:
Hugo Adán Cruz Suárez
Bulmaro Juárez Hernández
Francisco Solano Tajonar Sanabria
Hortensia Josefina Reyes Cervantes
Fernando Velasco Luna
José Dionicio Zacarías Flores
Víctor Hugo Vázquez Guevara (responsable)
Benemérita Universidad Autónoma de Puebla

2019
Primera edición: 2019
ISBN: 978-607-525-589-7
DR © Benemérita Universidad Autónoma de Puebla
4 sur 104, Col. Centro Histórico, Puebla, Pue. CP 72000
Teléfono: 01 (222) 229 55 00
www.buap.mx
Dirección General de Publicaciones
2 norte 1404, Col. Centro Histórico, Puebla, Pue. CP 72000
Teléfonos: 01 (222) 246 85 59 y 01 (222) 229 55 00 Ext. 5768 y 5764
www.dgp.buap.mx
dgp@correo.buap.mx
Facultad de Ciencias Físico Matemáticas
Av. San Claudio y 18 sur, Colonia San Manuel, Puebla, Pue. CP 72570
Teléfonos: 01 (222) 229 55 00 Ext. 7552
www.fcfm.buap.mx
BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA • Rector: José Alfonso Esparza Ortiz
• Secretario General: José Jaime Vázquez López • Vicerrector de Extensión y Difusión de la

Cultura: Fernando Santiesteban Llaguno • Director General de Publicaciones: Hugo Vargas
Comsille • Director de la Facultad de Ciencias Físico Matemáticas: Martha Alicia Palomino Ovando
Impreso y hecho en México
Printed and made in Mexico

Índice General
Capítulo 1 ……………………….………………………………………………………………………………………………..1
Índice de la calidad de la Vivienda en México
G. Olivera y O.V. Serrano
Capítulo 2 ……………………….………………………………………………………………………………………………13
Uso del condón de los adolescentes según las
características de la pareja sexual
C. Menkes, I.A. Sosa y L. Núñez
Capítulo 3 ……………………….…………………………………………………………………………………………….25
Una caracterización de la satisfacción estudiantil
mediante análisis de clases latentes
R. Álvarez-Vaz y E. Vernazza
Capítulo 4 ……………………….…………………………………………………………………………………………….40
Modelación espacial de la plaga Sigatoka Negra
(Mycosphaerella fijiensis) en cultivos de plátano
del estado de Guerrero
J.E. Solís, M. Guzmán, R. Reyes y D. Briones
Capítulo 5……………………….……………………………………………………………………………………………….53
Aplicación del análisis de supervivencia en datos
de pacientes sometidos a transplante renal
J.A. Gil, B. Juárez y V.H. Vázquez
Capítulo 6………………………………………………………………………………………………………………………64
Modelación espacial de la infestación del ácaro rojo
De las palmas (Raoiella Indica) en el estado de
Guerrero con un proceso espacial Poisson
D.A. Ozuna, M. Guzmán, F. Godínez y R. Reyes
Capítulo 7………………………………………………………………………………………………………………………..76
Una aplicación de la metodología Biplot Logístico:
Análisis de la sostenibilidad empresarial
A. Urruticoechea y E. Vernazza
Capítulo 8………………………………………………………………………………………………………………………..92
Análisis de la deserción en las licenciaturas
de la FCFM-BUAP mediante el modelo de
riesgo proporcional semiparamétrico
B.X. Muñoz, B. Juárez, L. Cervantes y H. Reyes
Capítulo 9………………………………………………………………………………………………………………………108
Modelación estadística con imágenes
Satelitales en Ciencias Ambientales
A.A. Oroza, G. Linares, H. Reyes y
M. L. Sandoval
Capítulo 10…………………………………………………………………………………………………………………….124
Riesgo de Crédito usando Redes Neuronales
A. Herrera, H. Reyes, G. Linares y B. Juárez
Capítulo 11…………………………………………………………………………………………………………………….136
Embarazo adolescente, desigualdad social
y salud sexual y reproductiva según
condición de indigenismo en México
I.A. Sosa e I. A. Quallenberg
Capítulo 12…………………………………………………………………………………………………………………….150
Uso de la distribución Bernoulli Multivariada
en salud bucal
R. Álvarez-Vaz y F. Massa
Capítulo 13…………………………………………………………………………………………………………………….166
Determinación de la distribución de
Probabilidad de la demanda en un
modelo de control de inventarios
E. Hernández y R. Ilhuicatzi
Capítulo 14…………………………………………………………………………………………………………………….179
El Conteo en la Probabilidad
F. Tajonar, E. Morales, F. Velasco,
H. Cruz y J. Zacarìas
Capítulo 15…………………………………………………………………………………………………………………….191
Optimalidad de políticas (s,S) para un modelo
de inventarios vía la teoría de los procesos
de decisión de Markov
R. Blancas, H. Cruz, F. Velasco y F. Tajonar
Capítulo 16…………………………………………………………………………………………………………………….208
Reemplazo óptimo de un equipo y
algoritmo creciente de inducción
hacia atrás
R.M. Flores, R. Ilhuicatzi y R. Rosales
Capítulo 17…………………………………………………………………………………………………………………….225
Juegos Estocásticos y criterios de
rendimiento
C. Briones, V.H. Vázquez y D. Zacarías
Capítulo 18…………………………………………………………………………………………………………………….238
Probabilidad de localización de una
Partícula en un potencial isotónico
cuántico
M. Castillo y M.A. Maya
Capítulo 19…………………………………………………………………………………………………………………….252
Análisis preliminar de la satisfacción
laboral de un hospital del estado
de Puebla
J.D. Velázquez, J.M. Hernández,
C. Solís y J. Cuéllar
Capítulo 20…………………………………………………………………………………………………………………….265
Aplicación del modelo exponencial
en hilados textiles
A.M. Islas, G. Buendía y
Y. Montoya
Probabilidad, Estadı́stica y sus Aplicaciones
Capı́tulo 1
1
Índice de Calidad de la Vivienda en México
Guillermo Olivera Lozano y Olga Victoria Serrano Sánchez
Centro Regional de Investigaciones Multidisciplinarias,

Universidad Nacional Autónoma de México,
Cuernavaca, Morelos 62210, México,
olgass@unam.mx, gol@unam.mx
Resumen. En este trabajo se analizan los datos de la Encuesta Intercensal
2015 (EIC-2015) para estimar un ı́ndice de calidad de la vivienda (ICV) en México,
por entidad federativa, con base en el método de Componentes Principales. Este
ejercicio se complementa con un análisis de cúmulos, el cual permite clasificar a
las entidades federativas en cinco grupos que presentan ı́ndices de calidad similares
dentro de ellos. El ICV se calcula a partir de diez variables incluidas en la EIC- 2015
del INEGI. Lo más evidente en los resultados es la enorme desigualdad que existe
en los estados del sur-sureste, frente a los del centro y norte del paı́s. Ası́, Chiapas,
Guerrero y Oaxaca en un grado extremo, junto con Campeche, Veracruz y Tabasco
padecen rezagos importantes. En contraste, Nuevo León, Aguascalientes, Distrito
Federal, Coahuila y Jalisco resultaron con las mejores condiciones en calidad de las
viviendas.
Abstract. In this paper, we estimate a house quality index (HQI) based on

data from Encuesta Intercensal (EIC) 2015, in each one of the federative entities,
using principal components method. We also apply cluster analysis methodology to
complement the results obtained by HQI. This methodology clasisfies the federative
entities in 5 groups with similar quality index in them. HQI is calculated using 10
variables included in EIC-2015 from INEGI. The most evident results is the ample
inequity that exists in the south and southeastern estates compared to the northern
and center estates of the country. Thus, Chiapas, Guerrero and Oaxaca are the
most unequal, followed by Campeche, Veracruz and Tabasco. In comparison Nuevo
Leon, Aguascalientes, Distrito Federal, Coahuila and Jalisco show the best housing
conditions.
Palabras clave: Calidad de la vivienda, componentes principales, estadı́stica

multivariada.
1 Este trabajo es un avance de resultados del proyecto PAPITT IN302718, financiado por la
DGAPA-UNAM, ”La polı́tica de vivienda en propiedad ¿Dónde estamos veinte años después?
Una mirada global y desde Morelos”, coordinado por los autores.
1
1.1. Introducción
La vivienda en México ha sido uno de los sectores privilegiados en los programas
de desarrollo de los gobiernos federales desde fines del siglo XX, pero sobre todo en
lo que va del tercer milenio. La centralidad que ha tenido este sector se cimienta en
su importante aportación al Producto Interno Bruto, ası́ como en su contribución
para resolver una de las necesidades primordiales de la población [3]. Del año 2000
a la fecha, sin embargo, cabe distinguir dos etapas en la polı́tica federal de vivien-
da, pero sobre todo, en las acciones ejecutadas por organismos públicos como el
Instituto del Fondo Nacional de la Vivienda para los Trabajadores (INFONAVIT)
y el Fondo de la Vivienda del Instituto de Seguridad y Servicios Sociales de los
Trabajadores del Estado (FOVISSSTE), ası́ como la Comisión Nacional de Vivien-
da (CONAVI). La primera etapa (2000-2008) se constituyó en un periodo dorado
para el otorgamiento de créditos hipotecarios, favorecido, entre otras razones, por
la existencia de un mercado o ´demanda efectiva´ conformado por trabajadores
formales con ingresos a partir de 2.6 veces el salario mı́nimo, pero sobre todo por
arriba de 4 veces el salario mı́nimo. A ese auge contribuyó la estabilidad económica,
la reducción progresiva de las tasas de interés y el fortalecimiento del sector finan-
ciero [1]. La evolución positiva del sector vivienda se tradujo en la asignación de 5.2
millones de créditos y subsidios, de los cuales dos terceras partes (66 por ciento)
sirvieron para financiar la venta de vivienda nueva. Estas acciones, sin embargo,
aunque debı́an centrarse en la disminución del déficit cuantitativo de vivienda (ca-
sas que debı́an reemplazarse por término de la vida útil de sus materiales y 756
mil hogares sin vivienda en 2001) [2], se orientaron más a atender las necesidades
de vivienda de los hogares de nueva formación (750 mil por año, misma cantidad
que los créditos programados a otorgarse). Parte importante de la demanda provino,
además, de propietarios patrimonialistas que compraron casas nuevas sin ocuparlas,
en tanto que otros que sı́ las requerı́an dejaron de pagarlas y las abandonaron por
su lejanı́a. Como resultado del creciente stock de vivienda nueva desocupada a cau-
sa de la ubicación de las unidades habitacionales construidas lejos de las cuencas
de empleo, con insuficiente acceso a equipamiento urbano e inadecuada conexión
con los sistemas de transporte, ası́ como debido a la crisis financiera de dos de las
principales empresas constructoras, coincidente con la recesión económica de 2008,
el modelo de desarrollo habitacional también entró en crisis. Diversos análisis sobre
los resultados de la polı́tica habitacional resaltaron el inconveniente de privilegiar
la atención del déficit cuantitativo cuando sólo representaba el 42.3 del rezago habi-
tacional al inicio de siglo. De ahı́ que en el periodo 2009 a la fecha (2018), el énfasis
de la polı́tica de vivienda se reorientó hacia la atención del rezago cualitativo, sin
desatender las necesidades de vivienda nueva ni el déficit cuantitativo. ¿Qué mide
el rezago cualitativo? De acuerdo con la metodologı́a de la Sociedad Hipotecaria
Federal (SHF)[6], la calidad de los materiales con que están construidas las vivien-
das -ya sea materiales en deterioro o materiales de calidad regular- , y aquellas que
están en situación de hacinamiento cuando tienen más de 2.5 personas por recáma-
ra. Los datos resultantes del análisis de la Encuesta Intercensal 2015 del INEGI,
con base en la metodologı́a de la SHF arrojaron que 67.8 % del parque habitacional
del paı́s estaba en situación de rezago habitacional cualitativo, correspondiente a
8.9 millones de viviendas. Desglosado en sus tres componentes la mayor parte del
rezago (67.8 %) estaba en las viviendas con hacinamiento (6 millones); le seguı́a la
2
vivienda construida con materiales regulares (30.9 %) (2.7 millones), en tanto que
la vivienda construida con materiales en deterioro (110 mil) apenas representaba
1.2 por ciento. Ahora bien, aunque la medición del rezago cualitativo permite to-
mar medidas para su atención, estas se constriñen a soluciones como ampliación o
mejoramiento de vivienda en función de los materiales con que están construidas.
Dicho ejercicio omite otros aspectos relacionados con el tipo de servicios básicos a
que tienen acceso las viviendas, relacionadas con condiciones de salubridad, y que
son indicadores también importantes. Esto es posible medirlo con otro tipo de técni-
cas y métodos, como puede ser un ı́ndice de Calidad de Vivienda, del cual derivan
resultados que permitirı́an tomar medidas complementarias a las que considera la
polı́tica de vivienda vigente. De acuerdo a los resultados principales, la atención a la
condición de los servicios hidrosanitarios de las viviendas, contribuirı́a a mejorar de
forma notable la calidad de las viviendas a nivel nacional, y su incidencia principal
ocurrirı́a en los estados más desfavorecidos social y económicamente, que son los del
sur del paı́s.
1.2. Fuente de información

El ı́ndice de calidad se obtuvo utilizando como fuente de información la Encues-
ta Intercensal EIC-2015 realizada por el INEGI. Esta consideró una muestra de 6.1
millones de viviendas con cobertura de información a nivel nacional, entidad fede-
rativa, municipio y localidades mayores de 50,000 habitantes. Su población objetivo
son los residentes habituales del territorio nacional y las viviendas particulares habi-
tadas; su objetivo es generar información estadı́stica actualizada de estimaciones de
calidad sobre el volumen, composición y distribución de los habitantes y viviendas
del territorio nacional, que sean comparables con censos e indicadores internaciona-
les. Se propone, asimismo, obtener estimadores de proporciones, tasas y promedios
para cada una de las variables estudiadas. Para el procesamiento y análisis de la
información se utilizó el paquete estadı́stico Statistical Package for Social Science
(SPSS) v 24 [7].
1.3. Metodologı́a
1.3.1. Unidad de análisis
Se analizan las viviendas que cumplen con la caracterı́stica de ser particulares y
estar habitadas en cada una de las entidades federativas del paı́s.
1.3.2. Variables
Se utilizan diez variables que reflejan las caracterı́sticas de las viviendas relacio-
nadas con el tipo de materiales de construcción, el nivel de acceso a servicios, ası́
como condiciones de salubridad y de hacinamiento en que se encuentran las casas-
habitación.
Las variables que se utilizan son:
3
a) Proporción de viviendas con paredes o muros construidas con tabique, ladrillo,

block, piedra, cantera, cemento o concreto.
b) Proporción de viviendas con techo construidas con losa de concreto o viguetas
con bovedilla.
c) Proporción de viviendas con piso construido con cemento, firme, mosaico,
madera u otro recubrimiento.
d) Proporción de viviendas que tienen cuarto para cocinar.

e) Proporción de viviendas en hacinamiento (más de 2.5 personas por cuarto
para dormir).
f) Proporción de viviendas con luz eléctrica.
g) Proporción de viviendas que obtienen el agua de llaves o mangueras que están

dentro de la vivienda.
h) Proporción de viviendas que tienen servicio sanitario.
i) Proporción de viviendas con taza de baño exclusiva de la vivienda.

j) Proporción de viviendas con drenaje a la red pública, fosa séptica o tanque
séptico (biodigestor).
1.3.3. Análisis de Componentes Principales (CP)

Descripción de la metodologı́a de componentes principales2
Mediante el análisis de componentes principales, se transforma al conjunto de

variables originales (X), que están correlacionadas en otro conjunto nuevo de va-
riables o factores no correlacionados (Y ) [4].
El procedimiento de componentes principales genera un número reducido de va-

riables que son combinaciones lineales de las variables originales, dependiendo de la
estructura de correlación entre las variables X.
Generalmente, en la práctica sólo se consideran las primeras combinaciones li-

neales que son las que explican la mayor variabilidad de los datos y ası́ descartar
los “sobrantes” y reducir el número de variables a considerar. Esta reducción de
variables es de gran utilidad práctica, ya que, en primer lugar facilita el manejo
matemático y presentación gráfica de los datos. En segundo lugar, en el supuesto
caso de que exista redundancia en las observaciones originales, tal que las varia-
bles están linealmente relacionadas, se dificulta el análisis numérico y esto se puede
evitar reduciendo el número de variables. Por último, dicha reducción no ocasiona
obstáculo alguno en la interpretación de los resultados finales, ya que las variables
2 A los lectores interesados sobre el desarrollo matemático de la metodologı́a de ACP, se les
invita a consultar “Componentes Principales. Análisis de Datos sobre calidad de la vivienda en el

estado de Morelos”, Serrano y Olivera, publicado en Modelación con estadı́stica y probabilidad,
BUAP 2018.
4
transformadas pueden conducir ellas mismas a esta interpretación en términos de

las variables originales.
Es importante mencionar que el método de componentes principales puede ser

aplicado, entre otros, para los siguientes propósitos:
a) Métodos gráficos y análisis de conglomerados. En análisis de conglome-
rados, no es tan fácil definir criterios mediante los cuales decidir, usando méto-
dos numéricos, si hay una justificación para dividir conjuntos de observaciones
en grupos. Si se grafican las CP puede ayudar al análisis de conglomerados;
por ejemplo, si hay grupos bien definidos y separados, un método analı́tico no
es necesario. En situaciones en las que ninguna prueba de significancia fuera
posible, el graficar las CP puede al menos confirmar que un grupo sugerido se
ve razonable y es realmente indicado por las observaciones.
b) Redundancia. La mayorı́a de las técnicas del análisis multivariado consideran
matrices de orden igual al número de variables. Cuando estas son demasiadas,
y si las correlaciones entre las observaciones son altas, tal que las matrices
de dispersión son casi singulares o singulares, las dificultades se incrementan.
Para prevenir este problema, se hace un CP preliminar y se descartan las CP
más grandes, ya que en muchos casos éstas contienen más ruido que informa-
ción y poco o nada se pierde con eliminarlas. Entonces el análisis se puede
llevar acabo con las CP restantes.
c) Detección de observaciones aberrantes. Un problema frecuente cuando
los datos se obtienen de muestras multivariadas, es el detectar las observacio-
nes que se encuentran “alejadas” del conjunto de datos. Un análisis de CP y
métodos gráficos puede ser de gran utilidad en la detección de observaciones
aberrantes.
d) Cálculo de ı́ndices. El análisis de CP también se usa en la construcción de
indicadores o ı́ndices, para analizar las condiciones de ventajas o desventajas
en que se encuentra una población. Se usa la primera CP como el mejor
indicador porque es la que retiene la mayor variabilidad posible del conjunto
de datos, y retiene la máxima información como una combinación lineal de
las variables originales.
1.4. Resultados
Utilizando la matriz de correlaciones se obtuvieron los eigenvalores o valores
propios y eigenvectores o vectores principales. Se estandarizaron las variables ori-
ginales para que cada una de ellas sea de igual importancia en el cálculo de las
CP o factores. En el cuadro 1.1, se presentan los valores propios y sus porcentajes
de variación correspondientes. Se observa que las dos primeras componentes prin-
cipales representan el 78.5 % de la variabilidad de los datos y la disminución del
segundo al tercer valor principal es del 30.7 %. Por lo tanto, según el criterio de la
raı́z principal y del porcentaje de variación3 el número apropiado de nuevos factores
3 En el criterio de la raı́z principal, sólo se consideran significativos los valores propios o auto-
valores mayores que 1. Esto se basa al considerar el cálculo de CP con datos estandarizados en
5
es dos4 . El primer factor, que es el que explica la mayor variabilidad de los datos, es
el que se utilizó para calcular las proyecciones de los datos originales en los nuevos
ejes componentes principales, y de esta manera, obtener el ı́ndice de calidad de las
viviendas para cada una de las entidades federativas.
Componente Valores propios % de variación % de variación de acumulados

1 6.600 65.998 65.998
2 1.255 12.545 78.543
3 0.844 8.742 87.286
4 0.486 4.856 92.142
5 0.254 2.544 94.686
6 0.236 2.363 97.049
7 0.119 1.191 98.240
8 0.083 0.834 99.074
9 0.077 0.770 99.844
10 0.016 0.156 100.000
Cuadro 1.1: Valores propios de la matriz de correlaciones.
En el cuadro 1.2, se presentan los vectores principales correspondientes a las tres

indicadores compuestos (IC1, IC2, IC3). Con base en que sólo las componentes con
valor absoluto mayores que .30 [5] intervienen significativamente en la conformación
del vector, se observa que IC1 está formado por todos los indicadores simples, lo
que confirma que las variables originales, están representadas de manera clara (IC1
se rota en dirección de la máxima variabilidad) y la interpretación del ı́ndice de
calidad de la vivienda mediante IC1, es fiable. Se observa también, que los valores
más altos de la primera componente corresponden a las variables relacionadas con
servicios hidrosanitarios y el material del piso de la vivienda.
El ı́ndice de calidad representado por la primera componente principal, se presen-

ta en la Figura 1.1 para las 32 entidades federativas. En la medida que se incrementa
el ı́ndice, mejores son las condiciones de la vivienda. Se aprecia en esta gráfica, una
polarización muy marcada en el nivel de calidad de las viviendas entre las entida-
des federativas, en las que el menor ı́ndice corresponde a los estados de Guerrero,
Oaxaca, Chiapas, por un lado, y las mejores condiciones de vivienda a Nuevo León,
Aguascalientes y Distrito Federal por el otro.
El rango de variabilidad del ı́ndice es muy amplio, lo cual sugiere que podrı́an
formarse grupos de entidades federativas similares entre sı́ y disı́miles entre los
grupos. Mediante un análisis de clúster o de cúmulos, es posible identificar objetos
con caracterı́sticas similares. Aplicando esta metodologı́a5 , se obtienen los siguientes
base a la matriz de correlaciones. El criterio del porcentaje de variación, consiste en declarar como
diferente de cero, a tantas raı́ces caracterı́sticas como sea necesario, para que las nuevas variables
expliquen un porcentaje de la variación original considerado como satisfactorio.
4 En el caso del cálculo del ı́ndice de calidad, se utilizó la primera CP, por ser, por definición,
la que mejor explica la variabilidad del conjunto de variables originales.

5 Los detalles de la regionalización de México según caracterı́sticas de la vivienda serán desa-
rrollados en un trabajo posterior.
6
Componente
IC1 IC2 IC3
Con paredes de tabique, ladri- 0.638 0.662 0.125
llo,cantera, etc
Con techos que son de losa de 0.756 0.380 -0.175
concreto o viguetas con bovedi-
llo.
Con pisos de cemento, firme, mo- 0.945 0.052 0.025
saico, madera u otro.
Con cuarto para cocinar. 0.697 -0.226 -0.631
Con luz eléctrica. 0.791 0.384 0.128
Con agua entubada que obtienen 0.928 -0.230 0.167
de llaves o mangueras que están
dentro de la vivienda.
Con servicio sanitario. 0.948 -0.219 -0.058
Con taza de baño exclusiva de la 0.608 -0.544 0.503
vivienda.
Con drenaje a la red pública o 0.886 0.074 0.221
fosa séptica o biodigestor.
Sin hacinamiento. 0.837 -0.262 -0.282
Cuadro 1.2: Vectores propios de la matriz de correlaciones.
grupos:
Región 1: Aguascalientes, Jalisco, Nuevo León, Distrito Federal, Coahuila de
Zaragoza, Tamaulipas, Sonora, Baja California Sur, México, Tlaxcala, Guana-
juato, Querétaro, Sinaloa, Quintana Roo, Nayarit, Hidalgo, Morelos, San Luis
Potosı́, Yucatán, Puebla, Michoacán, Colima, Baja California y Chihuahua.
Región 2: Campeche, Veracruz y Tabasco.
Región 4: Guerrero y Oaxaca.
Región 5: Chiapas.
En la Figura 1.2, se representan las 32 entidades federativas, utilizando las dos
primeras componentes principales. Lo grupos que se forman corresponden a las re-
giones descritas anteriormente. Lo más evidente en esta representación, es la enorme
desigualdad que existe en los estados del sur-sureste, ya que los estados de Chiapas,
Guerrero y Oaxaca en un grado extremo, junto con Campeche, Veracruz y Tabasco
padecen rezagos importantes en términos de calidad de la vivienda; en contraste
con Nuevo León, Aguascalientes, Distrito Federal, Coahuila y Jalisco que cuentan
con los valores más altos del ı́ndice de calidad.
En la Figura 1.3, se observa la regionalización de las entidades federativas, ba-

sada en las 10 variables que describen la calidad de las viviendas. Se identifican las
entidades con caracterı́sticas similares en una misma región, y se distinguen entida-
des con caracterı́sticas distintas entre sı́, según el valor del ı́ndice.
7
Figura 1.1: Índice de calidad de la vivienda en México.
Los resultados del ı́ndice de calidad que se obtuvieron, como lo mostraremos

en otros trabajos, se encuentra altamente relacionado con el ı́ndice de margina-
ción, niveles de escolaridad, analfabetismo, tasas de fecundidad y otras variables
sociodemográficas.
8
1 Aguascalientes
2 Baja California
3 Baja California Sur
4 Campeche
5 Chiapas
6 Chihuahua
7 Coahuila de Zaragoza
8 Colima
9 Distrito Federal
10 Durango
11 Guanajuato
12 Guerrero
13 Hidalgo
14 Jalisco
15 México
16 Michoacán de Ocampo
17 Morelos
18 Nayarit
19 Nuevo León
20 Oaxaca
21 Puebla
22 Querétaro
23 Quintana Roo
24 San Luis Potosı́
25 Sinaloa
26 Sonora
27 Tabasco
28 Tamaulipas
29 Tlaxcala
30 Veracruz de Ignacio de la Llave
31 Yucatán
32 Zacatecas
Cuadro 1.3: Identificación de Entidad Federativa.
9
Figura 1.2: Indicadores compuestos de las 32 entidades federativas.
Figura 1.3: Índice de calidad de las viviendas en México.
10
1.5. Conclusión
Según los resultados obtenidos con la aplicación de la metodologı́a de CP, por
medio de la primera componente principal es posible describir la calidad de las vi-
viendas con un indicador que es combinación lineal de 10 variables. Las variables
originales que conforman este indicador, son las relacionadas con servicios hidrosa-
nitarios y material del suelo en la vivienda.
Con la regionalización del paı́s por medio del análisis de cúmulos, se identifican
desigualdades importantes en la calidad de las viviendas por regiones. La región más
desfavorecida es el sur (Oaxaca, Guerrero y Chiapas), seguida de otros tres estados
del sureste (Campeche, Tabasco y Veracruz). La primera de ellas con fuerte presen-
cia de población rural y tradicionalmente asociada con pobreza y atraso económico;
los otros tres estados, relacionados con el declive de la industria petrolera. En el caso
opuesto, las mejores condiciones de vivienda corresponden a las entidades donde se
localizan las tres principales zonas metropolitanas del paı́s, que son la Ciudad de
México, Guadalajara (Jalisco) y Monterrey (Nuevo León), ası́ como otras entidades
con dinámicos procesos de urbanización reciente y fuerte concentración económica
en la ciudad principal (Aguascalientes y Querétaro), ası́ como Coahuila.
Para disminuir la brecha entre las regiones más desarrolladas y las más desfavo-
recidas, es necesario tomar medidas para aumentar la calidad de las viviendas.
Es importante mencionar, que las 10 variables utilizadas en la regionalización y en
el análisis de componentes principales no son suficientes para describir la calidad
de la vivienda, ya que no reflejan la situación exacta del paı́s. Consideramos que
es necesario ampliar el número de variables que se relacionen con la calidad de la
vivienda, para hacer una evaluación más precisa del desarrollo regional, dadas las
implicaciones que pudo tener el sismo de 2017 en las entidades afectadas.
Por otra parte, sin embargo, una posible implicación de polı́tica que pudieran
tener los resultados del ejercicio de componentes principales aplicado, es que los
programas de mejoramiento y ampliación de vivienda que tienen a cargo los orga-
nismos nacionales de vivienda y el gobierno federal, que otorgan créditos y subsidios,
respectivamente, pudieran dirigirse al mejoramiento de los servicios hidrosanitarios
como una forma de mejorar la calidad de la vivienda, ya que actualmente los prime-
ros dan prioridad a la ampliación de las viviendas mediante la construcción de un
cuarto adicional. Con esta acción se complementarı́an las medidas que actualmente
se llevan a cabo para reducir el rezago habitacional prevaleciente, que es de carácter
cualitativo, más que cuantitativo.
11
Bibliografı́a
[1] BBVA, México. Situación inmobiliaria, BBVA Research, julio, México, 2010.
[2] CONAFOVI, Rezago Habitacional, México, Consejo Nacional de Fomento a la
Vivienda, 2002.
[3] Diario Oficial de la Federación, Programa Nacional de Vivienda, 204-

2018, 30 de abril de 2014.
[4] Hair, J.F.; Anderson, R.E. y Tatham, R.L., Multivariate Data Analysis.
With Readings. New York: Mac Millan Publishing Co. 1987.
[5] Jolliffe, I.T., Principal Component Analysis, New York: Springer-Verlag,

2002.
[6] Sociedad Hipotecaria Federal, Rezago habitacional en México 2012, 2013.
[7] SPSS Advanced Models 9.0, Chicago IL, E.U., 1999.
12
Capı́tulo 2
Uso del condón de los adolescentes según las caracterı́sticas de la pareja sexual
Catherine Menkes Bancet, Itzel A. Sosa Sánchez y Leopoldo Núñez

Av. universidad s/n, Circuito 2, Col. Chamilpa,
Ciudad Universitaria de la UAEM, Cuernavaca Morelos,
C.P. 62210, México.
shajor57@gmail.com
Resumen. El objetivo principal del presente trabajo consiste en identificar

en las/los estudiantes de 14 a 19 años de edad con inicio de vida sexual, las carac-
terı́sticas de la pareja sexual que se asocian con un mayor uso del condón masculino.
Se analizan las caracterı́sticas socio-demográficas de los estudiantes y se establecen
comparaciones entre sexos y entre las distintas entidades federativas a través de
análisis bivariados. Para conocer los factores que se asocian con una mejor protec-
ción sexual se estiman modelos de regresión logı́stica. La variable dependiente es el
uso del condón masculino en la última relación sexual y las variables independientes
las constituyen las distintas caracterı́sticas de la pareja sexual. Los hallazgos mues-
tran claramente que para disminuir el riesgo de una relación sexual sin protección,
es de fundamental importancia lograr una mayor equidad de género, tanto en lo que
se refiere a la edad de ambos adolescentes que se encuentran en pareja, como en el
balance del poder en distintos temas relacionados con la sexualidad.
Abstract. The main objective of the present study is to identify which characte-
ristics of sexual partners increase the likelihoods of condom use in the case of 14 to
19 year old students who have begun their sexual life.
We analyze the relevant sociodemographic characteristics of the students and we
establish several comparisons between the genders and between the different fede-
ral entities where they live through bivariate analysis. In order to understand the
factors which tend to increase sexual protection among the mentioned group, we
use models of logistic regression. The dependent variable is male condom use during
their last sexual relation and the independent variables are the different characte-
ristics of sexual partners.
Results show that more gender equity tends to decrease the likelihood of condomless
sexual relations occurring in the case of the studied group. This applies to dispa-
rities between their respective ages as much as to power imbalances associated to
different sexual-related topics.
13
Palabras clave: Adolescentes, pareja sexual, protección sexual, regresión logı́sti-

ca.
2.1. Introducción
El embarazo adolescente en México es un problema importante no sólo de salud
sexual y reproductiva sino de derechos sexuales, reproductivos y humanos y ha ad-
quirido mayor visibilidad en las últimas décadas.
Al respecto, diversos estudios han señalado que el embarazo en edades tempranas
puede limitar las opciones de desarrollo personal de los adolescentes en determina-
dos contextos socioculturales [1]. Para el caso mexicano las estimaciones sugieren
que las gestaciones de las adolescentes de 15 a 19 años, constituyeron 17.5 % de la
tasa de embarazo del total de mujeres de 15 a 49 años en 2013, además, a partir
de las encuestas nacionales, se ha observado un ligero aumento en los últimos años,
ya que la tasa especı́fica de 15 a 19 años pasó de 68 a 85 embarazos por cada mil
mujeres, entre 2005 y 2013 [2].
La sexualidad adolescente también ha adquirido mayor visibilidad en la agenda

académica y polı́tica, debido al reciente incremento de las infecciones de trans-
misión sexual (ITS) en esta población. Por ejemplo, en la población adolescente
mexicana de 10 a 19 años de edad se reportaron 3,622 casos acumulados de SIDA
entre 1983-2013 (66.8 % corresponden a los varones y 33.2 % a mujeres) de un total
de 167,933 casos, obteniendo una prevalencia de 2.2 % en este grupo etario [3].
Si bien la prevalencia del preservativo masculino en los adolescentes y jóvenes en

general, ha aumentado de manera muy importante en las últimas décadas, los estu-
dios demográficos y sociológicos han enfatizado en el uso reducido de anticonceptivos
entre los adolescentes si se compara con otros grupos de edad, al tiempo que la de-
manda insatisfecha de anticonceptivos en esta población continúa siendo elevada,
en particular en lo que concierne al sexo femenino [4].
Cabe mencionar, que diversos estudios en el tema, han dado origen a una reflexión
en torno a los vı́nculos entre las relaciones y desigualdades de género y los compor-
tamientos y actitudes frente a la salud y a la sexualidad. Desde esta perspectiva,
se han propuesto algunas dimensiones analı́ticas para profundizar en el estudio de
la forma en que la construcción de las identidades y relaciones de género y las de-
sigualdades de acceso al poder se constituyen como un factor de riesgo en torno a
la salud y a la sexualidad tanto para las mujeres como para los hombres a partir de
distintos mecanismos: la construcción simbólica del cuerpo, la asignación genérica
del concepto de cuidado, la relación entre la afirmación de la identidad de género,
el comportamiento sexual y las decisiones sobre reproducción [5].
Ası́, más allá de la inestabilidad en las parejas sexuales de los adolescentes, las
evidencias empı́ricas han enfatizado en el importante rol que juegan las desigual-
dades de género y poder (que se intersectan e interactúan con otras desigualdades
sociales como la clase social, la edad, la etnia, etc.). Estas desigualdades dificultan
las negociaciones en torno al uso de métodos anticonceptivos y condón en esta po-
14
blación, e incrementan los riesgos de contraer enfermedades de transmisión sexual

ası́ como la ocurrencia de embarazos no planeados [6].
Paralelamente, la información reciente en relación al uso del condón sugiere que

a pesar de un significativo incremento en su uso, es también evidente que no se ha
logrado erradicar los significados que lo asocian con la falta de amor y la desconfian-
za y la incomodidad [7]. Bajo esta lı́nea estudios algunos autores han estudiado [8]
cómo los significados (sociales y simbólicos) en torno al condón entran en conflicto
con los discursos del amor, en los cuales se enfatiza la confianza y el compromiso
mutuos. Lo que es más, el uso del mismo, tiende a limitarse cuando en la ‘definición
de la situación se considera pertinente su uso, lo que generalmente tiende a vin-
cularse con relaciones sexuales ocasionales, “no estables”, cuando se conoce poco
(o no se conoce) al compañero/a sexual [9]. También se ha sugerido el importante
rol de los condicionantes de género tanto en las definiciones sociales sobre el riesgo
como en las negociaciones en torno a bajo qué circunstancias ocurren los encuentros
sexuales. A diferencia de otros métodos anticonceptivos, el uso de condón implica la
necesidad de establecer negociaciones entre las personas involucradas, donde éstas
puedan expresar bajo qué circunstancias desean que se den los encuentros sexuales.
Esto se torna problemático en el ámbito de la sexualidad, en contextos donde la
maternidad, la ausencia de deseo y de experiencia erótico-sexual en las mujeres son
altamente valorados y se convierten en atributo del ser mujer [10].
Respecto a los hombres, se ha sugerido que los varones se enfrentan a presiones

para tener múltiples parejas, a tener éxito con las mujeres para afirmar su virilidad
y a no ser pasivos en las relaciones sexuales [11]. Estos estereotipos de sexualidad
masculina y femenina repercuten en la valoración social diferenciada otorgada a la
actividad sexual premarital y en un doble estándar sexual donde la sexualidad feme-
nina continua estando dirigida hacia fines esencialmente reproductivos y en donde
moral judeocristiana (y la religión católica) juegan un rol central.
Por lo dicho anteriormente, uno de los ejes fundamentales para tratar de en-
tender las prácticas sexuales y reproductivas de los adolescentes, lo constituye la
perspectiva de género, y las desigualdades en particular con la pareja sexual.
Al respecto, varios estudios han señalado que no basta con estudiar los com-
portamientos individuales, sino que la protección sexual de los adolescentes puede
estar en función de la pareja, en particular si existe un balance de poder desigual [12].
El objetivo principal del presente trabajo consiste en identificar qué caracterı́sti-

cas de la pareja sexual se asocian con un mayor uso del condón masculino en los
adolescentes.
15
2.2. Metodologı́a
Todos los datos que presentamos provienen de la Encuesta sobre Noviazgo, Em-
poderamiento y Salud Sexual y Reproductiva en Adolescentes Estudiantes de Pre-
paratoria en México (ENESSAEP) efectuada en el año 2014 por el Centro Regional
de Investigaciones Multidisciplinarias de la UNAM. La encuesta es representativa
de los estudiantes que acuden a escuelas públicas y privadas de Puebla, Jalisco y
Morelos. Nuestra unidad de análisis lo constituyen los estudiantes de 14 a 19 años
que declararon haber tenido novia/o, free, amiga/o con derechos o pareja en los
últimos 12 meses y que tuvieron relaciones sexuales con su pareja actual.
En primer lugar se presentan algunas caracterı́sticas socio-demográficas de la pare-

ja sexual según el sexo del estudiante y después según la entidad federativa. Para
ver si hay diferencias entre hombres y mujeres o según la entidad donde reside el
estudiante, se utiliza la prueba de Chi-cuadrado.
Posteriormente, para conocer la asociación de la protección sexual con las carac-

terı́sticas de la relación con la pareja sexual, estimamos modelos de regresión logı́sti-
ca múltiple tomando como variable dependiente el uso del condón masculino en la
última relación sexual y como variables independientes el ı́ndice de balance de poder
con la última pareja actual, el abuso sexual y la diferencia de edad con la pareja.
A continuación describimos como construimos las distintas variables e ı́ndices:
Uso del preservativo masculino con la pareja actual:
La construcción de la variable dependiente uso del condón en la última relación
sexual se hizo utilizando las siguientes preguntas:
1. ¿Utilizaste algún método anticonceptivo en tu última relación sexual?,
2. ¿Qué método anticonceptivo usaron en la última relación sexual?.
Se asignó el valor de 0 cuando respondieron que no habı́an utilizado algún méto-
do anticonceptivo o habı́an utilizado un método anticonceptivo diferente al condón
masculino. Se asignó el valor de 1 cuando respondieron haber usado el condón o
preservativo en su última relación sexual.
Índice sobre balance de poder en la sexualidad con la pareja actual:

Para tratar de evaluar el balance de poder con la pareja se incorporaron distintas
caracterı́sticas relacionadas con las relaciones sexuales que tuvieron los estudiantes
con su pareja actual y se construyó un ı́ndice aditivo. Las caracterı́sticas que se
consideraron fueron las siguientes:
1. ¿Esperas a que tu pareja inicie el acercamiento sexual, como por ejemplo
acariciar tu cuerpo?,
2. ¿Tiene relaciones sexuales siempre que tu pareja lo desea, incluso si tú no
quieres?,
3. ¿Tomas la iniciativa cuando desea tener relaciones sexuales con tu pareja?,
4. ¿Le has dicho tu pareja que no toque los genitales u otras partes ı́ntimas
cuando no lo deseas o te hace sentir incómodo/a?,
16
5. ¿Tienes relaciones sexuales sin protección porque tu pareja prefiere no usar-

los?,
6. ¿Te aseguras de comprar los condones?
7. ¿Te sientes seguro/a y en control durante las relaciones sexuales?.
En el caso de las preguntas 1,2, y 5, cuando las respuestas de los estudiantes fueron
nunca, a veces o la mitad de las veces se consideraron como desbalance del poder
(en la sexualidad) y se le asignó el valor de 0. Cuando las respuestas fueron casi
siempre o casi nunca se consideró como balance del poder asignándole el valor de 1.
En el caso de las preguntas 3, 4, 6 y 7, cuando las respuestas de los estudiantes fue-

ron nunca, a veces o la mitad de las veces se consideraron como balance del poder
y se le asignó el valor de 1. Cuando las respuestas fueron casi siempre o casi nunca
se consideró como no desbalance del poder y se le asignó el valor de 0.
Para establecer el ı́ndice se sumaron todos los valores de las distintas preguntas, y
se dividió el ı́ndice en balance de poder y desbalance del poder. Para la recodifica-
ción de la variable se tomó como punto de corte a la mediana, ası́ el 57.9 % fueron
clasificados como balance del poder y el 42.1 % como desbalance del poder.
Abuso sexual del novio/de la novia o pareja:

Para construir esta variable se utilizaron las siguientes preguntas del cuestionario:
1. ¿Alguno se ha aprovechado (con alcohol o drogas) para tener relaciones se-
xuales con el otro?,
2. ¿Alguno ha forzado al otro a tener relaciones orales o anales?,
3. ¿Alguno ha hecho uso de la fuerza para tener relaciones sexuales con el otro?.
Si en cualquiera de las contestaciones el/la estudiante respondió que pocas veces o
muchas veces se consideró que sı́ hubo abuso sexual y si contestó en las tres pre-
guntas que nunca se clasificó como no hubo abuso sexual.
Diferencia de edad con la pareja:

Para construir esta variable restamos la edad del estudiante al momento de la en-
cuesta menos la edad de la pareja actual. Esta variable se clasificó en: 1) Misma
edad o menor edad que la pareja actual, 2) Mayor de dos años que la edad de la
pareja actual, y 3) Tres años y más que la pareja actual.
2.3. Resultados
2.3.1. Caracterı́sticas socio-demográficas de los estudiantes y
de la pareja actual según el sexo. Análisis bivariado
Al observar las caracterı́sticas socio-demográficas de los estudiantes iniciados
sexualmente y cuya última relación sexual fue con la pareja actual según el sexo
de los estudiantes de preparatoria, vemos que la mayorı́a tiene entre 16 y 17 años
17
(56.7 %), 23.1 % tiene 18 0 19 años, y el resto se encuentra en el grupo de edad

de 14 a 15 años (Ver cuadro 2.1). Respecto a la edad se puede decir también, que
no se encontraron diferencias estadı́sticamente significativas entre varones y mujeres.
Por el contrario, al estudiar la edad a la primera relación sexual, sı́ se observan

variaciones muy importantes entre sexos. Ası́, el 37.5 % de los varones declaró ha-
berse iniciado sexualmente antes de cumplir los 15 años, mientras que el porcentaje
correspondiente de las mujeres es de 19.2 %.
Respecto a las diferencias de edad con la pareja sexual, se observa una enorme bre-
cha entre hombres y mujeres. Ası́, mientras que el 70.3 % de los estudiantes varones
reportó tener una diferencia de edad de 3 años o más con su pareja, únicamente el
28 % de las mujeres se encontraban en esta situación. Por el contrario, el 37 % del
sexo femenino y únicamente el 8.1 % de los varones reportaron tener la misma edad
o una edad menor a su pareja sexual.
Si analizamos el balance de poder en la pareja, vemos que no existen diferencias

estadı́sticamente significativas entre hombres y mujeres, ya que cerca del 40 % tuvo
un balance de poder desigual y el resto un balance de poder más equitativo.
En el abuso de poder sı́ se observan diferencias entre sexos, de hecho un mayor

número de varones (9 %) declaró haber sido abusados sexualmente respecto a las
mujeres (5.7 %).
Finalmente, también hay un uso diferenciado por sexo en el uso del condón en la
última relación sexual, ya que mientras que el 34.4 % de los varones NO uso un pre-
servativo, este porcentaje aumenta a 45.9 % en el caso de las mujeres(Ver Cuadro
2.1).
Ası́, los datos refuerzan los hallazgos encontrados tradicionalmente, en que se mues-
tra que los varones tienden a iniciarse sexualmente antes que las mujeres, por los
mandatos de género que presionan a los varones a probar su virilidad teniendo
relaciones sexuales siempre que sea posible, mientras que el ideal femenino tradi-
cional justifica las relaciones sexuales de las mujeres, únicamente a través del amor
romántico o bien al interior de la unión o matrimonio.
Un dato que llama la atención, es que los varones reportan mayor abuso sexual que
las mujeres. Habrı́a que seguir investigando en futuros estudios, qué está sucediendo
con esta población.
18
Caracterı́sticas sociodemográficas de los estudiantes que tuvieron su última relación sexual los
últimos 12 meses con la pareja actual según sexo
Sexo Total Grado de significancia según
Hombre Mujer (N=2557) pruebas χ2 de Pearson
Grupos de edad 18-19 24.1 % 22.2 % 23.1 %
16-17 55.4 % 57.7 % 56.7 %
14-15 20.5 % 20.1 % 20.3 % p = 0.180
Grupos de edad a la 17-19 10.5 % 16.9 % 14.0 %
primera rel. sexual 15-16 52.0 % 63.9 % 58.4 %
≤14 37.5 % 19.2 % 27.7 % p = 0.000
Diferencia de edad menor o igual 8.1 % 37.0 % 23.6 %
con la pareja 1-2 años 21.6 % 34.9 % 28.7 %
mayor o igual a 3 70.3 % 28.0 % 47.6 % p = 0.000
Índice balance de más equitativo 59.5 % 61.1 % 60.4 %
poder desigual 40.5 % 38.9 % 39.6 % p = 0.393
Abuso sexual Sı́ 9.0 % 5.7 % 7.3 %
No 91.0 % 94.3 % 92.7 % p = 0.000
Usó condón en Sı́ 65.6 % 54.1 % 59.4 %
la última rel. No 34.4 % 45.9 % 40.6 % p = 0.000
Cuadro 2.1: Caracterı́sticas socio-demográficas de los estudiantes que tuvieron su

última relación sexual los últimos 12 meses con la pareja actual.
2.3.2. Caracterı́sticas socio-demográficas de los estudiantes y

de la pareja actual según la entidad federativa. Análisis
bivariado
Las caracterı́sticas socio-demográficas también varı́an por entidad federativa.
Por ejemplo, si analizamos el grupo de edad al que pertenecen los estudiantes ini-
ciados sexualmente que tuvieron una última relación sexual con su pareja actual,
vemos que en Morelos los estudiantes son de mayor edad en general, en segundo
lugar Jalisco y en último lugar Puebla.
Respecto a la edad a la primera relación sexual, se observa la misma tendencia que

en los grupos de edad, ya que en Jalisco (29.5 %) y Puebla (29.6 %) un porcentaje
mayor que en Morelos se inició a los 14 años o menos (19.5 %).
Respecto a la diferencia de edad con la pareja actual, también encontramos diferen-

cias estadı́sticamente significativas. Resalta el caso de Puebla, en que un porcentaje
muy significativo de estudiantes declaró que su pareja tenı́a 3 o más años de dife-
rencia en la edad con su pareja.
Por el contrario, ni en el abuso sexual, ni en el balance de poder, ni en el uso del

preservativo encontramos diferencias significativas entre las tres entidades federati-
vas consideradas (ver Cuadro 2.2).
Ası́, se puede concluir al comparar las caracterı́sticas socio-demográficas según las

entidades federativas, que las brechas se observan particularmente en lo que se refiere
a la edad en que tuvieron su primera relación sexual y a la diferencia de edad con
la pareja actual.
19
Caracterı́sticas sociodemográficas de los estudiantes que tuvieron su última relación sexual los
últimos 12 meses con la pareja actual según entidad federativa
Entidad federativa Grado de significancia según
Morelos Jalisco Puebla pruebas χ2 de Pearson
Grupos de edad 18-19 40.4 % 22.2 % 14.6 %
16-17 53.3 % 56.9 % 58.2 %
14-15 6.3 % 20.9 % 27.2 % p = 0.000
Grupos de edad a la 17-19 27.3 % 11.1 % 10.7 %
primera rel. sexual 15-16 53.2 % 59.4 % 59.8 %
≤14 19.5 % 29.5 % 29.6 % p = 0.000
Diferencia de edad menor o igual 24.3 % 25.8 % 19.8 %
con la pareja 1-2 años 30.5 % 29.6 % 26.5 %
mayor o igual a 3 45.1 % 44.6 % 53.7 % p = 0.002
Índice balance de más equitativo 58.5 % 63.3 % 56.8 %
poder desigual 41.5 % 36.7 % 43.2 % p = 0.483
Abuso sexual Sı́ 6.2 % 7.1 % 8.1 %
No 93.8 % 92.9 % 91.9 % p = 0.097
Usó condón en Sı́ 57.2 % 62.6 % 55.7 %
la última rel. No 42.8 % 37.4 % 44.3 % p = 0.079
Cuadro 2.2: Caracterı́sticas socio-demográficas de los estudiantes que tuvieron su

última relación sexual los últimos 12 meses con la pareja actual según entidades
federativas.
2.3.3. Uso del condón según distintas caracterı́sticas de la

pareja por sexo del estudiante. Análisis bi-variado
La protección sexual a través del preservativo masculino es diferencial según el
sexo del estudiante y las distintas caracterı́sticas que se relacionan con la esfera de
la pareja.
Ası́, se puede ver que la prevalencia del preservativo masculino disminuye consi-
derablemente si hubo abuso sexual. En el caso de los varones se reduce el uso de
66.8 % a 56.2 %, y en el caso de las mujeres de 54.9 % a 43.1 %. Cabe mencionar
que mientras que en caso de los varones se observa una relación estadı́sticamente
significativa (p=.000), en el caso del sexo femenino hay una relación marginalmente
significativa (p=.083).
Paralelamente, el uso aumenta de manera muy importante cuando hay un balance

de poder más equitativo en la pareja si se compara con un balance de poder de-
sigual; sube de 48.1 % a 78.6 % en los varones (p=000), y de 41.7 % a 62.8 % en las
mujeres (p=.000).
En el caso de la diferencia de edad con la pareja, las diferencias no son estadı́stica-

mente significativas si se analizan ambos sexos por separado (Ver Cuadro 2.3).
20
Porcentaje de estudiantes que SÍ usaron condón en la última relación sexual con la pareja
actual según sexo
Esfera de la pareja Hombres Grado de significancia según Mujeres Grado de significancia según
pruebas χ2 Pearson pruebas χ2 Pearson
Abuso de la pareja sexual
Sı́ 56.2 % 0.001 43.1 % 0.083
No 66.8 % 54.9 %
Diferencia de edad con la pareja
Misma edad o menor 57.8 % 0.904 52 % 0.144
1-2 años 65.0 % 51.9 %
3 o mayor 67.4 % 59.7 %
Balance de poder entre los sexos
Equitativo 78.6 % 0.000 62.8 % 0.000
Desigual 48.1 % 41.7 %
Cuadro 2.3: Porcentaje de estudiantes que sı́ usaron el condón en la última relación
con la pareja actual por sexo.
2.3.4. Factores asociados al uso del condón según las carac-

terı́sticas de la pareja actual. Modelos de regresión
logı́stica
Los factores asociados al uso del condón en la última relación sexual tomando
en cuenta las caracterı́sticas de la pareja actual, son la diferencia de edad con la
pareja y en particular el balance de poder entre los sexos en el terreno sexual. Ası́,
según el modelo de regresión logı́stica multivariado, se muestra que, en el caso de
todos los estudiantes hombres y mujeres en su conjunto, si la pareja es de la misma
edad o es menor, aumenta en 84 % la posibilidad de la prevalencia del preservativo
masculino si se compara con las parejas con diferencias de edad de tres años o más
(p=0.004).
Asimismo, se multiplica 2.8 veces la posibilidad de que los estudiantes utilicen un

condón masculino si existe un balance equitativo de poder en la pareja en la se-
xualidad (p=0.000). La única caracterı́stica de la esfera de la pareja que no mostró
una relación estadı́sticamente significativa con el uso del condón, fue el haber sido
abusado sexualmente por el/la novio/a o el/la ex-novio/a; es posible que esto se
deba al limitado número de casos de los que declararon ser abusados sexualmente
(Ver Cuadro 2.4).
Si observamos los condicionantes asociadas al uso del condón diferenciando según el

sexo del estudiante, vemos que se eleva aún más la probabilidad de uso cuando hay
una relación más equitativa en el balance de poder en el terreno de la sexualidad
en los varones, ya que la razón de momios se eleva a 3.49 (p=.000). La influencia de
un balance de poder más equitativo en la pareja, aunque menor que en los varones,
sigue siendo muy importante en el caso de las mujeres, ya que se multiplica en 2.3
veces la posibilidad de la protección sexual cuando la relación en el terreno de la
sexualidad es más equitativa en la pareja.
De hecho, en el caso de los varones, la única variable que resultó ser estadı́sticamen-
te significativa según el modelo de regresión logı́stico fue el balance de poder con
la pareja; en cuanto al sexo femenino, además del balance de poder, también hay
21
mayor uso cuando la pareja tiene la misma edad o es menor ya que la probabilidad
de uso del condón aumenta en 32 % (p=.049).
Ası́, los datos muestran claramente que las caracterı́sticas de la pareja son determi-
nantes para lograr una mejor protección sexual, en particular en lo que se refiere a
un poder más equitativo en la pareja (Ver Cuadro 2.4).
Factores asociados al uso del condón según las caracterı́sticas de la pareja sexual por sexo
Uso de condon el la última relación sexual
Hombres Mujeres Total
Razones de Razones de Razones de
Caracterı́sticas momios P >t momios P >t momios P >t
Balance de Poder (en la sexualidad)
No 1.00 1.00 1
Sı́ 3.49 0.000 2.35 0.000 2.81 0.000
Abuso sexual del novio o ex-novio
Sı́ 1 1 1
No 1.47 0.062 1.25 0.317 1.25 0.415
Diferencia de edad con la pareja
Tres años y más 1.00 1
Mayor hasta 2 años 0.92 0.773 1.23 0.112 1.17 0.495
Misma edad o menor 0.98 0.950 1.32 0.049 1.84 0.004
Cuadro 2.4: Factores asociados al uso del condón según las caracterı́sticas de la
pareja sexual por sexo.
2.4. Conclusiones
Ası́, los hallazgos relacionados con la pareja sexual de los adolescentes muestran
claramente que es de fundamental importancia lograr una mayor equidad de género
en las prácticas sexuales, tanto en lo que se refiere a la edad de ambos adolescentes
que se encuentran en pareja, como en el balance del poder en distintos temas re-
lacionados con la sexualidad para disminuir las prácticas de riesgo en esta población.
Esto significa reconocer que el sexo protegido involucra complejos procesos de ne-
gociación sexual, que requieren un grado de comunicación abierta sobre el propio
deseo, lo cual no es fácilmente accesible en sociedades como la mexicana donde las
relaciones heterosexuales están frecuentemente marcadas por las desigualdades de
género y poder.
Igualmente, es importante tener en cuenta que las prácticas de sexo protegido y la

prevención de embarazos dependen no sólo de elecciones individuales, sino también
de sistemas más amplios, que involucran además de las caracterı́sticas individuales,
las relaciones con la pareja como también significados morales y coacciones sociales.
22
Bibliografı́a
[1] Juárez, F.; Singh, S.; Maddow-Zimet, I; Wulf, D. Embarazo no planeado

y aborto Inducido en México: causas y consecuencias. Nueva York: Guttmacher
Institute, 45 pp. 2013.
[2] Menkes, Catherine: “Opciones de vida de la juventud y reproducción tempra-
na en México”. Ponencia presentada en la plenaria: La reproducción temprana
y las opciones de vida de la juventud en la XIII Reunión Nacional de Investiga-
ción Demográfica en México. Dinámicas de población y desigualdad, Sociedad
Mexicana de Demografı́a, 2016.
[3] SSA/CENSIDA. Vigilancia Epidemiológica de casos de VIH/SIDA en
México. Registro Nacional de casos de SIDA. Actualización al cierre de
2013. México: Dirección General de Epidemiologı́a/Secretarı́a de Salud y
Centro Nacional para la prevención y el Control VIH/SIDA. Recupera-
do desde: http://www.censida.salud.gob.mx/descargas/epidemiologia/
RN_CIERRE_2013.pdf
[4] Juárez, F.; Palma, JL; Singh, S.; Bankole, A.: Las necesidades de sa-
lud sexual y reproductiva de las adolescentes en México: Retos y oportunidades.
Nueva York: Guttmacher Institute, 35pp. 2010.
[5] Sosa-Sánchez, Itzel. Los Significados de la Salud y la Sexualidad en Jóve-
nes. Un Estudio de Caso en Escuelas Públicas en Cuernavaca. México, DF:
INMUJERES, 2010.
[6] Gayet, Cecilia; Juárez, Fátima; Pedrosa, Laura A. y Magis, Carlos:
Uso del condón entre adolescentes mexicanos para la prevención de las infeccio-
nes de transmisión sexual. Salud Pública de México, Vol. 45(sup. 5): 632-640,
2003.
[7] Sosa-Sánchez, Itzel: Significados del cuerpo y del riesgo en el marco de la
sexualidad y de la reproducción: un estudio de caso con jóvenes en Cuernavaca,
Tesis de Maestrı́a. FLACSO-CLACSO: Buenos Aires, 2010.
[8] Warr, Deborah: The Importance of Love and Understanding Speculation on
Romance in Safe Sex Health. Women's Studies International Forum, vol. 24, No.
2, pp.241 - 252, 2001.
[9] Szasz, Ivonne: Sexualidad y género: algunas experiencias de investigación en
México. Debate feminista, Año 9, vol. 18, Octubre, México pp. 77-104, 1998.
23
[10] Lamas, Marta: Maternidad y violencia simbólica. URIBER y BILLINGS D.

Violencia sobre la salud de las mujeres. México FEMEGO,-IPAS, pp. 114-121,
2003.
[11] Amuchástegui, Ana: Ética deseo y masculinidad: la difı́cil relación entre lo
sexual y lo reproductivo. En A. Amuchástegui e I. Szasz: Sucede que me canso
de ser hombre. Relatos y reflexiones sobre hombres y masculinidades en México.
Colmex: México, 2007.
[12] Casique, I: Dimensiones entrelazadas: empoderamiento y actitudes de los ado-
lescentes mexicanos respecto al uso del condón masculino. Revista Latinoameri-
cana de Población, 10(19): 149-168, 2016.
24
Capı́tulo 3
Una caracterización de la satisfacción estudiantil mediante análisis de clases
latentes.
Ramón Álvarez-Vaz y Elena Vernazza
Universidad de la República,
Facultad de Ciencias Económicas y de Administración,
Departamento de Métodos Cantitativos,
Instituto de Estadı́stica,
Eduardo Acevedo 1139, Cordón,
C.P. 11200, Montevideo, Uruguay,
ramon@iesta.edu.uy, evernazza@iesta.edu.uy
Resumen. En este trabajo se estudian las principales caracterı́sticas de la cons-
trucción de la Satisfacción Estudiantil en los cursos de grado de la Facultad de
Ciencias Económicas y de Administración, Universidad de la República, Uruguay,
mediante Análisis de Clases Latentes (ACL). Los datos utilizados para la aplicación
presentada en este trabajo provienen de una encuesta aplicada sobre una muestra de
estudiantes de grado de la Facultad, en el año 2009. Dicho cuestionario presenta una
estructura de bloques: por un lado (primer bloque) se encuentran las variables que
permitirán realizar una caracterización sociodemográfica de los estudiantes y por
otro se presentan las variables del modelo ECSI (European Customer Satisfaction
Index) que serán las utilizadas para la caracterización de la Satisfacción Estudiantil.
Las variables manifiestas consideradas como insumo para la construcción y carac-
terización de la Satisfacción Estudiantil son las siguientes 6: expectativas (E) de
los estudiantes al ingresar al centro de estudios, la imagen (I) que tienen de éste,
la calidad de la enseñanza recibida (CSA) y de los servicios brindados (CSF), las
necesidades y deseos personales con respecto a la facultad (ND) y el valor percibido
(VP). Los resultados presentados surgen de considerar que efectivamente existe una
variable que refiere a la Satisfacción Estudiantil y que ésta queda definida, a partir
de la interacción de las 6 variables manifiestas, por 4 clases latentes.
Palabras clave: Caracterización, Clases Latentes, Estudiantes Universitarios,

Satisfacción.
25
Abstract. This paper studies the main characteristics of the construction of Stu-
dent Satisfaction in the undergraduate courses of the Facultad de Ciencias Económi-
cas y de Administración, Universidad de la República, Uruguay, through Analysis
of Latent Classes (LCA). The data used for the application presented in this paper
comes from a survey applied to a sample of undergraduate students of the Facul-
tad, in 2009. This questionnaire presents a structure with several blocks: on the
one hand (first block) are the variables that will allow a sociodemographic charac-
terization of the students and, on the other hand, the variables of the ECSI model
(European Customer Satisfaction Index) that will be used for the characterization
of the Student Satisfaction. The variables used are the next 6: expectations of the
incoming students (E), the image that students have about courses (I), the received
teaching quality (CSA) and services provided (CSF), the needs and personal desires
about the Facultad (ND), and the perceived value (VP).The results presented arise
from considering that there is indeed an unobserved variable that refers to Student
Satisfaction, defined from the interaction of the 6 manifest variables, by four latent
classes.
Keywords: Characterization, Latent Class, Undergraduate Students, Satisfac-

tion.
3.1. Introducción
Conocer el nivel de satisfacción de los clientes, con un determinado servicio que
se les brinda resulta fundamental como insumo en la toma de decisiones que tengan
como objetivo primordial mantener o mejorar, en caso de que sea necesario, aquellos
aspectos que se entiende determinan la Satisfacción.
Vinculando esta idea con la educación universitaria, se toma lo propuesto por
Alves y Raposo [6], quienes plantean: “Sólo con la satisfacción de los alumnos se
podrá alcanzar el éxito escolar, la permanencia de los estudiantes en la institución
y, sobre todo, la formación de una valoración positiva boca a boca. En este sentido,
es extremamente importante encontrar formas fiables de medir la satisfacción del
alumno en la enseñanza universitaria, permitiendo ası́ a las instituciones de enseñan-
za conocer su realidad, compararla con la de los otros competidores y analizarla a
lo largo del tiempo”.
En este trabajo se considera a los estudiantes universitarios que concurren a la
Facultad de Ciencias Económicas y Administración (FCEA) de la Universidad de
la República, como “clientes” y se determina que el “servicio” que se les brinda es
el de la educación de nivel terciario.
La información necesaria para poder establecer cómo se construye el concepto
de Satisfacción, se obtiene a través de la aplicación de un cuestionario formado por
apartados de preguntas que conforman el modelo ECSI (European Customer Satis-
faction Index). Sobre este instrumento, y a través del Análisis de Clases Latentes,
se analiza cómo se construye la Satisfacción Estudiantil [5],[21].
La estructura de este documento es la siguiente: en primera instancia se ha-
ce referencia a las caracterı́sticas generales de las técnica estadı́stica empleada. A
continuación se presenta una descripción de los datos, seguida de los principales
resultados obtenidos y por último, se plantean las principales conclusiones y pro-
26
puestas de lı́neas de trabajo e investigaciones a futuro.
3.2. Metodologı́a
Generalmente, al trabajar con datos categóricos multivariados, resulta de interés
investigar eventuales fuentes de confusión entre las variables observadas, identifi-
car/caracterizar grupos de individuos y aproximar la distribución de las observacio-
nes a través de las variables en estudio [15]. Existe una técnica que contempla todas
estas situaciones: Análisis de Clases Latentes (ACL) o Modelos de Clases Latentes
(MCL) [1], [7], [11],[12], [14].
El ACL busca segmentar la tabla/hipercubo de contingencia creado a partir de

las variables observadas/manifiestas, por una variable no observada/latente, con la
siguiente caracterı́stica: se supone que las respuestas a todas las variables manifies-
tas son estadı́sticamente independientes con respecto a los valores de la variable
de clases latentes (independencia local o condicional ). De este manera el modelo
asocia, en términos de probabilidad, a cada individuo a una clase latente. Se puede
predeterminar, por lo tanto, el valor esperado con el que una observación responde
a cada variable manifiesta. Si bien el modelo estimado no estipula el número de
clases latentes, pueden usarse varios estadı́sticos de bondad de ajuste para evaluar
de forma tanto teórica como empı́rica la cantidad de clases a considerar.
Este método puede verse como un modelo de regresión y, por lo tanto, serı́a
posible incluir variables predictivas para la membresı́a de cada observación a una
clase latente [7].
Existen antecedentes de estudios con este tipo de variables en disciplinas como la

economı́a y la psicologı́a. En particular, en el trabajo “Segmentación de la población
española según su grado de concienciación ecológica mediante modelos de variables
latentes”, los autores presentan una segmentación de los hábitos de consumo en
función de su grado de concienciación ecológica mediante técnicas estadı́sticas de
ACL [19].
Por otra parte, en el trabajo “Modelos De Clases Latentes Para Definir Perfiles
Conductuales en Niños De 4 y 5 Años” [9] sus autores elaboran perfiles conductuales
en niños de 4 o 5 años de México aplicando ACL sobre los resultados del test de
screening “Child Behavior Check List” (CBCL).
En otras áreas de la salud como la epidemiologı́a, se presenta el trabajo “Análisis de
clases latentes en tablas poco ocupadas: consumo de alcohol, tabaco y otras drogas
en adolescentes” [8], en el que sus autores presentan una segmentación del tipo de
consumo de drogas en jóvenes de Costa Rica.
3.2.1. Definición del Modelo

Se considera un modelo en el que se observan J variables categóricas politómicas
(variables manifiestas) tal que cada una tiene Kj (j = 1 : J) posibles respuestas,
para los i = 1, 2....N individuos.
27
El modelo de clases latentes aproxima la distribución conjunta observada de las

variables manifiestas como la suma ponderada (por un número finito R) de las ta-
blas de clasificación cruzada.
Yijk será el valor observado de las J variables manifiestas para el individuo i, tal
que Yijk = 1 si el individuo i da la respuesta k de la variable j y Yijk = 0 en otro
caso, con j = 1....J y k = 1....Kj y πjrk representará la probabilidad condicional
de que una observación en la clase r = 1, ..., R produzca el k-ésimo resultado de la
variable j-ésima.
Dentro de cada clase, para cada variable manifiesta, se cumple:
Kj
X
πjrk = 1.
k
Por otra parte, pr corresponderı́a a las proporciones a partir de las cuales

serán
Pmaxgenerados los pesos para la suma ponderada de las tablas de clasificación
( r pr = 1). En este sentido, considerando que estos pr representan la probabi-
lidad incondicional de que un individuo pertenezca a una clase (antes de tomar en
cuenta el valor de Yijk ), pr será denominado probabilidad a priori de la membresı́a
a cada clase latente.
La probabilidad de que un individuo i en la clase r genere un conjunto J de

resultados en las variables manifiestas, asumiendo independencia condicional de los
resultados Y dado la pertenencia a una clase dada, es:
Kj
J Y
Y
f (Yi ; πr ) = (πjrk )Yijk . (3.1)
j=1 k=1
Además, la función de densidad es:

R Kj
J Y
X Y
P (Yi | π, p) = pr (πjrk )Yijk . (3.2)
r=1 j=1 k=1
De esta manera se tienen dos clases de parámetros a estimar por el modelo:

pr y πjrk . Dadas p̂r y π̂jrk , las probabilidades a posteriori de que cada individuo
pertenezca a una clase latente, condicionada a los valores observados de las variables
manifiestas, queda determinada:
p̂r f (Yi ; π̂r )

P̂ (ri | Yi ) = PR (3.3)
q=1 p̂q f (Yi ; π̂q )
con ri = 1, ..., R.
Se debe tener en cuenta que las π̂jrk son estimaciones de las probabilidades de
los resultados condicionales en la clase r. También es importante observar que el
número de parámetros independientes estimados aumenta rápidamente
P con R, J y
Kj . Dados estos valores, el número de parámetros a estimar es R j (Kj − 1) + (R −
1). Este último resultado puede producir una situación no deseada, ya que cuando
28
este número excede el número total de observaciones, o una menos que el número
total de celdas en la tabla de clasificación cruzada de las variables manifiestas, el
modelo no puede ser identificado.
3.2.2. Estimación de parámetros

Los modelos de clase latente pueden estimarse mediante máxima verosimilitud,
donde la log-verosimilitud es:
N R Kj
J Y
X X Y
lnL = ln pr (πjrk )Yijk . (3.4)
1 1 j=1 k=1
Dicha verosimilitud será maximizada con respecto a pr y πjrk a través del al-
goritmo EM [10], [16]. Como con cualquier modelo de mezcla finita, el algoritmo
EM se puede aplicar en virtud de que la membresı́a a la clase de cada individuo es
desconocida, por lo que se trata como un problema de datos faltantes. El algoritmo
trabaja en forma iterativa en dos fases a partir de valores iniciales arbitrarios de p̂r
y π̂jrk , los que se etiquetan como p̂anterior
r
anterior
y π̂jrk .
1. En la fase de esperanza (E), se calcula la probabilidad de membresı́a a la

clase latente usando la ecuación (3.3), sustituyendo en los valores p̂anterior
r y
anterior
π̂jrk .
2. En la fase de maximización (M) los parámetros estimados se actualizan ma-
ximizando la log-verosimilitud dada la probabilidad a posteriori (P̂ (ri | Yi )).
La nueva probabilidad a priori, será:

N
1 X
p̂nueva
r = P̂ (ri | Yi ) (3.5)
N i=1
y la nueva probabilidad condicional será:

PN
nueva i=1 Yij P̂ (ri | Yi )
π̂jr = PN . (3.6)
i=1 P̂ (ri | Yi )
nueva
En la ecuación (3.6), π̂jr es el vector de longitud Kj de las probabilidades
condicionales para la j-ésima variable manifiesta; y por otra parte Yij es la matriz
N × Kj de resultados para Yijk para esa variable. Como todo proceso iterativo este
algoritmo repite las dos fases sustituyendo el valor viejo por el nuevo, hasta alcanzar
un máximo o hasta que el incremento que tiene la log-verosimilitud sea menor a un
cierto umbral previamente establecido.
Por último, cabe destacar que la aplicación de este método de estimación de-
pende de: los valores iniciales elegidos para p̂anterior
r
anterior
y π̂jrk y de la complejidad
del modelo que se estima, por lo que el algoritmo EM puede encontrar un máximo
local de la función log-verosimilitud, en lugar del máximo global deseado, con lo
cual es recomendable estimar más de una vez.
29
3.2.3. Criterios de selección y validación del modelo

Tal como fuera mencionado previamente, la estimación a través de ACL no es-
tipula una cantidad de clases latentes, sin embargo una de las ventajas de esta
técnica, a diferencia de varias de las técnicas de clusterización más comúnmente
utilizadas, es la variedad de herramientas existentes para determinar dicha canti-
dad.
En algunos de los casos, el número de clases latentes a utilizar viene dado por la
teorı́a y en otros, por experiencias empı́ricas previas. Sin embargo, en la mayorı́a de
los casos será necesario realizar un análisis exploratorio que permita decidir la can-
tidad de clases latentes presentes en el problema en estudio. Este proceso comienza
presentando el modelo más general posible, es decir, un modelo con independencia
completa que determina una sola clase. Una vez estimado dicho modelo, el número
de clases se va incrementando de una en una hasta encontrar el modelo que resulte
el “modelo adecuado”.
Agregar una clase al modelo mejorará el ajuste, pero incorporará ruido y paráme-
tros a estimar, por lo que será necesario tener en consideración un criterio de par-
simonia que establezca un equilibrio entre la mejora del ajuste y la cantidad de
parámetros que se incorporan al aumentar una clase en el modelo. El criterio de
parsimonia utilizado en este trabajo será el del mı́nimo BIC (Bayesian information
criterion).
3.3. Resultados
En esta sección se presentan, en forma resumida, los datos con los que se trabajó,
describiendo el diseño muestral empleado y el cuestionario utilizado. Por último se
exponen los principales resultados del Análisis de Clases Latentes.
3.3.1. Diseño muestral

La aplicación que se presentará en este trabajo fue realizada sobre los datos ob-
tenidos mediante la aplicación de un cuestionario sobre una muestra de estudiantes
universitarios de la FCEA, en el año 2009.
La muestra fue seleccionada en base a un marco muestral que se construyó

a partir de las inscripciones a cursos de FCEA en dicho año. El diseño muestral
usado fue estratificado por conglomerados en dos etapas y la muestra finalmente
quedó conformada por estudiantes de 60 grupos prácticos (repartidos en forma
proporcional en 6 estratos, uno por cada año y otro especı́fico con asignaturas de la
Licenciatura en Administración).
Con la muestra seleccionada, se realizó el relevamiento de datos que culminó con
647 encuestas realizadas (tasa de cobertura de la muestra de 90 %).
3.3.2. Cuestionario utilizado

El cuestionario, aplicado sobre la muestra seleccionada, resulta de una adap-
tación del cuestionario utilizado por los investigadores Alves y Raposo de la Uni-
30
versidad de Beira Interior (Portugal) [6]. Éste presenta la siguiente estructura: un

primer bloque, claramente diferenciado de los demás, que contiene una serie de va-
riables de carácter sociodemográfico, como sexo, edad y algunas otras variables que
caracterizan al estudiante dentro del ámbito de la facultad, como año de ingreso,
año y cantidad de materias en curso, entre otras. Los restantes ocho bloques de
preguntas (presentados como bloque A - H) presentan todos la misma estructura,
se plantea una pregunta general que determina la esencia del bloque y a partir de
ella, se establecen una serie de afirmaciones sobre las cuales el estudiante deberá
expresar su posición, utilizando una escala Likert que toma valores en el intervalo
[1 - 10], donde 1 indicará la mayor discrepancia con lo planteado en la pregunta y
10 el mayor acuerdo.
Los bloques A a H presentan las siguientes caracterı́sticas:
Bloque A - 12 afirmaciones referentes a las expectativas de los estudiantes,

previo ingreso a facultad.
Bloque B - 6 afirmaciones vinculadas a la imagen que tienen los estudiantes
sobre la facultad.
Bloque C - 9 afirmaciones asociadas a la calidad del servicio que brinda la

facultad.
Bloque D - 9 afirmaciones asociadas a la calidad de los servicios que brinda
la facultad con respecto a la biblioteca, bedelı́a y cafeterı́a, entre otros.
Bloque E - 9 afirmaciones (las mismas que el bloque C) asociadas a necesida-

des/deseos actuales.
Bloque F - 7 afirmaciones que indagan sobre el valor percibido.
Bloque G - 6 afirmaciones que refieren a la satisfacción de los estudiantes con
la facultad.
Bloque H - 5 afirmaciones que pueden dividirse en 2 subgrupos, las 3 prime-

ras referentes a la lealtad de los estudiantes con la facultad, y las 2 últimas
asociadas al boca a boca que se genera entre los estudiantes.
Las variables consideradas en este trabajo resultan de la agregación de los ı́tems
por Bloques: Expectativas (ER ), Imagen (IR ), Calidad de Servicios Académicos
(CSAR ), Calidad de Servicios Funcionales (CSFR ), Necesidades/Deseos (N DR ) y
Valor Percibido (V PR ).
3.3.3. Aplicación
La aplicación presentada en este trabajo, toma como insumo las puntuaciones
(categorizadas) de las seis variables del ECSI. éstas, y sus respectivas categorı́as,
son:
ER : Expectativas
Altas (> 90), Medias (81 : 90), Bajas (< 81)
31
IR : Imagen
Alta (> 50), Media (41 : 50), Baja (< 41)
CSAR : Calidad de los Servicios Académicos
Alta (> 70), Media (61 : 70), Baja (< 61)
CSFR : Calidad de los Servicios Funcionales
Alta (> 65), Media (56 : 65), Baja (< 56)
N DR : Necesidades/Deseos
Alta (> 70), Media (61 : 70), Baja (< 61)
V PR : Valor Percibido
Alta (> 60), Media (51 : 60), Baja (< 51).
Simplificando la notación, la codificación utilizada será (para i = 1:6):

 3 Alto
Yi = 2 M edio
1 Bajo

Y = (ER , IR , CSAR , CSFR , N DR , V PR ).
En resumen, se tiene:
Tamaño de muestra: n = 470 (luego de depurar los datos y descartar obser-
vaciones con datos faltantes).
Una variable de clases latentes: Satisfacción estudiantil.
Seis variables (Yi ) manifiestas: p = 6.
Cada una de las variables manifiestas posee 3 categorı́as de respuestas posibles:
ki = 3 (para i = 1:6).
En el Cuadro 3.1 se presentan los seis patrones de respuesta más frecuentes (de
las 163 secuencias observadas), y sus respectivas frecuencias, para el caso de los 470
estudiantes en estudio. En dicha tabla se puede observar que los dos patrones más
frecuentes son los que representan los extremos: niveles altos de todas las variables
manifiestas y valores bajos en todas ellas, respectivamente.
Cuadro 3.1: Patrones de respuesta - Frecuencias observadas.

ER IR CSAR CSFR N DR V PR Frecuencia
3 3 3 3 3 3 48
1 1 1 1 1 1 45
2 2 2 3 2 2 17
1 2 1 1 1 1 11
3 3 3 3 3 2 11
3 2 3 3 3 2 10
32
3.3.4. Estimación del modelo

Los modelos estimados, presentados en esta sección, fueron estimados con el
paquete poLCA [15] del Software libre R-project [17].
En el contexto del análisis de variables de clases latentes estimar un modelo

consiste, en primera instancia, en determinar cuántas clases latentes existen en el
problema en estudio.
Por lo tanto, la hipótesis de partida en la estimación de cada uno de los posibles

modelos será:
H0 : El modelo ajustado es el adecuado, vs.
H1 : El modelo ajustado NO es el adecuado.
Por adecuado se entenderá que la cantidad de clases especificadas es la correcta.
En este trabajo se han estimado 4 modelos (M = 1, 2, 3, 4) y a partir de los

resultados obtenidos se determina que, siguiendo el criterio de mı́nimo BIC, el me-
jor modelo serı́a aquel que presenta una variable con 3 clases latentes. Sin embargo,
tanto en este modelo como en aquellos que proponen una variable con una y dos
clases latentes los resultados obtenidos ponen de manifiesto que la hipótesis nula es
rechazada1 , por lo que serı́a necesario un ajuste con más clases.
Para el caso del modelo con una variable con cuatro clases latentes la hipótesis
nula no puede ser rechazada, por lo que podrı́a considerarse que ajustar un modelo
con cuatro clases latentes es adecuado. Además, se verifica que al estimar este modelo
no existen problemas de identificabilidad y que en el proceso de maximización se
alcanza, al menos, un máximo local (que puede coincidir con el máximo global).
3.3.5. Caracterización de las clases

En función de lo expuesto se decide estimar un modelo de una variable con cua-
tro clases latentes, cuyas probabilidades a priori son:
P(1) = 0.32, P(2) = 0.29; P(3) = 0.24 ; P(4) = 0.15.
La caracterización de cada una de las clases se realiza en función de la probabi-

lidad condicional, de cada una de las categorı́as de cada variable manifiesta, dada la
clase. Tomando como referencia los resultados presentados en el Cuadro 3.2, la ca-
racterización de las clases en las que se agrupan a los 470 estudiantes es la siguiente:
Clase Latente 1
Los estudiantes que se encuentran en esta clase presentan un nivel de expectativas
y una percepción de la calidad de los servicios funcionales medio-bajo y niveles
medios de imagen, percepción de la calidad de los servicios académicos, necesidades
y deseos y valor percibido.
En función de la descripción hecha se entiende que los patrones caracterı́sticos de
esta clase son:
1 Se considera un α = 0.05.
33
(ER , IR , CSAR , CSFR , N DR , V PR ) = (1,2,2,1,2,2),

(ER , IR , CSAR , CSFR , N DR , V PR ) = (2,2,2,2,2,2).
Clase Latente 2
Los estudiantes que se encuentran en la clase latente 2, presentan un nivel alto de
todas las variables manifiestas. Cabe destacar, además, el hecho de que la proba-
bilidad de que un estudiante que pertenece a esta clase, tenga niveles bajos en su
percepción de la calidad de los servicios académicos, es 0.
El patrón especı́fico de esta clase es:
Clase Latente 3
En el extremo opuesto a los estudiantes cuya Satisfacción se define a partir de la
clase latente 2, se encuentran los estudiantes de esta clase. éstos presentan un nivel
bajo de todas las variables manifiestas. Cabe destacar, además, el hecho de que la
probabilidad de que un estudiante que pertenece a esta clase, tenga niveles altos en
imagen y necesidades/deseos, es 0.
El patrón especı́fico de esta clase es:
Clase Latente 4
Por último, los estudiantes que pertenecen a la clase latente 4 se caracterizan por
tener nivel medio-alto de expectativas, nivel medio de imagen, percepción de la ca-
lidad de los servicios académicos, necesidades/deseos y valor percibido. En lo que
refiere a la percepción de la calidad de los servicios funcionales, los estudiantes que
se encuentran en esta clase presentan valores altos.
Además, se destaca que la probabilidad de que un estudiante que pertenece a esta
clase, tenga niveles bajos en imagen, percepción de la calidad los servicios académi-
cos y necesidades/deseos, es 0.
Los patrones caracterı́sticos de esta clase son:

(ER , IR , CSAR , CSFR , N DR , V PR ) = (2,2,2,3,2,2),
34
Cuadro 3.2: Probabilidades condicionales P (Yi /m).

ER 1 2 3
m=1 0.42 0.43 0.15
m=2 0.04 0.15 0.81
m=3 0.81 0.17 0.02
m=4 0.09 0.48 0.43
IR 1 2 3
m=1 0.19 0.62 0.19
m=2 0.01 0.26 0.73
m=3 0.70 0.30 0.00
m=4 0.00 0.91 0.09
CSAR 1 2 3
m=1 0.30 0.69 0.01
m=2 0.00 0.05 0.95
m=3 0.99 0.00 0.01
m=4 0.00 0.68 0.32
CSFR 1 2 3
m=1 0.38 0.40 0.22
m=2 0.04 0.16 0.80
m=3 0.77 0.19 0.04
m=4 0.03 0.29 0.68
N DR 1 2 3
m=1 0.28 0.63 0.09
m=2 0.01 0.07 0.92
m=3 0.97 0.03 0.00
m=4 0.00 0.74 0.26
V PR 1 2 3
m=1 0.13 0.57 0.30
m=2 0.03 0.24 0.73
m=3 0.75 0.24 0.01
m=4 0.05 0.95 0.00
Por lo tanto, en lo que refiere a la Satisfacción Estudiantil, las clases latentes se

podrı́an categorizar como:
m = 1: Estudiantes con Satisfacción Estudiantil medio-baja.

m = 2: Estudiantes con Satisfacción Estudiantil alta.
m = 3: Estudiantes con Satisfacción Estudiantil baja.
m = 4: Estudiantes con Satisfacción Estudiantil media-alta.
35
Figura 3.1: Perfil de las 4 clases latentes en función de las 6 variables manifiestas.
3.3.6. Probabilidades a posteriori

Los resultados presentados en el Cuadro 3.3 hacen referencia, a modo de ejemplo,
a las probabilidades a posteriori, para cada uno de los patrones posibles de respuesta
(para los 6 patrones más frecuentes, presentados en el Cuadro 3.1), y la asignación
a cada una de las clases (en función de la máxima probabilidad a posteriori).
Cuadro 3.3: Probs. a posteriori según patrones y asignaciones.
ER IR CSAR CSFR N DR V PR P (1) P (2) P (3) P (4) Asignación
3 3 3 3 3 3 0.00 1.00 0.00 0.00 2
1 1 1 1 1 1 0.00 0.00 1.00 0.00 3
2 2 2 3 2 2 0.18 0.00 0.00 0.81 4
1 2 1 1 1 1 0.01 0.00 0.99 0.00 3
3 3 3 3 3 2 0.00 0.99 0.00 0.01 2
3 2 3 3 3 2 0.00 0.76 0.00 0.24 2
En función de las probabilidades a posteriori, de cada una de las clases, el total

de estudiantes queda distribuido en cada una de ellas en un 30 % (145), 29 % (137),
25 % (118) y 16 % (77) respectivamente.
36
3.4. Conclusiones y Consideraciones finales

Los resultados obtenidos y presentados en este trabajo, nos permiten concluir:
Efectivamente existe una variable de clases latentes que refiere a la Satisfacción

Estudiantil de los estudiantes de nivel universitario de la Facultad de Ciencias
Económicas y Administración (FCEA, UDELAR, Uruguay).
Dicha variable tiene 4 clases que quedan definidas a partir de la interacción

de las 6 variables manifiestas.
En función de la pertenencia a cada una de las clases, se detectan estudian-
tes universitarios cuya satisfacción con la FCEA es extrema en 2 sentidos
opuestos: Satisfacción Estudiantil alta y Satisfacción Estudiantil baja. En un
término medio, existen estudiantes cuya Satisfacción Estudiantil se define co-
mo media. Para estos, existen dos clases: media-alta y media-baja.
Como consideraciones finales y propuestas a futuro se plantea:

Evaluar la robustez de la variable de clases latentes, iterando varias veces para
evaluar el grado de dependencia de los valores iniciales.
Plantear el uso de las clases latentes detectadas para, a través de una partición
de la tabla de datos, volver a estimar un Modelo de Ecuaciones Estructurales y
realizar un estudio comparativo con los modelos ya estimados con estos datos
[2], [3], [4], [21].
Realizar un estudio similar con los datos obtenidos en una investigación rea-
lizada en 2017 en FCEA (réplica del estudio 2009).
37
Bibliografı́a
[1] Agresti, A. Categorical data analysis. Wiley-Interscience, Hoboken, N.J.,

2013.
[2] Álvarez-Vaz, R. y Vernazza, E. Aplicación de los modelos de ecuaciones
estructurales para el estudio de la satisfacción estudiantil en en los cursos su-
periores de FCCEEyA. Documentos de Trabajo - IESTA. Serie DT (13 / 02),
2013.
[3] Álvarez-Vaz, R. y Vernazza, E. Aplicación de modelos de ecuaciones
estructurales en la medición del nivel de satisfacción estudiantil: comparación
de tres métodos de estimación. Documentos de Trabajo - IESTA. Serie DT (14
/ 03), 2014.
[4] Álvarez-Vaz, R. y Vernazza, E. Evaluación de un instrumento de medición
del nivel de satisfacción estudiantil a través de la aplicación de modelos de
ecuaciones estructurales. Cuadernos del CIMBAGE, (19):1–25, 2017.
[5] Álvarez-Vaz, R., Freira, D., Vernazza, E., y Alves, H. Can students’
satisfaction indexes be applied the same way in different countries? Int Rev
Public Nonprofit Marketing, 13(101), 2016.
[6] Alves, H. y Raposo, M. La medición de la satisfacción en la enseñanza
universitaria: El ejemplo de la universidade da beira interior. Int Rev Public
Nonprofit Marketing, 1(1):73–88, 2014.
[7] Bandeen-Roche, K., Miglioretti, D. L., Zeger, S. L., y Rathouz,
P. J. Latent variable regression for multiple discrete outcomes. Journal of the
American Statistical Association, 92(440):1375–1386, 1997.
[8] Carlomagno, A. A. y Sepúlveda, R. Análisis de clases latentes en tablas

poco ocupadas: consumo de alcohol, tabaco y otras drogas en adolescentes.
Revista de Matemática: Teorı́a y Aplicaciones, 17(1):25–40, 2010.
[9] Castro López, C. R., Montano Rivas, A., y Oliva Zarate, L. Modelos
de clases latentes para definir perfiles conductuales en niños de 4 y 5 años.
Revista Electrónica de Psicologı́a Iztacala., 14(1), 2011.
[10] Dempster, A. P., Laird, N. M., y Rubin, D. B. Maximum likelihood from
incomplete data via the em algorithm. Journal of the Royal Statistical Society,
39:1–38, 1977.
38
[11] Everitt, B. S. An Introduction to Latent Variable Models. Springer Nether-

lands, Dordrecht, 1984.
[12] Hagenaars, J. Applied latent class analysis. Cambridge University Press,
Cambridge New York, 2002.
[13] Højsgaard, S. Graphical models with R. Springer, New York, 2012.
[14] Lazarsfeld, P. The logical and mathematical foundations of latent structure

analysis. ISA Stouffer (ed.), Measurement and Prediction, pp. 362-412., 1950
[15] Linzer, D. A. y Lewis, J. B. poLCA: An R package for polytomous variable
latent class analysis. Journal of Statistical Software, 42(10):1–29, 2011.
[16] McLachlan, G. Finite mixture models. Wiley, New York, 2000.

[17] R Core Team. R: A Language and Environment for Statistical Computing. R
Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0,
2017.
[18] Robertson, J. Modern statistical methods for HCI. Springer, Switzerland.,
2016
[19] Sánchez Rivero, M. Segmentación de la población española según su grado
de concienciación ecológica mediante modelos de variables latentes l. Investiga-
ciones Europeas de Dirección y Economı́a de la Empresa, 7(3):173–196, 2001.
[20] Scrucca, L. y Raftery, A. E. Improved initialisation of model-based clus-

tering using Gaussian hierarchical partitions. ArXiv e-prints, 2015.
[21] Vernazza, E. Evaluación de un instrumento de medición del nivel de satis-
facción estudiantil en los cursos de formación superior de la FCCEEyA de la
UDELAR a través de la aplicación de Structural Equation Modelling (SEM).
Informe de pasantı́a, Fac. de CCEEyA - UdelaR, 2013.
39
Capı́tulo 4
Modelación espacial de la plaga Sigatoka Negra (Mycosphaerella fijiensis) en
cultivos de plátano del estado de Guerrero
Juan Elı́as Solı́s Alonso1 , Marı́a Guzmán Martı́nez1 , Ramón Reyes Carreto1 y
Dolores Briones Reyes2
1
Universidad Autónoma de Guerrero,
Facultad de Matemáticas,
Av. Lázaro Cárdenas S/N, Ciudad Universitaria,
C.P. 39087, Chilpancingo, Guerrero,
2
INIFAP, Campo Experimental Pabellon
Km 32.5 Carretera Aguascalientes a Zacatecas,
C.P. 20660, Pabellón de Arteaga, Aguascalientes,
juanelias.solisalonso@gmail.com, manguzgm@gmail.com,
rrcarreto@gmail.com, briones 2003@yahoo.com.mx
Resumen. El plátano (Musa spp.) se cultiva en más de 120 paı́ses alrededor
del mundo, es una importante fuente de carbohidratos en la dieta de millones de
personas, sobre todo en paı́ses tropicales, además representan a nivel mundial el
cuarto cultivo de mayor importancia, después del maı́z (Zea mays), trigo (Triticum
aestivum) y arroz (Oryza sativa). La variedad de plátanos que se cultivan en México
es amplia, entre ellas destacan el Plátano Tabasco o Roatán, Enano Gigante, Crio-
llo, Valery, Dominico, Manzano, Macho, Morado y Pera. Guerrero ocupa el octavo
lugar con una producción anual de 50 a 60 toneladas por hectárea. Este cultivo
como cualquier otro presenta problemas de plagas, una de ellas es la Sigatoka negra
(Mycosphaerella fijiensis) que es una de las principales enfermedades del cultivo,
provoca una considerable reducción en el área foliar de la planta y en consecuencia
los racimos y los frutos tienen un menor peso en comparación con las plantas sanas.
Este problema finalmente se ve reflejado en la producción total. El objetivo de este
trabajo fue modelar la distribución espacial de la enfermedad en el municipio de
Tecpán de Galeana, ubicado en Costa Grande, Guerrero, a través de un proceso
espacial gaussiano estacionario. Para la modelación de la estructura de dependencia
espacial de los datos se utilizó la función del semivariograma; y para la interpolación
el método de kriging ordinario y universal. Esta investigación permitió identificar
los puntos de mayor gravedad de la enfermedad en la zona de estudio, lo cual es
muy importante a la hora de implementar las medidas de control para la Sigatoka
negra. La base de datos comprende los monitoreos de julio a diciembre del año 2017,
6 meses en total. La información fue proporcionada por SAGARPA.
Abstract. The banana (Musa spp.) is grown in more than 120 countries around the
40
world, is an important source of carbohydrates in the diet of millions of people, es-

pecially in tropical countries, also represent the fourth world level most important
crop, after corn (Zea mays), wheat (Triticum aestivum) and rice (Oryza sativa).
The variety of plantains grown in Mexico is wide, among them the banana Tabasco
or Roatán, Enano Gigante, Criollo, Valery, Dominico, Manzano, Macho, Morado
and Pera. Guerrero occupies the eighth place with an annual production of 50 to 60
tons per hectare. This crop, like any other, presents problems of pests, one of them
is black Sigatoka (Mycosphaerella fijiensis) which is one of the main diseases of the
crop, causes a considerable reduction in the leaf area of the plant and consequently
bunches and fruits have a lower weight compared to healthy plants. This problem
is finally reflected in the total production. The objective of this work was to model
the spatial distribution of the disease in the municipality of Tecpán de Galeana,
located in Costa Grande, Guerrero, through a stationary Gaussian spatial process.
For the modeling of the spatial dependence structure of the data, the function of the
semivariogram was used; and for interpolation the ordinary and universal kriging
method. This investigation allowed identifying the most serious points of the disease
in the study area, which is very important when implementing the control measures
for black Sigatoka. Data base includes the monitoring from july to december of the
year 2017, 6 months in total. The information was provided by SAGARPA.
Palabras clave: Interpolación espacial, Proceso espacial gaussiano, Semivario-

grama.
4.1. Introducción
El plátano es un cultivo muy importante, aunque poco estudiado en todo el
mundo. Mucha gente que hoy disfruta de los plátanos no se da cuenta de la amplia
gama de esfuerzos humanos que implica su cultivo [11] ni de los problemas fitosani-
tarios a los cuales el cultivo se enfrenta como la Sigatoka negra, Sigatoka amarilla,
Moko del plátano, entre otras.
Aunque la Sigatoka negra se describió por primera vez en 1964 [15], una descrip-
ción detallada de los sı́ntomas fue publicada por primera vez en 1969 por Meredith
y Lawrence [13]. Con base en estas observaciones, Fouré [8] redefinió los sı́ntomas
mostrados durante el desarrollo de la enfermedad en seis etapas. En cuanto a la sin-
tomatologı́a de la enfermedad, el primer sı́ntoma que se presenta son las manchas
cloróticas que aparecen entre los 14 a 20 dı́as después de la infección. El perı́odo
entre la aparición de manchas y el desarrollo de rayas y, posteriormente, puntos
necróticos varı́a en longitud de acuerdo con el cultivar y la gravedad de la infección.
Otros autores mencionan que en algunas áreas de cultivo, la primera aparición de
sı́ntomas se correlaciona con la susceptibilidad del cultivar [4]. Sin embargo, la du-
ración del perı́odo de incubación no parece correlacionarse con la resistencia general
[8].
De las investigaciones relacionadas con la Sigatoka está la de Chillet et al. [5]

que descubrieron que además de los efectos de la Sigatoka sobre el rendimiento del
plátano, ésta tiene un impacto en la calidad de la fruta, especialmente porque los
plátanos maduran prematuramente. Ellos llevaron a cabo una encuesta de planta-
41
ción y experimentos para evaluar el efecto de la enfermedad en la vida verde de los

plátanos recolectados a una edad fisiológica constante, medida en grados-dı́a (dd).
Sus resultados revelaron que los plátanos cosechados a 900 dd de plantas con alta
severidad de la Sigatoka tenı́an crecimiento de diámetro normal, pero una vida ver-
de más corta que los plátanos cosechados de plantas no infectadas. Estos resultados
indican que la Sigatoka es directamente responsable de la reducción de la vida verde
del banano, ya que la reducción de vida verde no podrı́a atribuirse a la cosecha de
frutos en una edad fisiológica más avanzada [5].
En cuanto a daño económico, Cook et al., en 2001 proporcionaron evidencia
cuantitativa que sugiere que en el caso de las importaciones de banano, el nivel
apropiado de protección corresponde a un daño esperado de 60 millones de dóla-
res australianos por año. Esto sugiere que, si bien las reglamentaciones actuales de
cuarentena restringen el comercio, el nivel adecuado de protección corresponde a
un nivel de daño relativamente grave [6].
Por otro lado, Alves et al. [2], aplicaron técnicas de geoinformación para desa-
rrollar modelos predictivos para estudiar las áreas de riesgo en la Sigatoka negra
(Mycosphaerella fijiensis var. difformis) en banano, considerando el clima carac-
terı́stico de Brasil y la distribución de cultivos de banano. Considerando datos de
temperatura y precipitación para el periodo comprendido entre 1950 y 2000, para
los cuales se disponı́a de datos de observación, y de simulaciones para 2020, 2050
y 2080; utilizando los escenarios de emisiones (SRESA2, por sus siglas en inglés),
de cambio climático, a partir del análisis de componentes principales, se generó una
sola variable en base a 57 variables, para determinar un ı́ndice que explica el 90 %
de la variabilidad de cultivos de banano, en distritos municipales de todo Brasil.
El modelo climático se utilizó para generar la zonificación de la enfermedad de la
planta, utilizando la temperatura y la humedad de la hoja como insumo. Se trazaron
áreas de favorabilidad para la enfermedad contra las principales áreas productoras
de banano en Brasil. Esta metodologı́a permitió la visualización de los cambios en
áreas favorables para epidemias bajo posibles escenarios futuros de cambio climático
[2].
Por otra parte Freitas et al. [9], analizaron la distribución espacial de la Mancha
de Sigatoka amarilla en relación con la fertilidad del suelo y el estado nutricional de
la planta mediante geoestadı́stica. El área experimental comprendió 1.2 hectáreas,
donde 27 puntos fueron georeferenciados y espaciados en una cuadrı́cula regular
de 18m × 18m. La severidad de la Sigatoka amarilla, la fertilidad del suelo y el
estado nutricional de la planta se evaluaron en cada punto. Para estas variables se
ajustó el modelo esférico cuyos parámetros se estimaron por máxima verosimilitud
restringida. Los mapas de interpolación mostraron que la mayor tasa de infección
de Sigatoka ocurrió en áreas altas del campo que tenı́an la mayor concentración de
arena, mientras que la tasa más baja se encontró en áreas bajas con limo inferior,
materia orgánica, bases intercambiables totales, capacidad efectiva de intercambio
catiónico, Ca y Mg en el suelo, y azufre foliar [9].
El objetivo de este trabajo fue modelar la distribución espacial del ı́ndice de in-
festación de la Sigatoka negra (Mycosphaerella fijiensis) en plátanos del municipio
de Tecpán de Galeana, ubicado en Costa Grande, Guerrero, a través de un proceso
42
espacial gaussiano estacionario. Cabe señalar que para esta enfermedad en el estado
de Guerrero no se tienen identificados trabajos de este tipo.
Este trabajo esta organizado de la siguiente manera. En la Sección 4.2 se discute

la teorı́a básica para la geoestadı́stica y el proceso gaussiano espacial y los métodos
de interpolación. En la Sección 4.3 se muestra una aplicación de la metodologı́a
anterior en el ı́ndice de infestación en plátanos y en la Sección 4.4 se da una breve
discusión y los resultados.
4.2. Marco Teórico

La forma básica para datos geoestadı́sticos es:
(xi , yi ), i = 1, ..., n
donde xi denota una ubicación espacial (normalmente en un espacio de dos dimen-
siones) y yi es un valor asociado a la ubicación xi . Se denota con Y a la variable
medible o respuesta, que debe estar definida en una región D ⊂ R2 . De esta manera,
cada yi es una realización de la variable aleatoria Yi , cuya distribución depende del
valor de la ubicación xi , Yi = Y (xi ), adyacente a un proceso estocástico espacial
continuo, S(x), el cual no es directamente observable.
Un modelo geoestadı́stico incorpora al menos dos elementos: un proceso estocástico
{S(x) : x ∈ D ⊂ R2 } y una variable aleatoria Y= (Y (x1 ), ..., Y (xn )) cuya distribu-
ción multivariada está condicionada a S(·).
La siguiente definición permite identificar cuando un proceso estocástico es gaus-
siano y estacionario.
Definición 4.2.1 Un proceso estocástico S(x) es un Modelo Gaussiano si la distri-
bución conjunta de S(x1 ), ..., S(xn ) es Gaussiana multivariada para cualquier entero
n y un conjunto de ubicaciones xi . El proceso es estacionario si la esperanza y la
varianza de S(x) es la misma para todo x, y la correlación entre S(xi ) y S(xj )
dependa solo de h = ||xi − xj ||, la distancia euclideana entre xi y xj .
Los supuestos subyacentes al modelo gaussiano estacionario son:
1. {S(x) : x ∈ R2 } es un proceso gaussiano con media µ y varianza σ 2 =
V ar{S(x)} y función de correlación ρ(h) = Corr{S(xi ), S(xj )} donde h =
||xi − xj ||.
2. Condicionadas en {S(x) : x ∈ R2 }, las realizaciones yi de la variable aleatoria
Yi son mutuamente independientes y normalmente distribuidas con media
condicional E[Yi |S(·)] = S(xi ) y varianza condicional τ 2 .
El modelo para el proceso estocástico S(x) puede definirse como:
Y (xi ) = S(xi ) + Z(xi ), i = 1, ..., n (4.1)
donde S(xi ) con xi ∈ D ⊂ R2 cumple con el supuesto 1 y los Z(xi ) son variables
aleatorias mutuamente independientes con distribución N (0, τ 2 ). Obsérvese que este
modelo asume que la media es constante en D. Si no fuera ası́ entonces
Y (xi ) = µ(xi ) + S(xi ) + Z(xi ), i = 1, ..., n (4.2)
43
donde ahora µ(xi ) es una función que depende de las ubicaciones xi . El Modelo
(4.2) es de alguna manera una generalización del Modelo (4.1).
Si la media del proceso observado en la superficie tiene tendencia lineal entonces

µ(x) esta dada por:
µ(x) = β0 + β1 d1 + β2 d2 (4.3)
donde d1 y d2 son la latitud y longitud de la ubicación, es decir xi = (d1 , d2 ) (ver
[14]). Si la media del proceso observado tiene una tendencia cuadrática entonces
µ(x) está dada por:
µ(x) = β0 + β1 d1 + β2 d2 + β3 d21 + β4 d22 + β5 d1 d2 .
Para modelar la estructura de dependencia del proceso estocástico gaussiano

estacionario, S(x), se puede utilizar la función del semivariograma. La cual se define
como
1
V (h) := V ar{S(xi ) − S(xj )}
2
donde h = ||xi − xj ||.
El estimador natural de V (h) es el estimador de momentos de Matheron (ver [12])
dado por:
1 X 2
V̂ (h) = [Y (xi ) − Y (xj )]
2|N (h)|
N (h)
donde N (h) = {(xi , xj ) : h − ∆ ≤ h ≤ h + ∆, i, j = 1, ..., n} con ∆ que es una cierta

tolerancia y |N (h)| es el número de pares contenidos en el conjunto N (h).
Algunos de los modelos teóricos para la función del semivariograma son el Ex-
ponencial, Esférico, Gaussiano y Wave (Cuadro 4.1), entre otros (ver [3]).
Cuadro 4.1: Modelos teóricos para el semivariograma.
Modelos Función del semivariograma

h
τ 2 + σ 2 (1−− a ) h>0
Exponencial V (h) =
0 en otro caso
τ + σ 2 (1.5( ha ) − 0.5( ha )3 si h ≤ a
2
Esférico V (h) =
τ 2 + σ2 si h > a
−( h )2

2 2
τ + σ (1− a ) h>0
Gaussiano V (h) =
0 en otro caso
τ + σ 2 (1 − ha sen( ha ))
2
h>0
Wave V (h) =
0 en otro caso
Los modelos que se ajustaron para el semivariograma en esta investigación fueron

los del Cuadro 4.1, para validar cual de los modelos se ajusta mejor al semivariogra-
ma empı́rico se utilizó validación cruzada, la idea de esta técnica es dejar de lado
cada observación por turno y usar kriging para predecir su valor usando las otras
observaciones sin volver a estimar el modelo del semivariograma.
44
Para cada ubicación xi se tiene entonces, un valor observado Y (xi ) y valor predi-
cho Ŷ (xi ), la validación es a través del criterio del error cuadrado medio normalizado
que se define por:
n
1 X (Y (xi ) − Ŷ (xi ))2
M SN E = (4.4)
n i=1 σ̂x2i
donde σ̂x2i es la varianza del kriging. Si el modelo del semivariograma esta correcta-
mente identificado y bien estimado, entonces el MSNE deberı́a ser muy cercano a 1
[10].
Nuestro objetivo es crear un mapa de predicción para Y (xi ) sobre todo D cuan-
do Y (xi ) solo se observa en un número finito de puntos de D. La palabra “kriging”
es sinónimo de “predicción óptima”, en otras palabras, se refiere a hacer inferen-
cias sobre valores no observados del proceso aleatorio Y (xi ), a partir de ubicaciones
xi ∈ D.
El kriging ordinario se define como

n
X
Kok (Y (x0 )) = λi Y (xi ) (4.5)
i=1
que es la predicción espacial del proceso Y (x0 ) bajo los siguientes dos supuestos,
En el Modelo (4.1), xi ∈ D, µ ∈ R, y µ es una constante desconocida.

n
X
λi = 1.
i=1
Esta última condición, que los coeficientes del predictor lineal (4.5) suman 1, ga-
rantiza uniformidad insesgada, es decir, E(Kok (Y (x0 ))) = µ, para toda µ ∈ R.
El kriging universal se define como

n
X
Kuk (Y (x0 )) = λi Y (xi ), λ1 , ..., λn ∈ R (4.6)
i=1
el cual será insesgado si E(Kuk (Y (x0 ))) = µ(x0 ) [7], donde µ(x0 ) es la función de
la media, entonces la ecuación (4.6) queda como,
n
X
E [Kuk (Y (x0 ))] = λi µ(xi ) = µ(x0 ). (4.7)
i=1
4.3. Aplicación
4.3.1. Descripción de los datos
La base de datos comprende los monitoreos de julio a diciembre del año 2017,
la cual fue proporcionada por SAGARPA. En cada mes se muestreo 2 veces cada
45
punto georeferenciado dejando pasar un lapso de 15 dı́as para el siguiente muestreo,

de esa manera fue en que se abordó el análisis geoestadı́stico, en el Cuadro 4.2 se
muestra la estructura de cuantos puntos georeferenciados hay en cada mes.
Cuadro 4.2: Puntos georeferenciados por mes.
Mes 1ra quincena 2da quincena Total

Julio 130 107 237
Agosto 143 146 289
Septiembre 149 133 282
Octubre 122 148 270
Noviembre 139 138 277
Diciembre 150 141 291
Para la modelación de la estructura de dependencia espacial de los datos se

utilizó la función del semivariograma (ver [7]); y para la interpolación del proceso
el método de kriging ordinario (4.5) y universal (4.7).
4.3.2. Análisis de tendencia y estacionariedad

En la Figura 4.1 se observa la ubicación de los puntos georeferenciados en estudio
sobre en un mapa de Google para observar el área en la que se llevó a cabo el
muestreo.
●●●
●
● ●
●
●● ●●
● ●
● ● ●
● ●
●
●
●
●●
● ● ●
●
●● ● ●
●
● ● ● ●
● ●
●
● ●
●
● ●
●● ●
●
●● ●
●
●
●
●
● ● ● ●
●●●●
●●●
●● ●
●
●
●
●
● ●
●
●● ●
●
●
●
● ●
● ●
● ●●
●●
●
● ●●
●● ● ● ● ●
● ●
●
●●
● ●● ●
●
●● ●
●●●
● ● ●●
●
● ●
●
●
●●●
● ●
●
●
●●●●
●
●●
●
●●
●
Figura 4.1: Mapa de los puntos georeferenciados en estudio.
En la Figura 4.2 se analiza si se presenta tendencia en los datos, como se pue-

de apreciar, hay efecto de tendencia en los sentidos norte a sur y de este a oeste,
dependiendo del comportamiento de los puntos es que se sabe si los datos tienen
media constante, lo normal es una lı́nea horizontal [14], en este caso la media no es
constante sobre el área de estudio.
En la Figura 4.3 se muestra el ı́ndice de infestación en cada uno de los puntos

georeferenciados de muestreo, donde lo negro indica mayor ı́ndice de infestación
siendo el sur de la zona de estudio quien tiene mayor infestación.
46
50
50
● ● ● ● ● ● ● ● ● ● ● ●● ● ● ●
● ●
● ● ● ●
● ●
● ●
● ●
● ● ● ● ● ● ● ●
● ● ● ● ●
●
45
45
● ●
● ●
● ●
● ● ● ● ● ●
● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ●● ● ● ●
● ● ● ●
● ● ● ●
● ●
● ● ● ● ● ● ● ● ● ●● ●
● ●
● ●
40
40
● ● ● ● ● ● ●●
● ●
● ●
● ●
● ●
● ● ● ●
Infestacion
Infestacion
● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ●● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ●
35
35
● ●
● ●
● ●● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ●● ● ● ● ● ● ● ●
● ● ● ● ● ●
● ●
● ● ● ●
● ●
● ●
● ● ● ●
● ●
30
●
30
●
● ●
● ● ● ●
● ●
● ● ● ● ● ●
● ●
● ● ● ●
● ● ● ● ● ● ● ●
● ●
● ●
25
25
● ● ● ● ● ●
● ●
● ●
● ● ● ●
● ●
● ●
● ●
20
20
● ● ● ●
● ● ● ●
−100.675 −100.665 −100.655 −100.645 17.16 17.17 17.18 17.19 17.20 17.21
W−E S−N
Figura 4.2: Dispersión del ı́ndice de infestación vs las coordenadas.

17.21
●●●
● ●
● ●
●
●●
● ●
●● ●
● ● ●
17.20
●
●
●●
● ●●
●
●●
●
● ●●●
● ● ● ●
●
●●
● ●
● ●
17.19
●●
● ●●●
● ●
●● ●
Latitud
● ●●●●●
●●●
●
●
●
17.18
● ●
●
●
●
● ●
●
●●
●
●
● ●
●● ●
●
●
17.17
●●
●●
●●
● ●●
●● ●
●
●● ●●●
●●
●
●●
● ●●
●
●
●
●●●●
●
●
●
●●●
●●
17.16
●
●●
●
−100.68 −100.67 −100.66 −100.65 −100.64
Longitud
Figura 4.3: Índice de infestación por punto georeferenciado.
La Figura 4.4 tiene el ajuste de los modelos del Cuadro 4.1 al semivariograma
empı́rico, el modelo Wave es el que más aproxima la forma del semivariograma. Se
usa el criterio (4.4) para validar el ajuste de los modelos al semivariograma empı́rico.
120
Exp
Spherical
Gauss
100
Wave
●
80
semivariance
● ●
●
●
60
●
● ●
●
●
●
● ●
40
20
0.00 0.01 0.02 0.03 0.04 0.05 0.06
distance
Figura 4.4: Ajuste de modelos para el semivariograma empı́rico.
47
Se observa que los meses de julio-agosto y noviembre-diciembre son similares en

cuestión al comportamiento del ı́ndice de infestación, por tal motivo se produce el
mapa de interpolación de los meses que son aydacentes al resto, es decir, agosto y
noviembre. El procedimiento se realizó 8 veces, uno por quincena en los 4 meses, se
muestran los resultados a continuación.
4.3.3. Resultados
Para el mes de agosto en la primera quincena se tiene un mayor ı́ndice de infesta-
ción hacia el suroeste del mapa de interpolación alcanzando un 46 %, en la segunda
quincena el ı́ndice de infestación es mayor en la parte sur del mapa de interpolación
alcanzando un 46 %, en todo el mes el rango del ı́ndice de infestación está entre
30 % y 46 % (Figura 4.5).
Infestación 1ra quincena Infestación 2da quincena

17.21
17.21
30
30
17.20
17.20
32
30
17.19
17.19
32
Latitud
Latitud
30
38
17.18
17.18
34
34
40 36
36
38 42
46
40
17.17
42 17.17
44
44
44
17.16
17.16
30 35 40 45 30 35 40 45
−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63
Longitud Longitud
Figura 4.5: Mapa de interpolación para el mes de agosto.
Para el mes de septiembre en la primera quincena se tiene un mayor ı́ndice de

infestación hacia el suroeste del mapa de interpolación alcanzando un 52 %, en la
segunda quincena el ı́ndice de infestación es mayor en la parte sur del mapa de
interpolación alcanzando un 52 % después de hacer un tipo de elipse en el norte, en
todo el mes el rango del ı́ndice de infestación está entre 30 % y 52 % (Figura 4.6).

17.21
17.21
30
32
34
17.20
17.20
32 30
30
17.19
17.19
Latitud
Latitud
32
34
17.18
17.18
50 36
34
38
38
36
40
42
48
42
40
44
44
46 46
17.17
17.17
48 48
52
50
50
52
17.16
17.16
30 35 40 45 50 30 35 40 45 50
−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63
Longitud Longitud
Figura 4.6: Mapa de interpolación para el mes de septiembre.
48
Para el mes de octubre en la primera quincena se tiene un mayor ı́ndice de

infestación hacia el sur del mapa de interpolación alcanzando un 50 % con compor-
tamientos de elipses en los centros del mapa, en la segunda quincena el ı́ndice de
infestación es mayor en la parte sur del mapa de interpolación alcanzando un 50 %,
en todo el mes el rango del ı́ndice de infestación está entre 26 % y 50 % (Figura 4.7).
17.21
17.21
30
17.20
17.20
34
28 30
28
17.19
17.19
26
Latitud
Latitud
26 30
34
32
17.18
17.18
30
38
32
46
42
36
34
38 36
40
50
44
48
40
42
48 44
46
17.17
17.17
48
50
50
48
17.16
17.16
25 30 35 40 45 50 30 35 40 45 50
−100.68 −100.67 −100.66 −100.65 −100.64 −100.68 −100.67 −100.66 −100.65 −100.64
Longitud Longitud
Figura 4.7: Mapa de interpolación para el mes de octubre.
Para el mes de noviembre en la primera quincena se tiene un mayor ı́ndice de

infestación hacia el sur del mapa de interpolación alcanzando un 43 %, en la segunda
quincena el ı́ndice de infestación no tiene una distribución uniforme, hay brotes de
infestación altos y bajos en varios puntos de la zona de estudio oscilando entre 30 %
y 44 % (Figura 4.8).

17.21
17.21
35
30
40
38
36
36
36
34
36 38
17.20
17.20
36 38
40
36 34
36
38
36
35 32
17.19
17.19
34 40
38 34
38
40
Latitud
Latitud
38 34
36
36
32
34 36
17.18
17.18
38
38 40
37
36
39
38
34
38 38
38 38
36 34
40
37
34 36
41 32
17.17
17.17
32
42 36 34 40
34
38
43
38 38
34
36
32
43
17.16
17.16
36
34
36 38 40 42 30 35 40 45
−100.68 −100.67 −100.66 −100.65 −100.64 −100.63 −100.68 −100.67 −100.66 −100.65 −100.64 −100.63
Longitud Longitud
Figura 4.8: Mapa de interpolación para el mes de noviembre.
4.4. Conclusiones
Esta investigación permitió identificar las zonas de mayor infestación en el área
de estudio, esto porque el modelo toma en cuenta la estructura de dependencia es-
49
pacial que presenta la enfermedad, lo cual es muy importante para los agricultores y
campesinos que cultivan el plátano a la hora de implementar las medidas de control
para la Sigatoka negra, ya que saber con precisión sobre que áreas aplicar medidas
de control disminuye la reproducción de la enfermedad y por ende baja el ı́ndice de
infestación.
Debido al comportamiento de los semivariogramas fue el modelo Wave el que

mejor ajustó, ya que la forma de los semivariogramas tendı́a a subir y bajar a lo
largo del rango.
Se puede resaltar en base a los resultados obtenidos que el ı́ndice de infestación

es un poco menor en los últimos meses del año y su rango de variación es más
pequeño, ya que en el mes de julio-agosto se encuentra entre 30 % y 46 %, mientras
que en la primera quincena de noviembre esta entre 36 % y 43 %, además de inferir
ligeramente con los resultados de la segunda quincena de noviembre que para esa
etapa del año el ı́ndice de infestación presenta un comportamiento diferente al resto
de los meses. Esto se podrı́a deber a cambios en la temperatura o disminución en
la precipitación pluvial, pero eso quedará como un trabajo posterior.
50
Bibliografı́a
[1] Alvarez E., Pantoja A., Gañan L., & Ceballos G.. Estado del arte
y opciones de manejo del Moko y la Sigatoka negra en América Latina y el
Caribe, 2013.
[2] Alves M. D. C., de Carvalho L. G., Pozza E. A., Sanches L., &
Maia J. D. S.. Ecological zoning of soybean rust, coffee rust and banana black
sigatoka based on Brazilian climate changes. Procedia Environmental Sciences,
6, 35-49, 2011.
[3] Banerjee S., Carlin B. P., & Gelfand A. E.. Hierarchical modeling and
analysis for spatial data. Crc Press, 2014.
[4] Carlier J., Fouré E., Gauhl F., Jones D. R., Lepoivre P., Mourichon
X., Pasber-Gauhl C. & Romero R. A.. Black Leaf Streak, Diseases of
Banana, Abaca and Enset. D. R. Jones, ed. CAB International, Wallingford,
UK, 1985.
[5] Chillet M., Abadie C., Hubert O., Chilin-Charles Y. & de Bellaire
L. D. L.. Sigatoka disease reduces the greenlife of bananas. Crop Protection,
28(1), 41-45, 2009.
[6] Cook D. C., Liu S., Edwards J., Villalta O. N., Aurambout J. P.,
Kriticos D. J., ... & De Barro, P. J.. Predicted economic impact of black
Sigatoka on the Australian banana industry. Crop protection, 51, 48-56, 2013.
[7] Cressie N.. Statistics for spatial data. John Wiley & Sons, 2015.
[8] Fouré E. Black Leaf Streak Disease of Bananas and Plantains (Mycosphae-
rella fijiensis Morelet). Study of the symptoms and stages of the disease in
Gabon. IRFACIRAD, Parı́s, 1985.
[9] Freitas A. S., Pozza E. A., Alves M. C., Coelho G., Rocha H. S., &
Pozza, A. A. A.. Spatial distribution of Yellow Sigatoka Leaf Spot correlated
with soil fertility and plant nutrition. Precision agriculture, 17(1), 93-107, 2016.
[10] Gaetan C. & Guyon X.. Spatial statistics and modeling. New York: Springer,
2010.
[11] Marin D. H., Romero R. A., Guzmán M. & Sutton T. B.. Black Siga-
toka: an increasing threat to banana cultivation.. Plant disease, 87(3), 208-222,
2003.
51
[12] Matheron G.. Traitó de géostatistique appliquée, tome i: Mémoires du bureau

de recherches géologiques et miniéres. Editions Technip, Paris, 14, 1962.
[13] Meredith D. S. & Lawrence J. S.. Black leaf streak disease of bananas
(Mycosphaerella fijiensis): Symptoms of disease in Hawaii, and notes on the
conidial state of causal fungus. Trans. Br. Mycol. Soc. 52:459-476, 1969.
[14] Ribeiro Jr P. J. & Diggle P. J.. Model Based Geostatistics. Springer Series
in Statistics, 2007.
[15] Rhodes P. L.. A new banana disease in Fiji. Comm. Phytopathol. News
10:38-40, 1964.
52
Capı́tulo 5
Aplicación del análisis de superviviencia en datos de pacientes sometidos a trans-
plante renal.
Jorge Antonio Gil Mota, Bulmaro Juárez Hernández y Vı́ctor Hugo Vázquez
Guevara
Benemérita Universidad Autónoma de Puebla,

Facultad de Ciencias Fı́sico Matemáticas,
Av San Claudio y 18 sur, Col. San Manuel,
C.P. 72570, Puebla, Puebla,
217470111@alumnos.fcfm.buap.mx, bjuarez@fcfm.buap.mx,
vvazquez@fcfm.buap.mx
Resumen. En este trabajo se modelizó el rechazo del injerto renal, identifi-
cando las caracterı́sticas clı́nicas y los factores de riesgo que influyen en la pérdida
del injerto, para esto se realizó un análisis con el enfoque de supervivencia en los
pacientes con injerto renal cuya cirugı́a se realizó en el Hospital General Regional,
número 36 del Instituto Mexicano del Seguro Social (IMSS), de la ciudad de Puebla,
Pue., México, entre los años 2006 y 2014.
Abstract. In this work, kidney transplant rejection was modeled, identifying the
clinical characteristics and risk factors that influence graft loss, for which an analysis
was made with the survival approach in patients with renal graft whose surgery was
performed in the Regional General Hospital, number 36 of the Mexican Institute of
Social Security (IMSS), of the city of Puebla, Pue., Mexico, between 2006 and 2014.
Palabras clave: Análisis de supervivencia, modelación estadı́stica, modelo de

riesgo relativo, rechazo en injertos renales.
5.1. Introducción
El análisis de supervivencia se puede definir como el conjunto de métodos es-
tadı́sticos destinados al análisis de datos que provienen de observar la ocurrencia
de un evento, llamado falla, el cual sólo puede suceder a lo más una vez. Algunos
ejemplos de falla son la muerte de un paciente en un ensayo clı́nico, encontrar la
primera filtración de agua en una tuberı́a, el divorcio en una pareja, la primera
contratación de un recién egresado en ciencias, etc.
Al observar el fenómeno de interés desde un punto inicial, llamado origen, se ob-

tiene el registro del momento en que se presenta la falla, como la forma más intuitiva
53
de medir el momento de falla es el tiempo, frecuentemente es llamado tiempo de

falla o tiempo de vida, sin embargo, este momento puede estar dado en términos
más variados, como son: longitud, volumen, ingreso, etc., al igual que la defini-
ción del evento falla, las unidades de medición varı́an de acuerdo al fenómeno de
estudio, pero conservan el hecho de ser medidas en términos de cantidades positivas.
En la práctica, existen factores que impiden registrar cada tiempo de falla, ge-
neralmente debido a la conclusión del periodo de observación, en este caso se dice
que el individuo cuyo momento no se registra presenta censura. A diferencia de los
modelos usuales de regresión, los métodos y modelos del análisis de supervivencia
incorporan de forma correcta información tanto de observaciones censuradas como
no censuradas.
5.2. Conceptos básicos del análisis de superviven-

cia
En el análisis estadı́stico los tiempos de falla se modelizan a través de varia-
bles aleatorias estrictamente positivas. En lo siguiente se considera una población
homogénea de individuos cuyos tiempos de falla son idénticamente distribuidos y
están representados por la variable aleatoria (v. a.) T . La distribución de la v. a.
T , denotada por F (·), es caracterizada principalmente por las funciones de super-
vivencia, riesgo y riesgo acumulado, cuya interpretación permite obtener diferentes
puntos de vista acerca del fenómeno de estudio.
Definición 5.2.1 La función de supervivencia de la v. a. T es la función S :

R → [0, 1] cuya regla de correspondencia es
S(t) := P {T > t} (5.1)
y denota la probabilidad de que un individuo sobreviva más allá del instante t, [5].
Definición 5.2.2 La función de riesgo o tasa de fallo instantánea, se define

como la función h : R → R+ dada por

 lim P {t ≤ T < t + ∆|T ≥ t}
h(t) := ∆→0+ ∆ (5.2)
P {T = t|T ≥ t}

si T es una v. a. continua en el primer caso y si T es una v. a. discreta en el segun-

do caso. En el primer caso, la función de riesgo representa la razón instantánea de
cambio de la probabilidad condicionada a no haber presentado la falla aún, mientras
que en el segundo caso, denota la probabilidad condicional, [8].
Si a es un elemento en R tal que P {T = a } > 0, entonces a se denomina átomo

de probabilidad de la v. a. T . Para trabajar con v. a. discretas y mixtas (discretas y
continuas) por cada átomo de probabilidad aj , con j = 1, 2, . . ., se asigna a la den-
sidad de probabilidad una componente fj δ(t − aj ), t ∈ R, donde fj := P {T = aj }
54
y δ(·) denota a la función Delta de Dirac en cero. En base a la notación previa,

tenemos los siguientes resultados:
Proposición 5.2.3 Si T es una v. a. continua, con función de densidad f entonces

para cada t ≥ 0 se cumple que
Z ∞
1. S(t) = f (u)du,
t
f (t)
2. h(t) = ,
S(t)
Z t
3. S(t) = exp(−H(t)), donde H(t) := h(u)du es llamada la función de
0
riesgo acumulado,
4. f (t) = h(t) exp(−H(t)).
Proposición 5.2.4 Si T es una v. a. puramente discreta entonces para cada t ≥ 0

se cumple que
∞
P fj
1. h(t) = hj δ(t−aj ), con hj = , donde S(aj −) denota al lı́mite lateral
j=1 S(aj −)
izquierdo de S en el punto aj ,
Q
2. S(t) = (1 − hj ),
j:aj ≤t
3. f (t) = h(t)S(t−).
5.3. Covariables en modelos de supervivencia

Frecuentemente, en estudios de supervivencia se registran datos de variables que
podrı́an estar relacionadas con el tiempo de vida, el uso de estos datos en el análisis
puede ayudar a representar la heterogeneidad de la población, por lo que se deno-
minan variables explicativas o covariables. Por ejemplo, al estudiar el proceso
de rechazo en injertos renales, variables demográficas como la edad, sexo, lugar de
procedencia, variables médicas como el esquema de medicamentos pretransplante,
la presencia de diabetes, la existencia o no de diálisis previa, la presencia de bacte-
rias e infecciones especı́ficas y variables fisiológicas como el ı́ndice de masa corporal
(IMC) y el tipo de sangre pueden influir en la supervivencia del injerto, [6] y [7]. En
algunos estudios la heterogeneidad de la población se debe a la aplicación de cierto
tratamiento y esto se representa a través de covariables categóricas, por ejemplo,
en [13], Xuan Chen y Michael Baron estudian cómo la aplicación de un tratamiento
farmacológico influye en la función de riesgo en pacientes adictos a la metanfeta-
mina en un ensayo clı́nico realizado por Research Across America en la ciudad de
Dallas, Texas.
55
En lo siguiente, se considera que cada tiempo de falla T tiene asociado un vec-

tor de covariables Z = (Z1 , . . . , Zp )0 , donde estas son medidas antes del tiempo
0, el vector Z puede incluir variables cuantitativas (como presión sanguı́nea, edad,
temperatura y peso) y variables cualitativas (como género, tratamiento y nivel so-
cieconómico).
En algunos casos, el interés es comparar la supervivencia de la población con

respecto a un conjunto de condiciones estándar, por ejemplo, un grupo al que no se
le aplica tratamiento, por lo que es conveniente definir Z = 0 para los individuos
que poseen estas condiciones.
Principalmente, existen dos formas de incluir covariables en el análisis de super-

vivencia, la primera se basa en utilizar transformaciones del tiempo, asumiendo que
el efecto de las covariables consiste en alterar la tasa en la cual el tiempo transcurre,
si el efecto es multiplicativo se denomina modelo de vida acelerada o modelo
de falla acelerada. La segunda forma consiste en especificar la forma en que las
covariables afectan a la función de riesgo de la v. a. T , siendo el caso más popular
el modelo de riesgo relativo o modelo de Cox, propuesto por David Cox en
1972, [4].
Definición 5.3.1 En el modelo de vida acelerado existe una función φ : Rp → R+

que depende de un vector fijo de parámetros desconocidos β ∈ Rp , que satisface que
φ(00; β ) = 1 (caso estándar) y
T0
T1 = , (5.3)
φ(ZZ; β)
donde T1 denota el tiempo de vida del individuo con vector de covariables Z y T0
es el tiempo de falla en el caso estándar.
Definición 5.3.2 En el modelo de riesgo relativo la función de riesgo de un indi-

viduo con vector de covariables Z esta dada por
β 0Z )h0 (t), para cada t ≥ 0,

h(t; Z ) = ϕ(β (5.4)
en donde h0 es una función de riesgo arbitraria correspondiente al caso Z = 0 , lla-

mada función de riesgo base, β ∈ Rp es un vector de parámetros desconocidos y
ϕ : R → R+ es una función positiva que satisface que ϕ(0) = 1, llamada función
de riesgo relativo, [9].
En el modelo (5.4), la componente lineal, β 0Z , no incluye término constante, ya

que un posible término constante β0 puede ser fácilmente incluido como factor en h0 .
5.4. Caso de estudio: Rechazo de injerto renal

El trasplante renal es aceptado universalmente como la mejor terapia para el en-
fermo renal crónico; sin embargo, a pesar de que los avances en las últimas décadas
56
han mejorado el éxito del trasplante, el rechazo continúa siendo uno de los princi-
pales problemas, [6].
El rechazo del injerto renal es una respuesta inmunológica compleja del huésped,
cuando se expone a antı́genos no compatibles del donante.
Son múltiples los factores que han contribuido a mejorar la supervivencia del in-
jerto y del paciente; entre los más importantes se mencionan el uso de nuevas drogas
inmunosupresoras, las transfusiones especı́ficas pre trasplante, una mayor compati-
bilidad entre el donante y el receptor, un seguimiento organizado del paciente y un
óptimo manejo de las múltiples complicaciones pos trasplante. Sin embargo, aún el
20 % de pacientes padecen el rechazo durante el primer año pos trasplante, [7].
5.4.1. Materiales y procedimiento

En este trabajo se realizó un estudio retrospectivo de pacientes sometidos a tras-
plante renal en el Hospital General Regional, número 36 del Instituto Mexicano del
Seguro Social (IMSS), San Alejandro de la ciudad de Puebla, Pue., México, durante
el periodo comprendido entre los años 2006 y 2014. Para tal efecto se cuenta con el
registro de los pacientes que recibieron el trasplante ası́ como sus datos de acuerdo
a la Tabla 1.
Variable (Nomenclatura)
Lugar de Procedencia (LP)
Sexo (S)
Tipo de trasplante (TT)
Constante (C)
Hemotipo del paciente (HP)
Hemotipo del donador (HD)
Tipo de diálisis pre trasplante (TDP)
Causa de la insuficiencia renal (CIR)
Edad al momento del trasplante (EMT)
Talla (T)
Índice de masa corporal (IMC)
Edad del diágnostico de insuficiencia (EDIR)
Filtración glomerular (FGMT)
Creatinina Sérica (CSMT)
Tiempo de rechazo (TR)
Indicador de censura (EST)
Tabla 5.1: Variables medidas en pacientes que recibieron el transplante renal. Fuente:
Elaboración propia a partir de la base de datos proporcionada por el IMSS.
Se definió como rechazo del injerto a la presencia de deterioro agudo de la fun-

ción renal asociado a cambios patológicos especı́ficos como: elevación del valor basal
57
de la creatinina, disminución notable de los volúmenes urinarios y daño severo re-

portado en la escala de Banff, [6].
Los criterios de inclusión fueron: pacientes sometidos a trasplante cuyo proce-

dimiento resultó exitoso. Se excluyó a los pacientes cuyó trasplante no se logró y
aquellos para los cuáles no hubo seguimiento pos operatorio, además se excluyó
a los pacientes que no tenı́an información sobre todas las variables, por lo que se
incluyeron en el análisis 77 pacientes de los 89 registrados durante el periodo de
estudio.
5.4.2. Análisis no paramétrico

Para el análisis de los datos se utilizó el software estadı́stico R en su versión
3.4.4 para Windows y las librerı́as flexsurv [2], ggplot2 [12], survminer [1] y survival
[11].
Por la naturaleza del estudio, cada paciente tiene un tiempo origen y tiempo de
censura diferente, esto se debe a que la fecha de trasplante y el seguimiento para
cada paciente no es el mismo, por lo que se asumió que el esquema de censura es
censura aleatoria independiente.
En cuanto a las caracterı́sticas de la población, se tiene un promedio de edad

15.05 años (con una desviación estándar de 4.2), 46 (59.7 %) pacientes del sexo mas-
culino, 31 (40.3 %) del sexo femenino, 1. Con respecto al lugar de procedencia, 53
pacientes son originarios del estado de Puebla y los restantes 24 de los estados de
Oaxaca y Tlaxcala. 27 (35 %) pacientes presentaron episodios de rechazo del injerto,
mientras que la población restante tuvo tiempos de seguimiento que van desde 1
semana hasta 8 años.
25
Masculino
Femenino
20
Frecuencia
15
10
5
0
5 10 15 20 25 30 35
Edad
Figura 5.1: Histograma de edad asociados por género.
Como un primer paso en el análisis se estudió el comportamiento del proceso

sin considerar el efecto de covariables, es decir, considerando a la población como
homogénea, este análisis se hizo con el comando survifit, [11], con lo que se obtuvo
58
el estimador de Kaplan-Meier para la supervivencia, en la Figura 5.2a se muestra

la función de supervivencia estimada para el tiempo de rechazo del injerto renal en
azul, también se muestra en color claro el intervalo de confianza al 95 % para estas
estimaciones, dado que hacia el final del periodo de observación se tiene registro
de menos individuos (y por tanto menos información), estos intervalos tienden a
ser más amplios conforme el tiempo aumenta. A partir de estas estimaciones y la
proposición 5.2.3, se calculó la estimación de Kaplan-Meier para función de riesgo
acumulado, Figura 5.3.
Podemos observar que la supervivencia disminuye gradualmente durante el pri-

mer año, teniendo una disminución abrupta entre este y el segundo año para despúes
continuar disminuyendo gradualmente, esto también se observa en la Figura 5.3 don-
de el riesgo acumulado aumenta significativamente en el mismo periodo de tiempo.
Mediante el comando quantile se obtuvo una estimación para el valor correspon-
diente al 80 % de la función de supervivencia, el cual se sitúa en t = 12 meses,
lo cual desde el punto de vista frecuentista es consistente con la afirmación hecha
por Cortés, [6], acerca de que el 20 % de los pacientes padecen rechazo del injerto
durante el primer año pos trasplante.
(a)
Estimación + Kaplan−Meier
1.00 +
++
+ +
0.75 +
+ +
+ +
S(t)
0.50
0.25
0.00
0 25 50 75
t: tiempo en meses
Estimación
(b)
− 77
0
34
25
26
50
t: tiempo en meses
6
75
Figura 5.2: (a) Estimación de la función de supervivencia y (b) número de individuos

en riesgo.
5.4.3. Análisis paramétrico

En presencia de datos censurados por la derecha es posible derivar una expresión
para la verosimilitud bajo esquemas suficientemente amplios, mediante el comando
flexsurvreg, [2], se usó esta expresión para calcular los estimadores de máxima verosi-
militud (EMV) basados en los tiempos de rechazo para los modelos “Exponencial”,
“Gamma Generalizado”, “Gompertz”, “Log Logı́stico”, “Log Normal” y “Weibull”.
En la Figura 5.4a se muestran los ajustes para la función de supervivencia y en la
Figura 5.4b para la función de riesgo acumulado, en ambas gráficas se marcó en
negro el ajuste no paramétrico de Kaplan-Meier. De manera gráfica el modelo que
parece ajustarse mejor es el modelo Gompertz, para validar esta afirmación se usó
59
Estimación + Kaplan−Meier
0.6
+ +
+ +
0.4
H(t)
0.2
+ +
+
+
0.0 +
0 25 50 75
t: tiempo en meses
Figura 5.3: Estimación de la función de riesgo acumulado.
䔀砀瀀漀渀攀渀挀椀
愀氀䔀砀瀀漀渀攀渀挀椀
愀氀
䜀愀洀洀愀
䜀攀渀攀爀
愀氀䜀愀洀洀愀
䜀攀渀攀爀
愀氀
䜀漀洀瀀攀爀
琀稀䜀漀洀瀀攀爀
琀稀
䰀漀最
䰀漀最
猀琀椀
挀愀䰀漀最
䰀漀最
猀琀椀
挀愀
䰀漀最
一漀爀
洀愀氀䰀漀最
一漀爀
洀愀氀
䬀愀瀀氀
愀渀ⴀ
䴀攀椀
攀爀䬀愀瀀氀
愀渀ⴀ
䴀攀椀
攀爀
圀攀椀
戀甀氀
氀圀攀椀
戀甀氀
氀
(a) Función de supervivencia (b) Función de riesgo acumulado
Figura 5.4: Ajustes paramétricos mediante la función de verosimilitud.
el criterio de información de Akaike (AIC).
gompertz lnorm gammagen llogis weibull exp

AIC 290.882 291.911 292.008 293.976 296.033 299.877
Tabla 5.2: Valores de AIC := 2p − 2l(θ̂), donde p es el número de parámetros en el

modelo y l(θ̂) denota a la función de log verosimilitud evaluada en el EMV.
En la tabla 5.2, se puede observar que el modelo “Gompertz” es el que presentó

menor AIC, por lo que se seleccionó y se verificó su validez mediante el gráfico
de bondad de ajuste, el cual consiste en un gráfico de dispersión de 1 − Ŝ(ti ) vs
F̂Gompertz (ti ; θ̂), donde Ŝ(ti ) es la estimación no paramétrica de la curva de super-
vivencia y F̂Gompertz (ti ; θ̂) es la estimación de máxima verosimilitud suponiendo el
modelo “Gompertz”, Figura 5.5.
Los puntos en el diagrama se localizan alrededor de la recta identidad, lo cual es

evidencia a favor del buen ajuste del modelo Gompertz, aunque también se destaca
la existencia de un patrón en el orden de los puntos.
60
0.5
0.4
Estimación Kaplan−Meier
0.3
0.2
0.1
0.0
0.0 0.1 0.2 0.3 0.4 0.5

Estimación paramétrica
Figura 5.5: Gráfico de bondad de ajuste, estimación no paramétrica vs estimación

con el modelo Gompertz.
5.4.4. Análisis semiparamétrico: Modelo de riesgo relativo

Uno de los objetivos al estudiar un fenómeno es encontrar un modelo parsimo-
nioso que se ajuste de forma adecuada a los datos observados, con este objetivo
en mente, se empleó un método de selección hacia delante y de eliminación hacia
atrás, para reducir el número de covariables a tratar, lo cual arrojó como variables
significativas a EMT, C y LP, donde EMT y C son variables continuas mientras que
LP es una variable categórica cuyos niveles son Puebla (caso base), Oaxaca y Tlax-
cala. Al ajustar este modelo mediante la función coxph, [11], introduciendo variables
dummies para la variable categórica LP, se obtuvieron los siguientes resultados:
Call:
coxph(formula=Surv(TR, EST)~EMT+C+LP, data=dat)
coef exp(coef) p
EMT -0.1530 0.8582 0.015
C 6.7556 858.8700 0.055
LPOaxaca -0.4835 0.6166 0.655
LPTlaxcala -0.9159 0.4002 0.055
Likelihood ratio test=10.3 on 4 df, p=0.0359

n= 77, number of events= 27
en donde se destaca que al usar la prueba de razón de verosimilitud con un valor de

significancia de 0.05 (mayor al p-valor 0.0359) se rechaza que los coeficientes sean
iguales a cero, esto brinda evidencia a favor de la posibilidad de modelizar el tiempo
de rechazo a tráves de un modelo de riesgo relativo.
5.5. Conclusiones
En este trabajo se utilizó el criterio de Aikake para eligir el modelo Gompertz
como el modelo paramétrico que mejor representa el comportamiento del tiempo
de rechazo en injertos renales. El modelo Gompertz es usado para modelizar pro-
cesos que tienen un crecimiento lento al inicio y al final, usando el estimador de
61
Kaplan-Meier, Figura 5.3, se ha mostrado que la función de riesgo acumulado para

los pacientes de este estudio tiene este comportamiento.
Al realizar el análisis semiparámetrico se encontró que el modelo de riesgo rela-

tivo representa una opción viable para estudiar la forma en que las caracterı́sticas
individuales de cada paciente como la constante médica (C), la edad al momento del
transplante (EMT) y el lugar de procedencia (LP) influyen en el tiempo de rechazo
del injerto renal.
62
Bibliografı́a
[1] A. Kassambara, M. Kosinski, B. Przemyslaw & F. Scheipl. Paquete

“survminer” versión 0.4.2, CRAN, Enero 2018.
[2] C. Jackson, P. Metcalfe & J. Amdahl. Paquete “flexsurv” versión 1.1,
CRAN, Marzo 2017.
[3] D. Collet. Modelling survival data in medical research. Springer-
Science+Business Media, B.V., 1994.
[4] D. R. Cox. Regression models and life-tables. Journal of the Royal Statistical
Society, serie B (Methodological), 1972.
[5] D. R. Cox & D. Oakes. Analysis of survival data. Chapman and Hall, 1984.
[6] E. Cortés Paz, M. Hernández Domı́nguez et. al. Terapia inmunosupre-
sora en el trasplante renal. Guı́a de Práctica Clı́nica IMSS, 2008.
[7] G. Gamarra & J. Gómez. Rechazo en pacientes con trasplante renal. Acta
Médica Colombiana Vol. 16 No. 5, Septiembre 1991.
[8] J. D. Kalbfleisch & R. L. Prentice. The statistical analysis of failure
time data. John Wiley & Sons, 2002.
[9] J. F. Lawless. Statistical models and methods for lifetime data. Wiley Inters-
cience, 2003.
[10] J. P. Klein & M. L. Moeschberger. Survival analysis techniques for
censored and truncated data. Springer-Verlag, 2003.
[11] T. Therneau & T. Lumley. Paquete “survival” versión 2.42 − 3, CRAN,
Abril 2018.
[12] W. Hadley & W. Chang. Paquete “ggplot2” versión 2.2.1., CRAN, Diciem-
bre 2016.
[13] X. Chen & M. Baron. Change-point analysis of survival data with application
in clinical trials. Scientific Research Publishing Inc., volumen 4, páginas 663 −
677, Octubre 2014.
63
Capı́tulo 6
Modelación espacial de la infestación del ácaro rojo de las palmas (Raoiella In-
dica) en el estado de Guerrero con un proceso espacial Poisson
David Alejandro Ozuna Santiago, Marı́a Guzmán Martı́nez,

Flaviano Godı́nez Jaimes y Ramón Reyes Carreto
Universidad Autónoma de Guerrero,

Unidad Académica Matemáticas,
Av. Lázaro Cárdenas S/N, Ciudad Universitaria,
C.P. 39087, Chilpancingo, Guerrero,
David daos117@hotmail.com, manguzgm@gmail.com,
fgodinezj@gmail.com, rrcarreto@gmail.com
Resumen. El estado de Guerrero es el primer productor de palma de cocotero,

actualmente tiene entre 40,000 a 50,000 hectáreas dedicadas a dicho cultivo. Este
contribuye en gran medida a la economı́a de Guerrero. Dado que la palma de co-
cotero tiene un impacto económico importante en varios sectores de la sociedad, es
necesario entonces no descuidar aspectos fitosanitarios para asegurar la producción
y calidad. Una manera de hacerlo es con acciones que controlen las plagas que lo
afectan; una de ellas es el ácaro rojo, que ocupa el cuarto lugar en pérdidas de
producción, de ahı́ la importancia de su control. Este trabajo tuvo por objetivo
modelar y estudiar la distribución espacial de la infestación del ácaro rojo a través
de un proceso espacial Poisson en toda la zona costera de Guerrero que comprende
Costa Grande, Costa Chica y Acapulco durante el año 2017. Con el estudio se logró
determinar las zonas de mayor infestación, esto porque el modelo toma en cuenta la
estructura de variabilidad espacial que presenta la plaga, lo cual es muy importante
en la agricultura de precisión.
El conocimiento de las zonas de mayor infestación permite una mejor dirección de
los controles quı́micos, logrando con ello una reducción de los costos por el manejo
del cultivo. La dirección de las medidas de control sobre zonas especı́ficas disminuye
la resistencia de la plaga, trae beneficios a la salud de las personas y no se conta-
mina más al medio ambiente por el uso excesivo de los quı́micos. Los datos fueron
proporcionados por SENASICA. Tomando en cuenta la metodologı́a y la base de
datos, este estudio es el primer análisis realizado hasta el momento para el ácaro
rojo de la palma de cocotero, lo cual es innovador en el área de fitosanidad del
estado de Guerrero.
Abstract.The state of Guerrero is the first producer of coconut palm, currently has
between 40,000 to 50,000 hectares dedicated to that crop. This contributes greatly
to Guerrero’s economy. Given that the coconut palm has a significant economic im-
pact in several sectors of society, it is necessary not to neglect phytosanitary aspects
64
to ensure production and quality. One way to do this is with actions that control
the pests that affect it; one of them is the red acarus, which occupies the fourth
place in losses of production, hence the importance of its control. The objective
of this work was to model and study the spatial distribution of the red acarus in-
festation through a Poisson spatial process in the entire coastal area of Guerrero
that includes Costa Grande, Costa Chica and Acapulco during the year 2017. With
the study was achieved determine the areas of greatest infestation, this because the
model takes into account the structure of spatial variability that the pest presents,
which is very important in precision agriculture.
The knowledge of the zones of greater infestation allows a better direction of the
chemical controls, achieving with it a reduction of the costs by the handle of the
crop. The direction of the control measures on specific zones decreases the resistance
of the pest, brings benefits to the health of people and is not contaminated more
to the environment by the excessive use of chemicals. The data was provided by
SENASICA. Taking into account the methodology and the database, this study is
the first analysis carried out so far for the red acarus of the coconut palm, which is
innovative in the area of phytosanitation in the state of Guerrero.
Palabras clave: Cadenas de Markov Monte Carlo (MCMC), Dependencia espa-

cial, Modelos Lineales Generalizados Mixtos.
6.1. Introducción
Raoiella Indica es una plaga originaria de la India, encontrada en hojas del cocotero
(Cocos nucifera L.). Su primera notificación en América se produjo en el año 2004,
en Martinica, región que invadió rápidamente. Hoy la plaga se encuentra en muchos
paı́ses del continente americano, en los que destacan los de las regiones tropicales
[8]. Raoiella Indica ha sido considerada como una plaga severa en el cocotero (Co-
cos nucifera L.), en la palma Areca (Areca catechu L.) en India y en la palma Dátil
(Phoenix dactylifera L.) en Egipto. En el 2004 fue considerada como severa en la
región del Caribe, y se ha distribuido ampliamente en la mayorı́a de las islas. Poste-
riormente, esta plaga fue registrada en Florida, Venezuela y más recientemente en
México, Brasil y Colombia [16]. Cabe destacar que su alimentación provoca amari-
llamiento de la zona afectada y, cuando aumenta la densidad poblacional del ácaro,
se produce una clorosis generalizada. De acuerdo a muestreos realizados en tres es-
pecies de palmas en Quintana Roo en el 2015, se observó que el mayor número de
individuos de Raoiella Indica se encuentran en cocotero, donde a altas densidades
de la plaga los porcentajes de daños pueden estar entre el 60 y 90 por ciento [8].
Considerando que el estado de Guerrero es el primer productor de palma de co-

cotero, con una superficie sembrada de 40,000 a 50,000 hectáreas, aproximadamente
[9]; es importante entonces cuidar los porcentajes de la infestación de Raoiella Indi-
ca. Dado que la palma de cocotero tiene un impacto económico importante en varios
sectores de la sociedad, es necesario entonces no descuidar aspectos fitosanitarios
para asegurar la producción y calidad. Una manera de hacerlo es con acciones que
controlen las plagas que lo afectan. A estas acciones las denominamos agricultura
65
de precisión (también conocida como agricultura especı́fica del sitio).
La agricultura de precisión tiene como objetivo usar la tecnologı́a de la informa-

ción para adecuar el manejo de suelos y cultivos a la variabilidad presente dentro de
un lote. La agricultura de precisión involucra el uso de sistemas de posicionamiento
global (GPS, por sus siglas en inglés) y de otros medios electrónicos para obtener
datos del cultivo. Las tecnologı́as de la agricultura de precisión permiten satisfacer
una de las exigencias de la agricultura moderna: el manejo óptimo de grandes ex-
tensiones [7]. En relación con la infestación de una plaga en el campo, es importante
mapear la intensidad de una plaga. En un proyecto brasileño sobre la predicción
espacial del ácaro rojo de las palmas (Raoiella Indica), un objetivo fue investigar el
impacto potencial del ácaro rojo invasivo en la mayorı́a de las regiones brasileñas;
se observó que en las principales áreas de producción de coco (Cocos nucifera L.) y
en las regiones donde el cultivo está en expansión la plaga empeora en escenarios de
cambio climático en comparación con el perı́odo de referencia [11]. En la práctica,
el agricultor (o su asesor) debe establecer una relación entre las propiedades del cli-
ma y la presencia del ácaro a partir de observaciones extensivas recolectadas en los
años subsiguientes, donde solo se recolecta un número limitado de conteos del ácaro.
En la actualidad diversos autores han estudiado esta plaga. Los dos siguien-
tes autores realizaron un estudio mediante componentes principales: Vásquez et al.
[15], descubrieron que el cambio de la planta hospedera influye en la alimentación
de Raoiella Indica y en consecuencia afecta su tamaño [16]; Flores-Galano et al. [8]
concluyen que existe poca información sobre el efecto de los factores abióticos en la
fluctuación poblacional de Raoiella Indica. Sin embargo, la información disponible
sugiere que este ácaro está bien adaptado a las condiciones de clima tropical y que
en los periodos prolongados de sequı́a pueden favorecer el incremento poblacional
[8]. Vásquez et al. [15], discuten las medidas morfometricas y barreras de alimenta-
ción de Raoiella Indica en la cual se basan en la distribución espacial del ácaro rojo
de las palmas [15]. Por su parte Roda et al. [14], estudian la distribución espacial
del ácaro rojo de las palmas donde interpretan la variabilidad total y la densidad de
la varianza total que se modela mediante la ley de poder de Taylor, en su estudio
enfatizan el tipo de muestreo que debe llevarse para la presencia-ausencia de conteos
del ácaro rojo de las palmas [14]. Notemos que existen aspectos importantes confor-
me a la distribución del ácaro, como Pielou [12] argumenta que su distribución es
de manera no aleatoria en Europa, donde determina algunas distribuciones, entre
las que destaca doble Poisson, Binomial Negativa y Neyman [12]. Esto es de vital
importancia para tener conocimientos previos conforme a la modelación espacial de
la infestación del ácaro rojo de la palmas.
La geoestadı́stica es una de las ramas principales de la estadı́stica espacial Cres-

sie [4]. Utiliza la modelación e inferencia para fenómenos espaciales continuos. Navia
et al.[11] predijeron la distribución espacial del ácaro rojo de las palmas (Raoiella
Indica) usando escenarios actuales y futuros del cambio climático [11]. Los métodos
geoestadı́sticos tradicionales para la predicción de variables espaciales Cressie [4] se
basa en el supuesto de normalidad, que no es válido para los datos de conteo. Este
trabajo tuvo como objetivo modelar y estudiar la distribución espacial de la infes-
tación del ácaro rojo a través de un proceso espacial Poisson, en el cual se utilizó
66
el enfoque en Diggle et al. [6], donde los datos espaciales se analizaron utilizando
modelos lineales mixtos generalizados (GLMM por sus siglas en inglés). Para la pre-
dicción espacial del proceso se utilizó Cadenas de Markov Monte Carlo (MCMC)
con un algoritmo MCMC más eficiente, el cual está basado en las actualizaciones
de Langevin-Hastings.
Este trabajo esta organizado de la siguiente manera. En la Sección 6.2 se discute

el modelo para los datos de conteo y los GLMM espaciales. Los algoritmos para la
simulación y predicción se describen en la Sección 6.3. Finalmente, en la Sección
6.4 se da una aplicación de la metodologı́a y se presenta la predicción del ácaro en
los sitios no muestreados.
6.2. Marco Teórico

El término geoestadı́stica identifica la parte de la estadı́stica espacial que se refiere
a la variación espacial continua de un fenómeno, S(x), a lo largo de una región espa-
cial continua A ⊂ R2 y puede tratarse como si fuera una realización de un proceso
estocástico S(·) = {S(x) : x ∈ A}. En general, S(·) no es directamente observable.
Los datos disponibles consisten en mediciones Y1 , . . . , Yn tomadas en ubicaciones
x1 , . . . , xn contenidas en A. Ası́ Yi es una versión ruidosa de S(xi ). Se asume que el
diseño de muestreo para x1 , . . . , xn es determinista o estocástico pero independien-
te del proceso S(·), además todos los análisis se llevan a cabo condicionados en las
ubicaciones x1 , . . . , xn .
Los modelos lineales mixtos generalizados [1] son extensiones de modelos li-
neales generalizados [10], los GLMM incorporaran efectos aleatorios no observables
en el modelo, permitiendo de esta forma agregar fuentes adicionales de variabilidad.
A continuación se explican los GLMM para los datos de conteo, donde los efectos
aleatorios se modelan mediante un campo Gaussiano correlacionado espacialmente
[6].
6.2.1. Modelos Lineales Mixtos Generalizados Espaciales

El modelo clásico lineal generalizado (GLM) se define para un conjunto de varia-
bles respuestas mutuamente independientes Y1 , . . . , Yn . Las esperanzas µi = E[Yi ]
Pk
se especifican mediante un predictor lineal h(µi ) = j=1 fij βj , en el que h(·) es
una función conocida, llamada función enlace, fij , i = 1, . . . , k son las variables
explicativas y βj los parámetros de regresión [10]. Una extensión importante de es-
ta clase básica de modelos son los modelos lineales mixtos generalizados, en el que
Y1 , . . . , Yn son mutuamente independientes condicionadas a los valores realizados de
un conjunto de variables aleatorias latentes P U1 , . . . , Un , en este caso las esperanzas
k
condicionales están dadas por h(µi ) = Ui + j=1 fij βj .
67
Un modelo lineal generalizado espacial (GLSM por sus siglas en inglés) es un

GLMM en el cual U1 , . . . , Un se derivan de un proceso espacial S(·) = {S(x) :
P∈
x A}, con A ⊂ R2 , el cual es un proceso estocástico Gaussiano con E[S(x)] =
p
j=1 fj (x)βj , donde f1 (x), . . . , fp (x) son funciones observadas en la ubicación x,
0 0 0
V ar[S(x)] = σ 2 y ρ(u) = Corr[S(x), S(x )] donde u = ||x − x ||, tal que x y x son
ubicaciones observadas en A. Asumiendo que las mediciones Y1 , . . . , Yn son condicio-
nalmente independientes de S(·), con esperanzas condicionales µi y h(µi ) = S(xi ),
i = 1, . . . , n para una función de enlace conocida h(·). En este modelo la señal del
proceso es {h−1 (S(x)) : x ∈ A}.
T
Sea Y = (Y1 , . . . , Yn ) el vector de las variables respuestas observadas en las
T
ubicaciones x1 , . . . , xn ; S = (S(x1 ), . . . , S(xn )) los valores no observados del pro-
∗
ceso subyacente y S para los valores de S(·) en todas las demás ubicaciones de
interés, A.
La función verosimilitud para el GLSM generalmente no se puede expresar en
forma cerrada, si no sólo como una integral de alta dimensión, es decir
n
Z Y
g yi ; h−1 (si ) p(s; β, θ)ds1 , . . . , sn ,

L(β, θ) = (6.1)
i=1
donde β es un vector p × 1 de parámetros de regresión, θ es una matriz p × p de

los parámetros de covarianza en el modelo, con p < n, g(y; µ) denota la densidad
de la distribución de error parametrizada por la media µ y p(s; β, θ) es la densidad
Gaussiana multivariada para el vector S. La integral anterior es también la constante
de normalización en la distribución condicional de [S|y, β, θ]:
n
Y
g yi ; h−1 (si ) p(s; β, θ).

p(s|y, β, θ) ∝ (6.2)
i=1
En la practica, la alta dimensionalidad de la integral evita el cálculo directo de la

distribución predictiva [S ∗ |y, β, θ].
Los métodos estándar de aproximación de la integral (6,1) y por lo tanto de la

evaluación (6,2) tiene una precisión desconocida en el entorno geoestadı́stico, pero
los métodos Monte Carlo Cadenas de Markov proporcionan una posible solución.
6.2.2. Modelo para Datos de Conteo

Si se consideran las posiciones no observadas de la infestación del ácaro rojo de las
palmas como la realización de un proceso de conteo espacial, entonces un objetivo
clave de la ocurrencia de infestación es la intensidad del ácaro dado por la función
λ(·). Para una ubicación dada x ∈ A y un área A alrededor de x, λ(x)A es aproxi-
madamente el número esperado de ácaros en esa área. Para cada x ∈ A se modela
λ(x) como [3]
λ(x) = exp (S(x)) .
68
Un GLSM para modelar datos de conteo espacial es el modelo espacial Poisson-

log-linear, en el cual [Yi |S(xi )] sigue una distribución Poisson con media ti exp (s(xi )),
i = 1, . . . , n. El término ti representa un intervalo de tiempo sobre el que se acumula
el conteo correspondiente Yi [6].
Una vez ajustado el modelo se puede predecir la intensidad λ(x0 ) = exp(S(x0 ))

en una ubicación x0 , en la cual no se observó el proceso.
6.3. Predicción para los GLSM

La predicción es parte de un análisis geoestadı́stico. Sea T = T (S(·)) la función de
predicción. Entonces para Y = (Y1 , . . . , Yn )T se tiene la función T = T (Y ).
6.3.1. Algoritmo en un GLSM

Este algoritmo permite predecir el proceso en una ubicación donde no se obser-
vo. Asumiendo que los parámetros en el modelo son conocidos (o en su defecto
estimados), se tiene que la predicción T = T (S ∗ ) se realiza en 3 pasos [5]:
Simular s(1), . . . , s(m) de [S|y] usando MCMC ([6], [3]).
Simular s∗ (j) de [S ∗ |s(j)], j = 1, . . . , m, donde [S ∗ |s(j)] sigue una distribución
Gaussiana multivariada.
Se aproxima el predictor mı́nimo del cuadrado medio del error por medio de1
m
1 X
E[T (S ∗ )|y] ≈ T (s∗ (j)).
m j=1
6.3.2. Predicción de la Intensidad

Para predecir la intensidad en un punto no muestreado de un modelo de datos de
conteo se procede de la siguiente manera. Dada una muestra s(1), . . . , s(m) de [S|y],
obtenida mediante el algoritmo MCMC; y asumiendo que [S(x0 )|s(j)], j = 1, . . . , m
sigue una distribución gaussiana multivariada, lo cual es indispensable para predecir
λ(x0 ) = exp(S(x0 )), entonces:
Calcular E[S(x0 )|s(j)] y V ar[S(x0 )|s(j)], j = 1, . . . , m, usando kriging [5].
Calcular para cada j = 1, . . . , m,
E[λ(x0 )|s(j)] = exp(E[S(x0 )|s(j)] + 0.5V ar[S(x0 )|s(j)])
Aproximar
m
1 X
E[λ(x0 )|y] ≈ E[λ(x0 )|s(j)].
m j=0
Como E[exp(αS)|y] es finita para cualquier α ∈ Rn y además E[S(x0 )|S] es una

función lineal de S y V ar[S(x0 )|S] no depende de S, entonces E[λ(x0 )|y] ≤ ∞, es
decir, la cantidad que se desea aproximar utilizando MCMC existe [5].
69
6.4. Aplicación
6.4.1. Descripción de los Datos
Los datos proporcionados por SENASICA fueron conteos del ácaro rojo (Raoiella
Indica) de las palmas del cocotero para el año 2017. Dichos muestreos fueron reali-
zados parcialmente en la zona de Acapulco, Costa Chica y Costa Grande del estado
de Guerrero (Figura 6.1).
Figura 6.1: Distribución del ácaro rojo en la zona costera del estado de Guerrero.
Para el análisis de la infestación del ácaro rojo, la base de datos se dividió men-
sualmente. En la Figura 6.2 se observa la intensidad de infestación del ácaro rojo
de las palmas para los meses de Enero, Mayo, Septiembre y Diciembre. La intensi-
dad del color de los puntos está relacionado con el número de ácaros encontrados
en la zona de muestreo. Observe que hay una tendencia decreciente de Oeste-Este
(Costa grande-Costa Chica) en el número de ácaros rojos. Los valores del ı́ndice de
infestación se encuentran entre un rango de valores de 1.4 y 22.
Los datos de conteo se modelaron utilizando el modelo Poisson-log-linear espe-

cificado en la Sección 6.2.2, con función de correlación exponencial ρ(u) = exp(−u)
para el campo aleatorio gaussiano. En el estudio no existe mucha información dis-
ponible sobre el tipo de función de correlación del conjunto de datos dado, ya que
no se producen observaciones muy cercanas y el campo aleatorio gaussiano no se
observa directamente. Es por ello que por principios de parsimonia, no se incluye
la incertidumbre con respeto a la elección del modelo de correlación en la inferencia.
Con la ayuda de los paquetes geoR [13] y geoRglm [2] del software R se llevó a
cabo el análisis espacial de la infestación del ácaro rojo.
70
Enero Mayo
Septiembre Diciembre
Figura 6.2: Número de ácaros observados en la zona de estudio por meses.
6.4.2. Predicción de la Intensidad del ácaro Rojo

El objeto principal del estudio es la estimación de la intensidad de la plaga λ(x0 ),
x0 es una ubicación de la zona de estudio donde no se contó el número de ácaros
rojos. La Figura 6.3 muestra las predicciones del logaritmo natural del número de
ácaros rojos (Sección 6.3) en la zona de estudio. Dividiendo los datos mensualmente
se tienen aproximadamente 130 observaciones, que al implementar la metodologı́a
antes descrita (Sección 6.3) se realizan 2100 estimaciones.
71
Enero Febrero Marzo
19.0
19.0
18.5
1.8
18.5
18.5
1.8
1.8
18.0
1.7
18.0
18.0
1.7
** **
** 1.6
5
17.5
1.7 * 1.6
17.5
17.5
1.6 1.8 *
65
* *
7
7
* *
5
1.
1.
1.
**
1.5
**
1.5
**
6
5
1.
1.4
5
******** ** *** 1.3 ********* *****
1.3
******* *******
4
1.3
1.5
3
17.0
1.
1.5 * **
17.0
1.3
17.0
1.
* *** * *
1.3 ** *** ** ********
1.2
***** *
* * * * *** 1.4
1.25
* *
* **** ** * * ** ** ********
1.2
*
1.25
1.4
1.1
1.2
* * *** ***
1.2
16.5
**** **
16.5
*** 1.4 ** ***

16.5
** *** ***
1.3
16.0
16.0
1.3 1.2
16.0
1.2
15.5
15.5
1.2
15.5
−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −101.0 −100.5 −100.0 −99.5 −99.0 −101.5 −100.5 −99.5 −99.0 −98.5
Abril Mayo Junio

19.0
19.0
19.0
18.5
18.5
18.5
1.8 1.8
2.0
18.0
18.0
18.0
** ** **
1.7
1.8
** *
17.5
17.5
** *
17.5
2
* 1.8 1.7
1.7
5
* *
1.7
*
1.6
** ** **
1.5
1.8
5
1.5
********* ***** 1.4

5
********* *******
1.5
********* *******
1.4
17.0
17.0
17.0
* ** 1.4 1.6 1.55 *** ***
1.7
** ***** **
1.4 * ***** * ****** **
* *** *** 7
1.45* ** ******** **
*1.5 ** ***** 1. * ** ******1.
1.5
1.5
1.4
1.6 ***4
1.5
*** **
16.5
16.5
*** ***
16.5
** ** ** *** **** **** ***

1.5 1.6
16.0
16.0
16.0
1.4 1.5
1.4
15.5
15.5
15.5
−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5
Julio Agosto Septiembre

19.0
19.0
19.0
2.35 2.8
18.5
18.5
18.5
1.8
2.30 2.6
18.0
18.0
18.0
** ** **
** 2.25 ** * 2.4
17.5
17.5
** *
17.5
1.8 1.7 *
1.7
*
2.2
** 2.2 **
1.9
2.25
********* ******** ********* *******
2
********* ******* 2.2

17.0
17.0
17.0
1.55 *** *** 2.20 *** 9

1.
******** ******** ******* 2
*** *** ***
*2.2
1.7
**
*1.5 ** ***** ** *******
1.9
*2.2 ** ***
1.7
1.6 *
1.5
***** ** ****** *
16.5
16.5
** * **
16.5
** *** * ** 2.15 ** *** 2.0

16.0
16.0
16.0
2.10 1.8
1.5
15.5
15.5
15.5
−101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5 −101.5 −100.5 −99.5 −99.0 −98.5
Octubre Noviembre Diciembre
Figura 6.3: Valores pronosticados de la infestación del ácaro para el año 2017.
72
De este estudio se observa que el comportamiento de la plaga varı́a respecto al

año, notándose una tendencia decreciente de oeste-este para los valores que se pre-
dicen en los meses de Marzo a Octubre y Diciembre, se observa que la infestación
del ácaro rojo de las palmas es más intensa en la zona alta de la Costa Grande
de Guerrero. Particularmente en los meses de Septiembre y Diciembre el ı́ndice de
infestación es mayor a 1.8. Por otra parte para los meses de Enero, Febrero y No-
viembre, existe una mayor variabilidad en el comportamiento de la distribución de
la infestación del ácaro rojo en la zona de estudio. Para Enero y Noviembre se pre-
senta mayor infestación del ácaro en Acapulco y la parte baja de la Costa Grande,
pero para el mes de Febrero la infestación de la plaga predomina en la Costa Chica
y Grande.
De todos los meses analizados, Noviembre y Diciembre presentan una mayor

intensidad del ácaro rojo, esto se debe posiblemente a los factores ambientales que
se presentan en esa temporada del año.
6.5. Discusión y Conclusiones

Aunque la metodologı́a de predicción en los GLSM es muy similar a los métodos de
interpolación clásicos en geoestadı́stica, la estimación de los parámetros del GLSM,
es un poco diferente. En un GLSM se puede utilizar la función de verosimilitud para
la estimación de los parámetros del modelo sin recurrir a la función del semivario-
grama. Por otra parte determinar la forma paramétrica del semivariograma en un
GLMM espacial es un problema más complicado que merece más estudio.
Con este estudio se logró determinar la zonas de mayor infestación del ácaro rojo
en la zona costera del estado de Guerrero. Esto gracias a que el modelo Poisson-log-
lineal toma en cuenta la estructura de variabilidad espacial que presenta la plaga.
Este tipo de estudios es muy importante en la agricultura de precisión ya que per-
mite una mejor dirección de los controles quı́micos logrando con ello: una reducción
de los costos del manejo del cultivo, una disminución en la resistencia de la plaga a
los quı́micos y beneficios a la salud de las personas, además de disminuir la conta-
minación del medio ambiente.
Este estudio es importante porque implementa los modelos lineales mixtos gene-
ralizados para la predicción espacial de una plaga, ya que al usarlo permite predecir
la intensidad de la plaga en ubicaciones no muestreadas. Esto es importante porque
ayuda en la elaboración de un plan de alerta para la utilización de herbicidas en
sitios especı́ficos.
Tomando en cuenta la metodologı́a y la base de datos, este es el primero estudio

realizado hasta el momento para el ácaro rojo de la palma del cocotero, en este
sentido es innovador en el área de fitosanidad del estado de Guerrero.
73
Bibliografı́a
[1] Breslow, N. E., & Clayton, D. G.Approximate inference in generalized

linear mixed models. Journal of the American statistical Association, 88(421),
9-25, 1993.
[2] Christensen, O. F., & Ribeiro Jr, P. J. geoRglm-a package for generalized
linear spatial models. R News, 2(2), 26-28, 2002.
[3] Christensen, O. F., & Waagepetersen, R. Bayesian prediction of spatial
count data using generalized linear mixed models. Biometrics, 58(2), 280-286,
2002.
[4] Cressie, N. A. Statistics for spatial data. Wiley series in probability and mat-
hematical statistics, 1993.
[5] Diggle, P. J., Ribeiro, P. J., & Christensen, O. F.An introduction to
model-based geostatistics. In Spatial statistics and computational methods, 43-
86. Springer, New York, NY, 2003.
[6] Diggle, P. J., Tawn, J. A., & Moyeed, R. A.Model based geostatistics
(with discussion). Journal of the Royal Statistical Society: Series C (Applied
Statistics), 47(3), 299-350, 1998.
[7] Emilio G., Fernando F. Agricultura de Precisión. Tecnologı́a Agropecuaria.
[8] Flores-Galano, G., Rodrı́guez-Morell, H., Hernández-Turcas, R.,

Miranda-Cabrera, I., & Montoya-Ramos, A. Dinámica poblacional de
Raoiella Indica Hirst (Acari: Tenuipalpidae) en cocotero (Cocos nucifera L.)
en Guantánamo, Cuba. Revista de Protección Vegetal, 32(1), 23-32, enero-abril
2017.
[9] INIFAP Agenda Técnica Agrı́cola Guerrero. Instituto Nacional de Investigacio-

nes Forestales, agrı́colas y Pecuarias, México, 2017.
[10] McCullagh, P., & Nelder, J. A.Generalized linear models. (Vol. 37). CRC
press, 1989.
[11] Navia, D., Hamada, E., Gondim Jr, M. G. C., & Benito, N. P. Spatial
forecasting of red palm mite in Brazil under current and future climate change
scenarios. Pesquisa Agropecuaria Brasileira, v.51(5), n.5, 586-598, maio 2016.
74
[12] Pielou, D. P. Contagious distribution in the European red mite, Panonychus

ulmi (Koch), and a method of grading population densities from a count of mite-
free leaves. Regional Research Station, Canadian Journal of Zoology, 38(3), 645-
653, 1960.
[13] Ribeiro Jr, P. J., Christensen, O. F., & Diggle, P. J. geoR and geoRglm:
software for model-based geostatistics. In Proceedings of DSC (Vol. 2), 2003
[14] Roda, A., Nachman, G., Hosein, F., Rodrigues, J. C. V., & Peña, J. E.
Spatial distributions of the red palm mite, Raoiella Indica (Acari: Tenuipalpidae)
on coconut and their implications for development of efficient sampling plans.
Experimental and applied acarology, 57(3-4), 291-308, 2012.
[15] Vásquez, C., Egurrola, Z., Valera, R., Sanabria, M. E., & Col-
menárez, Y. Anatomı́a y quı́mica foliar en especies ornamentales de Arecaceae:
posibles barreras a la alimentación de Raoiella Indica Hirst (Acari: Tenuipalpi-
dae). Gayana. Botánica, 72(2), 296-304, 2015.
[16] Vásquez, C. L., Rodrı́guez, G., Hernández, A., Mendez, N., Dávila,
M., Valera, N., & Morales, J. Variabilidad de poblaciones de Raoiella In-
dica (Acari: Tenuipalpidae) evaluada mediante análisis morfológico y molecular
en Venezuela. Sociedad Venezolana de Entomologı́a Vol. 29(2): 105-120, agosto
2014.
75
Capı́tulo 7
Una aplicación de la metodologı́a Biplot Logı́stico: Análisis de la sostenibilidad
empresarial
Alar Urruticoechea1 y Elena Vernazza2
1
Facultad de Psicologı́a,
Instituto de Fundamentos y Métodos en Psicologı́a,
Dr Tristón Narvaja 1674, C.P. 11200, Montevideo, Uruguay,
2
Eduardo Acevedo 1139, C.P. 11200, Montevideo, Uruguay
aurruticoechea@psico.com, evernazza@iesta.edu.uy
Resumen. Esta investigación es una continuación del trabajo “Sostenibilidad
Empresarial: Análisis desde una perspectiva multivariante a través de la metodo-
logı́a HJ-Biplot”[9]. Los resultados aquı́ presentados refieren a las mismas empresas
que el mencionado trabajo, pero en esta oportunidad se tiene en consideración
únicamente los ı́ndices reportados por el Global Reporting Initiative (GRI, en su
versión G4), en su calidad de variables binarias (reporta/no reporta).
Se presenta, en primera instancia, un análisis descriptivo de las variables a utilizar
y se da paso a una comparación multivariante, a través de la implementación de
la metodologı́a Biplot (en particular Biplot Logı́stico). Por último, se presentan los
principales resultados obtenidos al realizar un análisis de cluster que permite encon-
trar y caracterizar grupos de empresas similares en función de los indicadores de
sostenibilidad que reportan. En cada uno de estos análisis se hace especial énfasis
en la distinción existente por región (América Latina y América del Norte).
Entre los principales resultados obtenidos se destaca: a) la diferencia en el reporte
de los indicadores al considerar las distintas regiones y b) la existencia de 3 grupos
de empresas con las siguientes caracterı́sticas: empresas que presentan ausencias y
presencias en igual proporción en los indicadores de sostenibilidad, empresas que
presentan ausencias en la mayorı́a de los indicadores y, por último, empresas que
muestran presencia de reporte de la mayorı́a de indicadores.
76
Abstract. This research is a continuation of the paper “Sostenibilidad Em-

presarial: Análisis desde una perspectiva multivariante a través de la metodologı́a
HJ-Biplot”[9].
The results here presented are related to the same companies of the mentioned
paper. In this opportunity, it has into consideration only indexes reported by the
Global Reporting Initiative (GRI, in its version, G4) as binary variables (report/
not report).
First of all, it is shown a descriptive analysis of the using variables, to make space
for a multivariate comparison, through the use of the Biplot methodology (particu-
larly Logistic Biplot). Finally, it is shown the obtained results of a cluster analysis,
which allows to find and define similar companies’groups, according the sustainabi-
lity indexes they report. In each of this analysis, it is made emphasis on the existing
distinction by region (Latin America and North America).
Between the core of the obtained results, it emphasizes: a) The difference in the
report of the indexes, having into consideration the different regions, and b) The
existence of 3 groups of companies, with the following characteristics: companies
that present absences and presences in equal proportion on the sustainability in-
dexes, companies that present absences on the majority of the indexes and finally,
companies who show presences of the majority of indexes.
Palabras clave: Biplot Logı́stico, Clusters, Global Reporting Initiative (GRI),

Sostenibilidad Empresarial.
7.1. Introducción
La sostenibilidad es un concepto tan amplio que puede ser aplicado a los más
diversos ámbitos. Es posible hablar de economı́a sostenible, de sociedad, de empresa,
de medio ambiente y hasta de polı́tica sostenible, entre otros. Se entiende que en
todos los casos se refiere al mismo concepto pero aplicado a distintos contextos.
Este concepto, tal como se percibe en la actualidad, surge a fines de la década
del 80 a partir de la necesidad de estudiar (y tratar de delimitar) el impacto que
tienen las acciones humanas sobre el medio ambiente.
Desde entonces, los gobiernos de diferentes paı́ses han trabajado para concienciar
a las empresas sobre la necesidad de poseer polı́ticas empresariales sostenibles. Gra-
cias a la presión llevada a cabo por diversos sectores económicos y sociales en 2002
se redactó el Código de Buen Gobierno de la Empresa Sostenible, donde se define
la empresa sostenible y se le vincula a la idea de responsabilidad social corporativa
(RSC) [8].
La RSC se entiende como la promoción e implementación de buenas prácticas
de negocio, asumiendo la responsabilidad del impacto que genera la actividad de la
empresa. La RSC consta de cinco dimensiones: polı́tica filantrópica de la empresa
(concepto alejado de la RSC en el marco del desarrollo sostenible), ética en los ne-
gocios (principios y valores compartidos con todos aquellos miembros de la sociedad
que tengan relación con la empresa), polı́tica de la empresa (gobernabilidad basada
en rendición de cuentas con monitoreo y validación externa, transparencia y cumpli-
miento de las normativas), preocupación y atención a todo el ciclo productivo (desde
el proveedor de materia prima hasta el consumidor final) y, por último, normativa
77
y regulación (referente a que la información proporcionada por la empresa resulte

veraz y transparente) [6]. Para la medición de estas dimensiones surge la Iniciativa
del Reporte Global (GRI), el cual estudia el comportamiento de las empresas en las
siguientes áreas: economı́a, medio ambiente, desempeño social, prácticas laborales,
derechos humanos, sociedad y responsabilidad sobre el producto [4],[5].
Esta investigación presenta un estudio sobre la caracterización de las empresas
más fuertes (económicamente hablando1 ), del continente americano, con respecto a
los indicadores de sostenibilidad reportados.
La estructura del presente trabajo es la siguiente: en primer lugar una breve
exposición de la metodologı́a utilizada para el análisis de los datos, seguida de una
descripción de dichos datos. A continuación se presentan los principales resulta-
dos obtenidos (Biplot Logı́stico y Análisis de Cluster) y por último las principales
conclusiones obtenidas.
7.2. Metodologı́a
Los métodos Biplot son una representación gráfica (en baja dimensión) de la
información proporcionada por una matriz de datos multivariantes [1], al igual que
un diagrama de dispersión representa gráficamente una relación (correlación lineal)
entre dos variables, los métodos Biplot representan relaciones existentes entre más
de dos variables [2].
Siendo X una matriz de datos con información referente a n individuos y p varia-
bles, por lo general continuas, una representación Biplot de ésta se logra a partir de
la determinación de a1 , a2 , ..., an marcadores fila y b1 , b2 , ..., bp marcadores columna
de forma tal que el producto interno ati bj logre reproducir el elemento xij original.
En formato matricial, si se considera A una matriz cuyas filas sean los marcado-
res a1 , a2 , ..., an y otra matriz B tal que sus filas sean los marcadores b1 , b2 , ..., bp
entonces, la matriz X podrá ser aproximada como X ∼ = AB t .
La factorización de la matriz X siempre es posible, pero ésta no es única. Por lo
tanto, para que la representación Biplot sea válida es necesario imponer restricciones
que garanticen que la descomposición, y por lo tanto la representación Biplot, sea
única.
Al igual que en la mayorı́a de las técnicas clásicas de análisis de datos multi-
variantes basada en la reducción de dimensionalidad, la factorización propuesta es
la que se obtiene al realizar una descomposición de la matriz X en valores singu-
lares. Por lo tanto, el punto de partida de un análisis a través de la metodologı́a
Biplot, será: X = U DV t , donde U es una matriz cuyas columnas coinciden con los
vectores propios de XX t , V otra matriz cuyas columnas coinciden con los vectores
propios de X t X y D la matriz diagonal que contiene los valores singulares de X,
equivalentes a las raı́ces cuadradas (≥ 0) de los valores propios de X t X.
Ası́, dependiendo de como se decida realizar la factorización de la matriz X se
obtendrá un tipo de representación Biplot diferente [9].
Por otra parte, si X es una matriz de datos con información referente a n in-
dividuos y p variables binarias, se tiene una formulación del problema diferente,
denominada Biplot Logı́stico [10], [12]. Siendo Πij la probabilidad esperada de que
1 Estas empresas se seleccionaron tomando en cuenta el ranking FORTUNE 500.
http://fortune.com/global500/
78
la variable j está presente en el individuo i, entonces Πij = E(xij ). La formulación

del Biplot Logı́stico establece:
P
ebj0 + k bjk aik
Πij = P
1 + ebj0 + k bjk aik
con aik y bjk los marcadores fila y columna, respectivamente. Ası́, la función link
que permitirá linealizar este modelo será:
Πij X
logit(Πij ) = log( ) = bj0 + bjk aik = bj0 + ati bj
1 − Πij
k
Lo que equivale, en formato matricial, a logit(Π) = 1n bt0 +AB t (con A y B las matrices
de marcadores ya definidas y 1n vector de unos).
7.3. Resultados
Los datos utilizados en este trabajo corresponden a las 56 empresas más grandes de
América Latina, el Caribe y América del Norte. Se cuenta con información referente a
variables divididas en 2 grupos: caracterı́sticas propias de las empresas (Paı́s, Región,
Tamaño, Sector) e indicadores de sustentabilidad reportados en el GRI (en su versión
G4). Estas variables son de naturaleza binaria: reporta/no reporta.
7.3.1. Análisis descriptivo

Variables de identificación
A continuación se presentan las principales caracterı́sticas de las empresas en relación
al grupo de variables de identificación.
En el Cuadro 7.1 se presenta la distribución de las empresas según su ubicación geográfi-
ca. En ella puede verse que del total de empresas, un 10 % (7 de 56) son empresas de origen
latinoamericano, un 82 % estadounidense y el 8 % restante, canadiense.
Cuadro 7.1: Cantidad de empresas por paı́s según continente

Paı́s / Continente A.L. y Caribe A.N. Total
Brasil 5 0 5
Canadá 0 3 3
Colombia 1 0 1
México 1 0 1
EE.UU 0 46 46
Total 7 49 56
Por otra parte, en el Cuadro 7.2 se observa la distribución de las empresas por paı́s
según tamaño, donde se puede ver que ninguna pertenece a pequeñas empresas y poco
más del 50 % son multinacionales.
79
Cuadro 7.2: Cantidad de empresas por paı́s según tamaño

Paı́s / Tamaño Grande MNE Total
Brasil 5 0 5
Canadá 2 1 3
Colombia 0 1 1
México 1 0 1
EE.UU 17 29 46
Total 25 31 56
En lo que refiere al sector de actividad económica de las empresas (ver Cuadro 7.3), un
46 % se dedica a la Industria, Agua y Energı́a, seguidas de aquellas que se dedican a brindar
otro tipo de servicios (20 %). Cabe resaltar que hay solo una empresa del sector Primario,
una del sector Reparaciones, y una del sector Educación y que las tres corresponden
a empresas de Estados Unidos. Sólo una de las 56 empresas es estatal, se encuentra en
Brasil, pertenece al sector otros servicios y es una empresa de tamaño grande. Las restantes
empresas corresponden todas al sector privado.
Cuadro 7.3: Cantidad de empresas por sector según paı́s

Sector / Paı́s Brasil Canadá Colombia México EE.UU Total
Primario 0 0 0 0 1 1
Industria, Agua y Energı́a 1 2 1 1 21 26
Comercio 1 0 0 0 7 8
Reparaciones 0 0 0 0 1 1
Servicios 0 0 0 0 2 2
Logı́stico 0 0 0 0 6 6
Educación y Servicios Sociales 0 0 0 0 1 1
Otros 3 1 0 0 7 11
Total 5 3 1 1 46 56
Variables reportadas en el GRI G4

En primer lugar se presentan los resultados del análisis de los ı́ndices de sostenibilidad
reportados en el GRI (versión G4), agregados en dimensiones.
En cuanto al valor mı́nimo de indicadores reportados, en las dimensiones Ambiental
y Prácticas Laborales todas las empresas reportan algún indicador (mı́nimo ≥ 1), en las
demás dimensiones, en cambio, hay empresas que no reportan indicadores (ver Cuadro 7.4).
En el otro extremo, se aprecia que el máximo de cada una de las dimensiones coincide con
la cantidad de indicadores de cada una, es decir que, en todas las dimensiones, existe al
menos una empresa que reporta todos los indicadores.
Resulta destacable, además, que todas las variables (excepto Derechos Humanos), pre-
sentan una distribución simétrica, ya que media y mediana prácticamente coinciden.
80
Cuadro 7.4: Descriptivos univariados - ı́ndices GRI (agregados)

Mı́n. Q1 Q2 Media Desvı́o Q3 Máx.
Ec. 0 4 5 5.42 2.51 7 9
Amb. 5 11 19 19.38 9.38 28 34
Pra.L. 1 4 8 8.67 5.14 13 16
Der.H. 0 1 4 5.22 4.32 9 12
Soc. 0 2 5 5.76 3.62 9 11
Resp. 0 1 3 3.84 3.11 6.5 9
En la Figura 7.5 se presentan la matriz de correlaciones 2 a 2 de las dimensiones. En ella

se observa que existe correlación lineal positiva entre todas las dimensiones y se destaca,
en particular, la correlación que existe entre Prácticas Laborales, Derechos Humanos y
Sociedad (r > 0.8).
Cuadro 7.5: Matriz de correlaciones - ı́ndices GRI (agregados)

Ec. Amb. Pra.L. Der.H. Soc. Resp.
Ec. 1.00 0.73 0.74 0.71 0.75 0.54
Amb. 1.00 0.72 0.74 0.83 0.64
Pra.L. 1.00 0.84 0.86 0.64
Der.H. 1.00 0.83 0.71
Soc. 1.00 0.69
Resp. 1.00
Para finalizar, se presentan los porcentajes de los reportes de cada ı́ndice separado por
región, Latinoamérica y Norteamérica (ver Figura 7.1 y Figura 7.2).
Para los indicadores EN (Medio Ambiente), se destaca que en las dos regiones el com-
portamiento es muy parecido. Resalta EN15 (20 %), emisiones directas de gases de efecto
invernadero y los picos altos de EN18 (85 %) y EN27 (70 %) que atienden, respectivamente,
a la intensidad de las emisiones de gases de efecto invernadero y la mitigación del impacto
ambiental de los productos y servicios.
En lo que refiere a los indicadores HR (Derechos Humanos), se observa que latinoaméri-
ca presenta mayor porcentaje de reporte en todos, excepto en el indicador HR10 porcentaje
de nuevos proveedores que se examinaron en función de criterios relativos a los derechos
humanos.
Los indicadores LA (Prácticas Laborales) se comportan de manera similar al HR,
siempre con valores más altos para latinoamérica excepto en los indicadores LA10 (85 %),
programas de gestión de habilidades y formación continua que fomentan la empleabilidad
de los trabajadores y le ayudan a gestionar el final de sus carreras profesionales, y LA12
(85 %), composición de los órganos de gobierno y desglose de la plantilla por categorı́a
profesional y sexo, edad, pertenencia a minorı́as y otros indicadores de diversidad. Tam-
bién se destaca la bajada de reporte que se da en latinoamérica en los indicadores LA3
(60 %), ı́ndices de reincorporación al trabajo y de retención tras el permiso por maternidad
o paternidad, desglosado por sexo, y LA4 (60 %), plazos mı́nimos de preaviso de cambios
operativos y posible inclusión de estos en los convenios colectivos.
81
Figura 7.1: Indicadores EN, HR y LA - Por región.
En la categorı́a EC (Económica), se destacan los valores altos de norteamérica en EC1

(95 %), valor económico directo generado y distribuido, EC3 (70 %), lı́mite de las obliga-
ciones de la organización debidas a programas de presentaciones sociales y EC7 (70 %),
desarrollo e impacto de la inversión en infraestructuras y los tipos de servicios, ası́ como el
valor alto de EC2 (100 %), consecuencias financieras y otros riesgos y oportunidades para
las actividades de la organización debido al cambio climático y el bajo de EC3 (40 %) que
presenta latinoamérica.
Por último, se destaca que en la categorı́a PR (Salud y Seguridad de los clientes), lati-
noamérica tiene valores superiores en todos los ı́ndices (destacando PR5 (85 %), resultados
de las encuestas para medir la satisfacción de los clientes), excepto en el PR6 (25 %), venta
de productos prohibidos o en litigio.
82
Figura 7.2: Indicadores EC, PR, SO y Global - Por región.
Los indicadores de la escala SO (Sociedad), muestran picos altos para SO1 (70 %),
porcentaje de operaciones donde se han implantado programas de desarrollo, evaluación de
impactos y participación de la comunidad local, SO4 (75 %), polı́tica y procedimientos de
comunicación y capacitación sobre la lucha contra la corrupción y SO6 (70 %), valor de las
contribuciones polı́ticas, por paı́s y destinatario, para norteamérica, y SO4 (85 %) y SO6
(100 %) para latinoamérica. Mientras que muestran picos bajos en SO11 (30 %), número de
reclamaciones sobre impactos sociales que se han presentado, abordado y resuelto mediante
mecanismos formales de reclamación, para norteamérica y para latinoamérica en SO2
(60 %), centros de operaciones con efectos negativos significativos, reales o potenciales,
sobre las comunidades locales, SO7 (60 %), número de procedimientos legales por causas
reclamadas con prácticas monopolı́sticas y contra la libre competencia, y sus resultados,
y SO8 (60 %), valor monetario de las multas significativas y número de sanciones no
monetarias por incumplimiento de la legislación y la normativa, aunque todos los ı́ndices
son más reportados por las empresas de latinoamérica.
Por último, al considerar el reporte de los ı́ndices de manera general, se aprecia que
todas las categorı́as son más reportadas por las empresas latinoamericanas.
7.3.2. Biplot Logı́stico

Para analizar la sostenibilidad de las 552 empresas en estudio, utilizando únicamente
los indicadores reportados en la versión G4 del GRI y considerando que éstos son binarios,
se realiza un análisis Biplot Logı́stico (descrito en la sección 7.2).
Los primeros resultados obtenidos, a partir de los cuales se determina la dimensión de
la solución presentada, se reportan en el Cuadro 7.6. En función de esta información, se
decide trabajar únicamente con los dos primeros ejes. Esta decisión se respalda, además,
en el hecho de que el primer valor propio sea tres veces mayor que el siguiente.
2 No es considerada en el análisis una empresa de EEUU, considerada un outlier.
83
Cuadro 7.6: Variabilidad explicada - Biplot Logı́stico

Ejes Val. Prop. Var. Exp. Acumulada
Eje 1 2.89 23.07 23.07
Eje 2 0.89 7.09 30.18
Eje 3 0.74 5.94 36.12
De esta forma se obtiene una solución que resulta fácilmente interpretable y que logra
explicar más del 30 % de la variabilidad total (porcentaje que se entiende razonable, si se
considera que están en estudio 91 variables).
Los resultados generales, sin imponer ninguna restricción sobre la calidad de represen-
tación, se presentan en la Figura 7.3.
Figura 7.3: Biplot Logı́stico - General
En el cuadro que se presenta a continuación (Cuadro 7.7) se reportan algunas medidas

que surgen del ajuste logı́stico. Se reportan únicamente los indicadores que presentan un
R2 ≥ 0.60 (de aquı́ en adelante éstas serán las únicas variables consideradas).
Tal como se observa en el Cuadro 7.7, todas las variables resultan significativas y todas
poseen un porcentaje de empresas bien clasificadas superior al 80 %. Esta última medida
se obtiene a partir de las probabilidades estimadas (tomando 0.5 como probabilidad de
corte para estimar presencia o ausencia).
7.3.3. Clusters Biplot Logı́stico

Uno de los objetivos planteados en este trabajo era describir el comportamiento de
grupos de empresas. Para eso se decide realizar un análisis de cluster jerárquico, utilizando
las coordenadas (scores de ordenación) del Biplot Logı́stico y aplicando el algoritmo de
Ward.
Se detecta una estructura de 3 clusters con la siguiente caracterización, en función de:
ubicación, sector de actividad y tamaño (ver Cuadro 7.8).
La estimación se realiza de forma conjunta considerando todos los indicadores (con
R2 ≥ 0.60) pero a modo de simplificar la interpretación, se presentan los resultados por
dimensión.
84
Cuadro 7.7: Bondad de ajuste - Biplot Logı́stico.

Indicador Deviance p valor R2 % Correctas
EC5 11.20 0.00 0.70 87.27
EC6 9.44 0.00 0.60 81.82
EN1 12.71 0.00 0.75 85.46
EN2 9.77 0.00 0.60 81.82
EN4 10.47 0.00 0.61 81.82
EN9 14.94 0.00 0.69 87.27
EN10 12.22 0.00 0.66 81.82
EN11 25.00 0.00 0.91 92.73
EN12 14.12 0.00 0.66 81.82
EN14 26.84 0.00 0.96 94.55
EN16 20.18 0.00 0.71 98.18
EN20 13.17 0.00 0.68 83.64
EN21 12.43 0.00 0.62 80.00
EN22 29.22 0.00 0.89 96.36
EN23 15.27 0.00 0.71 83.64
EN24 15.09 0.00 0.68 85.46
EN25 14.41 0.00 0.75 87.27
EN26 14.40 0.00 0.78 90.91
EN32 14.33 0.00 0.68 85.46
EN34 11.39 0.00 0.72 83.64
LA1 11.03 0.00 0.64 80.00
LA3 24.57 0.00 0.95 94.55
LA4 9.52 0.00 0.60 85.46
LA6 12.33 0.00 0.67 85.46
LA7 10.74 0.00 0.62 83.64
LA8 13.48 0.00 0.70 85.46
LA9 19.26 0.00 0.69 81.82
LA10 17.67 0.00 0.64 89.09
LA11 14.80 0.00 0.70 83.64
LA14 12.31 0.00 0.68 83.64
LA15 14.57 0.00 0.72 87.27
LA16 11.16 0.00 0.67 80.00
HR2 10.56 0.00 0.66 90.91
HR8 22.83 0.00 0.92 85.46
HR11 11.82 0.00 0.65 89.09
HR12 19.38 0.00 0.90 89.09
SO3 10.49 0.00 0.62 83.64
SO5 12.97 0.00 0.75 87.27
SO8 11.08 0.00 0.66 85.46
SO9 11.56 0.00 0.69 81.82
SO10 10.66 0.00 0.66 83.64
SO11 12.42 0.00 0.75 83.64
PR2 10.95 0.00 0.66 81.82
PR8 23.42 0.00 0.67 87.27
85
Cuadro 7.8: Descripción % por Clusters.

Paı́s Cluster 1 Cluster 2 Cluster 3
Brasil 16.67 5.56 8
EE.UU 83.33 88.88 76
México 0 0 4
Canadá 0 5.56 8
Colombia 0 0 4
Sector Cluster 1 Cluster 2 Cluster 3
Primario 0 5.56 0
Industria 75 5.56 64
Comercio 16.67 27.77 0
Reparaciones 0 0.00 4
Servicios 0 11.11 0
Logı́stico 8.33 11.11 12
Educación y Ss.Ss 0 5.56 0
Otros 0 33.33 20
Tamaño Cluster 1 Cluster 2 Cluster 3
Multinacional 66.67 44.44 56
Grande 33.33 55.56 44
Dimensión Económica
Tal como se observa en la Figura 7.4, en esta dimensión quedan bien representadas las
variables EC5 (Relación entre el salario inicial desglosado por sexo y el salario mı́nimo
local en lugares donde se desarrollan operaciones significativas) y EC6 (Porcentaje de altos
directivos procedentes de la comunidad local en lugares donde se desarrollan operaciones
significativas).
La caracterización de los clusters, en función de la dimensión económica, es:
Cluster 1 y 2 ausencia en ambas variables.
Cluster 3 presencia en ambas variables.
86
Figura 7.4: Biplot Logı́stico - Económica.
Dimensión Ambiental
En cuanto a la dimensión ambiental, como puede verse en la Figura 7.5, en esta di-
mensión quedan bien representadas los ı́ndices EN1, EN2, EN4, EN9, EN10, EN11, EN12,
EN14, EN16, EN20, EN21, EN22, EN23, EN24, EN25, EN26, EN32, EN34.
Figura 7.5: Biplot Logı́stico - Ambiental.
87
La caracterización de los 3 clusters, en esta dimensión es la siguiente: los 3 clusters

predicen presencia en los indicadores EN16 y EN23, y ausencia del EN14. Además:
Cluster 1 ausencia en EN1, EN25, EN26, EN32 y EN34.
Cluster 2 ausencia en todos menos en EN23 y EN16.
Cluster 3 presencia en todas menos EN14.
Prácticas Laborales
En esta dimensión, y considerando el mismo R2 de las dimensiones anteriores quedan
representadas todas las indicadoras menos LA2, LA4, LA5, LA12 y LA13 (ver Figura 7.6).
Los culsters se caracterizan por:
Cluster 1 ausencia en todas menos LA6.
Cluster 2 ausencia en todas menos LA9 y LA10.
Cluster 3 presencia en todas.
Figura 7.6: Biplot Logı́stico - Prácticas laborales.
Recursos Humanos, Sociedad y Responsabilidad

Por último, en la Figura 7.7, se presentan las dimensiones de Recursos Humanos,
Sociedad y Responsabilidad. En lo que refiere a la primera, quedan bien representadas
HR2, HR8, HR11 y HR12. En cuanto a la segunda, se tiene que las indicadoras SO3, SO5,
SO8, SO9, SO10, SO11 son las que quedan bien representadas y, al considerar la última
dimensión, PR2 y PR8.
El comportamiento de los clusters en estas 3 dimensiones se puede resumir de la si-
guiente manera:
Cluster 1 ausencia de todas las HR, SO y PR.
Cluster 2 ausencia de todas las HR, SO y PR (menos PR8).
Cluster 3 presencia de todas las HR (menos HR8), todas las SO y todas las PR.
88
Figura 7.7: Biplot Logı́stico - Recursos Humanos, Sociedad y Responsabilidad.
7.4. Conclusiones
Las principales conclusiones obtenidas del análisis presentado en este trabajo se expo-
nen a continuación:
Teniendo en consideración la comparación por región, se destaca que América Latina
presenta mayores reportes en todos los indicadores.
Los indicadores más reportados por las empresas de América Latina son: Prácticas
Laborales y Sociedad, y para las empresas de norteamérica: Económica y Ambiental.
Existen 3 grupos de empresas con las siguientes caracterı́sticas:
• Cluster I: se detecta ausencia y presencia en igual proporción en el reporte de
los indicadores de sostenibilidad.
• Cluster II: ausencia de reporte en la mayorı́a de los indicadores.
• Cluster III: presencia de reporte de la mayorı́a de indicadores.
89
Bibliografı́a
[1] Gabriel, K., The biplot graphic display of matrices with application to principal
component analysis., Biometrika 58(3), 453 - 467, 1971.
[2] Gabriel, K. y ODORFF, CH., Biplot un biomedical research., Statistics in Medicine

9, 469 - 485, 1990.
[3] Galindo, M.P., Una alternativa de representación simultánea: HJ-Biplot., Questı́o

10, 1, 13 - 23, 1986.
[4] GRI, G4 - Guı́a para la elaboracion de Memorias de Sostenibilidad - Parte 1,

https://goo.gl/q66f9K, 2013.
[5] GRI, Memorias de Sostenibilidad, https://www.globalreporting.org/languages/spanish/Pa-

ges/Memorias-de-Sostenibilidad.aspx, 2015.
[6] Nuñez, G., División de Desarrollo Sostenible y Asentamientos Humanos

(CEPAL), La responsabilidad social corporativa en un marco de desarrollo sostenible.,
Series de la CEPAL: Medio Ambiente y Desarrollo 72, 70pg. CEPAL, Chile, 2003.
[7] R Core Team, R: A Language and Environment for Statistical Computing., R

Foundation for Statistical Computing, Vienna, Austria. http://www.R-project.org/,
2015.
[8] Ricart, J.E. y Rodrı́guez, M.A., Código de Gobierno para la empresa Sostenible:
Guı́a para su implementación. Center for Business in Society, IESE, 2002.
[9] Vernazza, E., Urruticoechea, A., Sostenibilidad Empresarial: Análisis desde una
perspectiva multivariante a través de la metodologı́a HJ-Biplot, 2017. Disponible en:
https : //www.f cf m.buap.mx/SIEP 2017/M emorias/Extensos/Carteles/8.pdf .
[10] Vicente Villardán, J.L., Biplot for binary data based on logistic response surfaces.,
Salamanca Statistics Seminar IV. Advances in Multivariate Analysis. Salamanca,
December, 2001.
[11] Vicente Villardán, J.L., MULTBIPLOT: A package for Multivariate Analy-

sis using Biplots., Departamento de Estadı́stica. Universidad de Salamanca.
http://biplot.usal.es/ClassicalBiplot/index.html, 2015.
90
[12] Vicente Villardán, J.L., Galindo, M.P., y Blazquez, A., Logistic Biplots.,
Múltiple Correspondence Análisis And Related Methods, 491 - 509, 2006.
91
Capı́tulo 8
Análisis de la deserción en las licenciaturas de la FCFM-BUAP mediante el
modelo de riesgo proporcional semiparamétrico
Blanca Xochilt Muñoz Vargas, Bulmaro Júarez Hernández

Lucı́a Cervantes Gómez, Hortensia J. Reyes Cervantes

Av. San Claudio y 18 Sur, Col. San Manuel,
b.xochilt.munoz@gmail.com, bjuarez@fcfm.buap.mx,
lcervant@fcfm.buap.mx, hreyes@fcfm.buap.mx
Resumen. El Análisis de Supervivencia modeliza el tiempo que se tarda en
ocurrir un evento especı́fico. En este trabajo se presentan las principales definicio-
nes del Análisis de Supervivencia, se describen diferentes modelos de supervivencia
y se aplica el modelo de riesgo proporcional semiparamétrico al problema de la
deserción en las licenciaturas en Actuaria, Matemáticas y Matemáticas Aplicadas
impartidas en la Facultad de Ciencias Fı́sico Matemáticas de la Benemérita Uni-
versidad Autónoma de Puebla (FCFM-BUAP).
Abstract. The Survival Analysis models the time it takes to occur a specific
event. This paper presents the main definitions of the Survival Analysis and diffe-
rent survival models, in addition the semi-parametric proportional hazard model
is applied to the problem of dropout in the Actuarial, Mathematics and Applied
Mathematics degrees taught in the Facultad de Ciencias Fı́sico Matemáticas of the
Benemérita Universidad Autónoma de Puebla (FCFM-BUAP).
Palabras clave: Análisis de Supervivencia, modelo de riesgo proporcional semi-

paramétrico, deserción en las licenciaturas.
8.1. Introducción
El Análisis de Supervivencia es un conjunto de técnicas que tienen como obje-
tivo modelizar el tiempo que se tarda en ocurrir un evento especı́fico. Este evento
frecuentemente se llama fracaso, falla o muerte, y ocurre después de un periodo
llamado el tiempo de falla, tiempo de supervivencia o tiempo de vida.
Las aplicaciones del Análisis de Supervivencia van desde investigaciones de la
durabilidad de artı́culos manufacturados hasta estudios de enfermedades humanas
y sus tratamientos [3].
92
Algunas veces, solamente se tiene interés en la distribución del tiempo de falla

de un sólo grupo de individuos. Más a menudo, se desea comparar los tiempos
de falla de dos o más grupos para ver, por ejemplo, si el tiempo de falla de los
individuos son sistemáticamente más largos en el segundo grupo que en el primero.
Alternativamente, pueden estar disponibles para cada individuo valores de variables
explicativas, las cuales se consideran relacionadas a la supervivencia [1].
8.2. Definiciones
A continuación se presentan algunas definiciones utilizadas en el Análisis de Su-
pervivencia. Se considera una población homogénea de individuos, teniendo cada
uno un tiempo de falla, es decir, se trata con una variable aleatoria no negativa, T .
Supóngase que T es continua, con función de densidad de probabilidad (f.d.p.) f (·) y
F (t) = P r(T 6 t), para t > 0,

la función de distribución acumulada (f.d.a.) de T .
La probabilidad de que un individuo sobreviva al tiempo t está dada por la
función de supervivencia, definida por
Z ∞
S(t) = P r(T > t) = f (x)dx = 1 − F (t), para t > 0. (8.1)
t
Las funciones S(·), f (·) y F (·) proporcionan tres formas matemáticas equivalen-
tes para especificar la distribución de una variable aleatoria continua no negativa, y
por supuesto hay otras funciones equivalentes. Una con valor especial en el contexto
presente es la función de riesgo, definida por,
P r(t 6 T < t + ∆|t 6 T )
h(t) = lim+ , para t > 0. (8.2)
∆→0 ∆
La función de riesgo especı́fica la tasa instantánea de muerte o falla en el tiem-
po t, dado que el individuo sobrevive hasta el tiempo t; h(t)∆ es la probabilidad
aproximada de falla en [t, t + ∆), dado que sobrevivió hasta el tiempo t.
8.3. Censura y truncamiento

En los estudios de tiempo de falla puede haber limitaciones en la información
recolectada, éstas pueden ser impuestas por el tiempo, costo y otras restricciones.
Dos caracterı́sticas que usualmente presentan los datos de tiempo de falla son la
censura y el truncamiento.
La censura ocurre cuando se conoce que algunos tiempos de falla han ocurrido
en cierto intervalo de tiempo y el resto de los tiempos de falla son conocidos exac-
tamente. Algunas categorı́as de censura son: por la derecha, por la izquierda, por
intervalo y doble.
Una segunda caracterı́stica de muchos estudios de supervivencia, a veces con-
fundida con la censura, es el truncamiento. El truncamiento de los datos de su-
pervivencia se produce cuando sólo se observan aquellos individuos cuyo tiempo
de falla se encuentra dentro de un determinado intervalo de observación (YL , YR ),
93
Figura 8.1: Modelos en el Análisis de Supervivencia.
donde YL < YR y YL , YR > 0. No se observa a un individuo cuyo tiempo de falla no

está en este intervalo y no hay información disponible sobre este individuo para el
investigador. Esto contrasta con la censura donde hay al menos información parcial
sobre cada individuo. Debido a que sólo se tiene información de los individuos con
tiempos de falla en el intervalo de observación, la inferencia de los datos truncados
se limita a la estimación condicional.
8.4. Modelos de supervivencia

En el análisis de datos de tiempo de falla se utilizan diferentes tipos de modelos:
paramétricos, no paramétricos y semiparamétricos (Figura 8.1). En los modelos pa-
ramétricos se especı́fica la forma funcional de la distribución que los tiempos de falla
tendrı́an en ausencia de censura y la inferencia estadı́stica se basa en la metodologı́a
de máxima verosimilitud. Para obtener la función de verosimilitud o las propiedades
de los procedimientos estadı́sticos basados en datos censurados es necesario consi-
derar el proceso por el que surgen los tiempos de falla y tiempos censurados. Para
hacer esto, se necesita un modelo de probabilidad para el mecanismo de censura.
De manera interesante, resulta que la función de verosimilitud observada para los
parámetros del tiempo de falla toma la misma forma bajo una gran variedad de
mecanismos.
Ahora, suponga que se ha elegido una familia especı́fica, ası́ que se sabe que
la distribución del tiempo de falla depende de un vector paramétrico φ y que está
disponible para la inferencia sobre φ una sola muestra aleatoria de tiempos de
falla, posiblemente sujeta a censura por la derecha. En este caso se tiene que la
verosimilitud completa de n individuos independientes, indexados por i es
Y Y
L(φ; t) = f (ti ; φ) S(ti ; φ), (8.3)
i∈U i∈C
en donde U y C son los conjuntos de los individuos no censurados y censurados,

respectivamente.
94
Varias familias paramétricas se usan como modelos en el análisis de datos de

tiempo de fallas. Entre los modelos univariados, algunas distribuciones ocupan una
posición central ya que se ha demostrado su utilidad en una amplia gama de situacio-
nes. Principalmente en esta categorı́a están la distribuciones exponencial, Weibull,
log normal, log logı́stica y gamma [3].
Las técnicas no paramétricas no requieren especificaciones de la forma funcional
de la distribución que los tiempos de falla tendrı́an en la ausencia de censura. Un
estimador no paramétrico de la función de supervivencia, S(·), es
Y dj

S(t) =
b 1− , para t > 0, (8.4)
rj
j:tj 6t
en donde rj es el número de individuos en riesgo en tj y dj es el número de tiempos

de falla observados en tj . Usualmente, S(·)
b es llamado el estimador de Kaplan-Meier
o producto-Lı́mite.
Cuando se usa el estimador Producto-Lı́mite es deseable tener un estimador de
la varianza de S(t),
b el cual esta dado por
b 2
X dj
Vd
ar(S(t))
b = S(t) , (8.5)
rj (rj − dj )
j:tj 6t
que a menudo se conoce como fórmula de Greenwood. El estimador del error

estándar para S(t)
b está dado por la raı́z cuadrada de (8.5) [3].
8.4.1. Modelos de regresión de supervivencia

Frecuentemente se desea comparar dos o más conjuntos de datos, algunas veces
es mejor hacer la estimación de la función de supervivencia para cada conjunto de
datos por separado y luego hacer una comparación cualitativa, ya sea directamente
o mediante un resumen estadı́stico. También se pueden hacer comparaciones más
sensibles o más complejas mediante modelos completos en los que el efecto de las
covariables o variables explicativas se representa por medio de parámetros desco-
nocidos [1]. Por otra parte, en muchos estudios el principal objetivo es entender y
aprovechar la relación entre el tiempo de falla y las covariables [3].
Ahora supóngase que para cada individuo está definido un vector x de variables
explicativas. Las componentes de x pueden representar varias caracterı́sticas, que
se piensa afectan el tiempo de falla, tales como tratamientos, indicadores de grupo,
caracterı́sticas individuales o condiciones ambientales.
Las variables explicativas se pueden clasificar como constantes (fijas), x, o de-
pendientes del tiempo, x(t). Un proceso de las covariables X = {x(t)|t > 0}, que
se desarrolla independientemente del proceso de tiempo de falla, se denomina ex-
terno, mientras que un proceso de las covariables, que se desarrolla dependiente del
proceso de tiempo de falla, se denomina interno y su tratamiento requiere cuidado.
Notar que las covariables constantes son externas [3].
Modelos de regresión paramétricos

Los modelos de regresión para tiempos de falla se pueden formular de diferentes
formas. Cualquier modelo paramétrico se puede convertir en un modelo de regresión
95
paramétrico especificando una relación entre los parámetros del modelo y las cova-
riables. Sin embargo, frecuentemente sólo ciertos parámetros en una distribución de
tiempo de falla se asumen dependientes de las covariables [3].
Otra forma frecuente de formular modelos es definir al vector x de variables ex-
plicativas de modo que x = 0 corresponde a algún conjunto de condiciones estándar
significativas, por ejemplo un tratamiento control. Luego, se pueden desarrollar los
modelos convenientemente en dos partes:
1. un modelo para la distribución del tiempo de falla cuando x = 0;

2. una representación del cambio inducido por un x 6= 0, frecuentemente en
términos de alguna forma paramétrica [1].
Tres modelos que se pueden desarrollar de esta forma son el modelo de vida
acelerada, el modelo de riesgo proporcional y el modelo de riesgo aditivo.
Modelo de vida acelerada
Supóngase ahora que el vector de variables explicativas depende del tiempo, x(t).
La esencia del modelo de vida acelerada es que el tiempo es contraı́do o ampliado
relativamente a éste en x = 0. Esto sugiere que para un individuo caracterizado
por x(t), el tiempo t(x) , evoluciona con respecto al tiempo t(0) para tal individuo
estando en x = 0 de acuerdo con
dt(x) 1
(0)
= ,
dt ψ(x(t(x) ))
i.e.
Z t(x)
(0)
t = ψ(x(u))du = Ψ(t(x) ),
0
donde ψ(·) es una función positiva y ψ(0) = 1, ası́ que el tiempo de falla está
relacionado por T = Ψ−1 (T0 ) [1].
Por lo tanto, en el modelo de vida acelerada la función de supervivencia, la f.d.p.
y la función de riesgo son
S(t|X) = S0 [Ψ(t)],
f (t|X) = ψ[x(t)]f0 [Ψ(t)], (8.6)
h(t|X) = ψ[x(t)]h0 [Ψ(t)],
en donde X = {x(t)|t > 0} y ψ(·) es una función positiva. Si x(·) es constante

sobre el tiempo, i.e. x(t) = x para todo t > 0, entonces se tiene el modelo de vida
acelerada simple.
Se puede considerar a S0 (·) igual a la función de supervivencia de alguna familia
paramétrica y una forma paramétrica para ψ(·), que se denotará por ψ(·; β), con el
propósito de tener
0
un modelo paramétrico. Un procedimiento común es especificar
a ψ[x(u)] = eβ x(u) para todo u > 0, en tal caso
hR 0
i
t
S(t|X) = S0 0 eβ x(u) du .
96
Modelo de riesgo proporcional
Una segunda familia de modelos que ha sido ampliamente usada en el análisis

de datos de supervivencia, es conocida como el modelo de riesgo proporcional.
En el modelo de riesgo proporcional se supone que para un vector x(t) de varia-
bles explicativas la función de riesgo es
h(t|x(t)) = ψ(x(t))h0 (t) para t > 0, (8.7)
por lo que la función de supervivencia y la f.d.p. son
S(t|x(t)) = exp[−H(t|x(t))]
h R i
t
= exp − 0 h(u|x(u))du
h R i
t
= exp − 0 ψ(x(u))h0 (u)du
y
f (t|x(t)) = h(t|x(t))S(t|x(t))h i
Rt
= ψ(x(t))h0 (t) exp − 0
ψ(x(u))h0 (u)du .
Si x(·) es constante sobre el tiempo, i.e. x(t) = x para todo t > 0, entonces se
tiene el modelo de riesgo proporcional simple.
Se puede considerar a h0 (·) igual a la función de riesgo de alguna familia pa-
ramétrica y a una forma paramétrica para ψ(·), que se denotará por ψ(·; β), para
tener un modelo paramétrico. 0
Tres parametrizaciones para ψ(·) son: la forma log lineal ψ(x; β) = eβ x , que por
buenas razones ha llegado a ser la más popular, la forma lineal ψ(x; β) = 1 + β 0 x,
0
y el logı́stico, ψ(x; β) = log(1 + eβ x ).
Modelo de riesgo aditivo
En el modelo de vida acelerada y en el modelo de riesgo proporcional las dis-

tribuciones de T para diferentes valores en las covariables, x1 y x2 , que cum-
plen que ψ(x1 ) < ψ(x2 ) son ordenadas en el sentido de que S(t|x1 ) 6 S(t|x2 ) o
S(t|x1 ) > S(t|x2 ) para t > 0. Existen otros modelos que también cumplen esta
propiedad, uno es el modelo de riesgo aditivo en el cual
h(t|x) = ψ(x) + h0 (t) para t > 0,
en donde ψ(·) está restringida para que ψ(0) = 0 y ψ(x) + h0 (t) > 0 para todo x
y t > 0, además h0 (·) es la función de riesgo para un individuo bajo la condición
estándar (x = 0). La función de supervivencia y la f.d.p. cumplen que
S(t|x) = exp[−H(t|x)]
h R i
t
= exp − 0 (ψ(x) + h0 (u))du
= exp [−ψ(x)t − H0 (t)]
= exp [−ψ(x)t] exp [−H0 (t)] ,
i.e.
S(t|x) = exp [−ψ(x)t] S0 (t) (8.8)
97
y
f (t|x) = h(t|x)S(t|x)
= (ψ(x) + h0 (t)) exp [−ψ(x)t] S0 (t).
Los modelos completamente paramétricos se obtienen considerando a h0 (·) igual
a la función de riesgo de alguna de las familias de distribuciones y una forma pa-
ramétrica para ψ(·).
El análisis de los modelos de regresión paramétricos se concentra en los métodos
basados en la función de verosimilitud. Para una variedad de mecanismos de censura
por la derecha, la función de verosimilitud de las observaciones (ti , δi , Xi (ti )), i =
1, . . . , n, cumple que
n
Y
L∝ f (ti |Xi (ti ))δi S(ti |Xi (ti ))1−δi ,
i=1
en donde δi es el indicador de censura para ti y Xi (ti ) = {xi (s)|0 6 s 6 ti }, denota

la historia de las covariables hasta el tiempo ti para el individuo i.
Modelos de regresión semiparamétricos

Los modelos semiparamétricos también son ampliamente usados, estos especi-
fican la dependencia de T en x paramétricamente, pero consideran arbitraria a la
distribución real. El modelo de regresión de tiempo de falla semiparamétrico más
conocido es el modelo de riesgo proporcional semiparamétrico, que toma a la función
de riesgo de T dado x de la forma
h(t|x) = h0 (t) exp{β 0 x},
donde h0 (·) es una función de riesgo basal arbitraria [3].

De manera más general, considérese al modelo de riesgo proporcional simple, es
decir,
h(t|x) = ψ(x; β)h0 (t), para t > 0,
en donde el vector de variables explicativas, x, es constante para cualquier individuo.
La inferencia sobre β cuando la función de riesgo h0 (·) es completamente desco-
nocida se basa en la siguiente función de verosimilitud
Y ψ(xi , β)
L= X ,
i∈U ψ(xk , β)
k∈Ri
en donde U denota al conjunto de los individuos que fallan y Ri = R(ti ) = {j|tj >
ti } es el conjunto de individuos en riesgo justo antes de ti .
8.5. Caso de estudio: la deserción en las licencia-

turas de la FCFM-BUAP
La deserción se entiende como la interrupción o desvinculación del proceso
académico-institucional que lleva a cabo el estudiante. Este ha sido un tema estu-
diado por diferentes autores e Instituciones de Educación Superior (IES). El tema
98
ha tomado un lugar importante dado que no tiene sentido realizar un esfuerzo sig-
nificativo por aumentar la cobertura, calidad y equidad en educación superior, sin
controlar la deserción y su problemática multicausal y compleja. De esta manera,
el emprendimiento de este tipo de estudios aporta a la comprensión del fenómeno
y permite generar estrategias de retención estudiantil al interior de las IES y por
parte del Estado [4].
8.5.1. La deserción en las licenciaturas de la FCFM-BUAP

La Benemérita Universidad Autónoma de Puebla (BUAP), cuyas raı́ces se re-
montan al siglo XVI, constituye un gran pilar de la educación superior y la inves-
tigación cientı́fica en la región, y ocupa un destacado sitio entre las universidades
públicas del paı́s, gracias al esfuerzo conjunto de todos los miembros de la institución
[2].
En la década de los 70, en la BUAP se impuso un modelo de Universidad Crı́tica,
Democrática y Popular que fortaleció la investigación cientı́fica y la vinculación con
los sectores más necesitados de la sociedad. Se creó el Instituto de Ciencias, se
consolidó la Escuela de Fı́sico Matemáticas y nacieron los primeros estudios de
posgrado: maestrı́a y doctorado en Fı́sica [2]. Actualmente, la oferta educativa de
la Facultad de Ciencias Fı́sico Matemáticas (FCFM) consta de:
Licenciatura en Actuarı́a (LA)
Licenciatura en Fı́sica (LF)
Licenciatura en Fı́sica Aplicada (LFA)

Licenciatura en Matemáticas (LM)
Licenciatura en Matemáticas Aplicadas (LMA)
Maestrı́a en Ciencias Fı́sica Aplicada
Maestrı́a en Ciencias Matemáticas

Maestrı́a en Educación Matemática
Doctorado en Ciencias Fı́sica Aplicada
Doctorado en Ciencias Matemáticas.

Las licenciaturas de la FCFM-BUAP no están excentas del problema de la de-
serción escolar, hay alumnos desertores en los diferentes semestres impartidos. El
periodo en el que se presenta la mayor deserción es el primer año escolar. Desde el
2006 hasta el 2013 el porcentaje de deserción en el primer año de la LM ha variado
entre el 27 % y el 57 % y en la LMA entre el 26 % y el 44 %, mientras que en el caso
de la LA la deserción varı́a entre el 13 % y el 25 % como se muestra en la Tabla
8.5.1. La primera generación de la LA ingresó en 2010 por lo que sólo se muestran
las generaciones 2010 a la 2013.
99
Tabla 8.5.1 Porcentaje de deserción en el primer año de la LA, la LM y la LMA.

Fuente: Elaboración propia a partir de información proporcionada por la FCFM-
BUAP.
Lic. 2006 2007 2008 2009 2010 2011 2012 2013
LA 25 % 22 % 13 % 20 %
LM 39 % 27 % 36 % 28 % 57 % 32 % 33 % 43 %
LMA 34 % 35 % 42 % 26 % 30 % 37 % 44 % 43 %
8.5.2. Descripción del análisis de deserción para las licencia-

turas de la FCFM-BUAP
En el análisis de deserción en las licenciaturas de la FCFM-BUAP se considera
a la deserción como el abandono de la licenciatura de la FCFM. Por lo tanto,
el seguimiento que se le hace al estudiante comienza desde que se matricula en
una licenciatura de la FCFM hasta que sale de ésta. No se considera el hecho de
que el estudiante continúe sus estudios en otra licenciatura de la FCFM, de la
BUAP, de otra institución o si deja de estudiar por completo. Se supone que la
deserción del estudiante es una decisión voluntaria y se reconoce que un estudiante
ha desertado cuando permanece un semestre sin matricularse en la licenciatura que
estaba cursando.
El tiempo de observación considerado es del segundo semestre de 2009 al primer
semestre de 2015, por lo que se consideran a las generaciones que ingresaron en
2009, 2010, 2011, 2012, 2013 y 2014.
El objetivo del análisis es determinar factores causales o indicadores de mayor
deserción; para esto se ajusta un modelo interaccionista, es decir, se consideran
covariables sin dar preferencia a ninguna en especial. Las covariables consideradas
son: puntaje de ingreso (Puntaje), autoestima (Autoestima), hábitos de estudio
(HabEstudio), razonamiento cientı́fico (Lawson), comprensión lectora (THLB), es-
tilos de aprendizaje (Activo, Reflexivo, Teórico y Pragmático), género (Género), con
quien vive (Vive), financiamiento del bachillerato de procedencia (FinBach), tipo
de bachillerato de procedencia (TipoBach), materias reprobadas (MatRep), opción
de carrera (OpCarrera), sostén de estudios (SosEst), trabajo (Trabajo) y recursos
semanales (RecSem). Algunas covariables son categóricas por lo que se les asignó
un valor a cada categorı́a como se muestra en la Tabla 8.5.2.
Tabla 8.5.2 Covariables con sus categorı́as y valores asignados.

Covariable Categorı́as
Género Femenino (0) y Masculino (1)
Vive Padre/Madre (0), Solo (1), Amigos (2), Esposo/Hijos (4) y Otros (3)
FinBach Público (0) y Privado (1)
TipoBach General (0) y Especializado (1)
MatRep Ninguna (0), Menos de 3 (1), De 3 a 6 (2) y Más de 6 (3)
OpCarrera Primera opción (0) y Segunda opción (1)
SosEst Recursos familiares (0), Recursos propios (1), Ambos (2) y Otros (3)
Trabajo No (0) y Si (1)
RecSem Insuficientes (0), Suficientes (1) y Excelentes (2)
Las covariables consideradas son caracterı́sticas del alumno obtenidas mediante

las siguientes pruebas aplicadas a los estudiantes de nuevo ingreso de la FCFM:
Exámenes de admisión de la BUAP.
100
Inventario de Autoestima de Coopersmith.
Cuestionario de Hábitos de Estudio.

Prueba de Lawson.
Test de habilidades Lecto-Comprensivas Básicas.
Cuestionario Honey-Alonso de Estilos de Aprendizaje.

Cuestionario para alumnos de nuevo ingreso.
Estas pruebas se describen en [5].
Un limitante de este análisis es el hecho de que algunas covariables que varı́an
en el tiempo son consideradas constantes.
Se aplica la metodologı́a del Análisis de Supervivencia al problema de deserción
escolar universitaria en las licenciaturas en Actuarı́a, Matemáticas y Matemáticas
Aplicadas impartidas en la FCFM-BUAP. Se analiza la deserción de los alumnos
de las licenciaturas mencionadas utilizando el modelo de riesgo proporcional semi-
paramétrico. El objetivo es identificar las variables indicadoras de mayor riesgo que
permitan tomar medidas de prevención adecuadas que disminuyan la deserción en
las licenciaturas estudiadas.
En el caso bajo estudio la población objetivo consta de los alumnos que ingresa-
ron a la FCFM entre los años 2009 y 2014. Para medir el tiempo de deserción para
cada alumno se considera como tiempo origen la fecha de su ingreso a la FCFM, la
escala para medir el paso del tiempo es el semestre y el significado de fracaso es la
deserción.
El análisis estadı́stico se realiza con el paquete survival del software R. Este
paquete permite calcular el estimador de Kaplan-Meier y estimar los parámetros
del modelo de riesgo proporcional semiparamétrico.
8.5.3. Análisis con el Modelo de riesgo proporcional semipa-

ramétrico
El análisis con covariables del tiempo de deserción de los alumnos de las licen-
ciaturas de la FCFM se realiza mediante el modelo de riesgo proporcional semipa-
ramétrico, debido a que este modelo está enfocado en evaluar la relación con los
factores o covariables.
En las licenciaturas estudiadas (LA, LM y LMA), modelizar el tiempo de deser-
ción mediante el modelo de riesgo proporcional semiparamétrico con todas las cova-
riables de escala mı́nima de intervalo (Puntaje, Autoestima, HabEstudio, Lawson,
THLB, Activo, Reflexivo, Teórico y Pragmático) proporciona modelos en los que la
mayorı́a de covariables son estadı́sticamente no significativas. Para obtener modelos
con covariables estadı́sticamente significativas se propone realizar el procedimiento
de regresión paso a paso, que es una técnica de selección de modelo ampliamente
utilizada en Regresión Lineal Múltiple [6]. Esta técnica proporciona un modelo cu-
yas variables explicativas son estadı́sticamente significativas. El procedimiento que
se realiza es el mismo que el que se lleva a cabo en Regresión Lineal Múltiple sólo
que en este caso se estiman los coeficientes del modelo de riesgo proporcional en
lugar de los de la regresión lineal múltiple, i.e. se consideran los p-valores de los
101
estadı́sticos de las pruebas para la hipótesis H0 : βk = 0 correspondientes al modelo

de riesgo proporcional en lugar de los p-valores correspondientes a la regresión lineal
múltiple. En este análisis se considera αdentro = 0.10 = αf uera , donde αdentro es el
p-valor umbral para introducir covariables al modelo y αf uera es el p-valor umbral
para eliminar covariables del modelo (αdentro 6 αf uera ).
Para cada licenciatura (LA, LM y LMA), se obtiene un modelo de riesgo propor-
cional semiparamétrico mediante el procedimiento de regresión paso a paso. Estos
modelos cumplen que todas sus covariables son estadı́sticamente significativas. Po-
siblemente se podrı́a disminuir el número de covariables significativas en el modelo
si se disminuye el valor del nivel de significancia de entrada y salida. Los modelos
se presentan a continuación.
En Actuarı́a:
h(t|x) = h0 (t) exp{(−0.118, −0.006, −0.034)x},

b
en donde x = (Teórico, Puntaje, Autoestima)0 y h0 (·) es la función de riesgo basal

arbitraria.
En Matemáticas:
h(t|x) = h0 (t) exp{−0.006x},
b
en donde x = (Puntaje) y h0 (·) es la función de riesgo basal arbitraria.

En Matemáticas Aplicadas:
h(t|x) = h0 (t) exp{(−0.008, 0.097)x},

b
en donde x = (Puntaje, Lawson)0 y h0 (·) es la función de riesgo basal arbitraria.

Estos modelos indican que la covariable Puntaje es estadı́sticamente significativa
en las licenciaturas analizadas y que a mayor Puntaje es menor el riesgo de deser-
ción. En el caso de Actuarı́a, otras covariables que con mayor puntuación indican
menor riesgo de deserción son Teórico y Autoestima. Mientras que en Matemáticas
Aplicadas parece que mayor puntuación en Lawson indica mayor riesgo de deser-
ción, quizá esto se debe a la correlación positiva moderada existente entre Puntaje
y Lawson. Estas interpretaciones se resumen en la Tabla 8.5.3.
En la siguiente parte del análisis, para cada licenciatura estudiada se obtiene un
modelo de riesgo proporcional semiparamétrico mediante el procedimiento de regre-
sión paso a paso considerando a las covariables: Puntaje, Autoestima, HabEstudio,
Lawson, THLB, Activo, Reflexivo, Teórico, Pragmático, Género, Vive, FinBach,
TipoBach, MatRep, OpCarrera, SosEst, Trabajo y RecSem. En el análisis de Ac-
tuarı́a no se considera a la covariable OpCarrera ya que en esta licenciatura se llena
el cupo, lo cual no permite que ingresen alumnos que tenı́an como primera opción
otra licenciatura de la BUAP. Los modelos obtenidos se presentan a continuación.
En Actuarı́a:
h(t|x) = h0 (t) exp{(0.535, −0.093, −0.164, −1.071)x},
b
en donde x = (MatRep, Teórico, Lawson, TipoBach)0 y h0 (·) es la función de riesgo

basal arbitraria.
102
En Matemáticas:
h(t|x) = h0 (t) exp{(−0.006, 0.846, 0.717, −0.589)x},
b
en donde x = (Puntaje, Trabajo, OpCarrera, TipoBach)0 y h0 (·) es la función de

riesgo basal arbitraria.
En Matemáticas Aplicadas:
h(t|x) = h0 (t) exp{(−0.007, −0.560, 0.603, 0.095)x},
b
en donde x = (Puntaje, RecSem, FinBach, Lawson)0 y h0 (·) es la función de riesgo

basal arbitraria.
El modelo obtenido para Actuarı́a muestra que mayor puntuación en Teórico in-
dica menor riesgo de deserción, lo cual también ocurre con la puntuación de Lawson.
Se nota que los alumnos que proceden de un bachillerato general (TipoBach=0) tie-
nen mayor riesgo de desertar que los que proceden de un bachillerato especializado
(TipoBach=1). También se observa que a mayor número de materias reprobadas
durante el bachillerato (MatRep) mayor es el riesgo de desertar.
El modelo para la Licenciatura en Matemáticas muestra que mayor Puntaje
indica menor riesgo de deserción. También, los alumnos que proceden de un bachi-
llerato general (TipoBach=0) tienen mayor riesgo de desertar que los que proceden
de un bachillerato especializado (TipoBach=1). En esta licenciatura, los alumnos
que trabajan (Trabajo=1) tienen mayor riesgo de desertar que los alumnos que no
trabajan (Trabajo=0). Además, los alumnos que eligieron estudiar Matemáticas co-
mo primera opción (OpCarrera=0) tienen menor riesgo de desertar que los que la
estudian como segunda opción (OpCarrera=1).
El modelo para Matemáticas Aplicadas señala que mayor Puntaje indica menor
riesgo de deserción y que mayor puntuación en Lawson indica mayor riesgo de
deserción, esto posiblemente se debe a la correlación positiva moderada existente
entre Puntaje y Lawson. Este modelo también revela que los alumnos con más
recursos semanales (RecSem) tienen menor riesgo de desertar y que los alumnos que
proceden de un bachillerato público (FinBach=0) tienen menor riesgo de deserción
que los que proceden de un bachillerato privado (FinBach=1). Estas interpretaciones
se resumen en la Tabla 8.5.4.
Dado que en las licenciaturas en matemáticas (Matemáticas y Matemáticas Apli-
cadas) la covariable Puntaje es indicadora de mayor riesgo de deserción, se realiza
una comparación de las estimaciones de la función de supervivencia y de la fun-
ción de riesgo acumulado para los alumnos con Puntaje mayor o igual a 750 con los
alumnos con Puntaje menor a 750. La Figura 8.2 muestra que los alumnos con Pun-
taje mayor o igual a 750 tienen mayor supervivencia estimada que los alumnos con
Puntaje menor a 750. Además, la Figura 8.3 muestra que los alumnos con Puntaje
mayor o igual a 750 ya no están en riesgo de desertar a partir del quinto semestre
y medio en la LM y a partir del séptimo semestre y medio en la LMA.
103
Tabla 8.5.3 Interpretación del modelo de riesgo proporcional semiparamétrico con

todas las covariables de escala mı́nima de intervalo para cada licenciatura. El Efecto
en h(·) se indica como sigue: del lado izquierdo el efecto en el riesgo de una baja
puntuación de la covariable, mientras que del lado derecho se indica el efecto de
una puntuación alta. El simbolo + significa que el riesgo aumenta mientras que el
simbolo - significa que el riesgo disminuye.
Licenciatura Variables significativas exp(βbi ) Efecto en h(·)
Estilo de aprendizaje Teórico (Teórico) 0.888 + -
Actuarı́a Puntaje de ingreso (Puntaje) 0.994 + -
Autoestima (Autoestima) 0.967 + -
Matemáticas Puntaje de ingreso (Puntaje) 0.994 + -
Matemáticas Puntaje de ingreso (Puntaje) 0.993 + -
Aplicadas Razonamiento cientı́fico (Lawson) 1.102 - +
Tabla 8.5.4 Interpretación del modelo de riesgo proporcional semiparamétrico con

todas las covariables para cada licenciatura. El Efecto en h(·) se indica como sigue:
del lado izquierdo el efecto en el riesgo de una baja puntuación de la covariable,
mientras que del lado derecho se indica el efecto de una puntuación alta. El simbolo
+ significa que el riesgo aumenta mientras que el simbolo - significa que el riesgo
disminuye.
Licenciatura Variables significativas exp(βbi ) Efecto en h(·)
Materias reprobadas (MatRep) 1.707 - +
Estilo de aprendizaje Teórico (Teórico) 0.912 + -
Actuarı́a
Razonamiento cientı́fico (Lawson) 0.849 + -
Tipo de bachillerato (TipoBach) 0.343 + -
Puntaje de ingreso (Puntaje) 0.994 + -
Trabajo (Trabajo) 2.331 - +
Matemáticas
Opción de carrera (OpCarrera) 2.048 - +
Tipo de bachillerato (TipoBach) 0.555 + -
Puntaje de ingreso (Puntaje) 0.993 + -
Matemáticas Recursos semanales (RecSem) 0.571 + -
Aplicadas Financiamiento del bachillerato (FinBach) 1.827 - +
Razonamiento cientı́fico (Lawson) 1.100 - +
8.5.4. Resultados del análisis

Para cada licenciatura estudiada se obtienen dos modelos de riesgo proporcional
semiparamétricos, uno considerando sólo covariables de escala mı́nima de intervalo y
Figura 8.2: Comparación de las estimaciones de la función de supervivencia por Pun-

taje (con banda de confianza de 95 %) de la LM y la LMA, utilizando el estimador
de Kaplan-Meier.
104
el otro considerando a todas las covariables. Estos modelos sólo contienen covariables
estadı́sticamente significativas y muestran que valores en las covariables indican
mayor riesgo de deserción.
Los modelos obtenidos cuando sólo se consideran a las covariables de escala
mı́nima de intervalo muestran que el Puntaje es una covariable significativa en las
licenciaturas estudiadas y que mayor Puntaje indica menor riesgo de deserción. En
la Licenciatura en Actuarı́a otras covariables que tienen la misma interpretación
son Teórico y Autoestima.
Los modelos resultantes cuando se consideran a todas las covariables incluyen
al menos una covariable académica (Teórico, Lawson o Puntaje) y una covariable
que tiene que ver con las caracterı́sticas del bachillerato de procedencia (TipoBach
o FinBach). Esto significa que el bachillerato de procedencia influye en el riesgo de
deserción de los alumnos de las licenciaturas estudiadas.
Sólo en las licenciaturas de matemáticas (Matemáticas y Matemáticas Apli-
cadas), los modelos contienen una covariable que tiene que ver con la economı́a
(Trabajo o RecSem). Lo cual se puede deber a la diferencia económica existente
entre los alumnos de estas carreras y los de Actuarı́a.
Los modelos muestran que el número de materias reprobadas en el bachillerato
(MatRep) sólo aumenta el riesgo de deserción de los estudiantes de Actuarı́a. Mien-
tras que el hecho de estar estudiando la carrera como segunda opción (OpCarrera)
sólo aumenta el riesgo de los estudiantes de Matemáticas.
La comparación por Puntaje muestra que en las licenciaturas en matemáticas
(Matemáticas y Matemáticas Aplicadas) los alumnos con Puntaje mayor o igual a
750 tienen mayor supervivencia estimada que los alumnos con Puntaje menor a 750.
A pesar de que los modelos obtenidos varı́an, se puede decir que en las licen-
ciaturas estudiadas el Puntaje de ingreso a la universidad es un factor que tiene
gran influencia en la deserción. Además, el bachillerato de procedencia también in-
fluye en la deserción. También, caracterı́sticas respecto a la economı́a sólo afectan
a los estudiantes de las licenciaturas de matemáticas (Matemáticas y Matemáticas
Aplicadas).
Figura 8.3: Comparación de las estimaciones de la función de riesgo acumulado

por Puntaje (con banda de confianza de 95 %) de la LM y la LMA, utilizando el
estimador de Kaplan-Meier.
105
8.6. Conclusiones
El Análisis de Supervivencia consiste en un conjunto de técnicas que estudian
el tiempo hasta que ocurre un evento especı́fico. Su metodologı́a es muy extensa
ya que incluye una gran variedad de modelos (paramétricos, no paramétricos y se-
miparamétricos), además algunos modelos permiten incluir variables explicativas o
covariables para evaluar la relación existente entre el tiempo de falla y las covaria-
bles. Los diferentes modelos de supervivencia, con o sin covariables, se pueden usar
para estudiar diferentes datos, incluso cuando se tienen individuos de los que no se
conoce el tiempo de falla exacto (censurados).
La flexibilidad del Análisis de Supervivencia permite aplicarlo en una gran va-
riedad de estudios. En este trabajo se aplica esta metodologı́a en un estudio de la
deserción de las licenciaturas de la Facultad de Ciencias Fı́sico Matemáticas (FCFM)
de la Benemérita Universidad Autónoma de Puebla (BUAP).
Para las licenciaturas en Actuarı́a, Matemáticas y Matemáticas Aplicadas el
análisis de deserción con covariables proporciona modelos de riesgo proporcional
semiparamétricos. Estos modelos muestran que mayor puntaje de ingreso a la uni-
versidad (Puntaje) indica menor riesgo de desertar. Además, al considerar todas
las covariables estudiadas los modelos resultantes muestran que la puntuación alta
de una covariable académica (en Actuarı́a: Teórico o Lawson; en Matemáticas y
Matemáticas Aplicadas: Puntaje) indica menor riesgo de desertar, que las carac-
terı́sticas del bachillerato de procedencia influyen en el riesgo de deserción y que
sólo los modelos correspondientes a las licenciaturas de matemáticas (Matemáti-
cas y Matemáticas Aplicadas) indican que una covariable de economı́a (Trabajo o
RecSem) esta relacionada con el riesgo de deserción.
106
Bibliografı́a
[1] Cox, D. R.; Oakes, D. Analysis of Survival Data. 1a ed., Gran Bretaña,
Chapman & Hall, 1984.
[2] “Historia Universitaria”. BUAP. http://www. buap. mx/. Consultado: 14 de
abril de 2017.
[3] Lawless, J. F. Statistical Models and Methods for Lifetime Data. 2a ed., Nueva
Jersey, Wiley-Interscience, 2003.
[4] Montes Gutiérrez, I. C.; Almonacid Hurtado, P. Ma.; Gómez Car-
dona, S.; Zuluaga Dı́az, Fco. I.; Tamayo Zea, E. Análisis de la deserción
estudiantil en los programa de pregrado de la Universidad EAFIT. Grupo de
investigación estudios en economı́a y empresa, Departamento de Economı́a, Es-
cuela de Administración, Universidad EAFIT. Medellı́n. ISSN 1692-0694, 2010.
[5] Muñoz Vargas, B. X. Análisis de la deserción en las licenciaturas de la
FCFM-BUAP mediante modelos de supervivencia. Tesis de maestrı́a. Facultad
de Ciencias Fı́sico Matemáticas, Benemérita Universidad Autónoma de Puebla,
2017.
[6] Navidi, W.Estadı́stica para ingenieros y cientı́ficos. Mc Graw Hill, 556-599,
2006.
107
Capı́tulo 9
Modelación estadı́stica con imágenes satelitales en Ciencias Ambientales
Ana Aleyda Oroza Hernández1 , Gladys Linares Fleites2

Hortensia Josefina Reyes Cervantes1 , Marı́a de L. Sandoval Solı́s3
1
2
Departamento de Investigación en Ciencias Agrı́colas,
3
Facultad de Ciencias de la Computación,
aleyda16188@hotmail.com, gladyslinares1@yahoo.com
hreyes@fcfm.buap.mx, malosa1753@gmail.com
Resumen. Actualmente la modelación medio ambiental puede considerarse un
campo maduro con muchos artı́culos presentados en un amplio espectro de pro-
blemas ambientales y distintos estudios de caso que cubren diferentes modelos. El
desarrollo de la teledetección o percepción remota ha incrementado aún más las
posibilidades de la modelación estadı́stica en este campo. En el presente capı́tulo se
describe brevemente, a través de dos estudios de caso, la manera en que los modelos
de regresión lineales de efectos- fijos y mixtos son construidos y aplicados a los pro-
blemas del medio ambiente. Un caso se refiere a la modelación de escenarios de las
coberturas y usos de suelo a través de imágenes satelitales en el sureste de la Presa
de Valsequillo, Puebla. El otro caso enfoca la modelación del secuestro de carbono
por suelos forestales en la Región Terrestre Prioritaria 105, Puebla, para mostrar
cómo integrar las herramientas estadı́sticas con otros enfoques y estrategias, como
son las imágenes satelitales y los modelos mixtos, que combinados contribuyen a
una mejor explicación del fenómeno que se estudia, debido a que se pueden incluir
efectos fijos y efectos aleatorios. El software R es utilizado para la estimación, ajuste
y selección de los modelos elaborados.
Palabras claves: Regresión Lineal y polinomial, Modelos mixtos, ı́ndices de vegeta-
ción.
Abstract.The development of remote sensing has further increased the possibilities

of statistical modeling in this field. In this chapter we briefly describe, through two
case studies, the way in which models are constructed and applied to environmen-
tal problems. One case refers to the modeling of land cover and land use scenarios
through satellite images in the southeast of the Valsequillo Dam, Puebla. The other
case focuses on the modeling of carbon sequestration by forest land in the Priority
Land Area 105, Puebla, to show how to integrate statistical tools with other ap-
proaches and strategies, such as satellite images and mixed models, which combined
contribute to a better explanation of the said phenomenon. The software R is used
108
for the estimation, adjustment and selection of the elaborated models.
Keywords: Linear and polynomial regression, mixed models, vegetation indexes.
9.1. Introducción
El uso de los modelos se ha incrementado en el manejo medioambiental, debido
a que ellos son la única herramienta que permite relacionar cuantitativamente el
impacto en un ecosistema con las consecuencias para el estado del ecosistema [13].
El campo de la modelación medio ambiental se ha desarrollado enormemente desde
que emergieron los primeros modelos en 1970, no sólo debido al desarrollo de la tec-
nologı́a computacional sino también al desarrollo de la teledetección o percepción
remota.
En dependencia del nivel de complejidad, los modelos estadı́sticos de imágenes

pueden tratar con modelos lineales o con modelos lineales generalizados de efectos
mixtos o con modelos no lineales de efectos mixtos. El objetivo que se persigue en el
presente capı́tulo es describir la manera en la que los esfuerzos de la modelación me-
dioambiental han contribuido a esclarecer complejos problemas. Se presentan dos
aplicaciones de la modelación medioambiental. La primera aplicación tiene como
objetivo modelar tres Factores de cobertura de suelo, para conocer cuánto protege
la vegetación la erosión del suelo en la presa de Valsequillo, Puebla. La segunda apli-
cación modela la cantidad de carbono orgánico para una zona terrestre prioritaria
en Puebla.
9.2. Teledetección
La teledetección es una técnica que nos permite obtener información a distancia
de objetos que se encuentran situados sobre la superficie terrestre. El fenómeno de
la Teledetección es posible gracias a la interacción de la energı́a electromagnéti-
ca con las cubiertas terrestres. Estas tienen un comportamiento reactivo variable,
condicionado tanto por los factores externos (ambientales) como por sus propias
caracterı́sticas fisicoquı́micas en el momento de la toma de la imagen.
La primera experiencia de teledetección se retoma en 1859, donde Gaspar Félix de
Tournachon obtuvo las primeras fotografı́as aéreas desde un globo, después se hizo
uso del avión hasta llegar en 1960 al uso de los satélites. Actualmente son numerosos
los centros de producción, enseñanza e investigación que trabajan activamente en
este campo con el uso de satélites (Teledetección espacial).
Para obtener información mediante teledetección espacial es importante que los
objetos y el sensor tengan algún tipo de interacción. Para que la observación sea
posible, se necesitan los siguientes elementos:
Sensor: Instrumentos de grabación, instrumentos de escaneo, aviones, satélites,
boyas o barcos.
Objeto observado: arboles, suelos, etc.
Flujo energético que permite poner a ambos en relación.
109
Dentro de la teledetección, se destacan las siguientes bandas espectrales, donde

su unidad de medida es el Amgstroms(µm);
1. Espectro visible (.4 a .7 µm): Es la radiación que puede percibir nuestros
ojos, coincide con las longitudes de onda en donde es máxima la radiación
solar.
2. Infrarrojo cercano (.7 a 1.3 µm): Resulta importante por su capacidad para
discriminar masas vegetales y concentraciones de humedad.
3. Infrarrojo medio (1.3 a 8 µm): En esta banda se mezclan los procesos de
reflexión de la luz solar y de emisión de la superficie terrestre.
4. Infrarrojo lejano o térmico (8 a 14 µm).
5. Micro-ondas (a partir de 1 metro): Tipo de energı́a bastante transparente

a la cubierta nubosa.
La constelación de satélites LANDSAT (LAND=tierra y SAT=satélite), que
inicialmente se llamaron ERTS (por sus siglas en inglés, Earth Resources Technology
Satellites), fue la primera misión de los Estados Unidos para el monitoreo de los
recursos terrestres, el primer satélite se puso en órbita el 23 de julio de 1972.
9.2.1. Índices de Vegetación

Se han desarrollado muchos ı́ndices de vegetación basados en el hecho de que
las plantas reflejan menos en luz roja visible, pero más en la radiación infrarroja
cercana en comparación con la superficie sin vegetación [3] y [9].
Por lo tanto, los ı́ndices de vegetación pueden mejorar o extraer algunas carac-
terı́sticas especı́ficas que las bandas espectrales individuales no pueden. Los ı́ndices
de vegetación que más se utilizan son: el ı́ndice de vegetación de diferencia nor-
malizada (NDVI), el ı́ndice de vegetación ajustado al suelo (SAVI), el ı́ndice de
vegetación de diferencia renormalizado (RDVI), el NDVI transformado (TNDVI),
ı́ndice de vegetación simple (SVI) y la proporción simple (RVI).
El NDVI mide la cantidad de vegetación verde, tomando un cociente de las dife-
rencias de reflectancia espectral entre infrarrojo cercano (NIR) y rojo (RED) para
calcularlo, se ha utilizado ampliamente en estudios de teledetección cuyo rango de
valores es de −1.0 a 1.0, donde los valores más altos son para vegetación verde y
los valores bajos para otro tipo de superficie. Ası́, el suelo desnudo o rocas se repre-
sentan con valores de NDVI más cercanos a 0 y los valores negativos corresponden
principalmente a las nubes, el agua y la nieve.
La fórmula para calcular el NDVI queda de la siguiente forma:
(N IR − RED)
N DV I = . (9.1)
(N IR + RED)
9.2.2. Índice de Vegetación Relativo (FVC)

El Índice de Vegetación Relativo (en inglés “Fractional Vegetation Cover”) es la
estimación del porcentaje de vegetación [2]; se basa en el supuesto de que el NDVI
110
de la vegetación se distribuye gradualmente entre el NDVI del suelo desnudo y el

NDVI de la vegetación totalmente verde. Para calcular el FVC se utiliza la ecuación:
N DV I − N DV Isd
FV C = ∗ 100. (9.2)
(N DV IV V − N DV Isd )2
donde N DV Isd es el NDVI del suelo desnudo y N DV IV V es el NDVI del pixel con
la mayor cobertura de vegetación verde en el área.
9.3. Modelos estadı́sticos

El modelo de regresión para estos métodos puede escribirse como:
y = Xβ + . (9.3)
donde:
y es un vector n × 1 de observaciones de la variable dependiente.
X es una matriz n × p que consiste de n observaciones de las p variables,
β es un vector p × 1 de coeficientes de la regresión (parámetros desconocidos), y
es un vector n×1 de errores independientes e idénticamente distribuidos con media
cero y varianza σ 2 .
El modelo lineal de efectos mixtos (LMM) es una poderosa herramienta de mo-
delado que permite el análisis de conjuntos de datos correlacionados (clúster) [6]. El
LMM fue presentado originalmente por Laird y Ware, donde presentaron diferentes
aplicaciones en el estudio epidemiológico con datos longitudinales [15], la denomi-
nación de “efectos mixtos” se asigna para tener efectos tanto fijos como aleatorios.
Actualmente se usan para modelar datos de muchos campos en diferentes áreas,
como biologı́a, bioestadı́stica, ciencias sociales, salud y medicina [4, 6] y, particular-
mente, en el medio ambiente.
La formulación corresponde a la propuesta en el artı́culo clásico de Laird y Ware

en [15], en forma matricial el modelo queda expresado como:
yi = Xi β + Zi bi + εi (9.4)
bi ∼ Nq (0, ψ)
εi ∼ Nni (0, σ 2 Λi )
donde
yi es el vector de respuesta ni × 1 para observaciones en el grupo i-ésimo.
Xi es la matriz del modelo ni × p para los efectos fijos y las observaciones en el
grupo i.
β es el vector p × 1 de los coeficientes de efectos fijos.
Zi es la matriz del modelo ni × q para los efectos aleatorios para las observaciones
en el grupo i.
bi es el vector q × 1 de los coeficientes de efecto aleatorio para el grupo i.
εi es el vector de errores ni × 1 para las observaciones en el grupo i.
111
ψ es la matriz de covarianza q × q para los efectos aleatorios.

σ 2 Λi es la matriz de covarianza ni × ni para los errores en el grupo i.
Los errores residuales εi para el mismo grupo son independientes de los efectos
aleatorios bi .
9.4. Dos Casos de Estudio

9.4.1. Análisis de la cobertura edáfica en el sureste de la
Presa Valsequillo, Puebla.
El uso y manejo no sostenible de la tierra está llevando a una mayor degradación
del suelo y la pérdida de un recurso clave que es fundamental para la vida en el
planeta [12]. En el Plan Estratégico Decenal 2008-2018 aprobado en 2007 por la 8va
Conferencia de las Partes de la Convención de las Naciones Unidas de Lucha contra
la Desertificación, se estableció el objetivo de proteger los suelos contra la erosión
y la contaminación. En México, en el Programa Nacional Manejo Sustentable de
Tierras a favor de un manejo y uso sostenible, publicado en 2008, se señaló que la
erosión y el declive de la fertilidad del suelo afectan a la viabilidad de los terrenos
agrı́colas.
Desde hace décadas, en la región sur de la presa de Valsequillo, el manejo de los re-
cursos naturales se ha llevado de manera inadecuada provocando la degradación del
suelo y la pérdida de la vegetación. La escasa investigación en los diferentes ecosiste-
mas, el empleo de las tecnologı́as de explotación sin tener en cuenta las condiciones
del entorno y el desconocimiento de los principios fı́sicos, quı́micos y biológicos que
determinan la continuidad de los sistemas de producción, son los principales factores
que han afectado gravemente la estabilidad de los sistemas naturales en la Región
Sur de la Presa de Valsequillo. La Figura 9.1 muestra la localización de esta zona.
La zona de estudio corresponde a la parte norte del municipio de Tzicatlacoyan
donde se sitúan las localidades San Miguel Acuexcomac, San Bernardino Tepenene,
San José Texaluca y San Martı́n los Teteles (para más detalles ver [16]).
Identificar mediante imágenes de satélite las afectaciones de la cobertura edáfica de
esta zona es importante para la posterior toma de decisiones en el manejo de estos
suelos y es el objetivo que se persigue en este estudio.
Factores de manejo de cobertura de suelo.

A continuación, se resumen algunos de los indicadores que se utilizan para estos
estudios y que constituyen factores a tener en cuenta en el manejo de la cobertura
del suelo.
Los valores de este factor se calculan tomando el logaritmo del porcentaje de

FVC usando la función de regresión
C F V C = 0.6508 − 0.343 log(F V C). (9.5)
Es uno de los factores de la Ecuación Universal de Pérdida de Suelo, (USLE,

por sus siglas en inglés). Este factor refleja el efecto de las prácticas de cultivo
112
Figura 9.1: Localización de la zona de estudio. Fuente: Pacheco Rı́os, A., 2018.
y manejo sobre las tasas de erosión. Sus valores indican cuánto protege la
vegetación la erosión del suelo [19]. El factor C USLE corresponde a la pérdida
de suelo bajo condiciones especı́ficas de cultivo, en relación con la que ocurre
en un suelo desnudo. Toma valores de 0 (cubierta vegetal alto) a 1 (suelo
desnudo). Esto puede ser representado como
Acrop
C U SLE = ∗ 100. (9.6)
Af allow
Este factor refleja el efecto de las prácticas de cultivo y manejo sobre las tasas
de erosión. Los valores de C USLE indican cuánto protege de la erosión la
vegetación del suelo.
El factor C exp puede estimarse aplicando la relación utilizada por Van der
Knijff en [14]:
N DV I)
C exp = exp(−α ∗ ). (9.7)
(β − N DV I)
Se considera como un factor de gestión de cobertura de cultivo calculado. En
[14] se sugiere que al aplicar esta relación, se obtienen mejores resultados que
usando una relación lineal.
Obtención de la imagen satelital y análisis exploratorio de la tabla de

datos
La imagen de satélite fue obtenida del Servicio Geológico de los Estados Unidos
(USGS, por sus siglas en inglés) y corresponde al año 2015. Dicha imagen se obtuvo
sin cobertura de nubes en la temporada de sequı́a, lo que permitió reducir el efecto
espectral de la vegetación y de los cultivos en el procesamiento de la imagen. El
113
análisis e integración de la información se realizó con el Sistema de Información

Geográfica de uso libre Quantum GIS[18]. Con la información obtenida se elaboró
una tabla de 34552 filas (puntos georeferenciados) y 5 columnas con las variables
cuantitativas NDVI, FVC, C FVC, C USLE y C exp, realizándose el análisis ex-
ploratorio de los datos. Se detectaron 5 puntos aberrantes o “outliers” que fueron
eliminados, dado que el análisis gráfico realizado y la gran cantidad de datos dispo-
nibles indicaron que no se afectarı́a la modelación estadı́stica posterior. La matriz
de correlaciones, que se muestra en la Tabla 9.1, indica que las variables NDVI,
FVC, C FVC y C exp se encuentra altamente correlacionadas entre ellas, por lo
cual es importante considerar su relación para la construcción de modelos.
Tabla 9.1: Correlación entre las variables.

FVC C FVC C USLE C exp
NDVI 0.98 -0.97 -0.32 -0.96
FVC -0.93 -0.32 -0.90
C FVC 0.30 0.99
C USLE 0.29
C exp
Modelos de regresión
Se ajustaron tres modelos lineales, uno para cada variable FVC, C FVC y C exp,
tomadas como variables dependientes y como variable independiente el NDVI. Sus
estimaciones fueron ajustadas usando la función lm() del software R. Las estima-
ciones de intercepto y pendientes de cada modelo se muestran en la Tabla 9.2.
Tabla 9.2: Estimaciones de los parámetros en cada modelo lineal.

MODELO Estimate Pr(>|t|)
Modelo 1 (Intercept) -20.2621 0.0000
FVC NDVI 95.7324 0.0000
Modelo 2 (Intercept) 0.5324 0.0000
C FVC NDVI -0.6875 0.0000
Modelo 3 (Intercept) 0.7403 0.0000
C exp NDVI -1.1064 0.0000
A pesar de que las estimaciones para cada modelo, tanto del intercepto como de
la pendiente, son significativas, una parte importante dentro de la modelación que
no debe ser olvidado, es la validez de los supuestos del modelo, para ello hicimos uso
de los gráficos de residuales que proporciona el comando plot() en el software R. Los
gráficos de valores ajustados y residuales mostraron un comportamiento particular
que sugirieron el uso de otro tipo de modelo, por ejemplo, un modelo polinomial
para ajustar los datos.
Las estimaciones de cada modelo usando modelos polinomiales se muestran en
la Tabla 9.3. Estas estimaciones son de igual forma significativas, con excepción de
la pendiente del modelo 1 no lineal, por lo cual sólo se realiza el ajuste del modelo
sin intercepto para el primer modelo polinomial. El ajuste y las predicciones dentro
114
de cada modelo se muestran en los gráficos correspondientes en las Figuras 9.5, 9.6
y 9.7.
Las estimaciones de los parámetros de los modelos no lineales son significativas y
también poseen un buen ajuste ya que el coeficiente de determinación R2 es igual
0.98.
La Figuras de los residuos que se muestran en 9.2, 9.3 y 9.4 son usados para el
ajuste de modelos lineales, para verificar los supuestos de linealidad, normalidad y
homogeneidad de varianzas, que no todos se consideran dentro de los modelos no
lineales. Un modelo lineal adecuado muestra gráficas de residuos con valores ajusta-
dos distribuidos de manera homogénea sobre un intervalo, mientras que el supuesto
de normalidad y linealidad se verifica con el gráfico de residuales estandarizados
y cuantiles teóricos, en caso de cumplir el supuesto de normalidad los datos estos
deben estar muy cercanos a la recta de dicho gráfico. Finalmente, estas ecuaciones
que se estimaron se puede calcular la cantidad de cobertura vegetal, en función
del ı́ndice de vegetación NDVI que es obtenido por medio de la imagen de satélite
considerada.
Tabla 9.3: Estimaciones de los parámetros en cada modelo no lineal.

MODELOS Estimate Pr(>|t|)
Modelo 1. (Intercept) 0.0000 0.5800
FVC NDVI -0.0000 0.2917
I(NDVI^2) 100.0000 0.0000
C FVC NDVI -2.4437965 0.0000
I(NDVI^2) 3.0196644 0.0000
I(NDVI^3) -1.5291057 0.0000
C exp NDVI -2.8568 0.0000
I(NDVI^2) 1.8285 0.0000
Finalmente los modelos estimados quedan de la siguiente forma:
F CV = 100 ∗ N DV I 2 + ε (9.8)
C F CV = .82 − 2.44 ∗ N DV I + 3.01 ∗ N DV I 2 − 1.52 ∗ N DV I 3 + ε (9.9)
C exp = 1.1 − 2.8 ∗ N DV I + 1.8 ∗ N DV I 2 + ε (9.10)
115
Figura 9.2: Gráfico del modelo ajustado: Modelo 1.
9.4.2. Secuestro de carbono en la RTP 105

Se presenta la localización de la Región Terrestre Prioritaria 105 (RPT 105)
que se ubica en las coordenadas extremas: 190 460 2300 y 200 110 5500 de latitud norte
y 970 090 1700 a 970 380 3600 de longitud oeste y está conformada por 28 municipios de
los que 4 pertenecen al estado de Veracruz y 24 en la Sierra Norte de Puebla. La
Figura 9.6 muestra en color rojo la localización de la zona de estudio.
116
Figura 9.5: Localización de la Región Terrestre Prioritaria 105.
Figura 9.6: Imagen satelital de la zona de estudio.
Para el estudio del secuestro de carbono en suelos en la RTP-105, se buscaron

imágenes con sensor ETM+ y TM. Las muestras de suelo (propiedades fı́sico y
quı́micas del suelo) habı́an sido tomadas en el año 2005, por lo que era de interés
tomar imágenes de ese año y el satélite que se encontraba en órbita correspondı́a
al satélite Landsat 7. Se descargaron las imágenes del satélite Landsat 7 (2 de
noviembre de 2005), que se obtuvo a través de USGS (Earth Resource Observation
Systems Data Center). Se consideraron también las condiciones atmosféricas para
que la información no se viera afectada por las condiciones climáticas.
Ya obtenidas las imágenes de satélite que corresponden a la banda 3 y 4 del satélite
Landsat 7, se hizo uso del software GIS (Geographic Information System), para
poder obtener el ı́ndice de vegetación NDVI.
Se utilizó la metodologı́a de Zuur que está enfocada a obtener el mejor modelo
mixto, basado en los criterios de selección de modelos AIC y BIC. El procedimiento
fue el siguiente:
PASO 1 Ajustar un modelo donde la componente fija contenga todas las variables
explicativas e interacciones posibles. Dentro de las variables de la zona RTP-
105, se realizó una selección de variables que aportan más información al
modelo. Los distintos modelos de regresión se realizaron usando la función
117
lm() del software R, llegando a que el mejor modelo de efectos fijos es el que
se muestra en la tabla 9.4.
Tabla 9.4: Estimaciones del modelo modelo1.lm.

Estimate Std. Error t value Pr( > | t|)
Ntot 3.9109 0.3168 12.35 1.25e-11 ***
Tomando como base el modelo anterior, se introduce la variable NDVI mos-

trando sus estimaciones en la Tabla 9.5.
Tabla 9.5: Estimaciones del modelo modelo2.lm.

Estimate Std. Error t value Pr( >| t|)
Ntot 9.545 1.950 4.894 6.81e-05 ***
NDVI 5.382 2.204 2.442 0.0231 *
PASO 2 Teniendo como base el mejor modelo con las componentes fijas, ahora
continuamos con el segundo paso de la metodologı́a de Zuur, sin embargo, en
este estudio sólo se requiere ver las variaciones en F V (formación vegetal),
como variable aleatoria que queremos introducir dentro del modelo, por lo
cual el modelo en este paso de la metodologı́a de de Zuur, para el caso de la
Zona RTP-105 queda como: parte fija las variables del modelo modelo2.lm y
parte aleatoria F V.
PASO 3 Se busca la estructura óptima de la componente fija del modelo. Para
ello podemos utilizar el estadı́stico F o el estadı́stico t obtenido mediante el
estimador REML con la función lme() o comparar modelos anidados. Para
comparar modelos que tienen la misma estructura en la componente aleato-
ria, pero difieren en la componente fija se debe de utilizar un estimador LM
y no un estimador de REML.
Se construyen distintos modelos, donde se varı́a la componente aleatoria, intro-
duciéndola como una intercepto, pendiente, que afecta a los distintos modelos,
para buscar la mejor estructura de modelo con componente fija y componente
aleatoria.
Para realizar los distintos modelos mixtos, en este trabajo se usan la librerı́a
library(lme4), library(Matrix), library(Rcpp)y library(nlme). Estas librerı́as,
contienen distintas funciones que nos ayudan a poder estimar los efectos de las
variables fijas y aleatorias en modelos mixtos. Los siguientes modelos mixtos
contienen la misma componente aleatoria, pero buscando la mejor componen-
te fija. Para seleccionar el mejor modelo en esta parte, usamos los criterios de
selección de modelos AIC y BIC.
En la Tabla 9.6, se observan los criterios de selección de modelos para selec-

cionar el mejor modelo. El modelo mixed.model1 es seleccionado por tener
los valores más pequeños de los criterios, con un valor de AIC = 38.34 y
BIC = 42.70463.
118
Tabla 9.6: Criterios de selección de modelos.

df AIC BIC
mixed.model1 4.00 38.34 42.70463
mixed.model2 3.00 50.49 53.89353
mixed.model3 2.00 55.51 57.86206
PASO 4 Finalmente el último paso consiste en presentar el modelo final utilizando

un estimador REML y analizar las suposiciones establecidas en el mismo.
Modelo lineal Mixto seleccionado

mixed.model1<- lme(log(Corg)~-1+Ntot+NDVI, random = ~1| F_V)
Como parte final de la metodologı́a de Zuur se muestra la salida completa de

las estimaciones del modelo, usando el metodo REML.
Linear mixed model fit by REML t-tests use Satterthwaite

approximations to degrees of
freedom [lmerMod]
Formula: log(Corg) ~ -1 + Ntot + NDVI + (1 | F_V)
Random effects:
Groups Name Variance Std.Dev.
F_V (Intercept) 0.1654 0.4067
Residual 0.1528 0.3909
Number of obs: 24, groups: F_V, 6
Fixed effects:
Estimate Std. Error df t value Pr(>|t|)
Ntot 1.9082 0.4780 21.7410 3.992 0.000627 ***
NDVI 2.2151 0.5194 21.9890 4.264 0.000317 ***
Correlation of Fixed Effects:

Ntot
NDVI -0.569
Con los siguientes comandos en R, realizamos los gráficos, para analizar las
suposiciones del modelo mixed.model1.
Res <- residuals(mixed.model1, type="normalized")

Fit <- fitted(mixed.model1)
par(mfrow=c(2,2))
plot(Res ~ Fit, xlab="Fitted values", ylab="Residuals",
main="Residuals vs. fitted")
abline(h=0)
plot(Res ~ datos\$F_V, xlab="FORMACI\’ON VEGETAL", ylab="Residuals",
main = "FORMACI\’ON VEGETAL")
abline(h=0)
119
hist(Res, main="Histogram of residuals", xlab="Residuals")

qqnorm(Res)
qqline(Res)
Figura 9.7: Suposiciones del modelo mixed.model1.
La forma del modelo mixto ajustado, se muestra a continuación:

log(Corgij ) = β1 ∗ N totij + β2 ∗ N DV Iij + aj + ij . (9.11)
El ı́ndice j(representa a las distintas Formaciones vegetales F V ) toma valores
de 1 a 6, e i (representa las muestras dentro de cada formación vegetal).
La parte de los resultados que se refiere a los efectos aleatorios nos muestra que
la varianza residual es σ 2 = .392 y la varianza de la constante σa2 = .402 . Para la
parte de los efectos fijos del modelo, β1 ∗ N tot + β2 ∗ N DV Iij , la constante se
estima con el valor β1 = 1.90 y la segunda en β2 = 2.21. Ambos parámetros son
significativamente distintos de 0. Un observación importante es sobre la correlación
entre las constantes es de −.50.
El Ntot y NDVI tienen efecto significativo sobre el logaritmo del carbono orgáni-
co, obervando en la salida del software R que hay en promedio más cantidad de
Carbono orgánico por el ı́ndice de vegetación, mientras que el Ntot hay ligeramente
menos. El modelo es bastante adecuado y se cumplen los supuestos (Figura 9.7).
9.5. Conclusiones
En los dos casos de estudios, donde el NDVI que se obtiene por medio de imáge-
nes de satélite resultó ser significativo en ambos modelos, es decir permite predecir
120
los ı́ndicadores de suelo y/o la cantidad de carbono orgánico dependiendo el caso de

estudio. En el primer caso se determinaron los modelos 9.8, 9.9, 9.10 de regresión
polinómicos que mejoraron ajuste de los modelos, debido a que los datos tienen
comportamientos curvilı́neos. En el segundo caso los modelos lineales mixtos resul-
taron ser mejores para ajustar y estimar la cantidad de carbono orgánico dentro de
la zona RTP-105, el modelo final de este caso corresponde a la fórmula 9.11.
Existe reconocimiento internacional del papel de la modelación estadı́stica en la
investigación medioambiental, la cuantificación de la incertidumbre presente en los
problemas ambientales es uno de los retos actuales de la Ciencia Estadı́stica, que
junto al desarrollo de la Teledetección y la Ciencia de la Computación, se enfocan
a brindar mejores explicaciones a tan complejos problemas, no viéndolos como un
fin meramente técnico, sino como un medio necesario para mejorar las condiciones
de vida de millones de personas.
121
Bibliografı́a
[1] Arriaga, L., J.M. Espinoza, C. Aguilar, E. Martı́nez, L. Gómez y

E. Loa (coordinadores). Regiones terrestres prioritarias de México. Escala
de trabajo 1:1 000 000. Comisión Nacional para el Conocimiento y uso de la
Biodiversidad. México, 2000.
[2] Boettinger, J. L., Ramsey, R.D. , Bodily, J.M., Cole, N.J., Kienast-
Brown, S., Nield, S.J., Saunders, A.M., and Stum, A.K. Landsat
Spectral Data for Digital Soil Mapping. In Digital Soil Mapping with Limited
Data, A.E. 2008.
[3] A. Bannari and D. Morin F. Bonn A. R. Huete . A review of vegetation
indices, Remote Sensing Reviews. Vol.(13), p. (95-120), Taylor & Francis,
1995.
[4] Demidenko, E.. Mixed models. Theory and applications with R. 2nd edition.
Wiley, New York, USA, 2013
[5] Dı́az G. y Cervigón, J. J. Estudio de ı́ndices de vegetación a partir de
imágenes aéreas tomadas desde UASRPAS y aplicaciones de estos a la agri-
cultura de precisión , 2015.
[6] Galecki A. and Burzykowski T.Linear mixed-effects models using R. A
step by step approach. 1st edition. Springer, New York, p.(542), 2013.
[7] Ieno N. E., Saveliev A. A., Smith M. G., Walker J. N. and Zuur
F. A Mixed Effects Models and Extensions in Ecology with R. Springer, 2009.
[8] Instituto Nacional de Estadı́stica y Geografı́a (INEGI),
Marco Geoestadı́stico Nacional, México. Disponible.
http://www.beta.inegi.org.mx/app/biblioteca/ficha, 2017.
[9] Jensen, J.R. Remote Sensing of the Environment: An Earth Resource Pers-
pective. Pearson Prentice Hall, New Jersey, 2000.
[10] Jensen, J.R. Introductory Digital Image Processing: A Remote Sensing
Perspective. Pearson Prentice Hall, New Jersey, 2005.
[11] John, R., Jensen y Dr. Kalmesh Lulla, Introductory digital ima-
ge processing: A remote sensing perspective, Geocarto International. Vol.(2),
p.(65-65), 1987.
122
[12] Jones, A. P., Panagos, S.,Barcelo, F., Bouraoui, C.,Bosco, O. De-

witte, C., Gardi, The State of Soil in Europe. Joint Research Centre Refe-
rence Report. Publications Office of the European Union Luxembourg, p.(45),
2012.
[13] Jorgensen, S.E. . Environmental Models and Simulations. In Environmen-
tal Systems. [Ed. Achim Sydow], in Encylopedia of Life Support Systems
(EOLSS), Developed under the Auspices of the UNESCO, Eolss Publishers,
Oxford, UK, http://www.eolss.net, 2004.
[14] van der Knijff J. M. , Jones R. J. A., Montanarella L., Soil Erosion
Risk Assessment in Europe, 2000.
[15] Nan M. Laird and James H. Ware, Random-Effects Models for Longitu-
dinal Data, Biometrics , p.(963–974), Wiley, International Biometric Society,
Vol.(38), 1982.
[16] Pacheco R. A. . Cambio espacio temporal de la cobertura edáfica en el sur-
este de la Presa Valsequillo, Puebla. Causas y efectos. Tesis de Maestrı́a en
Ciencias Ambientales. Posgrado en Ciencias Ambientales. Instituto de Cien-
cias. Benemérita Universidad Autónoma de Puebla, 2018.
[17] R Core Team. R: A language and environment for statistical com-
puting. R Foundation for Statistical Computing, Vienna, Austria.
https://www.r-project.org, 2017.
[18] Quantum GIS Development Team., Quantum GIS Geographic In-

formation System. Open Source Geospatial Foundation Project.
http://qgis.osgeo.org, 2017.
[19] Wischmeier W. H., Smith D. D.. Predicting rainfall erosion losses R,
USDA Agricultural Handbook 537, 1978.
123
Capı́tulo 10
Riesgo de Crédito usando Redes Neuronales
Adriana Herrera Martı́nez1 , Hortensia J. Reyes Cervantes1

Gladys Linares Fleites2 , Bulmaro Juárez Hernández1
1
2
Departamento de Investigación en Ciencias Agrı́colas
adrianahema@gmail.com, hreyes@fcfm.buap.mx
gladyslinares1@yahoo.es, bjuarez@fcfm.buap.mx
Resumen. Los modelos de Credit scoring estiman las probabilidades de in-
cumplimiento y determinan criterios a los deudores y solicitantes de financiamiento
en función de su riesgo de incumplimiento. Estos procedimientos se han venido
desarrollando dentro de las últimas cuatro décadas, debido al perfeccionamiento de
mejores recursos estadı́sticos y computacionales. La modelación de la base de datos
es importante adecuarla a los tipos de clientes y la información con la que se cuenta
de los solicitantes. La información de estudio contenı́a 30,000 datos de un banco
de Taiwán, se usó una técnica de minerı́a de datos (redes neuronales), debido a
la ventaja de ser un método flexible y de fácil aplicación. Las variables de mayor
importancia que se obtienen en la modelación están relacionadas con información
financiera y no con las variables demográficas.
Abstract. Credit scoring models estimate the probabilities of default and determine
criteria for debtors and loan applicants based on their default risk. These procedures
have been developed within the last four decades, due to the improvement of better
statistical and computational resources. The modeling of the database is important
to adapt it to the types of clients and the knowledge with which the applicants
are counted. The study information contained 30,000 data from a Taiwan bank, a
data mining technique (neural networks) was used, due to the advantage of being
a flexible and easy to apply method. The most important variables obtained in the
modeling are related to financial information and not to the demographic variables.
Palabras clave: Regresión Logı́stica, Credit scoring, redes neuronales, base de

datos de Taiwán.
10.1. Introducción
A lo largo de los años el aumento en el uso de créditos ha llevado a la industria
a desarrollar métodos para determinar a qué personas fı́sicas o morales se les otórga
124
uno. Para una institución financiera es esencial poder reducir los riesgos que pue-
dan producir pérdidas debido a una mala selección de clientes, ya que si los créditos
otorgados no son pagados estos se traducen en pérdidas económicas para estas ins-
tituciones. Los modelos de Credit scoring son herramientas estadı́sticas que se han
desarrollado en el tiempo para poder realizar la clasificación de clientes buenos o
malos [4]. Antiguamente un gerente de créditos o alguna persona representante de
una institución mediante su criterio decidı́a si aceptaba o no el préstamo o crédito
a un cliente, hoy en dı́a es más frecuente usar en las instituciones los modelos de
Credit scoring, el cual es más objetivo pues cuentan con un respaldo matemático y
con mucha información relevante sobre el comportamiento de solicitantes con cuen-
tas en la institución, aunque estas no son tan precisas en general para cada cliente
que solicita un crédito. Cada institución tiene sus propias caracterı́sticas en sus so-
licitantes, clientes y sus instituciones. Es común encontrar en las bases de datos de
los Credit scoring que se incluyan datos demográficos y caracterı́sticas financieras
de los clientes, como: edad, género, historial crediticio, ingreso económico, tipo de
trabajo, morosidad en los pagos, etc. ([2], [3]). Para determinar a los clientes buenos
las instituciones financieras cuentan con una fórmula con parámetro desconocido,
que estiman usando la información de los solicitantes, la experiencia anterior con
el solicitante y si es posible la información que ha tenido con otras instituciones. A
partir de este parámetro se podrá determinar las probabilidades de incumplimiento.
Los métodos estadı́sticos más frecuentes que se utilizan son: análisis discriminan-
te, modelo de probabilidad lineal, modelo Logit, modelos de programación lineal,
redes neuronales, árboles de decisión y otras más ([1], [3], [8], [11]). La metodologı́a
usada fue con redes neuronales, una técnica de la minerı́a de datos, que tiene su
origen en las neurociencias, matemáticas, fı́sica y ciencias computacionales, entre
otras. Uno de los problemas para desarrollar estos sistemas de Credit scoring es la
escasez de información pública, disponible, actual y completa. Esto es debido a la
confidenciabilidad que las instituciones financieras que tienen con sus solicitantes y
clientes. Los datos de este trabajo se obtuvieron de un sitio de internet de la Uni-
versidad de California, que cuenta con 30,000 clientes de un banco de Taiwán en un
periodo de Abril a Septiembre del 2005 y contenı́a cerca de 23 variables explicativas
socioeconómicas.
10.2. Marco teórico

10.2.1. Modelo de Credit scoring
Los modelos de Credit scoring buscan encontrar una regla general que determine
la probabilidad default de una determinada solicitud, para generar ésta regla se
debe de analizar la relación que existe entre las caracterı́sticas disponibles de los
solicitantes. Realizando dicho análisis y con el uso de un sistema de score se puede
determinar la clasificación de un solicitante [6]. Se puede plantear la ecuación
P = f (x1 , ..., xk ) + ε (10.1)
donde xi son las variables explicativas, ε es la perturbación aleatoria, f (.) la función

que determina la relación entre las variables utilizadas y P la probabilidad de que
125
el crédito resulte en no pago. El objetivo principal de estos métodos se centra en

calcular una función que permita ajustar con la mayor exactitus las observaciones
de la muestra y que los errores de predicción sean los menores posibles. Depen-
diendo si la función f (.) es conocida o no, se trata de un modelo paramétrico o no
paramétrico. Los modelos paramétricos se basan en una función de distribución o
clasificación conocida f (.) que se establece a priori, el interés consiste en estimar los
parámetros que mejor ajustan las observaciones en la muestra. Estos modelos son
muy efectivos cuando el procesador generador de datos sigue la distribución pro-
puesta, pero es sensible a las violaciones de las hipótesis de inicio cuando se utilizan
muestras pequeñas.
Construcción del Modelo

En este trabajo se toma la construcción de un modelo de Credit scoring dado
por Nieto et al. [9]:
1. Conformación de la base de datos. Obtener la base de datos en formato
electrónico a partir de la información de las solicitudes de crédito y el resto
de la fuentes disponibles.
2. Depuración de la base de datos. Buscar los datos nulos inconsistentes,
fuera de rango o erróneos que tenga la base para corregirlo o eliminarlos.
Evaluar cada variable y elemento de la muestra que tengan muchos valores
con errores.
3. Agrupar la base de datos. Se conforman los intervalos de clase para los
atributos de cada variable. Separar la muestra, generalmente tomando el 75 %
para el modelo y el 25 % para la validación.
4. Seleccionar las caracterı́sticas. Mediante herramientas estadı́sticas se ana-

liza cada variable para saber cuáles presentan mayores diferencias en las pro-
porciones de los clientes buenos y malos, es un punto decisivo para determinar
que variables se deben de agregar al modelo.
5. Determinar la función clasificación. La clasificación de los clientes se
puede realizar con cualquiera de los métodos que se mencionan en este trabajo.
6. Validar el modelo. Una vez elaborada la función de clasificación se valida

tomando la parte restante del 25 %, corroborando que los resultado se apeguen
al modelo original (backtesting).
7. Elaborar el scordcard. En caso de que el modelo lo permita, se puede formar
un scorecard con cada variable, calculando los valores con una translación o
cambios de escala. Aquı́ se tendrá el peso de cada atributo de cada variable.
8. Establecer el puntaje de corte o cut-off. Se establece un puntaje mı́nimo
que debe tener el solicitante para ser aceptado en un crédito.
126
10.2.2. Estimación
Sea i = 1, ..., n una muestra de n observaciones (yi , xi ) donde Y es una variable
dependiente dicotómica y las variables independientes (xi ), son las caracterı́sticas
del i-ésimo individuo en la muestra con una distribución asociada Bernoulli. Se
presenta la ecuación
exp(β0 +β1 x1 +...+βn xn )

π(xi ) = . (10.2)
1 + exp(β0 +β1 x1 +...+βn xn )
donde se estiman a las βi , aplicando el logaritmo neperiano se busca encontrar la
maximización de
n
X
L(β) = ln(l(β0 , ..., βn )) = [yi ln(π(xi )) + (1 − yi ) ln(1 − π(xi ))] . (10.3)
i=1
El próximo paso a seguir es comprobar la significancia estadı́stica de cada uno de

los coeficientes de la regresión del modelo, para esto existen dos métodos principales:
el estadı́stico de Wald y el estadı́stico G de razón de verosimilitud.
El estadı́stico de Wald: Aquı́ se contrasta la hipótesis de que un coeficiente ais-

lado es distinto de 0, y sigue una distribución ( Normal Estándar) [4]. Su valor
para un coeficiente en especı́fico viene dado por el cociente entre el valor del
coeficiente (β̂i ) y su correspondiente error estándar σ̂(βi ).
H0 : βi = 0 vs H1 : βi 6= 0
β̂i
W ald = . (10.4)
σ̂(βi )
La obtención de significación indica que dicho coeficiente es diferente de 0 y

merece la pena su conservación en el modelo.
El estadı́stico G de razón de verosimilitud: En este método se trata de ir
contrastando cada modelo que surge de eliminar cierta cantidad h de varia-
bles frente al modelo completo (que incluye las k variables de la muestra). La
valoración se desarrolla mediante el contraste del siguiente juego de hipótesis,
para toda i = 1, ..., h:
H0 : Las variables no influyen en el modelo, βi = 0.

vs.
H1 : Las variables influyen en el modelo, βi 6= 0.
La ausencia de significación implica que el modelo sin la covariable no empeora

respecto al modelo completo (es decir, da igual su presencia o su ausencia),
por lo que según la estrategia de obtención del modelo más reducido, dicha
covariable debe ser eliminada del modelo ya que no aporta nada al mismo.
127
10.2.3. Medidas de confiabilidad del Modelo

1. Devianza: Se define como D = −2Σni=1 [yi ln( yp̂i ) + (1 − yi ) ln( 1−y
1−p̂
i
)]. Dado
2
un α fijo, Si D > χ(n−p),α el modelo es confiable.
2. Prueba de Bondad de ajuste de Hosmer-Lemeshov. Se construyen
tablas para comparar los resultados de la estimación con los datos reales de
la muestra, clasificando éxitos y fracasos. Con j = 1, ..., J, la hipótesis a
contrastar es
exp{β0 + β1 x1 + ... + βn xn }
H0 : ω̂j = vs H1 : no H0 .
1 + exp{β0 + β1 x1 + ... + βn xn }
Tomando g el número de grupos, π ek el número total de observaciones en el

késimo grupo, Ok la suma de las Y en el késimo grupo y π ek el promedio de
las πk en el k-ésimo grupo, se define
0
g (Ok − nk π ek )2
Ĉ = Σk=1 0 .
ek (1 − π
nk π ek )
Dado un α, si el modelo es correcto, la distribución del estadı́stico Ĉ es

χ2(g−2),α.
10.2.4. Capacidad predictiva del Modelo

Hay que clasificar a los individuos dependiendo del valor de la probabilidad que
tomen si supera un valor de corte o no, si su valor estimado excede a π entonces se
le asignará el valor de 1, y de otra forma se le asigna 0; el valor más frecuente es
0.5 [6].
La exactitud de una prueba estadı́stica puede definirse en función de la sen-
sibilidad y especificidad diagnósticada. Tomando un punto de corte que permita
clasificar los dos grupos. Se define por sensibilidad de una prueba a la proba-
bilidad de obtener un resultado positivo y por especificidad la probabilidad de
obtener un resultado negativo. A continuación se presenta ([4], [5]).
1. Clasificación. Se clasifican las cuatro situaciones de la realidad (y0 ) y los va-
lores posibles en el modelo: valores verdaderos positivos (VP), valores verda-
deros negativos (VN), falsos negativos (FN) y falsos positivos (FP). Donde se
definen los conceptos de
VP
Sensibilidad= V P +F N , Especificidad = V NV+F
N
P y el
Área bajo la curva ROC (Receiver Operating Characteristic).

La curva ROC es un gráfico en que se observan todos los pares en el cociente
de sensibilidad/especif icidad que es resultado de la variación continua de
los puntos de corte de π en todo el rango de resultados observados. El eje
perpendicular y es la sensibilidad, en el eje x los falsos positivos. El área bajo
la curva es una medida de la capacidad del modelo para discriminar entre los
sujetos que cumplen y los que no.
128
2. Cálculo del área del ROC. El procedimiento consiste: a) Guarda los valores
estimados del modelo. b) Calcula el estadı́stico de Mann-Whitney para los
valores esperados.
3. Elección del punto de corte óptimo. a) Hay que optimizar la sensibilidad y
especificidad. b) Buscar el punto de corte para encontrar diferentes modelos
logı́sticos. c) Buscar la constante estimada para maximizar la sensibilidad y
especificidad. d) Hay reglas generales para ROC en la discriminación: total,
aceptable, excelente y extraordinaria.
10.2.5. Redes neuronales

Este modelo tiene su importancia debido a su potencia predictiva, flexibilidad
y facilidad en el uso. Una red neuronal es una máquina disenãda para modelar la
forma en que trabaja el cerebro cuando realiza una actividad especı́fica o una fun-
ción de interés, esta red está compuesta por un conjunto de neuronas artificiales
interconectadas. El entrenamiento de una red neuronal se hace mediante la repeti-
ción de pruebas con varias sub-muestras de la muestra hasta que la red alcanza una
mı́nima diferencia entre el resultado deseado y el obtenido. Las redes neuronales
tienen ventajas ya que no presentan relaciones no lineales, se adaptan a pequeños
cambios en los medios que se desarrollan y es un modelo no paramétrico. La forma
en que las variables se relacionan se determina en el proceso de aprendizaje. Si una
relación lineal entre las variables independientes o dependientes es adecuada, los
resultados de la red neuronal deben de aproximarse automáticamente a la estruc-
tura correcta del modelo. Las ponderaciones sinápticas de una red neuronal no son
fáciles de interpretar, por lo cual se usa un modelo estadı́stico [1].
Estructura MLP. La red de perceptrones multicapa (MLP) es una función

de predictores (llamadas entradas o v.i.) que minimizan el error de predicción de
las variables destino (las variables salidas). La arquitectura del Perceptrón Multi-
capa es llamada arquitectura feedforward porque las conexiones de la red fluyen
unidimensionalmente desde la capa de entrada hasta la capa de salida sin ciclos de
retroalimentación.
Error de entropı́a cruzada. Las redes neuronales se entrenan con el objetivo

de minimizar una función de error, para el caso binario se usa el error de entropı́a
cruzada 0 0
E = −Σni=1 yi log yi + (1 + log yi ) log(1 − yi )
0
donde yi es el resultado de la neurona de salida, yi el resultado esperado u objetivo.
El error de entropı́a cruzada es la suma de la relación de las diferencias entre lo real
y lo esperado de todas las salidas de la red. En la propagación hacia atrás (Back
propagation) este error se minimiza mediante la actualización iterativa de los pesos
de las neuronas de entrenamiento [8].
Perceptrón Multicapa (MLP) El procedimiento genera un modelo predic-

tivo para una o más variables dependientes (destino) basada en los valores de las
variables predictorias. Una de sus caracterı́sticas principales es tener una funcı́on de
activación no lineal, la cual relaciona la suma podenderada de unidades de capa con
129
los valores de unidad en la capa correcta, una función común es yi = 1/[1 + exp(vi )]
donde vj es la suma ponderada de todas las entradas sinápticas más el sesgo de
la neurona de todas las entradas sinápticas más el sesgo de la neurona j con yj la
salida de la neurona. Otra es que la red puede contener una o más capas ocultas,
distintas a la capa de entrada y de salida, son las capas que ayudan a que la red
“aprender”, y finalmente la red muestra un alto grado de conectividad determinada
por la sinápsis de la red.
Hay dos formas para entrenar una red neuronal, con respecto a la presentación
de los datos a la red y los ajustes en los pesos, son: 1) Entrenamiento de patrón
por patrón, a la red se le presenta un patrón e inmediatamente después se realiza la
propagación hacia atrás ajustando los pesos y 2)Entrenamiento conjunto o Batch,
los datos se presentan en la red y el cálculo de la modificación de los pesos es
almacenado hasta que todas las muestran sean presentadas a la red y luego se
modifican los pesos con la suma de las modificaciones almacenadas.
10.3. Caso de estudio

En 1987 Taiwán experimenta una democratización polı́tica y económica, se con-
vierte en un paı́s competitivo en el sector mundial de tecnologı́as de la información
y comunicación. En 1990 el gobierno taiwanes permitió la formación de nuevos ban-
cos, éstos se dedicaron a prestar grandes cantidades de dinero a las compañı́as de
Bienes y Raı́ces y después de unos años el mercado se saturó y las ganancias co-
menzaron a disminuir.
Descripción de la base. La base de datos contiene información del segundo y ter-
cer trimestre de 2005, de un banco de Taiwán. Se cuenta con 30,000 observaciones
de las cuales 6,636 (22.1 %) son “clientes morosos”, la variable respuesta es binaria
(No moroso=0, Moroso=1) y hay 23 variables explicativas [7]:
X1: Monto del crédito dado, esto incluye ambos, el crédito individual con-
sumido y el crédito de su familia.
X2: Género (Hombre=1; Mujer=2).
X3: Educación (1= Posgrado; 2=Universidad; 3=Preparatoria; 0,4,5,6=Otro).
X4: Estado civil (1=Casado; 2=Soltero; 3=Divorciado; 0=Otros).
X5: Edad (en años).
X6-X11: Historial de pagos pasados. Se tiene el record mensual de los
pagos pasados (de Abril a Septiembre, 2005) de la siguiente manera: X6=
status de pago de Septiembre de 2005; ...; X11= status de pago de Abril de
2005. La medida de la escala para el status de pago es:
• -2= No hubo consumo; -1= Pago completo; 0= Uso de crédito revolvente;
1= Pago retrasado por un mes; 2= Pago retrasado por dos meses; ...; 8=
Pago retrasado por 8 meses; 9= Pago retrasado por 9 meses o más.
X12-X17: Monto del estado de cuenta. X12= Monto del estado de cuenta
en Septiembre 2005; ...; X17= Monto del estado de cuenta en Abril de 2005.
130
Cuadro 10.1: Comparación de resultados.

Porcentaje global correcto
Error de entropı́a
Entrena-
cruzada Pruebas Reserva
miento
En el orden en que aparecen 7,375.824 81.2 % 81.4 % 80.6 %
Quitando (4) variables 7,245.680 82.0 % 82.0 % 81.2 %
De mayor a menor importancia 7,233.872 81.7 % 81.7 % 81.4 %
De menor a mayor importancia 7,380.174 81.8 % 81.5 % 81.4 %
Cuadro 10.2: Información de la red.

Capa de entrada Factores 9
Covariables 14
Número de unidadesa 88
Método de cambio de escala
Estandarizado
para las covariables
Capas ocultas Número de capas ocultas 1
Número de unidades en la
10
capa oculta 1a
Tangente
Función de activación
Hiperbólica
Capa de salida Variables dependientes 1 Tipo de cliente
Número de unidades 2
Función de activación Softmax
Entropı́a
Función de error
cruzada
a. Se excluye la unidad de sesgo.
X18-X23: Monto de pago previo. X18= Monto pagado en Septiembre 2005;

X19= Monto pagado en Agosto 2005; ...; X23= Monto pagado en Abril 2005.
Se usa la paqueterı́a de SPSS [10] en la base de datos, para crear una red neuronal
MLP, para clasificar a los clientes. Se realizaron diversas pruebas para elegir una red
neuronal, cambiando el orden de las variables, eliminando variables y se probaron
diversas tipos de entrenamiento.
En la Cuadro 10.1 se muestran algunos de los resultados que se obtuvieron, ya

que varias redes tuvieron el mismo porcentaje global correcto, se elegió la red que
presentó el menor error de entropı́a cruzada.
En el Cuadro 10.2, de información sobre la red, es útil para asegurar que las es-
pecificaciones de la red son correctas, aquı́ se detallan las especificaciones de la red
neuronal, el número de unidades en la capa de entrada es el número de covariables
más el número de factores de nivel; se crea una unidad adicional por cada categorı́a
de las variables. Se utilizaron 10 unidades en la capa oculta de la red.
En el Cuadro 10.3, se tienen los porcentajes de clasificación correcta con las

tres muestras de la base, para cada tipo de cliente (moroso o no moroso), donde el
porcentaje correcto global es similar para las tres muestras. En la muestra reserva
para la clasificación de clientes no morosos tiene un porcentaje correcto del 95.6 %,
para los clientes moroso un 32.9 % y el porcentaje correcto global es del 81.4 %. Por
lo que se puede decir que en general la red tiene un buen porcentaje correcto de
pronósticos.
131
Cuadro 10.3: Clasificación.

Pronosticado
Porcentaje
Muestra Observado No moroso Moroso
correcto
Entrenamiento No moroso 12,423 613 95.3 %
Moroso 2,428 1,199 33.1 %
Porcentaje global 89.1 % 10.9 % 81.7 %
Pruebas No moroso 3,145 148 95.5 %
Moroso 627 313 33.3 %
Reserva No moroso 6,725 308 95.6 %
Moroso 1,386 679 32.9 %
Variable dependiente: Tipo de cliente.
A continuación se muestra la curva ROC, que representa la capacidad discri-

minatoria de la red para clasificar morosos como morosos y no morosos como no
morosos. Un parámetro para evaluar la bondad de una prueba diagnóstica que pro-
duce resultados continuos es el área bajo la curva (AUC, por sus siglas en inglés) la
cual se muestra en la Figura 10.1, esto es, que si se elige un cliente no moroso hay
un 77 % de probabilidad de se clasifique correctamente como no moroso.
Figura 10.1: Área bajo la curva.
Se muestra el gráfico de la importancia normalizada en Figura 10.3, de cada

variable utilizada en la red neuronal, es decir cuánto cambia el valor predictivo de
la red para diferentes valores de la variable independiente. Se puede observar que las
variables predictivas más importantes son las relacionadas con los comportamientos
financieros de los clientes, como pagos previos, monto del estado de cuenta,historial
de pagos pasados y lı́mites de crédito. Siendo el status de pago del mes de Julio
la variable más notables. Por otro lado, las variables con menor poder predictivo
resultaron el género, nivel de estudios y estado civil.
10.4. Conclusiones
En los modelos de Credit scoring las bases de datos se deben de adecuar según
el tipo de cliente y la información con la que cuente el solicitante, se definen a
los clientes buenos y malos, ya sea con base a la experiencia previa o tomando
en cuenta la experiencia de las fuentes externas y ası́ limitar los parámetros para
definir a los clientes buenos. Para realizar el Credit scoring se separó la muestra
en un backtesting y se comprueba si la clasificación obtenida es adecuada, esto es
importante realizarlo en forma recurrente para actualizar correctamente los ajustes
de las variables que se utilizan.
En este trabajo se usa una base de datos de Taiwán y se aplica una técnica de
132
Figura 10.2: Curva ROC.
Figura 10.3: Importancia normalizada.
minerı́a de datos llamada redes neuronales que muestra su poder predictivo, su

flexibilidad y fácil aplicación al desarrollar estos sistemas. En particular, se utiliza
el modelo de redes neuronales MLP debido su eficacia en el desarrollo de Credit
scoring y apoyados por el software de SPSS, se elige la red neuronal con menor
133
error de entropı́a y mayor pocentaje de pronósticos correctos. La red neuronal MLP

final tiene un porcentaje global correcto de 81.4 %, a pesar de que el porcentaje
correcto de clientes no morosos es menor al 50 %. La red neuronal que se obtuvo
tiene un punto de corte de 0.5, el cual es dado por default en el programa, para
considerar un cliente moroso o no moroso. Las variables de mayor importancia son
aquellos que dan información financiera del solicitante, las más importantes fueron
el monto previo pagado en Julio de 2005 y el monto del estado en Julio, las variables
con menor importancia son las que se refieren a la información demográfica de los
solicitantes, como: estado civil, nivel de educación, edad y género.
134
Bibliografı́a
[1] Cuadras C. Nuevos Métodos de Análisis Multivariante. CMC Editions, 2014.

[2] Encino V. El sistema de las instituciones financieras no comerciales en Taiwán.
Taiwan Studies, Faculty Research Award Program for Paraguayans, 2005.
[3] Hand D. y Henley W.. Statistical Classification Methods in Costumer Credit
Scoring: A review. Journal Royal Statistical Society A., 1997.
[4] Hosmer D. & Lemeshow S.. Applied Logistic Regression. John Wiley & Sons,
2000.
[5] Infante S. y Zarate G.. Métodos Estadı́sticos: un enfoque interdisciplinario.
Trillas, 1990.
[6] Meza E., Reyes H. y Pérez B., Tajonar F. Modelación del Riesgo Crediti-
cio, a través de Credit Scoring mediante Regresión Logı́stica: Un caso de Estudio.
Modelación con Estadı́stica y Probabilidad, Dirección General de Fomento Edi-
torial, 175-190, 2017.
[7] Lichman M. UCI Machine Learning Reposity [http://archive.ics.uci.edu/ml],
University of California, School of Information and Computer Science, 2013.
[8] Nasr G. y Badr E. Cross Entropy Error Function in Neural Networks: Fores-
casting Gasoline Demand. Conference Paper, 2002.
[9] Nieto S., Pérez B. y Soriano J. Crédito al consumo: La estadı́stica aplicada
a un problema de Riesgo Crediticio. Revista Mexicana de Investigación Actuarial
Aplicada, Colegio Nacional de Actuarios, 2010.
[10] SPSS (2016) IBM SPSS Statistics 24 para Windows.
[11] Pozo M., Carrasco G. Aplicación del Análisis Discriminante a un conjunto
de datos vinı́colas mediante el paquete estadı́stico SPSS v10. Tecnociencia Vol.7.
2005.
[12] Yeh C., Lien C. The comparisons of data mining techniques for the predictive
accuracy of probability of default of credit card clients. in Expert Systems with
Applications, 2009.
135
Capı́tulo 11
Embarazo adolescente, desigualdad social y salud sexual y reproductiva según
condición de indigenismo en México
Itzel A. Sosa-Sánchez e Ian Ariel Quallenberg

Av. universidad s/n, Circuito 2, Col. Chamilpa,
Ciudad Universitaria de la UAEM, Cuernavaca Morelos,
C.P. 62210, México,
itzela@correo.crim.unam.mx
Resumen. La población indı́gena en México es heterogénea, sin embargo, en
general ésta tiende a enfrentar diversos grados de marginación, inequidad y pobre-
za, lo cual incrementa su vulnerabilidad en términos de salud sexual y reproduc-
tiva acrecentando su rezago en este ámbito. A su vez, el embarazo adolescente en
México es un problema que va en ascenso y que refleja en diverso grado las es-
tructuras de desigualdad social que impactan con diferentes grados de intensidad
el comportamiento reproductivo de la población adolescente en general y de la po-
blación adolescente indı́gena en particular. A partir de los datos de la Encuesta
Nacional de la Dinámica Demográfica (2014) se documenta el embarazo y la salud
sexual y reproductiva en adolescentes según condición de indigenismo en México.
Los resultados evidencian la particular vulnerabilidad y rezago de la salud sexual
y reproductiva en la población adolescente, lo que es particularmente acrecentado
por la condición de indigenismo. De tal suerte, 35.1 % de las mujeres de 20 a 29
años sexualmente iniciadas reportan haberse embarazado en la adolescencia. Este
porcentaje continúa siendo significativamente más alto en las mujeres hablantes de
lengua indı́gena (48.8 %) y en las mujeres con pertenencia étnica (auto-adscritas)
(39.9 %) que entre las mujeres adolescentes no indı́genas. Los resultados evidencian
el peso de las desigualdades sociales y de contextos sociales que restringen las opor-
tunidades de las mujeres adolescentes en general y en las indı́genas en particular
restringiendo proyectos alternativos a la conyugalidad y a la maternidad a edades
tempranas en la población estudiada.
Abstract. The heterogeneity of the indigenous population in Mexico is indubita-

ble. In spite of that, this population shares different degrees of marginalization,
inequity and poverty, which increases their vulnerability in the reproductive health
realm. At the same time, teenage pregnancy in Mexico is increasing its prevalence
in this country and it can be seen as an indicator of the social inequality structures
136
which play a central role over the reproductive behavior of the adolescent popu-
lation (including indigenous population). Using data from the national survey of
the demographic dynamic (ENADID, 2014) we document the teenage pregnancy
and sexual and reproductive health among adolescents according to their indige-
nous status in Mexico. Results show the particular vulnerability and backwardness
of the sexual and reproductive health among the adolescent indigenous population.
This situation is particularly exacerbated by their status as indigenous people. The
results show the specificities of the indigenous teenage pregnancy and reproduc-
tive trends, revealing the effects that diverse structural inequalities have on the
reproductive behaviour among this population. In this way, 35.1 % of women aged
between 20 and 29 years old (sexually initiated) report having been pregnant during
their adolescence. This percentage continues to be significantly higher among the
indigenous language-speaking women (48.8 %) and among the women with ethnic
affiliation (39.9 %) than among the non-indigenous teenage women. These findings
highlight the important role played by social inequalities and social contexts over
the reproductive behaviour and over alternative life projects (other than conjugality
and early maternity) among the studied population.
Palabras clave: embarazo adolescente, desigualdad, indı́genas, salud reproducti-

va.
Desde la demografı́a mexicana se han aportado conocimientos importantes res-
pecto a la salud reproductiva y la dinámica de la población en general. Sin embargo,
no ha sucedido lo mismo respecto a los conocimientos referidos a la población indı́ge-
na en general y a la población indı́gena adolescente en particular [11]. En América
Latina en general y en México en particular existen colectivos de jóvenes muy hete-
rogéneos1 en términos demográficos y socio culturales que expresan la persistencia
de fuertes desigualdades (de diversa ı́ndole) en la región y que se manifiestan en
forma particular entre la población indı́gena adolescente2 [8, 12].
Según los resultados de la encuesta intercensal en México 6.1 % de la población en
México habla alguna lengua indı́gena y 21.2 % se considera indı́gena (auto adscri-
tas) [6]. Paralelamente, las estimaciones de esta misma encuesta sugieren que en
2015, 45.3 % de la población que habla lengua indı́gena tiene menos de 30 años [13]
señalándose que una significativa proporción de la población indı́gena en México la
constituyen los adolescentes [12].
A su vez, se ha señalado que la población indı́gena en México enfrenta condicio-

nes particulares de vulnerabilidad, exclusión social y pobreza [7]. Ası́, se ha sugerido
que el 89.7 % de la población indı́gena viven por debajo de la lı́nea de pobreza; la
1 Al respecto se ha señalado que, el que se considere a la población indı́gena como un todo
homogéneo es, en parte una muestra más del racismo hacia estas poblaciones [18].
2 Es necesario precisar que reconocemos la plasticidad de los conceptos de adolescencia y juven-
tud y su carácter problemático, dinámico y discontinuo. Reconocemos pues, que la adolescencia y

la juventud no son nunca categorı́as universales ni biológicas. Por el contrario, son categorı́as occi-
dentales de estatus [14] que implican una construcción social de los grupos de edad y las divisiones
entre las edades son siempre arbitrarias, históricas y contextuales [1].
137
mayorı́a habita en municipios de alta o muy alta marginación y cuenta con los ı́ndi-
ces más bajos de desarrollo humano [18], lo que se ve reflejado de manera especı́fica
en su salud sexual y reproductiva y en su comportamiento reproductivo [8, 10]. Al
respecto, estudios recientes han sugerido que en la última década, los indicadores
de salud sexual y reproductiva en la población indı́gena en general y en la población
indı́gena adolescente en particular han experimentado cambios importantes (sobre
todo en lo que se refiere al acceso a información y uso de anticoncepción moderna)
[6, 10]. Estos cambios en el comportamiento reproductivo se ven reflejados de ma-
nera diferencial según la etapa de la vida en la que las mujeres se encuentran [22].
Por ejemplo, estudios en el tema han sugerido que esta población tiene una mayor
demanda insatisfecha de métodos anticonceptivos, un menor conocimiento y acceso
a métodos anticonceptivos, un menor uso de los mismos, tienen una menor atención
relativa a la salud materno-infantil, niveles más bajos de escolaridad y patrones de
fecundidad más temprana que las mujeres no indı́genas [2, 12, 23].
Adicionalmente, se ha señalado (sobre todo desde la última década un incremento en
la ocurrencia de embarazo adolescente en México [19, 20])). Al respecto las eviden-
cias son consistentes y sugieren que el embarazo adolescente tiene lugar mayorita-
riamente en estratos socioeconómicos bajos y en mujeres con niveles de escolaridad
bajos. Si bien en trabajos anteriores hemos analizado la fecundidad adolescente,
en este trabajo el análisis se centra en el embarazo adolescente dado que asumimos
que el análisis del comportamiento del mismo puede impactar de diferentes maneras
las trayectorias de las mujeres que lo experimentan (independientemente de que el
resultado final sea o no un nacimiento).
Paralelamente, un problema central para enfrentar los desafı́os que implica la

elaboración de polı́ticas tendientes a garantizar y a cubrir las necesidades de salud
sexual y reproductiva entre la población adolescente indı́gena lo constituye la falta
de información relevante y actualizada en la materia, lo que nos lleva a recono-
cer la imperiosa necesidad de generar información empı́rica sobre las necesidades y
problemáticas particulares de las mujeres indı́genas durante la adolescencia y que
reflejen la heterogeneidad de esta población ası́ como el efecto de diversas desigual-
dades sociales sobre su comportamiento reproductivo [11].
11.2. Objetivos
A partir de los datos de la Encuesta Nacional de la Dinámica Demográfica
(ENADID, 2014) se compara el porcentaje de mujeres de 20 a 29 años (sexualmente
iniciadas) hablantes de lengua indı́gena (HLI), auto-adscritas (pertenencia étnica)
y no indı́genas que se embarazaron durante la adolescencia según diferentes indica-
dores socio-demográficos utilizando la prueba de ji-cuadrada.
Objetivos especı́ficos
Identificar y caracterizar a las mujeres de 20 a 29 años que experimentaron un
embarazo durante la adolescencia.
138
11.3. Metodologı́a del trabajo y fuente de datos

Se analiza el comportamiento sexual y reproductivo de mujeres de 20 a 29 años.
Se realizó un análisis bi-variado de datos utilizando la prueba de la ji-cuadrada de
indicadores de salud sexual y reproductiva de la población de estudio de acuerdo
con diversas caracterı́sticas socio-demográficas y su condición de indigenismo. Pa-
ralelamente, se realizó un análisis de la relación entre el embarazo adolescente y la
deserción escolar según la condición de indigenismo.
11.3.1. Significancia estadı́stica: la ji-cuadrada (χ2 )

Con el objeto de saber, si las diferencias encontradas durante el análisis bi-
variado (tablas de contingencia) son estadı́sticamente significativas, calculamos la ji
cuadrada χ2 . Esta prueba estadı́stica no paramétrica (ji-cuadrada) proporciona
un estadı́stico (también conocido como χ2 o chi-cuadrado el cual fue (propuesto por
Pearson en 1911) y que permite el contraste de hipótesis de que los dos criterios de
clasificación usados (las dos variables categóricas) son independientes (la significan-
cia estadı́stica se relaciona con la necesidad de probar hipótesis) [3, 9].
La distribución de Pearson llamada también ji cuadrada chi cuadrado(a) χ2 , es
una distribución de probabilidad continua con un parámetro que representa los gra-
dos de libertad de la variable aleatoria [16].
Sean Z1 , . . . , Zn variables aleatorias que se distribuyen como normales N (0, 1) y se
define una nueva variable X = Z12 + . . . + Zn2 . Se dice que X se distribuye como
una Chi-Cuadrado o Ji-cuadrado con n grados de libertad, donde n es el número
de variables aleatorias normales independientes elevadas al cuadrado que se han
sumado. Esta se representa como [16]:
X ∼ χ2n
y su función de densidad es de la forma:
( −n/2
2 −x/2 n/2−1
f (x) = Γ(n/2) e x si x > 0
0 si x ≤ 0
Propiedades:
Es una función asimétrica.
La esperanza es igual a E (X) = n.
La varianza es igual a V (X) = 2n.
Sean dos variables aleatorias ji-cuadrado se distribuyen X1 ∼ χ2n y X2 ∼ χ2m

se define una nueva variable de la forma Y = X1 + X2 entonces esta nueva
variable se distribuye como:
Y ∼ χ2n+m
Cuando el número de variables aleatorias es muy grande, es decir, cuando

n → ∞ la variable se puede aproximar a una normal.
139
La prueba estadı́stica X 2 sigue el modelo de distribución de probabilidad χ2 con

los grados de libertad resultantes de multiplicar el número de filas menos uno por
el número de columnas menos uno:
gl = [Jn − 1] [Kn − 1]
En consecuencia se puede usar la distribución χ2 para establecer el grado de compa-
tibilidad que existe entre el valor del estadı́stico X 2 y la hipótesis de independencia.
De tal suerte, si los datos son compatibles con la hipótesis de independencia, la pro-
babilidad asociada a la ji-cuadrada será alta (mayor de 0,05). Si esa probabilidad
es muy pequeña, menor que 0,05, se considera que los datos son incompatibles con
la hipótesis de independencia y se concluye por tanto, que las variables estudiadas
están relacionadas.
Paralelamente, la distribución ji-cuadrada, es una distribución de probabilidad y
tiene un sesgo positivo como se aprecia en la siguiente figura:
Figura 11.1: sesgo positivo de la distribución χ2
Igualmente, la distribución de la ji-cuadrada tiende a la normalidad, en la medida

que aumentan los grados de libertad.
Esta prueba estadı́stica se emplea ası́ en el análisis de dos o más grupos y de dos
o más variables. Con esta finalidad, el procedimiento compara las frecuencias ob-
servadas (las frecuencias de hecho obtenidas) con las frecuencias esperadas (las
frecuencias que teóricamente deberı́amos haber encontrado en cada casilla si los dos
criterios de clasificación fueran independientes). De tal suerte, cuando dos criterios
de clasificación son independientes, las frecuencias esperadas son estimadas de la
siguiente manera:
(total de la fila i)×(total de la columna j)
(frecuencia esperada)ij = número total de casos
Donde i se refiere a una fila cualquiera; j a una columna cualquiera; ij a una casilla
cualquiera. En otras palabras, bajo la condición de independencia, la frecuencia
esperada de una casilla concreta resulta de dividir el producto de las frecuencias
marginales correspondientes a esta casilla (su total de fila y su total de columna)
140
por el número total de casos. Una vez obtenidas las frecuencias esperadas para cada
casilla, el estadı́stico X 2 o ji-cuadrado es obtenido de la siguiente manera:
X X (nij − mij )2
X2 =
i j
mij
Donde nij se refiere a las frecuencias observadas y mij a las esperadas y donde de
la ecuación se desprende que la X 2 valdrá cero cuando las variables sean totalmente
independientes (dado que las frecuencias observadas y las esperadas serán iguales),
y que el valor del estadı́stico X 2 será tanto mayor cuanto mayor sea la diferencia
entre las frecuencias observadas y las esperadas (diferencia que será tanto mayor
cuanto mayor sea la relación entre las variables) [3, 9].
Es preciso
señalar que para que las probabilidades de la distribución ji-cuadrada
χ2 constituyan una buena aproximación a la distribución de este estadı́stico es
conviene que se cumplan algunas condiciones. Por ejemplo, que las frecuencias espe-
radas no sean demasiado pequeñas, es decir que todas las frecuencias esperadas sean
iguales o mayores a 5, asumiéndose que, si existen frecuencias esperadas menores
que 5, éstas no deben superar el 20 por ciento del total de frecuencias esperadas.
Se supone que el valor del estadı́stico X 2 se podrá aproximar por una distribución
ji-cuadrado cuando el tamaño muestral n sea grande (n > 30).
La distribución χ2 tiene muchas aplicaciones en inferencia estadı́stica. La más co-
nocida es la de la denominada prueba χ2 utilizada:
1. Como prueba de independencia entre dos variables categóricas,
2. Como prueba de bondad de ajuste para evaluar la credibilidad de que los
datos muestrales, que vienen de una población cuyos elementos se ajustan a
un tipo especı́fico de distribución de probabilidad,
3. En la estimación de varianzas.
En resumen, esta prueba contrasta frecuencias observadas con frecuencias esperadas
de acuerdo a la hipótesis nula. En el análisis llevado a cabo, se contrasta la hipótesis
de que hay asociación entre variables frente a la hipótesis alternativa de que no
existe asociación. Si existe concordancia perfecta entre las frecuencias observadas y
las esperadas el estadı́stico toma un valor igual a 0; por el contrario, si existe una
gran discrepancia entre estas frecuencias el estadı́stico tomará un valor grande y, en
consecuencia, se rechazará la hipótesis nula [3, 9].
Es preciso señalar que en ciencias sociales, el nivel de significación (riesgo de error
que se está dispuesto a asumir en caso de rechazar la hipótesis nula), suele ser del
0.05; es decir, con un 5 % de errores posibles (como máximo) en el momento de
rechazar la hipótesis nula (intervalo o margen de confianza del 95 %, e intervalo o
margen de error del 5 %). A menor sea el nivel de significación, mayor es el nivel de
confianza y por tanto menor será la probabilidad de cometer un error en la prueba
de hipótesis [9, 3]. En otras palabras, esto representa una seguridad del 95 % que la
asociación que estamos estudiando no se deba al azar. Este es el criterio que se asume
en este documento cuando se afirma que las diferencias encontradas en las tablas
de contingencia presentadas en este análisis son estadı́sticamente significativas.
141
11.3.2. Fuente de datos

Se realizó un análisis estadı́stico a partir de la Encuesta Nacional de la Dinámica
Demográfica (ENADID, 2014). Esta encuesta, fue realizada por el INEGI (Instituto
Nacional de Estadı́stica y Geografı́a) en 2014 y cuenta con representatividad a nivel
nacional. El tamaño de la muestra fue de 101 mil 389 viviendas a nivel nacional
y la unidad de observación fue la vivienda seleccionada, sus hogares, residentes
habituales, migrantes internacionales en los últimos cinco años y las mujeres de
15 a 54 años de edad. El diseño de la muestra en esta encuesta fue probabilı́stico,
bietápico, estratificado y por conglomerados. Los instrumentos de recolección de
datos comprenden dos cuestionarios: uno del hogar y otro dirigido a mujeres de 15
a 54 años de edad.
El análisis bivariado realizado tomó como base el cuestionario individual dirigido a
mujeres de 15 a 54 años de edad, de donde se seleccionaron a las mujeres que en el
momento de la encuesta tenı́an entre 20 y 29 años de edad con la finalidad de evitar
el efecto de truncamiento asociado al análisis de la fecundidad cuando el objeto de
estudio es la fecundidad y el embarazo adolescente (dado que no es posible saber si
la niña que tenı́a 15 años al momento de la encuesta, se iba o no a embarazar en el
transcurso de su adolescencia). Igualmente, la selección de esta población responde
a la necesidad de incrementar el número de casos en el análisis (respecto al grupo
de mujeres de 20 a 24 años).
Ası́, la población central de este análisis lo constituyen las mujeres de 20 a 29
años de edad (n = 21, 497) que reportaron en la encuesta haberse embarazado en la
adolescencia (n = 7005). Paralelamente, esta encuesta incluyó dos preguntas con el
objeto de captar la población indı́gena: aquella referida a las mujeres que se auto-
reconocen como pertenecientes a una etnia (auto-adscritas) y aquella que se refiere
a las hablantes de alguna lengua indı́gena (HLI).
11.4. Resultados
Con la finalidad de caracterizar a la población de estudio en el cuadro 1 se pre-
sentan las caracterı́sticas socio demográficas de todas las mujeres de 20 a 29 años de
edad (sexualmente iniciadas y no sexualmente iniciadas), resultante del análisis de
la ENADID 2014. De estas el 37.1 % de las mujeres de 20 a 29 años se unieron en la
adolescencia. También sobresale que la mayorı́a de estas mujeres se concentran en
el estrato bajo (39.4 %) y muy bajo (21.9 %) lo que evidencia condiciones objetivas
de vida poco favorables al desarrollo de proyectos de vida alternativos a la mater-
nidad y a la conyugalidad tempranos. A su vez, 5.2 % (n = 1521) son Hablantes de
Lengua Indı́gena, y 29.6 % se auto-perciben como indı́genas (n = 8120). Sobresale
que poco más de la mitad de las mujeres encuestadas de 20 a 29 años contaban con
preparatoria o más. De las mujeres de 20 a 29 años que participaron en la encuesta
el 79.9 % son sexualmente iniciadas (han tenido relaciones sexuales alguna vez en
su vida (cuadro 11.1).
142
Caracterı́sticas sociodemográficas de las mujeres: 20-29 años (n=26824)

Porcentajes
Estrato socio- Muy bajo Bajo Medio Alto
económico
21.9 % 39.4 % 19.4 % 19.4 %
Nivel de escolari- Un grado en Un grado en Un grado en
dad primaria o secundaria o preparatoria
más más o más
12.8 % 31.1 % 56.1 %
Hablantes de len- Sı́ No
gua indı́gena
5.2 % 94.8 %
Condición de acti- Activa Inactiva
vidad
44.0 % 56.0 %
Situación conyugal Unida No unida
en adolescencia
37.1 % 62.9 %
Zona de residencia Rural Urbano
21.8 % 78.4 %
Ha tenido relacio- Sı́ No
nes sexuales
79.9 % 20.1 %
Cuadro 11.1: Estimaciones propias a partir de la Encuesta Nacional de Dinámica

Demográfica 2014
Como el objeto central de análisis de este trabajo, lo constituye la existencia

de embarazo en la adolescencia, a partir de este momento, el análisis se focalizará
exclusivamente en las mujeres sexualmente iniciadas de 20 a 29 años que participa-
ron en la encuesta. De tal suerte, como se observa en el siguiente cuadro (cuadro
11.2), resalta que, poco más de la mitad (52.8 %) de las mujeres de 20 a 29 años
(sexualmente iniciadas) hablantes de lengua indı́gena se unieron en la adolescencia,
porcentaje que decrece a 43.2 % y a 36.2 % respectivamente en las mujeres con per-
tenencia étnica y en las no hablantes de lengua indı́gena.
Sobresale también, que no existen diferencias significativas en los porcentajes relati-
vos a la iniciación sexual en la adolescencia según condición de indigenismo, aunque
el porcentaje es ligeramente mayor entre las no hablantes (74.5 %) y decrece a 74.4 %
y a 73.9 % en las mujeres con pertenencia étnica y en las mujeres HLI.
143
% de mujeres 20-29 años sexualmente iniciadas que tuvieron su primera relación sexual
o se unieron conyugalmente en la adolescencia según condición de indigenismo.
Habla una lengua Pertenece a una No habla lengua Significancia
Porcentajes indı́gena(n=1202) etnia(n=6749) indı́gena (n=20295) estadı́stica
Situación conyugal en la adolescencia ∗∗∗
Se unió en la adol. 64.9 % 53.1 % 45.0 %
No se unió en la adol. 35.1 % 46.9 % 55.0 %
Tuvo primera rel. sexual en la adol. NS
Sı́ 76.3 % 76.6 % 76.7 %
No 23.7 % 23.4 % 23.3 %
p = 0,0000 N S = sin significancia estadı́stica
Cuadro 11.2: Estimaciones propias a partir de la Encuesta Nacional de la Dinámica

Demográfica
Lo que es más, la diferencia más importante en la edad media en los distintos

eventos demográficos, se observa en la edad a la primera unión de las mujeres
hablantes de lengua indı́gena, ya que el promedio en la edad de la primera unión
es de casi un año respecto a las mujeres no indı́genas sugiriendo un patrón de
nupcialidad más temprano entre las primeras.
Edad media en distintos eventos demográficos según condición de indigenismo de las mujeres
de 20-29 años
Habla lengua indı́gena Pertenece a una etnia No habla lengua indı́gena
Edad a la primera rel. sexual 17.7 % 17.8 % 17.94 %
Edad a la primera unión 17.8 % 17.9 % 18.7 %
Edad al primer matrimonio 19.1 % 19.2 % 19.6 %

Demográfica 2014
Ası́, a partir de lo que se observa en el cuadro 11.3 los resultados sugieren que
hay un mayor número de mujeres hablantes no indı́genas que se inician sexualmente
estando solteras, mientras que en el caso de las hablantes indı́genas, en gran parte,
la primera relación sexual ocurrió en el caso de las mujeres de 20 a 29 años muy
poco tiempo antes de establecerse la primera unión (patrón al que se asemeja lo que
ocurre con las mujeres con pertenencia étnica).
De hecho, en las no indı́genas la edad media en la primera relación sexual es sig-
nificativamente menor que la edad media en la primera unión, y entre las jóvenes
hablantes de lengua indı́gena la edad media de ambos eventos es casi la misma.
Cabe señalar, que el inicio sexual y la unión temprana no se ven acompañadas con
una mayor protección en la primera relación sexual, lo que es particularmente cierto
en el caso de las mujeres hablantes de lengua indı́gena. Por ejemplo, como se obser-
va en el cuadro 11.4 sólo dos de cada diez mujeres hablantes de lengua indı́gena se
protegieron en su primera relación sexual. Este porcentaje asciende a 42 % en las
mujeres con pertenencia étnica y a 51 % en las mujeres no indı́genas.
144
Condición de protección y principales razones de no protección en la primera rel.

sexual de mujeres de 20-29 años sexualmente iniciadas, según condición de indigenismo
% Habla una lengua Pertenece a una No habla lengua Significancia
– indı́gena etnia indı́gena estadı́stica
Usó protección en la rel. sexual ∗∗∗
Sı́ se protegió 20.2 % 42.0 % 51.0 %
No se protegió 79.8 % 58.0 % 49.0 %
Principales razones de no protección o uso
de anticonceptivos en la rel. sexual ∗∗∗
Querı́a embarazarse 23.2 % 24.8 % 23.1 %
No conocı́a anticon. 45.7 % 26.5 % 19.0 %
Creı́a no quedar emb. 10.3 % 13.3 % 16.4 %
No planeaba tener rel. 9.9 % 24.2 % 32.5 %
Usó condón masc. en la rel. sexual ∗∗∗
Sı́ 17.0 % 37.7 % 46.3 %
No 83.0 % 62.3 % 53.7 %
p = 0,0000 N S = Sin significancia estadı́stica

Demográfica 2014
Paralelamente, conocer las razones por las cuales las mujeres no se protegie-
ron en la primera relación sexual posibilita tener un panorama más amplio de las
condiciones y obstáculos que tienen las mujeres para protegerse durante la primera
relación sexual.
Ası́, sobresale que sin importar la condición de indigenismo, poco más de dos de ca-
da diez mujeres de 20 a 29 años sexualmente iniciadas no usó ninguna protección en
su primera relación sexual porque querı́a embarazarse, lo que puede estar sugiriendo
en estas mujeres la existencia de un proyecto de vida vinculado a la maternidad y a
la unión conyugal tempranas. Pese a esto, es preciso subrayar que entre las mujeres
hablantes de lengua indı́gena (HLI) el 45.7 % no se protegió en las primera relación
sexual porque no conocı́a los métodos anticonceptivos, porcentaje que desciende a
26.5 % entre las mujeres con pertenencia y a 19.0 % entre las no hablantes de lengua
indı́gena.
Esto, como otros estudios sugieren [11, 12] evidencia la particular falta de acceso
de las mujeres indı́genas a información relativa a la salud reproductiva y a servicios
de salud de calidad elementos centrales que condicionan el acceso de las mujeres a
información y al uso de métodos anticonceptivos.
Al analizar el uso del preservativo en la primera relación sexual (único método

anticonceptivo que previene a la vez un embarazo no deseado y una infección de
transmisión sexual) se observa que únicamente el 17 % de las mujeres hablantes de
lengua indı́gena usó preservativo masculino en su primera relación sexual mientras
que este porcentaje es de 37.7 % y 46.3 % en las mujeres con pertenencia étnica
y no hablantes de lengua indı́gena respectivamente. Estos datos ponen de relieve
el particular rezago en materia de salud sexual y reproductiva que impera en esta
población en general y en las mujeres indı́genas en particular.
En lo que respecta al embarazo en la adolescencia, 35.1 % de las mujeres de 20 a

29 años sexualmente iniciadas reportan haberse embarazado en la adolescencia. Este
porcentaje continúa siendo significativamente más alto en las mujeres hablantes de
145
lengua indı́gena donde alcanza el 48.8 % y en las mujeres con pertenencia étnica
(auto-adscritas) donde asciende a 39.9 % mientras que este porcentaje es de 35.1 %
entre las mujeres adolescentes no indı́genas.
% de mujeres de 20-29 años que se embarazaron en la adolescencia sexualmente

iniciadas, según condición de indigenismo
Habla una lengua Pertenece a una No habla lengua
indı́gena etnia indı́gena
48.8 % 39.9 % 35.1 %

Demográfica 2014
Adicionalmente, dado el importante peso acordado al nivel de escolaridad en

general y a la asistencia escolar como factor de protección ante los embarazos en la
adolescencia [21], [4, 15], en el cuadro 6 se presenta un breve análisis de estas dos
variables.
Relación entre el embarazo y la deserción escolar de las mujeres de 20-29 años sexualmente
iniciadas (con experiencias de embarazo en la adolescencia) según condicón de indigenismo
CUANDO SE EMBARAZÓ: Habla lengua Pertenece a una No habla lengua Significancia
indı́gena etnia indigéna estadı́stica
ANTES de la deserción escolar 2.6 % 6.8 % 11 % ∗∗∗
MISMO año que desertó 1.3 % 0.8 % 1.1 % ∗∗∗
DESPUÉS de la deserción 96.1 % 92.3 % 87.9 % ∗∗∗
p = 0,0000 N S = sin significancia estadı́stica

Demográfica 2014
En el cuadro 6 se observa que, contrario a lo que generalmente puede pensarse

en términos de la relación embarazo adolescente-escuela, la gran mayorı́a de emba-
razos en la adolescencia tienen lugar una vez que las mujeres ya se encuentran fuera
del sistema escolar (lo que se acentúa aún más en el caso de las mujeres hablantes
de lengua indı́gena y las pertenecientes a una etnia) pero que no deja ser cierto
también para las mujeres no hablantes de lengua indı́gena cuyo porcentaje asciende
a 87.9 %.
De tal suerte, poco más de una de cada diez mujeres no hablantes de lengua indı́gena
se embarazó cuando aún se encontraba estudiando, porcentaje que decrece a 2.6 %
y a 6.9 % entre las hablantes de lengua indı́gena y las mujeres con pertenencia étnica.
11.5. Conclusiones
Los resultados son consistentes con lo que ya han sugerido algunos estudios
realizados con la población indı́gena [11, 12] y con población adolescente. Ası́ los
resultados ponen de manifiesto, la particular vulnerabilidad y rezago de la salud
sexual y reproductiva en la población adolescente, lo que es particularmente acre-
centado por la condición de indigenismo.
146
De tal suerte, los resultados sugieren que tanto el embarazo en la adolescencia, la

ocurrencia del mismo una vez fuera del sistema escolar, ası́ como el menor uso de
anticonceptivos y de protección en la primera relación sexual continúa siendo sig-
nificativamente más alto en las mujeres hablantes de lengua indı́gena (39 %) y en
las mujeres con pertenencia étnica (31.1 %) que entre las mujeres adolescentes no
indı́genas, lo cual pone en evidencia no sólo especificidades culturales sino la exis-
tencia de condiciones objetivas de vida y de desigualdad social que contribuyen a
la prevalencia del embarazo adolescente y del rezago en materia de salud sexual y
reproductiva en esta población.
Estos resultados obligan a visibilizar que la población indı́gena en México ha

sido históricamente excluida del desarrollo económico y social del paı́s [12], no sólo
debido a que en general esta población tiende a ubicarse geográficamente en locali-
dades rurales alejadas de los centros urbanos o en territorios de difı́cil acceso, sino
a la particular situación de precariedad, discriminación y exclusión social que la
población indı́gena en general y los adolescentes indı́genas en particular enfrentan
en una sociedad como la mexicana marcada por prácticas y discursos racistas.
Ası́, sin dejar de lado el componente cultural asociado a los patrones de fecun-
didad temprana entre la población indı́gena en general [4, 5] los resultados de este
análisis son consistentes con otros estudios [19, 20]) ya que permiten subrayar el
peso de las desigualdades sociales y de los contextos sociales sobre la ocurrencia
del embarazo adolescente y sobre la deserción escolar temprana, lo que sin lugar
a dudas restringe las oportunidades de las mujeres adolescentes en general, y de
las adolescentes indı́genas en particular y que dificultan proyectos alternativos a la
conyugalidad y a la maternidad. Estas desigualdades se reflejan por ejemplo, como
vimos precedentemente en el alto reporte de desconocimiento de métodos anticon-
ceptivos particularmente entre la población hablante de lengua indı́gena cuando
inician su vida sexual y que condiciona el bajo uso de protección sexual durante la
primera relación sexual.
Es también necesario enfatizar el contexto social en el que ocurre la deserción

escolar en la población adolescente y en la población indı́gena dado que cuando se
analizan las razones de esta deserción, los motivos relacionados con la pobreza (falta
de dinero) ocupan un lugar central en la misma.
Lo antes mencionado, se articula y potencia en un contexto como el mexicano

donde el reconocimiento y ejercicio de los derechos sexuales y reproductivos de las
mujeres en general y de las adolescentes en particular continúa siendo un desafı́o
importante para combatir la desigualdad de género y las desigualdades sociales en
el ámbito de la reproducción y la sexualidad en la población en general y en la
población indı́gena en particular.
147
Bibliografı́a
[1] Bourdieu P. La “Jeunesse”N 'est Qu'un Mot. Questions de sociologie, les pages
Bourdieu. Minuit, Paris, 1992.
[2] Bonfil, Paloma “Introducción”, en Bonfil, P: Derechos y salud sexual y repro-
ductiva entre jóvenes indı́genas: hacia la construcción de una agenda necesaria.
GIMTRAP, México; 2014.
[3] Castañeda, B., Cabrera, A., Navarro, Y., y de Vries, W. Procesa-
miento de datos y análisis estadı́sticos utilizando SPSS. Un libro práctico para
investigadores y administradores educativos. EDIPUCRs: Porto Alegre, 2010.
[4] Chávez, A.; Hernández, H.; Menkes, C.; Ruiz, A. y Flores, R. “La
salud reproductiva de la población indı́gena”, en Los indios de México en el
siglo XXI. CRIM-UNAM, México, 2007.
[5] Chávez, A.; Hernández, H.; Menkes, C. y González, E. “Tendencias de
la fecundidad indı́gena en México, 1997, 2003”, en Los indios de México en el
siglo XXI. Cuernavaca: CRIM-UNAM, 2007a.
[6] CONAPO. Infografı́a población indı́gena. CONAPO, México, 2015.
[7] CONEVAL La pobreza en la población indı́gena de México 2012. CONEVAL,
México, 2014.
[8] Del Popolo, F.; López, M y Acuna, M. Juventud indı́gena y afrodescen-
diente en América Latina: inequidades sociodemográficas y desafı́os de polı́ticas.
CELADE, UNFPA, Chile, 2009.
[9] Fierro, J. Métodos Cuantitativos en Ciencias Sociales: Apuntes de Apoyo a la
Docencia. Santiago de Chile. Departamento de Sociologı́a, Universidad de Chile.
Formato digital. 115 págs, Chile: 2013.
[10] Hernández, M.; Muradás, M. y Sánchez, M. “Panorama de la salud se-
xual y reproductiva, 2014”, en La situación demográfica de México 2015. CO-
NAPO, México, 2015.
[11] Hernández, Héctor. “Introducción”, en Los indios de México en el S. XXI.
UNAM-CRIM-México.
[12] Hernández, Marı́a, Hernández, Mario y Sánchez, M. “La salud sexual
y reproductiva de las mujeres hablantes de lengua indı́gena, 1997-2009”, en La
situación demográfica de México 2013, pp. 21-41, México, 2013.
148
[13] INEGI. Encuesta nacional de la dinámica demográfica 2014. Principales re-

sultados. INEGI-CONAPO: México, 2015.
[14] Martin, Enrique. Producir la juventud. Editorial ISTMO, España, 1998.
[15] Mier y Terán, Martha. “Maternidad temprana y escolaridad de las jóvenes
en México”, en Ávila, J.; Bringas, H. y López, M. (coords). Retos del cambio
demográfico de México, colección población, salud y sociedad. Capı́tulo 6, pp.
157-177. UNAM, México, CDMX, 2016.
[16] Montero, Roberto, Contraste de Hipótesis. Documentos de Trabajo en Eco-
nomı́a Aplicada. Universidad de Granada. Espana, 2007.
[17] UNFPA. Early unintended pregnancy. Recommendations for the education sec-
tor. UNFPA, Paris, 2017.
[18] Schmelkes, Sylvia. “Educación y pueblos indı́genas: Problemas de medi-
ción”Revista Internacional de Estadı́stica y Geografı́a. Vol. 4 Núm. 1 enero-abril
2013 págs. 5-13, 2013.
[19] Stern, C. y Menkes, C. “Embarazo adolescente y estratificación social”, en
Lerner, Susana y Szasz, Ivonne (coords.) Salud reproductiva y condiciones de
vida en México, tomo I, Colmex: México, 2008.
[20] Stern, Claudio. “Reflexiones finales”, en Adolescentes en México. Investi-
gación, experiencia y estrategias para mejorar su salud sexual y reproductiva.
Colmex, México, 2008.
[21] UNESCO. Embarazo precoz y no planificado y el sector de la educación. Re-

visión de la evidencia y recomendaciones. Organización de las Naciones Unidas
para la Educación, la Ciencia y la Cultura, Francia, 2017.
[22] Valdés, Luz. “El perfil sociodemográfico y económico de los hablantes de
lengua indı́gena”, en Hernández, H. Los indios de México en el S. XXI. UNAM-
CRIM-México.
[23] Vázquez, Germán. “Demografı́a étnica un balance del perı́odo 1986-2011”,
Coyuntura demográfica. 3(97-101), 2013.
149
Capı́tulo 12
Uso de la Distribución Bernoulli Multivariada en salud bucal
Ramón Álvarez-Vaz y Fernando Massa
Departamento de Métodos Cuantitativos,
Instituto de Estadı́stica,
Eduardo Acevedo 1139,
C.P. 11200, Montevideo, Uruguay,
ramon@iesta.edu.uy,fmassa@iesta.edu.uy,
unidad.biometria.iesta@gmail.com
Resumen. En general, en muy variadas disciplinas como la Economı́a, el Mar-
keting, la Epidemiologı́a, se dan situaciones donde la matriz de datos de la que se
dispone está formada por datos binarios (unos y ceros) que surgen de trabajar con
varias variables aleatorias resultantes de un experimento con 2 resultados posibles
en cada caso. El interés se centra entonces, generalmente, en analizar y dar cuenta
de las relaciones que se dan entre variables a través de la distribución Bernoulli
Multivariada (BM). Esta distribución puede ser caracterizada por un vector de in-
tensidades y una matriz de asociaciones entre las variables binarias, que se pueden
interpretar y asimilar como los parámetros de un modelo de regresión, por lo cual
es importante entonces ver como queda parametrizado este modelo probabilı́stico y
como puede ser estimado.
Se presenta luego a modo de ejemplo una aplicación en salud bucal para evaluar
la enfermedad periodontal en la población adulta uruguaya. Los datos surgen del
primer relevamiento nacional de salud bucal, llevado a cabo durante los años 2011
y 2012 en diversos departamentos de Uruguay, donde fueron encuestadas personas
de 3 grupos etarios (jóvenes, adultos y adultos mayores), a los que se les evalúa pre-
sencia de enfermedad periodontal, evaluada como atributos binarios en 6 sextantes
de la boca, por lo cual se tienen 6 variables binarias.
Abstract. In general in very varied disciplines such as Economics, Marketing,

and Epidemiology there are situations where the available data matrix is formed by
binary data (ones and zeros) that arise from working with several random variables
resulting from an experiment with 2 possible results in each case. The interest is
then generally focused on analyzing and accounting for the relationships that occur
between variables through the Multivariate Bernoulli (MB) distribution presented
150
in this work. This distribution can be characterized by a vector of intensities and

a matrix of associations between binary variables, which can be interpreted and
assimilated as the parameters of a regression model, so it is important to see how
it is parameterized this probabilistic model and how it can be estimated. An oral
health application is then presented as an example to evaluate periodontal disease
in the Uruguayan adult population measured as binary attributes in 6 sextants of
the mouth, for which there are 6 binary variables.
Palabras clave: asociación, distribución Bernoulli Multivariada, enfermedad pe-

riodontal, intensidad, variable latente.
En este documento se presenta y caracteriza una distribución de probabilidad
multivariada que solo puede adoptar los valores cero o uno y que se denomina Ber-
noulli Multivariada (BM). Esta distribución equivale a considerar los vértices de
un hipercubo en Rk , cuyas coordenadas son los valores 0 y 1. Una de las primeras
aproximaciones a la temática se puede encontrar en [9] donde se plantea la distri-
bución de Bernoulli bivariada.
En primera instancia, la distribución BM podrı́a definirse como el producto de

k distribuciones marginales cada una acorde al modelo Bernoulli [12], sin embargo
dicha parametrización solo contempla el caso en el que las variables en cuestión son
independientes. Es por esto que aquı́ se opta por una formulación donde se incluye
la opción de modelar las asociaciones entre las variables. Para ello, se siguen las
ideas expuestas en [4]. Pese a que la naturaleza categórica de las variables permite
pensar en asociaciones entre dos, tres o mas de éllas simultáneamente, se toma la
decisión de contemplar solamente las asociaciones “dos a dos” a modo de construir
modelos mas parsimoniosos.
Sin embargo, la metodologı́a aquı́ propuesta puede extenderse para tener en
cuenta asociaciones de orden superior. El método empleado en este trabajo difie-
re de la parametrización basada en la dicotomización de la distribución Gaussiana
multivariada [3] [12] debido a que, a diferencia de esta, no asume la existencia de
variables latentes, lo cual supone una ventaja en cuanto a la simplicidad del modelo
probabilı́stico.
El documento se estructura de la siguiente manera. En la sección 12.2 se conside-

ra la construcción de la distribución, comenzando desde el caso univariado, pasando
por el bivariado y llegando finalmente al modelo general, presentando las principales
propiedades de cada caso. En la sección 12.3 se presenta una aplicación en salud
oral de esta metodologı́a. Se plantean algunos estadı́sticos para explorar la indepen-
dencia o asociación entre las variables. En la sección 12.4 se plantea un resumen de
los resultados encontrados y posibles caminos por donde seguir.
151
12.2. Modelo probabilı́stico

A continuación se plantea la distribución BM comenzando como una reparame-
trización de la distribución de Bernoulli, para luego extenderla al caso bivariado y
finalmente al caso general. En cada etapa se exploran las principales caracterı́sticas
de la función de masa de probabilidad.
12.2.1. Caso univariado

La distribución Bernoulli es utilizada para modelar las variables aleatorias re-
sultantes de un experimento binario (considerando Rec(X) = {0, 1}) mediante un
único parámetro, el cual se interpreta como la probabilidad de obtener un éxito en
dicho experimento. La función de cuantı́a es la siguiente:
P (X = x) = px (1 − p)1−x , x ∈ {0, 1}. (12.1)
La variable aleatoria definida de esta manera tiene esperanza p y varianza p(1 −

p). También, es sencillo apreciar que esta función de cuantı́a puede expresarse como
un miembro de la familia exponencial.
p
P (X = x) = exlog( (1−p) )+log(1−p)) , x ∈ {0, 1}. (12.2)
De esta manera surge que el “parámetro natural” de esta distribución es el

p
logaritmo del odd. Tras llevar a cabo el cambio de variable φ1 = (1−p) , se llega a la
siguiente parametrización:
P (X = x) = φ0 φx1 , x ∈ {0, 1}, (12.3)
donde φ1 representa el odd de éxito y φ0 es una constante que normaliza la dis-

tribución y que se interpreta como la probabilidad de obtener un fracaso. En el
1
caso univariado, esta constante es φ0 = 1+φ 1
. Las nuevas expresiones para la espe-
φ1 φ1
ranza y varianza de la distribución son E(X) = 1+φ 1
y V ar(X) = (1+φ 1)
2 . Pese a
que, en un principio, esta reparametrización solo parece complicar la caracterización

de la distribución, en dimensiones superiores probará ser de gran utilidad ya que
proporcionará gran flexibilidad para incluir las asociaciones entre variables.
12.2.2. Caso bivariado

En el caso bivariado, si las variables X1 y X2 son independientes, su cuantı́a
conjunta podrı́a definirse de la siguiente manera:
2
P (X1 = x1 , X2 = x2 ) = p1x1 (1 − p1 )1−x1 px2 2 (1 − p2 )1−x2 , X1 , X2 ∈ {0, 1} (12.4)
152
Luego de realizar el mismo cambio de variable sugerido en el apartado anterior,

la cuantı́a conjunta se expresa de la siguiente manera:
2
P (X1 = x1 , X2 = x2 ) = φ0 φx1 1 φx2 2 , X1 , X2 ∈ {0, 1} (12.5)
En este caso, la constante de normalización φ0 equivale a 1+φ1 +φ12 +φ1 φ2 y se

interpreta como la probabilidad de obtener un fracaso en ambas variables. El si-
guiente paso en la construcción de la distribución BM es el de incluir en la ecuación
(12.5) la asociación entre X1 y X2 . Para ello se introducirá un nuevo parámetro α12
de la siguiente manera:
2
P (X1 = x1 , X2 = x2 ) = φ0 φx1 1 φx2 2 α12
x1 x2
, X1 , X2 ∈ {0, 1}
1 (12.6)
φ0 = 1+φ1 +φ2 +φ1 φ2 α12
Tras la modificación propuesta, φ0 continúa siendo la probabilidad de obtener

dos fracasos.
En cuanto al parámetro α12 , es sencillo demostrar que equivale al odds ratio en-
tre X1 y X2 . Sin embargo, la interpretación de φ1 y φ2 cambia ligeramente, ya que
en este caso pasan a ser los odds de éxito de cada variable condicional a que la otra
variable valga cero. Ya en presencia de ambos tipos de parámetros, nos referiremos
al conjunto de valores φi como intensidades o fuerzas y al conjunto de valores αij
como asociaciones.
El siguiente paso es definir las distribuciones marginales y condicionales de cada

variable. En cuanto a las marginales, se puede demostrar que son Bernoulli con la
siguiente función de cuantı́a:
P (X1 = x) = φ∗0 φ∗1 x , X1 , X2 ∈ {0, 1}

φ∗1 = φ1 (1 + φ2 α12 ), (12.7)
φ∗0 = 1+φ
1
∗
1
La distribución marginal de X2 es análoga. En cuanto a las distribuciones con-

dicionales, se puede demostrar que éstas también son Bernoulli:
P (X1 =i,X2 =j) φ0 φi1 φj2 αij

P (X1 = i|X2 = j) = P (X2 =j) = 12
φ0 φj2 (1+φ1 αj12 )
φi1 αij 2
= 12
(1+φ1 αj12 )
= φ0|j φi1|j , (i, j) ∈ {0, 1} , (12.8)
j
φ1|j = φ1 α12 ,
1
φ0|j = 1+φ αj .
1 12
Vale la pena mencionar que al fijar j = 0 se obtiene el caso particular de donde

surge la interpretación de φ1 como odd condicional. La cuantı́a condicional de X2
se obtiene de la misma manera.
153
12.2.3. Caso general

La función de cuantı́a del vector X = (X1 , X2 , . . . , Xk ) en el caso de k variables
binarias posiblemente asociadas entre sı́ es la siguiente:
k k
x x
Y Y k
P (X1 = x1 , X2 = x2 , . . . , Xk = xk ) = φ0 φxi i αiji j , x1 , x2 , ..., xk ∈ {0, 1}
i=1 j=i+1
(12.9)
En este caso, la especificación de φ0 se vuelve un poco mas compleja y para

ello se define la matriz de configuraciones H. Esta matriz, que consta de k(k+1) 2
columnas y 2k filas, contiene cada una de las posibles configuraciones del vector
aleatorio X en las primeras k columnas y los productos de estas coordenadas en las
siguientes k(k−1)
2 . Adicionalmente se define el vector γ, el cual contiene los k(k+1)
2
parámetros del modelo. Se trabaja entonces con Γ = (logφ1 , logφ2 , . . . , logαk−1,k ).
De esta manera, se reescribe la cuantı́a en función de los elementos de Γ.
k k
x x
Y Y k
P (X = x) = φ0 φxi i αiji j , X ∈ {0, 1}
i=1 j=i+1
k k (12.10)
x x
Y Y
= exp(log(φ0 φxi i αiji j ))
P i=1 j=i+1
P
= φ0 exp( xi logφi + xi xj logαij ).
Y, al sumar todos los elementos de la cuantı́a:
X X X X
1= P (X = x) = φ0 exp( xi logφi + xi xj logαij )
x∈H x∈H
1
⇒ φ0 = X X X (12.11)
exp( xi logφi + xi xj logαij )
x∈H
1
⇒ φ0 = 1eHφ
A modo de ejemplo se presenta el caso particular k = 2. En dicho caso Γ y H

adoptan la siguiente forma:
0 0 0
logφ1
1 0 0
Γ = logφ2
H= 0 1 0
logα12
1 1 1
De esta manera:
154
1
φ0 = 1eHΓ
1
= e<(0,0,0)Γ> +e<(1,0,0)Γ> +e<(0,1,0)Γ> +e<(1,1,1)Γ>
1
= e0 +elogφ1 +elogφ2 +elogφ1 +logφ2 +logα12
1
= 1+φ1 +φ2 +φ1 φ2 α12 ,
tal como se vio en la ecuación (12.6).
En cuanto a la interpretación de los parámetros, φ0 continúa interpretándose

como la probabilidad de obtener el valor cero en todas las variables. En cuanto a los
parámetros φi y αij , éstos se interpretan como los odds y odds ratio condicionales a
que el resto de las variables sean cero. Pese a que serı́a deseable que la interpretación
de dichos coeficientes no fuese parcial, es fácil construir estimadores incondicionales
a partir de los elementos del vector Γ.
El siguiente paso es definir las distribuciones condicionales y marginales de sub-

conjuntos del vector X. Sin pérdida de generalidad se asumirá que se quiere obtener
la distribución marginal del vector X M = (X1 , X2 , . . . , XM ), la cual se obtendrá
sumando sobre los 2k−M valores posibles del vector X m = (XM +1 , . . . , Xk ), donde
m = k − M.
XM +1 =1 XX
k =1 p p
x xj
X Y Y
P (X M
= x) = ... φ0 φxi i αiji
XM +1 =0 Xk =0 i=1 j=i+1
M M
x x
Y Y M
= φ∗0 φxi i αiji j F (x, φm , φM m ), x ∈ {0, 1}
i=1 j=i+1
YM YM
= φ∗0 φ∗i xi ∗ xi xj
αij .
i=1 j=i+1
De aquı́ se puede concluir que todas las distribuciones marginales también per-
tenecen a la familia de distribuciones BM. En cuanto a F (x, φm ), es una función
que involucra a los elementos de x, a las intensidades (γ (m) ) correspondientes a las
variables sobre las cuales se suma y a las intensidades (φM ) que “vinculan” los ele-
mentos de X M y X m . Para la construcción de los parámetros marginales se utiliza el
resultado anterior conjuntamente con la definiciones de odd y odds ratio marginales.
La definición de las intensidades marginales φ∗i en (12.13) es la siguiente:
(k−M )
φ∗i = φi γ
ei , (12.14)
(m) Hφ(m)
donde φei = e1eHφm φM (m) . La interpretación de estas intensidades marginales co-
rresponde a una corrección de las intensidades originales, donde dicha corrección
se construye como un promedio ponderado de las asociaciones (αM (m) ) entre Xi
y las variables contenidas en X k , con ponderadores dados por las intensidades y
asociaciones (αm ) de las variables sobre las cuales se sumó.
El caso de las asociaciones marginales en la ecuación (12.13) es similar:
155
(m)
∗
γ
eij
αij = αij φi φj (m) (m)
. (12.15)
γ
ei γ
ej
Las distribuciones condicionales son mas sencillas y se construyen a partir de la
siguiente relación:
P (X M = xM , X m = xm ) M M
P (X M = xM |X (m) = xm ) = , X ∈ {0, 1} (12.16)
P (X m = xm )
donde el numerador no es otra cosa que la cuantı́a que ya se definió en (12.9) y el
denominador corresponde a la marginal del vector Xk que se acaba de presentar.
Finalmente la cuantı́a condicional es la siguiente:
M M
x x
Y Y M k−M
P (X M = xM |X m = xm ) = φ0|j φxi|m
i
αiji j , X M ∈ {0, 1} , X m ∈ {0, 1}
i=1 j=i+1
1
φ0|j = HφM |m ,
1e
x
Y
φi|m = φi αijj .
xj ∈m
(12.17)
Hay que tener en cuenta cómo el proceso de condicionar en los valores de las
variables contenidas en X m solo afecta las intensidades y no las asociaciones.
12.2.4. Estimación
Dado que la función de verosimilitud es no lineal en los parámetros, se opta
por realizar la estimación de los parámetros del modelo BM mediante técnicas de
optimización numérica. Para ello, se define la función de log-verosimilitud de una
muestra de n observaciones como:
k
X k
X k
`(x|φ) = n log(φ0 ) + Sj log φi + Sjk log αik , x ∈ {0, 1} , (12.18)
j=1 j=1
n
X n
X
donde Sj = xij y Sjk = xij xik .
i=1 i=1
La maximización de esta función se lleva a cabo por algunos de los métodos

iterativos comunmente utilizados. La mayorı́a de los mismos requiere del gradiente
(o score) y la matriz Hessiana de la ecuación (12.18). Los elementos del primero (al
que denotamos como U (φ)) tienen la siguiente forma:
156
∂`(x|φ) H Γ
Sj 1e (j)
Uj (γ) = ∂φj = φj − n 1eHΓ ,
∂`(x|φ) Sjk H
1e (jk)
Γ (12.19)
Ujk (γ) = ∂αjk = αjk − n 1eHΓ ,
donde H(j) es la matriz compuesta por las filas de H que contienen unos en la
j-ésima columna (correspondiente a φj ), luego esta columna es reemplazada por un
vector de ceros. El caso de H(jk) es análogo al anterior pero con la columna corres-
pondiente a αjk reemplazada por un vector de ceros.
12.3. Una aplicación a la salud oral

Una posible aplicación de esta distribución es en al análisis de la enfermedad pe-
riodontal. La enfermedad periodontal, es una de las enfermedades más prevalentes
en Odontologı́a, teniendo un peso muy importante en la carga mundial de enferme-
dades no trasmisibles (ENT), que afectan al 40 % de la población mundial [8]. Desde
el punto de vista de la salud colectiva el estudio de su distribución, explicación, pre-
vención y tratamiento debe abordarse integralmente y considerase en el contexto
de la salud general de los colectivos humanos. Desde el punto de vista biológico, la
enfermedad periodontal está asociada al biofilm, matriz de microorganismos (inclui-
dos los patógenos en una baja proporción) adheridos a la superficie del diente que
en condiciones normales, se encuentran en armonı́a con el huésped sano. Los signos
asociados con esta patologı́a son sangrado gingival, sarro, bolsa patolı́gica, pérdida
de inserción de los tejidos periodontales, pérdida ósea y movilidad dentaria. Los
ı́ndices que pretenden dar cuenta de la enfermedad periodontal tienen limitaciones
derivadas del número de signos involucrados ası́ como de los instrumentos utiliza-
dos y la subjetividad del observador. A nivel internacional se habla de enfermedad
periodontal cuando existen bolsas periodontales iguales o mayores a 4 mm, la que
se mide a través del ı́ndice CPI.
12.3.1. Datos de sangrado

A continuación se presenta la aplicación de la distribución BM para el análisis del
sangrado peridontal que es uno de los componentes de la enfermedad periodontal.
Se trabaja con los datos provenientes del estudio sobre personas que demandan
atención en la Facultad de Odontologı́a de la Universidad de la República, Uruguay
y que son evaluados por los odontólogos del Servicio de registros de la Facultad. Se
aplica una muestra de 602 personas que consultan en el perı́odo que corresponde
a mayo 2015-junio 2016, los que se seleccionan mediante muestreo sistemático, a
los que se les aplica un cuestionario sociodemográfico y un examen completo de la
boca, en donde se evalúa el estado de las piezas dentales y de la mucosa.
Vemos como ejemplo 6 registros de la tabla de datos que muestran el estado en
términos de sangrado para las diferentes piezas que componen cada sextante, tal
como aparece en el Cuadro 12.1
En la Figura 12.1 puede verse que hay sextantes vinculados al maxilar superior
(sextantes 1, 2 y 3) e inferior (sextantes 4, 5 y 6) y a su vez si están en la parte
derecha (sextantes 1 y 6) o izquierda (sextantes 3 y 4) de la boca.
157
paciente s11 s31 s1617 s2627 s3637 s4647

1 1 0 1 1 0 0
3 1 1 0 1 0 1
8 0 0 0 0 0 0
50 0 0 0 0 0 0
100 0 0 0 0 0 0
550 0 0 1 1 0 0
Cuadro 12.1: Ejemplo de Presencia de sangrado en 6 personas
Figura 12.1: Distribución de los sextantes en la boca
piezas sextante presencia ausencia %

piezas 16 y 17 S1 167 435 27,7
pieza 11 S2 129 473 21,4
piezas 26 y 27 S3 174 428 28,9
pieza 31 S4 161 441 26,7
piezas 36 y 37 S5 119 483 19,8
piezas 46 7 47 S6 134 468 22,2
Cuadro 12.2: Presencia de sangrado por sextantes
158
En un análisis preliminar de estos datos se observó que gran parte de la muestra

tiene esta patologı́a. Se consideró “sano” a un individuo con sus 6 sextantes sanos.
Estos constituyen apenas el 43.8 % de los datos, por lo tanto conformaron un perfil
claro de individuos los cuales se dejaron de lado para trabajar sobre el resto, de
modo de poder determinar distintos perfiles de carga de enfermedad.
Cantidad de sextantes con sangrado Frecuencia

0 264
1 121
2 61
3 68
5 33
5 25
6 30
Total 602
Cuadro 12.3: Distribución de Cantidad de sextantes con sangrado
A partir de estos datos se van a ajustar modelos donde se supone que no hay
restricciones entre las relaciones de las 6 variables y luego modelos donde hay inde-
pendencia local y homogeneidad local de las asociaciones.
12.3.2. Modelo ajustado

Las subrutinas de cálculos fueron desarrolladas en el sistema R [11] usando,
para la optimización los algoritmos de optimización no lineal implementados en la
librerı́a nloptr [5] y que aparecen comentados por Ypma en el reporte técnico [14].
A continuación se muestran las subrutinas de estimación creadas en R especial-

mente con los resultados de las estimaciones puntuales y por intervalo, por ejemplo
para el modelo simple (sin restricciones).
y<-datos[,c(15:20)]
modelo1<-estim(y)
L0<-c(modelo1$intensidades,modelo1$asociaciones)
int.conf(modelo1,0.05)
repar(modelo1$intensidades,modelo1$asociaciones)
Vemos entonces los valores estimados φ̂i y α̂ij que devuelve la función estim.
Por otra parte, para una mejor interpretación de lo resultados, se reparametrizan
los φ̂i y los α̂ij para ser presentados como proporciones,odds y OR
> modelo1[1:2]
$intensidades
[1] 0.097 0.066 0.124 0.076 0.130 0.045
$asociaciones
159
[1] 2.678 4.675 1.585 2.423 1.871 1.880 1.777 2.859

2.513 2.140 1.271 2.665 2.182 4.970 1.916
repar(modelo1$intensidades,modelo1$asociaciones)
$proporciones
[1] 0.214 0.268 0.277 0.289 0.198 0.223
$odds
[1] 0.273 0.365 0.384 0.407 0.2464 0.286
$OR
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] Inf 6.535 7.237 5.7414 7.875 5.949
[2,] 6.535 Inf 5.532 3.9374 5.864 5.396
[3,] 7.237 5.532 Inf 9.0184 6.901 5.426
[4,] 5.741 3.937 9.018 Inf 7.662 5.906
[5,] 7.875 5.864 6.901 7.6617 Inf 11.56
[6,] 5.949 5.396 5.426 5.9057 11.56 Inf
intensidades
S1 S2 S3 S4 S5 S6
0.097 0.066 0.124 0.076 0.130 0.045
asociaciones
- 2.67 4.67 1.58 2.42 1.87
- 1.88 1.77 2.85 2.51
- 2.14 1.27 2.66
- 2.18 4.97
- 1.91
-
Cuadro 12.4: (a) Parámetros estimados
proporciones
S1 S2 S3 S4 S5 S6
0.277 0.214 0.289 0.223 0..268 0.198
OR
- 7.23 9.1 5.42 5.53 6.90
- 5.74 5.95 6.53 7.87
- 5.90 3.93 7.66
- 5.40 11.56
- 5.86
-
Cuadro 12.5: (b) Reparametrización a proporciones y OR
160
Los intervalos de confianza para los parámetros que surgen del modelo (intensi-
dades y asociaciones) se calculan utilizando la normalidad asintótica de los estima-
dores máximo verosı́miles con la siguiente formulación:
[φ − Z(1−α/2) ∗ s.e; φ + Z(1−α/2) ∗ s.e] (12.20)

donde s.e. es la raı́z cuadrada de la varianza de cada parámetro del modelo, la que
se estima para cada caso, a través de la descomposición QR de la hessiana asociada
al modelo.
intervalos de confianza al 95 % para las intensidades

intensidades Ext. Inf. Estimación puntual Ext. Sup.
1 0.065 0.097 0.129
2 0.041 0.066 0.091
3 0.086 0.124 0.161
4 0.048 0.076 0.103
5 0.091 0.130 0.169
6 0.026 0.045 0.065
Cuadro 12.6: intervalos de confianza al 95 % para las intensidades
intervalos de confianza al 95 % para las asociaciones

asociaciones Ext. Inf. Estimación puntual Ext. Sup.
1-2 1.284 2.678 4.072
1-3 2.517 4.675 6.833
1-4 0.720 1.585 2.450
1-5 1.247 2.423 3.598
1-6 0.802 1.871 2.939
2-3 0.886 1.880 2.874
2-4 0.794 1.777 2.761
2-5 1.447 2.859 4.270
2-6 1.095 2.513 3.931
3-4 1.017 2.140 3.262
3-5 0.634 1.271 1.908
3-6 1.202 2.665 4.128
4-5 1.071 2.182 3.293
4-6 2.358 4.970 7.581
5-6 0.871 1.916 2.961
Cuadro 12.7: intervalos de confianza al 95 % para las asociaciones
12.3.3. Discusión
Puede verse en este caso que según el modelo ajustado, el sextante con mayor
intensidad (parcial) es el S5 con un valor de φ̂5 = 0.13 mientras que los sextantes
que presentan mayor asociación (parcial) son el S4, S6 y el S1, S3 que son los sex-
tantes posteriores inferiores y superiores respectivamente, con valores de α̂4,6 =4.97
161
y α̂1,3 =4.67.
Si se opta por reducir el número de parámetros del modelo mediante restric-

ciones de igualdad, surgen diferentes alternativas. Una posibilidad es el modelo de
“independencia”, en dicho caso se impone αij = 1 ∀ i, j, logrando ası́ que solo se
estimen las k intensidades del modelo. Otro caso donde se simplifica la dimensio-
nalidad del modelo es el caso de “homogeneidad”, en este caso se asume αij = αkl
de modo que se estimen k intensidades y una sola asociación, común a todos los
pares de sextantes. Utilizando una prueba de cociente de verosimilitud, se pudieron
contrastar las hipótesis de estos modelos. A continuación se presentan las lı́neas de
código:
# para testear la hipotesis de asociaciones=1 (independencia)
modelo1.indep<-estim(x,restr=c(rep(NA,6),rep(1,15)))
1-pchisq(-2*(modelo1.indep$Logv-modelo1$Logv),df=p*(p-1)/2)
# para testear la hipotesis de asociaciones iguales (homogeneidad?)
modelo1.homog<-estim(x,restr=c(rep(NA,6),rep(-1,15)))
1-pchisq(-2*(modelo1.homog$Logv-modelo1$Logv),df=p*(p-1)/2-1)
Para el caso de la independencia entre los sextantes, se pudo rechazar la inde-
pendencia ya que el valor del estadı́stico (cuya distribución era χ215 ) arrojó un valor
p ≤0.00. Para el caso del modelo de homogeneidad de asociaciones, el estadı́stico
de prueba tiene un grado de libertad menos debido a que se estima un parámetro
de asociación. En este caso el p-valor fue de 0.043, rechazando ası́, que todas las
asociaciones fuesen iguales a un único valor desconodico. Por lo tanto en ambos
casos se rechazan la independencia y la homogeneidad de asociaciones.
En última instancia, retomando que en el modelo sin restricciones se observó que

las estimaciones de las asociaciones posteriores (sextantes S1-S3 y sextantes S4-S6)
eran mucho mayores al resto, se decidió poner a prueba la siguiente hipótesis:
α13 = α46
Para esto, se ajustó un nuevo modelo bajo esta restricción. Al comparar las
verosimilitudes, el p-valor encontrado fue de 0.942, lo que sugirió que las asociaciones
posteriores eran efectivamente, de la misma magnitud.
\# para testear la hipotesis alfa13 = alfa46
restriccion<-rep(NA,15)
restriccion[c(2,14)]<- -1
restriccion<-c(rep(NA,6),restriccion)
modelo1.restr<-estim(x,restr=restriccion)
modelo1.indep<-estim(x,restr=c(rep(NA,6),rep(1,15)))
1-pchisq(-2*(modelo1.indep\$Logv-modelo1\$Logv),df=p*(p-1)/2)
12.4. Conclusiones y futuros pasos

En este trabajo se presenta una metodologı́a de análisis para varias variables
binarias diferente a la que habitualmente se usa y que está basada en una des-
composición de una distribución Bernouilli Multivariada en términos que reflejan
162
intensidades de cada variable y asociaciones entre estas, que ya se habı́a presenta-

do por primera vez con resultados también en forma preliminar sobre enfermedad
periodontal en el documento de trabajo [2] .
Para el caso de una aplicación en salud oral se analizan las asociaciones entre
sextantes en el sangrado.
1. Se descartó la hipótesis de que la presencia de sangrado es independiente entre

algunos sextantes.
2. Se constató que la asociación de presencia de sangrado entre los sextantes

posteriores no difiere entre mandı́bula y maxilar.
A futuro se intentará establecer diferentes tipologı́as que den cuenta del gra-
diente de infección usando diferentes técnicas a ser combinadas con la distribución
Bernoulli Multivariada .
1. Creación de tipologı́as de sangrado gengival a través de variables latentes que

indican la pertenencia a diferentes grupos usando el algoritmo (EM).
2. Clustering a partir de particiones difusas mediante medidas de entropı́a:
[1],[10],[13]
Por otra parte, resta estudiar cómo hacer el proceso de ajuste de los modelos
al trabajar con valores faltantes. Esto problema de datos faltates es frecuente en la
evaluación de la enfermedad periodontal, cuando existen sextantes que no pueden
ser evaluados por no tener las personas las piezas que componen cada sextante.
Resta a su vez poder implementar el cálculo de los intervalos de confianza para
las reparametrizaciones de los componentes del modelo (odds, y OR), en donde la
varianza debe ser estimada mediante simulación Monte Carlo.
163
Bibliografı́a
[1] Álvarez, F., Álvarez-Vaz, R. y Massa, F. , Determinación de tipologı́as

de infecciones parasitarias intestinales, en escolares mediante, técnicas de clus-
tering sobre datos binarios. En CLATSE 2012. Congreso Latinoamericano de
Sociedades de Estadı́stica,2012.
[2] Álvarez-Vaz, R. y Massa, F. Distribución bernoulli multivariada. una apli-

cación a la salud oral. Documento de Trabajo Serie DT (14/03) - ISSN :
1688-6453, IESTA,2014.
[3] Cox, D. R. and Wermuth, N.. On some models for multivariate binary
variables parallel in complexity with the multivariate gaussian distribution.
Biometrika, 89:462–469,2002.
[4] Dai, B.. Multivariate Bernoulli Distribution Models. Technical Report 1171,
Department of Statistics, University of Wisconsin, Madison WI, 1300 Univer-
sity Ave, 2012.
[5] Johnson, S. G.. The NLopt nonlinear-optimization package. Rpackage version

1.0.4, 2014.
[6] Jurasinski, G. and Retzer, V.. simba: A Collection of functions for simi-
larity analysis of vegetation data. R package version 0.3-4, 2012.
[7] Lorenzo, S., Alvarez Vaz, R., Blanco, S., y Peres, M., Primer Re-
levamiento Nacional de Salud Bucal en población joven y adulta uruguaya:
Aspectos metodológicos. Odontoestomatologı́a, 15:8 – 25, 2013.
[8] Lorenzo, S., Piccardo, V., Álvarez, F., Massa, F., y Álvarez Vaz, R.,
Enfermedad Periodontal en la población joven y adulta uruguaya del Interior
del Pais: Relevamiento Nacional 2010-2011. Odontoestomatologı́a, 15:35 – 46,
2013.
[9] Marshall, A. and Olkin, I.. A family of bivariate distribution generated
by the bivariate bernoulli distribution. Journal of the American Statistical
Association, 80:332–338, 1985.
[10] Moustaki, I. y Papageorgiou, I., 2004. Latent class models for mixed
variables with applications in archaeometry. Elsevier Computational Statistics
& Data Analysis, p. 17, 2004.
164
[11] R Core Team. R: A Language and Environment for Statistical Computing.

R Foundation for Statistical Computing, Vienna, Austria, 2014.
[12] Tamhane, A. C., Qiu, D., y Ankenman, B. E.. A parametric mixture
model for clustering multivariate binary data. Wiley InterScience, pp. 3–19,
2009.
[13] Tsekouras, G., Papageorgiou, D., Kotsiantis, S., Kalloniatis, C., y
Pintelas, P.. Fuzzy clustering of categorical attributes and its use in analy-
zing cultural data. World Academy of Science, Engineering and Technology,
1:87–91, 2005.
[14] Ypma, J. Introduction to nloptr: an r interface to nlopt. Technical report,
2014.
165
Capı́tulo 13
Determinación de la distribución de probabilidad de la demanda en un modelo
de control de inventarios
Erika Hernández-Vargas y Rocı́o Ilhuicatzi-Roldán
Universidad Politécnica de Tulancingo,

Calle Ingenierı́as No 100, Col. Huapalcalco,
C.P. 43629, Tulancingo, Hidalgo,
Universidad Autónoma de Tlaxcala,
Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a,
Calz. Apizaquito s/n. km. 1.5,
C.P. 90300, Apizaco, Tlaxcala,
kik 1505@hotmail.com, rocioil@hotmail.com
Resumen. Se presenta un modelo de control de inventarios mediante la teorı́a
de procesos de decisión de Markov. Los conjuntos de estados y acciones se suponen
finitos. Para este modelo, la ley de transición queda determinada por una ecuación
en diferencias, la cual involucra la distribución de probabilidad de la demanda. En
un caso real, se propone estimar dicha distribución a partir de observaciones de la
demanda, por medio de la función de distribución empı́rica. Ası́ mismo, se sugiere
implementar un procedimiento de horizonte rodante para la obtención de la acción
de control en cada época de decisión, dicho horizonte permitirá mejorar la estima-
ción de la distribución de la demanda agregando el dato observado de la demanda
en la época anterior. Se muestra un ejemplo numérico a través de un programa
elaborado en Matlab, que calcula la distribución de la demanda y resuelve median-
te programación dinámica los problemas de control de inventarios indicados por el
procedimiento de horizonte rodante.
Abstract. A model inventory control through the theory of Markov decision

processes is presented. The sets of the states and the actions are considered finites.
For this model, the transition law is determined by an equation in differences, which
involves the probability distribution of the demand. In a real case, it is proposed to
estimate this distribution from observations of the demand, through the empirical
distribution function. Also, it is suggested implement a rolling horizon procedure to
obtain the control action of control in each decision period, such horizon will allow
to improve the estimate of the distribution of demand by adding the observed data
of the demand in the previous period. A numerical example is shown by means of
a program elaborate in Matlab, which calculates the distribution of demand and
solves through dynamic programming the inventory control problems indicated by
the rolling horizon procedure.
166
Palabras clave: Procesos de decisión de Markov, Programación dinámica, Fun-

ción de distribución empı́rica, Horizonte rodante.
El presente trabajo está relacionado con un modelo de control de inventarios.
En todo sistema de inventarios, se pueden identificar las siguientes componentes:
demandas, costos y reabastecimientos. Por lo general, las demandas son estocásticas
y de ahı́ surge el problema de control de inventarios. Al considerar un inventario
de mercancı́a se incurre en diferentes costos, los tres más significativos son: cos-
to por mantener un inventario, costo por reabastecimiento y costo por escasez de
mercancia. Dos decisiones que se pueden tomar en cuenta al tratar de controlar
un inventario son: cuándo reabastecer el inventario y qué cantidad de mercancia
ordenar para el reabastecimiento. El problema de control de un inventario consiste
en establecer una polı́tica de reabastecimiento que minimize el costo total asociado
a su manejo.
La teorı́a de procesos de decisión o control de Markov permite modelar a los

sistemas de inventarios. Un proceso de decisión de Markov requiere de un modelo
conocido como modelo de control de Markov, cuyas componentes permiten carac-
terizar su desarrollo en el transcurso del tiempo. La dinámica del proceso puede ser
influenciada por medio de la aplicación de acciones o controles en cada periodo de
tiempo. A la sucesión de acciones se le conoce como polı́tica, una forma de evaluar
su calidad es mediante una función objetivo o criterio de rendimiento. Entonces,
el problema de control óptimo consiste en determinar una polı́tica que optimice el
criterio de rendimiento.
En este trabajo se considera un modelo de control de inventarios propuesto en

[2], dentro de la teorı́a de procesos de decisión de Markov. Los conjuntos de estados
y acciones se consideran finitos. Para este modelo la ley de transición queda deter-
minada mediante una ecuación en diferencias la cual involucra la distribución de
probabilidad de la demanda y la función de costo por periodo se plantea en termi-
nos de los costos ya mencionados (reabastecimiento, mantenimiento de inventario
y escasez). En el problema de control de inventarios se considera como función de
rendimiento el costo total esperado con horizonte finito.
En la aplicación real del modelo mencionado, se requiere de la distribución de

probabilidad de la demanda, la cual difı́cilmente es proporcionada al momento de
iniciar el control y tendrı́a que ser estimada. La misma complicación ocurre con los
costos, pero, en este trabajo no se hace investigación sobre la determinación de los
costos.
El principal objetivo de este trabajo es proponer, con bases teóricas, una me-
todologı́a que permita estimar la distribución de probabilidad de la demanda. Se
propone estimar dicha distribución a partir de observaciones de la demanda, me-
diante la función de distribución empı́rica. Ası́ mismo, se considera el caso en donde
incluso se desconoce el horizonte de planeación. Para tal caso, se sugiere implemen-
167
tar un procedimiento de horizonte rodante para la obtención de la acción de control

en cada época de decisión, teniendo como ventaja el poder mejorar la estimación de
la distribución de probabilidad de la demanda al agregar cada vez el dato observado
de la demanda en la etapa anterior.
Para mostrar ejemplos numéricos, se ha elaborado un programa en Matlab, que

calcula la distribución de probabilidad de la demanda y resuelve mediante progra-
mación dinámica el problema de control de inventario con horizonte de planeación
finito (cuando se conoce el horizonte de planeación con certeza) o los problemas de
control de inventarios que requiere el procedimiento de horizonte rodante (cuando
no se tenga conocimiento sobre el horizonte de planeación).
Este trabajo se encuentra organizado de la siguiente manera: en la segunda sec-

ción, se proporcionan los conceptos básicos sobre la teorı́a de procesos de decisión
de Markov, en la tercera sección, se describe el modelo de control de inventarios
como un modelo de decisión de Markov, en la cuarta sección, se proporciona el
procedimiento para estimar la función de distribución de probabilidad de la deman-
da, en la quinta sección, se muestra un ejemplo numérico. Finalmente, se dan las
conclusiones.
13.2. Preliminares
En esta sección, se introducen los conceptos básicos de la teorı́a de procesos de
decisión de Markov, los cuales han sido retomados de [5].
13.2.1. Modelo de control de Markov

Un modelo de control o decisión de Markov puede representarse de la siguiente
manera:
{T, S, As , pt (·|s, a), ct (s, a)}
donde T representa el conjunto de épocas de decisión, S denota un conjunto de
estados del sistema, As representa al conjunto de acciones o controles admisibles
cuando el sistema se encuentra en el estado s ∈ S, pt (·|s, a) es una ley de transición
condicionada al estado s ∈ S y la acción elegida a ∈ As y ct (s, a) es una función de
costo por periodo que depende del estado s y la acción a.
Observación 13.2.1 En este trabajo se considera T = {0, 1, . . . , N } donde N <

∞ representa el horizonte de planeación y se consideran conjuntos de estados y
acciones finitos.
La dinámica del sistema es la siguiente: en una época de decisión t, un contro-

lador observa un estado st ∈ S del sistema y elige una acción at ∈ Ast incurriendo
en un costo ct (st , at ) por periodo, simultaneamente el sistema transita a un nuevo
estado st+1 con probabilidad de transición pt (st+1 |st , at ).
168
Observación 13.2.2 En muchos casos, la transición de estados puede ser especi-

ficada mediante una ecuación en diferencias, dada de la siguiente forma:
st+1 = ft (st , at , ωt ),
t = 0, 1, . . ., donde s0 es el estado inicial y {ωt } es una sucesión de variables alea-

torias independientes e idénticamente distribuidas que toman valores en un espacio
arbritario W y tienen distibución de probabilidad conocida, independiente del estado
inicial.
Se puede tener el caso en donde la función de costo dependa también de ωt .
13.2.2. Polı́tica de control

Las acciones pueden elegirse mediante reglas de decisión d aleatorias o deter-
ministas. Sea P(As ) la colección de todas las distribuciones de probabilidad sobre
subconjuntos de Borel de As . Elegir acciones aleatoriamente significa elegir una
distribución de probabilidad q(·) ∈ P(As ), de tal manera que la acción a es se-
leccionada con probabilidad q(a). Las distribuciones de probabilidad degeneradas
(q(a) = 1) corresponden a elección determinista de acciones. A su vez, las reglas de
decisión pueden ser markovianas o dependientes de la historia.
Las reglas de decisión necesarias para el desarrollo de este trabajo son determi-
nistas markovianas, las cuales se definen como funciones dt : S → As que especifican
la elección de la acción con certeza cuando el sistema se encuentra en el estado s
en la época de decisión t. Para cada s ∈ S, dt (s) ∈ As . Se dicen ser markovianas
porque dependen únicamente del estado actual del sistema y no de previos estados
y acciones. El conjunto de dichas reglas de decisión será denotado por DM D
Una polı́tica de decisión o control π especifica en cada una de las épocas de deci-
sión la regla de decisión que debe ser usada, esto es, π = (d0 , d1 , . . . , dN −1 ) (cuando
el horizonte de planeación es finito, se adopta la convención de que ninguna acción
será tomada en la época de decisión N ).
Una polı́tica determinista markoviana es una polı́tica π = (d0 , d1 , . . . , dN −1 ) tal

que dt ∈ DM D para t = 0, 1, . . . , N − 1. El conjunto de todas las polı́ticas determi-
nistas markovianas será denotado por ΠM D .
13.2.3. Problema de control óptimo

Considere un sistema dinámico en tiempo discreto con ley de transición
st+1 = ft (st , at , ωt ), t = 0, 1, . . . , N − 1.
Dado un estado inicial s0 , el problema de control óptimo consiste en encontrar una

polı́tica π = {d0 , d1 , ..., dN −1 } que minimice la función de costo
"N −1 #
X
Jπ (s0 ) = Eω0 ,ω1 ,...,ωN −1 ct (st , dt (st ), ωt ) + cN (sN ) (13.1)
t=0
169
sujeta a la ley de transición
st+1 = ft (st , dt (st ), ωt ), t = 0, 1, . . . , N − 1,
donde cN es una función de costo terminal.
Observación 13.2.3 La función objetivo (13.1) es referida como costo total espe-
rado con horizonte finito N . Dentro de la teorı́a de procesos de decisión de Markov,
existen otras funciones objetivo o de rendimiento, tales como son el costo total es-
perado descontado y el costo esperado promedio.
Una polı́tica óptima de control π ∗ es tal que
Jπ∗ (s0 ) = min Jπ (s0 ),

π∈Π
donde Π es el conjunto de todas las polı́ticas de control. El costo óptimo correspon-

diente puede ser denotado por J ∗ (s0 ); esto es,
J ∗ (s0 ) = Jπ∗ (s0 ).
J ∗ es una función que asigna a cada estado inicial s0 el costo óptimo J ∗ (s0 ), es
llamada función de valor óptimo.
13.2.4. Programación dinámica

La técnica de programación dinámica es la más usada para resolver el problema
de control descrito anteriormente. La siguiente proposición establece de manera
precisa el algoritmo de programación dinámica que da solución óptima al problema
de control.
Proposición 13.2.4 Sea J ∗ (s0 ) el costo óptimo. Entonces,
J ∗ (s0 ) = J0 (s0 ),
donde la función J0 esta dada por la última iteración del siguiente algoritmo, el
cual procede hacia atrás desde la época de decisión N − 1 a la época de decisión 0:
JN (sN ) = cN (sN )
Jt (st ) = min Eωt [ct (st , at , ωt ) + Jt+1 (ft (st , at , ωt ))], (13.2)
at ∈Ast
t = 0, 1, . . . , N − 1.
Además, si a∗t = d∗t (st ) minimiza el lado derecho de (13.2) para cada st y t, la ley
de control π ∗ = {d∗0 , d∗1 , . . . , d∗N −1 } es óptima.
La demostración de la Proposición 13.2.4 puede consultarse en [2], pag. 234.
170
13.2.5. Procedimiento de horizonte rodante

El procedimiento de horizonte rodante es el método mas común aplicado en la
práctica para aproximar soluciones a problemas de control óptimos no homogeneos
con horizonte infinito (vease [1]). Primero se fija un horizonte H, luego se procede
a resolver el problema correspondiente de H periodos y se implementa la primera
acción óptima encontrada, se rueda hacia adelante un periodo y se repite el proce-
dimiento a partir del estado actual y ası́ sucesivamente. Enseguida, se presenta el
algoritmo de horizonte rodante.
Algoritmo 13.2.5 Procedimiento de horizonte rodante.
1. Hacer m = 0 y n = H.
2. Hallar la polı́tica π ∗ = (d∗m , d∗m+1 , ..., d∗n−1 ), la cual es óptima para los periodos
de m a n, y sea dˆm = d∗m .
3. Hacer m = m + 1 y n = n + 1.
4. Regresar al Paso 2.
La polı́tica π̂ = (dˆ0 , dˆ1 , dˆ2 , ...) es llamada una polı́tica de horizonte rodante.
13.3. Modelo de inventarios

En un sistema de inventarios, considere el problema de ordenar una cantidad
de cierta mercancı́a al principio de cada periodo de tiempo para satisfacer una de-
manda estocástica. La teorı́a de procesos de decisión de Markov es adecuada para
modelar y resolver dicho problema.
El modelo de inventarios que se presenta en este trabajo es retomado de [2], pag.

18, y se formula bajo el siguiente conjunto de suposiciones simples:
1. La decisión de ordenar una cantidad adicional de inventario se realiza al inicio
de cada periodo de revisión y la entrega ocurre inmediatamente.
2. Las demandas del producto llegan a través del periodo pero todas son satis-
fechas al finalizar el periodo.
3. Si la demanda excede el inventario, el exceso de la demanda se pierde.
4. Los costos y la distribución de probabilidad de la demanda no varı́an de un
periodo a otro.
5. El producto es vendido sólo en unidades enteras
6. El almacen tiene una capacidad máxima de M unidades.
Sea st el nivel de inventario o stock disponible al principio del periodo t, at la

cantidad ordenada al principio del periodo t y ωt la demanda durante el perio-
do t. Se supone que {ω0 , ω1 , . . .} es una sucesión de variables aleatorias indepen-
diente e idénticamente distribuidas con probabilidad conocida P (ωt = k) = pk ,
171
k = 0, 1, . . . , D, donde D < ∞ es el valor máximo de la demanda. Observe que, de

acuerdo a los supuestos del modelo, el nivel de inventario st + at en el periodo t
debe cumplir que st + at ≤ M y como el exceso de demanda ωt − st − at se pierde,
el nivel de inventario se desarrolla de acuerdo a la siguiente ecuación en diferencias:
st+1 = max{0, st + at − ωt }.
Finalmente, el costo por periodo está dado por
c(st , at , ωt ) = dat + h max{0, st + at − ωt } + p max{0, ωt − st − at },
donde
d es el costo por unidad ordenada,
h es el costo por mantener en inventario una unidad de inventario
p es el costo por unidad no abastecida.
De esa manera, las componentes del modelo de decisión para el modelo de control
de inventarios, quedan especificadas de la siguiente manera:
épocas de decisión: T = {1, 2, . . . , N }, N ≤ ∞.
Conjunto de estados: S = {0, 1, . . . , M }.
Conjunto de acciones admisibles: As = {0, 1, 2, . . . , M − s}.
Ley de transición: st+1 = max{0, st + at − ωt }, donde P (ωt = k) = pk ,
k = 0, 1, . . . , D con D < ∞.
Costo por periodo: c(st , at , ωt ) = dat + h max{0, st + at − ωt } + p max{0, ωt −
st − at }.
La ecuación de programación dinámica para el problema de control de inventario,
de acuerdo con la Proposición 13.2.4, es dada como sigue:
JN (sN ) = cN (sN )
 
dat + h max{0, st + at − ωt }
Jt (st ) = min Eωt  +p max{0, ωt − st − at } 
at ∈{0,1,2,...,M −st }
+Jt+1 (max{0, st + at − ωt })
t = N − 1, N − 2, . . . , 0. (13.3)
13.4. Distribución de probabilidad de la demanda

en un sistema de inventarios
Para la aplicación del modelo de inventarios, presentado en la sección anterior,
a un sistema de inventarios real, se requiere contar con todas las componentes del
modelo de control de Markov. Principalmente se preveé la dificultad de contar con
la distribución de probabilidad de la demanda. El principal objetivo, como ya se
mencionó en la introducción, es proponer, con bases teóricas, una metodologı́a para
la determinación de la distribución de probabilidad de la demanda. Por ello, a
continuación se presenta una serie de resultados sobre la distribución empı́rica, los
cuales serán de utilidad.
172
13.4.1. Función de distribución empı́rica

Los siguientes conceptos son retomados de [3].
Sea F (w) la función de distribución de una variable aleatoria ω y

w0 , w1 , ..., wn (13.4)
los resultados de una sucesión de ensayos independientes en circunstancias idénticas.
La sucesión ordenada de manera creciente de (13.4) se puede representar como

sigue:
∗ ∗ ∗
w0,k 0
< w1,k 1
< ... < wr,k r
Pr
donde ki es el número de observaciones iguales a wi∗ , y i=0 ki = n. Tal sucesión
ordenada es llamada sucesión de variación.
La función Fn (w) definida como

para w < w0∗ ,

 0,
 Pi
j=1 kj ∗ ∗
Fn (w) = , para wi,k ≤ w < wi+1,k , i = 0, 1, . . . , r − 1,
 1, n
 i
para w ≥ wr,k∗
.
i+1
es llamada función de distribución empı́rica.
Observe que la función de distribución empı́rica es monótona y tiene sus puntos

de discontinuidad en los valores que coinciden con los valores de la sucesión de va-
riación. El tamaño del salto para los valores diferentes de la sucesión de variación
es igual a kni .
En el caso particular más simple donde la variable aleatoria ω puede tomar solo
un número finito de valores a0 , a1 , ..., aD , los términos de la sucesión de variación
podrı́an ser solo estos valores. Si k0 , k1 , ..., kD (k0 + k1 + .. + kD = n) denotan el
número de ensayos donde ω = a0 , ω = a1 , ...ω = aD , entonces, por la Ley de los
Grandes Números, estas frecuencias (para un n suficientemente grande) representa-
ron valores aproximados de las probabilidades desconocidas p0 = P {ω = a0 } , p1 =
P {ω = a1 } , ..., pD = P {ω = aD }, esto es p0 ≈ k0 /n, p1 ≈ k1 /n, ..., pD ≈ kD /n. Lo
descrito en este párrafo queda formalmente establecido en el siguiente teorema.
Teorema 13.4.1 (El Teorema de Borel). Sea µ el número de ocurrencias de un
evento A en n independientes ensayos en cada uno de los cuales el evento A podrı́a
ocurrir con probabilidad p. Entonces, cuando n → ∞
µ
P { → p} = 1
n
La demostración del Teorema de Borel puede consultarse en [3], pag. 212.
Teorema 13.4.2 (Teorema de Glivenko) Sea F (w) la función de distribución

de una variable aleatoria ω, y Fn (w) la función de distribución empı́rica de n ob-
servaciones independientes de la variable aleatoria ω. Entonces, cuando n → ∞

P sup |Fn (w) − F (w)| → 0 = 1.
−∞<x<∞
173
El Teorema de Glivenko permite estimar la función de distribución desconocida

de una variable aleatoria ω a partir de observaciones de la variable; es llamado Teo-
rema Principal de la Estadı́stica. Su demostración puede consultarse en [3], pag.215.
13.4.2. Estimación de la distribución de probabilidad de la

demanda
Recuerde que en el modelo de control de inventarios, la sucesión {ωt } es una
sucesión de variables aleatorias independientes e idénticamente distribuidas que
representan la demanda en el periodo t. Dichas variables, por ser idénticamente
distribuidas y por suponer que no varı́an de un periodo a otro, pueden ser repre-
sentadas por una variable genérica ω.
De acuerdo con el Teorema de Borel, para la estimación de la distibución de

probabilidad de ω, es necesario contar con observaciones de la demanda antes de
iniciar el control del inventario y entre mayor el número de observaciones, mejor
será la estimación de dicha distribución de probabilidad. El siguiente algoritmo,
indica el procedimiento para la estimación de la distribución de probabilidad de ω.
Algoritmo 13.4.3 Estimación de la distribución de probabilidad de la de-

manda.
1. Sea Cn el vector correspondiente a las n observaciones de la demanda.
2. Hacer D = max Cn .
3. Para i desde 0 hasta D, sea ki el número de observaciones iguales a i.
4. Hacer pˆi = ki /n,
pˆi es el valor estimado para pi = P (ω = i), i = 0, 1, . . . , D.
Otro inconveniente, al momento de aplicar el modelo de control de inventario, es

que también el horizonte de planeación N pudiera ser no especificado. En este caso,
se propone usar un procedimiento de horizonte rodante (véase el Algoritmo 13.2.5)
para la obtención de la acción de control en cada época de decisión, proporcionando
un valor adecuado para el horizonte H. De esa manera, se obtendrán las acciones
de control para los periodos necesarios.
Una ventaja que se podrı́a tener con la aplicación de un procedimiento de hori-

zonte rodante, es que los datos de la demanda observados en periodos ya controlados
podrı́an agregarse para mejorar la estimación de la distribución de la demanda, in-
cluso podrı́an modificarse costos en caso de ser necesario.
La Figura 13.1, muestra un diagrama de flujo que permite el control de un in-

ventario, en donde la acción de control obtenida es de horizonte rodante. En el
Algoritmo 13.2.5, la solución óptima de los problemas de control de tamaño H es
hallada mediante programación dinámica, de acuerdo con la Proposición 13.2.4 y
(13.3).
174
Figura 13.1: Diagrama de flujo para el control del inventario.
175
13.5. Ejemplo numérico

En esta sección se muestra un ejemplo numérico. Para la obtención de resulta-
dos se ha elaborado un programa en Matlab que incluye el Algoritmo 13.4.3 y el
algoritmo de programación dinámica indicado en la Proposición 13.2.4 y (13.3).
Considere el problema de control de inventarios presentado en este trabajo, con los
siguientes valores de los parámetros del modelo:
Vector de observaciones de la demanda:
C25 = [8, 3, 1, 7, 8, 1, 7, 8, 0, 6, 6, 8, 6, 5, 3, 2, 2, 1, 4, 6, 1, 8, 5, 4, 3].
Horizonte de planeación: N = 10 periodos.

Costo por unidad ordenada: d = 1.
Costo por mantener en inventario una unidad de inventario: h = 2.

Costo por unidad no abastecida: p = 4.
Costo terminal: cN (s) = s2 .
Máxima capacidad del inventario: M = 7.
La distribución de probabilidad de la demanda estimada se muestra en el si-

guiente vector:
p = [0.04, 0.16, 0.08, 0.12, 0.08, 0.08, 0.12, 0.08, 0.2]
La polı́tica óptima obtenida se presenta en el Cuadro 13.1.
t 0 1 2 3 4 5 6 7 8 9
s
0 3 2 1 0 0 0 0 0 0 0
1 5 4 3 2 1 0 0 0 0 0
2 6 5 4 3 2 1 0 0 0 0
3 6 5 4 3 2 1 0 0 0 0
4 6 5 4 3 2 1 0 0 0 0
5 6 5 4 3 2 1 0 0 0 0
6 6 5 4 3 2 1 0 0 0 0
7 6 5 4 3 2 1 0 0 0 0
Cuadro 13.1: Polı́tica óptima.
El costo total esperado mı́nimo para cada estado inicial s, se muestra en el

Cuadro 13.2.
176
s 0 1 2 3 4 5 6 7
J0 (s)
102.67 101.67 100.67 99.67 98.67 97.67 96.67 96.29
Cuadro 13.2: Valor óptimo.
13.6. Conclusiones
En este trabajo se ha estudiado mediante la teorı́a de procesos de decisión de
Markov un modelo de control de inventarios, en donde, se destaca la problemática
de no contar con la distribución de probabilidad de la demanda estocástica en
una aplicación real. Entonces, se propone estimar dicha distribución mediante la
distribución empı́rica a partir de observaciones previas de la demanda. Además, se
sugiere utilizar un procedimiento de horizonte rodante, que permite el control de
un inventario, aún cuando se desconozca el horizonte planeación.
177
Bibliografı́a
[1] Alden J. M. y Smith R. L. Rolling horizon procedures in nonhomogeneous

Markov decision process. Operations Research. Vol. 40, pp. 183-194, 1992.
[2] Bertsekas D. P. Dynamic Programming: Deterministic and Stochastic Models.
Prentice-Hall, New Jersey, 1987.
[3] Gnedenko B. V. Theory of Probability. Gordon and Breach Science Publishers,
Amsterdam, 1997.
[4] Hernández-Lerma O. y Lasserre J. B. Discrete-Time Markov Control Pro-
cesses: Basic Optimality Criteria. Springer, New York, 1996.
[5] Puterman M. L. Markov decision process: discrete stochastic dynamic pro-
gramming John Wiley & Sons, New Jersey, 1994.
178
Capı́tulo 14
El Conteo en la Probabilidad
Francisco Tajonar Sanabria, Estela Morales Ruiz, Fernando Velasco Luna,

Hugo Cruz Suárez y Dionicio Zacarı́as Flores

ftajonar@fcfm.buap.mx, estelamruiz@gmail.com,
fvelasco@fcfm.buap.mx, hcs@fcfm.buap.mx, jzacarias@fcfm.buap.mx
Resumen. En la actualidad la teorı́a de la probabilidad es una rama importante
de las matemáticas y las matemáticas aplicadas, con sus propios conceptos, méto-
dos y resultados. Tiene relaciones profundas con otros campos de las matemáticas
e innumerables usos teóricos y aplicaciones prácticas en otras ciencias. El problema
que presenta el lector que gusta de la Probabilidad es no saber contar. En este
trabajo se discutirán algunos problemas clásicos que pueden resolverse con técnicas
de conteo y ayudan al manejo de la Probabilidad.
Abstract. At present, the theory of probability is an important branch of applied

mathematics and mathematics, with its own concepts, methods and results. It has
deep relationships with other fields of mathematics and innumerable theoretical uses
and practical applications in other sciences. The problem presented by the reader
who likes Probability is not knowing how to count. In this paper we will discuss
some classic problems that can be solved with counting techniques and help the
handling of the Probability.
Palabras clave: Conteo, Probabilidad, Probabilidad Clásica.
En el siglo XX la Teorı́a de la Probabilidad tuvo un desarrollo importante tanto
en la parte teórica como en sus aplicaciones. En los años treinta se transformá del
cálculo de probabilidades en teorı́a de la probabilidad. El cálculo de probabilidades
ya tenı́a algunos de los ingredientes básicos de la teorı́a, pero consistı́a principalmen-
te en una colección de problemas computacionales con ideas intuitivas y resultados
poco precisos. La noción misma de probabilidad era confusa. Henri Poincaré afirmá
en su libro Calcul des probabilitı́es (1900) que no se podı́a dar una definición sa-
tisfactoria de probabilidad. En la actualidad la teorı́a de la probabilidad es una
179
rama importante de las matemáticas y las matemáticas aplicadas, con sus propios
conceptos, métodos y resultados. Tiene relaciones profundas con otros campos de
las matemáticas e innumerables usos teóricos y aplicaciones prácticas en otras cien-
cias y en la tecnologı́a, ası́ como implicaciones que nos afectan más de lo que nos
imaginamos.
Uno puede observar que muchos de los eventos que ocurren en la vida diaria
no se pueden predecir con exactitud, ni con anticipación por diversas razones, pues
la mayorı́a de los hechos están influenciados por factores externos. Además, exis-
ten aquellos sucesos que están directamente influenciados por el azar, es decir, por
procesos en los cuales no se esta completamente seguro de lo que va ocurrir. Sin
embargo, la probabilidad nos permite tratar a este tipo de sucesos y estudiarlos,
ponderando las posibilidades de su ocurrencia y proporcionando métodos para tales
ponderaciones.
La probabilidad nos permite descubrir que algunos sucesos tienen una mayor
o menor probabilidad de ocurrir que la ponderación asignada a través del sentido
común. Esto nos permite señalar que la información previa que podamos tener,
conocimiento o postura, son algunos de los factores que intervienen para no per-
mitirnos hacer ponderaciones reales y sistemáticas. La probabilidad de estudiar los
eventos de manera sistemática y más cercana a la realidad, retribuirnos con infor-
maciaón más precisa y confiable y, por tanto, de utilidad para algunas disciplinas
de investigación.
La necesidad de tratar con total incertidumbre nos lleva a estudiar y utilizar

la teorı́a de probabilidad. Al organizar la información y considerarla de manera
sistemática, seremos capaces de reconocer nuestras suposiciones, comunicar nuestros
razonamientos a otras personas y tomar una decisión más sólida.
14.2. Preguntas
La probabilidad y la estadı́stica son áreas de la matemática aplicada que han
tenido un gran crecimiento, tanto en su teorı́a como en sus aplicaciones. Sin embar-
go, son áreas diferentes; el primer reto del estudiante es diferenciar los conceptos y
herramientas que usa cada una de ellas. Para ello es necesario responder dos pre-
guntas: ¿Qué es la probabilidad?, ¿dónde se utiliza?
La noción de probabilidad viene de la necesidad de medir o determinar cuantita-

tivamente la certeza o duda de que un suceso dado ocurra o no. La probabilidad está
basada en el estudio de la combinatoria y es fundamento necesario de la estadı́stica,
con el fin de examinar las formas y medios para obtener esas medidas de certeza,
ası́ como encontrar los métodos de combinarlos cuando intervienen varios sucesos
en una prueba.
El problema esencial para el estudio de la probabilidad es romper con el pen-

samiento determinista y aceptar que existe el pensamiento aleatorio. Cada uno de
los resultados obtenidos al realizar un experimento recibe el nombre de suceso, has-
180
ta este punto no podemos establecer con certeza la probabilidad de ocurrencia de

cierto evento, y es cuando una de las dificultades que con frecuencia se presenta en
el estudiante, el no saber contar.
Contar consiste en enumerar eventos difı́ciles de cuantificar, la enumeración de

los eventos que se pueden presentar, en ocasiones es difı́cil y laboriosa por la canti-
dad de puntos a contar o enumerar, propiciando que se puedan cometer errores al
emprender esa tarea.
Como propuesta para llegar a un entendimiento más completo de las técnicas de

conteo sin precisar los conceptos y resultados básicos de conteo se presentan varios
problemas que pueden ayudar al manejo correcto de las técnicas de conteo.
14.2.1. Algunos Problemas

Problema 14.2.1 (Suma de números)
Calcule la suma de los primeros 1000 enteros positivos, esto es:
1 + 2 + 3 + 4 + · · · + 1000 =?
Solution 14.2.2 Sume el primer número y el último, que es
1 + 1000 = 1001
Luego sume el segundo número y el penúltimo, que también es
2 + 999 = 1001
Continúe de esta forma y al terminar se dará cuenta que tiene 500 pares cuya suma
es igual a 1001, es decir:
1 + 2 + 3 + 4 + · · · + 999 + 1000 = 500(1001)

1000(1000 + 1)
=
2
n(n + 1)
= .
2
La última igualdad indica la expresión general para sumar cualquier cantidad de
enteros positivos.
Un problema similar es el siguiente.
Problema 14.2.3 (Dominó)

¿Cuantas fichas de dominó se pueden formar con los primeros 1000 enteros positi-
vos?
Solution 14.2.4 Forme parejas con los números 1, 2, ..., 1000, es decir,
(1, 1), (1, 2), (1, 3), (1, 4), · · · , (1, 1000)
181
y como en una ficha de dominó el orden no es importante, se tendrán que descartar

las parejas
(2, 1), (3, 1), (3, 2), · · · ,
pues ya fueron tomadas en cuenta por lo que se tendrı́a
Parejas Num. Parejas

(1,1), (1,2), (1,3), ···, (1,1000) 1000
(2,1), (2,2), (2,3), ···, (2,1000) 999
(3,1), (3,2), (3,3), ···, (3,1000) 998
: : : : : :
(1000,1), (1000,2), (1000,3), ···, (1000,1000) 1
Finalmente se suman el número de parejas
1000 + 999 + 998 + · · · + 1
llegando a la siguiente expresión:
n(n + 1) 1000(1000 + 1)
= .
2 2
Es el número de fichas de dominó que se pueden formar con los primeros 1000
enteros positivos.
Problema 14.2.5 Examen

Un estudiante prepara 90 de 100 preguntas para su examen parcial.
El estudiante aprueba el examen si:

i) Responde correctamente a las dos preguntas que se le hace o,
ii) primero responde una de las dos y luego responde a una tercera.
¿Qué tiene que hacer el estudiante para saber si aprobará el examen o no?
Solution 14.2.6 Puede intentarlo haciendo cuentas y obtener todas sus posibilida-
des, ¿sabe contar?, o puede usar combinaciones y hacer uso de la lógica cuando usa
los conectivos: y, o., ¿su respuesta final tiene que ver con probabilidad?, ¿siempre
obtiene la misma respuesta?
Problema 14.2.7 Inversión

Suponga que cierta persona desea invertir $1000. 00 a un plazo de 5 años con una
tasa de interés del 6 %. Suponga que la tasa de interés se mantiene para cualquier
tipo de composición que elija:
a) Anual
b) Mensual
c) Diariamente
d) A cada instante
182
¿Habrá cambios en los diferentes tipos de composición?, ¿Qué concepto está escon-
dido en este problema?
Solution 14.2.8 Para a) denote con A0 = 1000 el capital inicial, luego al

finalizar el primer año, el segundo año, se tiene
A1 = (1 + 0,06) ∗ A0
A2 = (1 + 0,06) ∗ A1 = (1 + 0,06)2 ∗ A0
Continuando de esta forma, tenemos:
A5 = (1 + 0,06)A4 = (1 + 0,06)5 A0
En general se tiene
Ak = (1 + 0,06)A(k−1)
Ak es llamada “Ecuación en Diferencias con un Lapso de Tiempo”. Al susti-

tuir A0 se puede obtener el capital de la inversión cuando la composición es
anual.
Para b) y c) se procede como antes, haciendo uso de una ecuación en diferen-

cias.
En d) se tienen dos caminos:
1. Usar cálculo diferencial.
2. Hacer uso de una ecuación diferencial lineal de primer orden.
En este tipo de composición ya no se puede utilizar una ecuación en diferencias.
Observación 14.2.9 Observe que aún cuando se trata de un problema determinı́sti-

co, el capital que se obtiene al concluir el periodo de inversión este cambia con el
tipo de composición que se utilice. Note también que en los tres tipos de composición
la ecuación en diferencias indica que si conocemos el presente se puede conocer el
futuro y que no depende del pasado.
Es imperativo presentar los conceptos básicos necesarios para lograr comprender

el concepto de probabilidad, entre ellos definiremos los siguientes:
Definición 14.2.10 Un experimento es el procedimiento mediante el cual se trata

de verificar una o varias hipótesis relacionadas con un determinado fenómeno.
Definición 14.2.11 Un experimento aleatorio, es aquel que se puede repetir inde-

finidamente, siempre en las mismas condiciones, y antes de realizar el experimento,
se pueden conocer todos los posibles resultados, pero no se tiene certeza de cuál será
el resultado de este cuando se lleva a cabo.
183
Definición 14.2.12 El Espacio Muestral de un experimento aleatorio, es un con-

junto Ω con la propiedad de que cada resultado fı́sico del experimento corresponde
solamente a un elemento de Ω. Cada uno de estos elementos se llama punto mues-
tral.
El problema fundamental que se presenta en esta parte es el de asignar una medida

de probabilidad a cada uno de los puntos muestrales, a cada evento o suceso, para
esto se tiene la siguiente:
Definición 14.2.13 Un Evento se puede entender como cualquier subconjunto del

espacio muestra Ω, siempre que este conjunto sea finito.
Evento medible es un evento o suceso aleatorio que se le asigna una medida de
probabilidad, y el conjunto de todos los sucesos aleatorios constituye una σ-álgebra
de conjuntos o de eventos, la cual generalmente se le conoce como el espacio de
eventos.
Definición 14.2.14 Una variable aleatoria es una función con valores en los reales
que está definida sobre el espacio muestral Ω.
Definición 14.2.15 Función de probabilidad es una función que asocia a cada pun-
to de su espacio muestral Ω un número real p que denota la probabilidad de que
suceda.
14.3. Enfoques de la Probabilidad

La teorı́a de la probabilidad se ha desarrollado constantemente desde el siglo
XVII y ampliamente aplicada en diversos campos de estudio. A pesar de que el
concepto de probabilidad es una parte tan común y natural de nuestra experiencia,
no existe una única interpretación cientı́fica del término de “ probabilidad”. A través
de los años cada interpretación propuesta para la probabilidad por los expertos ha
sido criticada por otros, motivo por el cual en esta parte se presentan dos enfoques
de la probabilidad, cada uno de éstos puede ser útil en la aplicación de la teorı́a de
la probabilidad.
14.3.1. Enfoque Clásico

Tiene la caracterı́stica esencial, que basa la asignación de medida de ocurren-
cia para un resultado o suceso, sobre los antecedentes que aporta el experimento
realizado, en donde los posibles resultados del mismo son “igualmente probables”,
también conocido como experimento equiprobable, (ver[2]). La probabilidad de que
ocurra el resultado en cuestión es:
nA Número de casos favorables

P (A) = =
n Total de casos
Notemos que en el enfoque clásico (cuando es aplicable) se puede determinar la
probabilidad de un evento o suceso antes de observar los resultados experimentales,
por esta razón frecuentemente se le denomina probabilidad “apriori”.
184
Dos dificultades básicas aparecen cuando se intenta desarrollar una definición

formal de probabilidad desde el enfoque clásico, las cuales son las siguientes
El concepto de “igualmente probables” es esencia que tienen las mismas pro-
babilidades lo cual depende del enfoque que se aplique.
No proporciona un método sistemático para asignar probabilidades a resulta-
dos que no son igualmente verosı́miles.
Este enfoque solo considera el hecho de que el espacio muestra es finito, pero
si es infinito numerable o infinito y no numerable este ya no proporciona la
medida de probabilidad.
14.3.2. Enfoque Frecuentista

Se determina la probabilidad con base en la proporción de veces que ocurre un
resultado favorable en un determinado número de observaciones o repetición de un
experimento aleatorio. No hay implı́cita ninguna suposición previa de igualdad de
probabilidades. En este caso es necesaria la observación y recopilación de datos para
determinar los valores de probabilidad, (ver [4]).
Para calcular la probabilidad utilizando el enfoque Frecuencial se asocia dire-

ctamente al concepto de frecuencia relativa, el cual es un concepto de la estadı́stica
descriptiva.
nA Número de veces que ocurre A

P (A) = = ,
n Número de veces que se repite
donde A denota un evento y denota al experimento aleatorio.
Un inconveniente del enfoque frecuencial de la probabilidad es que solo puede

utilizarse en los problemas en los cuales, al menos hay un número grande de repe-
ticiones similares a cierto proceso. Lo anterior se puede entender que para obtener
la probabilidad con el enfoque frecuentista primero debemos de realizar (bajo las
mismas condiciones) el experimento aleatorio, (ver [3]).
Con lo anterior se puede notar que el enfoque frecuencial y el enfoque clásico

sólo contemplan el caso finito, pero, ¿Qué pasa en el caso infinito numerable y no
numerable?.
Actualmente existen problemas o aplicaciones en matemáticas y en otras áreas

en los cuales el espacio muestral es numerable y no numerable, en estos casos el
enfoque clásico y de frecuencia resultan ser insuficientes para dar solución a di-
chos problemas, por tal motivo es necesario establecer conceptos y resultados que
permitan estudiar este tipo de problemas.
14.4. Desarrollo Axiomático de la Probabilidad

La medida de probabilidad P , está construida con argumentos de Teorı́a de la
Medida los cuales no se contemplan en este trabajo. Retomando las definiciones
185
previas de experimento aleatorio, espacio muestra, σ-álgebra y evento, (ver [1]), se

establece lo siguiente:
P : F 7−→ [0, 1] es una función que asigna a cada uno de los eventos o sucesos
un valor numérico como medida de probabilidad y satisface los siguientes axiomas:
1. 0 ≤ P (A) ≤ 1.
2. P (Ω) = 1.
3. Si A y B son eventos disjuntos, es decir, A ∩ B = ∅ entonces
P (A ∪ B) = P (A) + P (B).
4. Sea A1 , A2 , · · · , An , · · · , una sucesión de eventos disjuntos dos a dos, es decir,

Ai ∩ Aj = ∅, si i 6= j,, entonces
"∞ # ∞
[ X
P Ak = P (Ak ).
k=1 k=1
Con esta función de probabilidad P se puede obtener la probabilidad de cual-

quier evento o suceso. Además, se pueden establecer algunos resultados básicos a
partir de los axiomas. También se pueden definir algunos conceptos que permitan
resolver otro tipo de problemas.
El concepto de probabilidad condicional, como su nombre lo indica, pretende

determinar la probabilidad de que ocurra el evento A, “Condicionado ” al supuesto
de que ha tenido lugar otro evento B, para poder identificar cuando se debe aplicar
probabilidad condicional deben buscarse las palabras claves “si” y “dado que”.
Definición 14.4.1 Probabilidad Condicional

Sean A y B eventos tales que P (A) 6= 0. La probabilidad condicional de B dado A,
se denota con P (B|A) y se define como sigue
P (A ∩ B)
P (B|A) = ,
P (A)
donde P (A) es la probabilidad de que ocurra el evento A y P (A ∩ B), es la proba-
bilidad de que ocurra tanto el evento A como el B.
Observación 14.4.2 Cuando el evento A no tiene efecto alguno sobre la ocurrencia

o probabilidad del evento B, se tiene que
P (B|A) = P (B)
Un concepto importante en probabilidad es el de “independencia”, el diccionario

Webster define a dos objetos independientes como aquellos que actúan uno sin tener
en cuenta al otro, es decir, dos eventos son independientes si uno puede ocurrir sin
importar qué pase con el otro.
186
Definición 14.4.3 Eventos independientes

Los eventos A y B son independientes si y solo si
P (A ∩ B) = P (A)P (B).
Otra manera de determinar si dos eventos son independientes en mediante el

concepto de probabilidad condicional, la cual se muestra en el siguiente teorema.
Teorema 14.4.4 Sean A y B dos eventos tales que por lo menos P (A) o P (B)
difieren de cero. A y B son independientes si y solo sı́
P (B|A) = P (B)siP (A) 6= 0,

P (A|B) = P (A)siP (B) 6= 0.
Los siguientes ejemplos muestran los experimentos más comunes que se presentan
en la literatura existente.
Ejemplo 14.4.5 Básicos

1. Lanzamiento de un dado honesto.
2. Lanzamiento de una moneda equilibrada.
3. Lanzamiento de dos dados honestos y distinguibles.
4. Lanzamiento simultaneo de 10 monedas equilibradas distinguibles.
5. ¿Cuál es la Probabilidad de que al seleccionar dos fichas de dominó se puedan
empatar?
6. ¿Cuál es la Probabilidad de que gane el melate?
Con estos sencillos ejemplos y profundizando un poco más en los conceptos de la

probabilidad tales como, partición del espacio muestral, probabilidad condicional de
eventos e independencia de eventos se pueden plantear y resolver problemas como
el siguiente.
Problema 14.4.6 Centro Comercial

Suponga que en una ciudad de tamaño medio compiten dos centros comerciales por
el abasto de productos que requiere la población. Estos centros comerciales son Au-
rrera y Soriana, se sabe que 70 % de clientes los tiene Aurrera y el resto de los
clientes Soriana. Para aumentar su competitividad Soriana contrata a una empresa
de publicidad, quien al final de su estudio le reporta sus resultados obtenidos men-
sualmente:
1. El 80 % de los clientes que compran en Aurrera al mes siguiente siguen com-

prando en Aurrera y el 20 % se cambia a Soriana.
2. El 60 % de los clientes de Soriana al mes siguiente siguen comprando en So-
riana y el 40 % se cambia a Aurrera.
Obtenga lo siguiente:
187
a) ¿Cómo se reparte el mercado al finalizar el primer mes?
b) ¿Cómo se reparte el mercado al finalizar el segundo mes?

c) ¿Qué pasa a la larga?
Solution 14.4.7 Considere lo siguiente

A0 : Porcentaje de clientes de Aurrera al mes cero.
S0 : Porcentaje de clientes de Soriana al mes cero.
Ω = A, S
que es una partición del espacio muestral. Entonces
A1 = (A0 ∩ A1 ) ∪ (S0 ∩ A0 )
S1 = (A0 ∩ S1 ) ∪ (S0 ∩ S1 )
Luego entonces
P (A1 ) = P (A0 ∩ A1 ) ∪ (S0 ∩ A0 ))

= P (A0 )P (A1 |A0 ) + P (S0 )P (A1 |S0 )
Análogamente para
P (S1 ) = P ((A0 ∩ S1 ) ∪ (S0 ∩ S1 )) = P (A0 )P (S1 |A0 ) + P (S0 )P (S1 |S0 )
Continuando de esta forma se obtiene: A2 , S2 , ....
Se puede notar que para la solución del problema se utiliza el concepto de

partición y probabilidad condicional. Tambión se puede observar que conti-
nuando con este procedimiento un némero finito de pasos las probabilidades
se comportan de manera similar, esto es, las probabilidades para Ak y Sk no
cambian, cuando ocurre esto en la teorı́a de procesos estocásticos se le llaman
probabilidades estacionarias debido a que ya no dependen del tiempo .
Un segundo camino para resolver el problema es usando álgebra lineal, en par-

ticular el empleo de valores y vectores propios, ası́ como también el concepto
de matriz diagonalizable que también se estudia en álgebra lineal.
Como tercera alternativa es utilizando la herramienta de procesos estocásticos

que nos permite obtener la misma solución, aunque el estudio de procesos se
requiere de más conceptos de probabilidad.
Estos son solo algunos ejemplos donde se aplica la probabilidad.
188
14.5. Comentario
Se hace notar nuevamente que la probabilidad ha logrado involucrarse con áreas
en la solución de sus problemas y aplicaciones. Este trabajo su objetivo primordial
es mostrar a todo lector que gusta de la probabilidad que debe iniciar por saber
contar.
189
Bibliografı́a
[1] Robert B. Ash, Basic Probability Theory. Dover Publications, Mineola, N.Y,
2008.
[2] Morris H. DeGroot, Probabilidad y estadı́stica. Addison-Wesley Iberoameri-
cana, Estados Unidos, 1988.
[3] Paul M. Meyer, Probabilidad y aplicaciones estadı́sticas. Fondo educativo in-
teramericano, México, 1973.
[4] Susan J. Milton, Probabilidad y estadı́stica con aplicaciones para ingenierı́a
y ciencias computacionales. Mc Graw Hill, Virginia, 2004.
[5] Alexander M. Mood, Introduction to the theory of statistics. McGraw-Hill,
1974.
190
Capı́tulo 15
Optimalidad de polı́ticas (s, S) para un modelo de inventario vı́a la teorı́a de los
procesos de decisión de Markov
Rubén Blancas-Rivera, Hugo Cruz-Sáurez , Fernando Velasco-Luna y

Francisco Tajonar-Sanabria

216470295@alumnos.fcfm.buap.mx, hcs@fcfm.buap.mx,
fvelasco@fcfm.buap.mx, ftajonar@fcfm.buap.mx
Resumen. En este capı́tulo se propone un modelo de inventarios con demanda
estocástica y con la caracterı́stica de permitir mercancı́a no suplida. Con la finalidad
de analizar y determinar estrategias de producción se emplea la teorı́a de Procesos
de Decisión de Markov. En especı́fico, mediante la metodologı́a de programación
dinámica se logra caracterizar polı́ticas óptimas para el problema de estudio. Pos-
teriormente, usando resultados de análisis convexo se determina la forma funcional
de la polı́tica óptima, la cual, en el contexto de teorı́a de inventarios, se denomina
polı́tica con punto de reorden o politicas (s, S).
Abstract. In this chapter we propose a model of inventories with stochastic

demand and with the characteristic of allowing non-supplied merchandise. In or-
der to analyze and determine production strategies, the theory of Markov Decision
Processes is used. Specifically, through the methodology of dynamic programming
it was able to characterize optimal policies for the studied problem. Subsequently,
using convex analysis results, the functional form of the optimal policy is deter-
mined, which in the context of the theory of inventories, is called the policy with
reorder point or policies (s, S).
Palabras clave: Procesos de Decisión de Markov, Teoria de Inventarios, Progra-

mación Dinámica, Politicas de Reorden, Lindley.
En este trabajo se plantea un sistema de inventarios con demanda estocástica,
el cual es observado de forma discreta en el tiempo y se busca controlar la can-
tidad ordenada o producida de artı́culos solicitados. En especı́fico suponemos que
191
dicho sistema dinámico es modelado por una caminata aleatoria de tipo Lindley,
la cual recibe este nombre debido a que David Linley la propuso por primera vez
en la década de los 50’s para el estudio de sistemas de lı́neas de espera [12]. Con
la finalidad de generalizar dicho sistema se introduce una nueva variable, la cual
modela la posibilidad de que la mercancı́a solicitada no se encuentre disponible en
el periodo actual de observación. El objetivo es determinar una estrategia de ope-
ración, la cual minimice los costos descontados asociados al sistema de inventarios.
De acuerdo a las caracterı́sticas que presenta el problema de optimización planteado
las componentes del problema se pueden identificar en un modelo de decisión de
Markov. De esta manera la teorı́a de Procesos de Decisión de Markov (PDM) puede
ser aplicada.
Los PDMs son aplicados para modelar sistemas dinámicos cuyos estados son obser-
vados de manera periódica y es aplicado un control. El desarrollo de un PDM, a
través del tiempo está dado de acuerdo al siguiente procedimiento. En cada tiempo
t, t = 0, 1, ..., se elige un control que se aplicará dependiendo del estado del sistema,
entonces como consecuencia del estado actual y de haber aplicado un control se paga
un costo y el sistema se traslada a un nuevo estado en el instante de tiempo t + 1,
mediante una ley de transición. Al ocurrir un estado en t+1, el proceso se repite. De
esta manera se obtiene una sucesión de controles a la cual se le denomina polı́tica.
Con la finalidad de medir la calidad de una polı́tica, el PDM está dotado de una
función real llamada criterio de rendimiento. De este modo, el problema de control
óptimo consiste en encontrar una polı́tica que minimice el criterio de rendimiento,
a tal politica se le llama óptima, y al criterio de rendimiento evaluado en la polı́tica
óptima se le llama función de valor. Una metodologı́a comúnmente empleada para
caracterizar polı́ticas óptimas es programación dinámica.
Mediante la teorı́a de los Procesos de Decisión de Markov demostramos la existencia
de una polı́tica óptima estacionaria markoviana. Después, como resultado principal
de este trabajo se demuestra la optimalidad de una clase polı́ticas conocidas en el
contexto de sistemas de inventarios como (s, S). En general, una polı́tica del tipo
(s, S) consiste en un reordenamiento de hasta S productos si el nivel de almacenaje
se encuentra por debajo de s, en caso contrario no se ordena. En 1959, Scarf [16]
presenta el primer resultado de optimalidad de esta clase de polı́ticas para un mo-
delo de inventarios distinto al que estudiamos en este trabajo. Otras aportaciones
semejantes, se pueden consultar en [4], [10], [16], [17], [18], [19]. En [3], se demuestra
la optimalidad de esta clase de polı́icas para el modelo con demanda no suplida, pe-
ro utilizando espacio de estados compacto. En este trabajo extendemos el resultado
a espacios de estados no necesariamente compacto.
El trabajo está estructurado de la manera siguiente. Primero, presentamos los con-
ceptos preliminares de la teorı́a de los PDMs. En la siguiente sección presentamos
los elementos de un sistema de inventarios el cual se encuentra modelado por un
sistema dinámico llamado modelo con demanda no suplida. En la sección siguiente
se demuestra la existencia de una polı́tica óptima que resuelve el problema de con-
trol para el modelo en estudio. En la Sección 5 demostramos que la polı́tica óptima
resulta ser de la forma (s, S). Finalmente, presentamos nuestras conclusiones.
192
15.2. Conceptos Preliminares

Un Proceso de Decisión de Markov (PDM) es utilizado para modelar un sis-
tema que es observado de forma discreta en el tiempo bajo incertidumbre en su
movimiento. Un PDM se encuentra caracterizado por las componentes siguientes:
(X, A, {A(x)|x ∈ X}, Q, C). (15.1)
A continuación se describen las componentes del modelo. Los conjuntos X y A son

llamados espacios de estados y acciones (o controles), respectivamente, ambos con-
juntos son subespacios de Borel pertenecientes a espacios polacos (espacios métricos
separables y completos). La siguiente componente es una colección de subconjuntos
no vacı́os {A(x)|x ∈ X} de A, donde A(x) es llamado espacio de controles (o accio-
nes) admisibles en el estado x ∈ X. El conjunto K de parejas de estados-acciones
admisibles, está definido por
K = {(x, a)|x ∈ X, a ∈ A(x)} (15.2)
Ası́ se define Q como un kérnel estocástico o una ley de transición definido en X

dado K. Finalmente C : K → R es una función medible denominada función de
costo en un paso.
La quı́ntupla en (15.1) es conocida como Modelo de Control de Markov (MCM)
estacionario a tiempo discreto. Un MCM estacionario a tiempo discreto es un sis-
tema estocástico controlado que se observa de manera periódica en los tiempos
t = 0, 1, 2, . . .. La dinámica que describe este sistema funciona de la siguiente ma-
nera: Si el sistema se encuentra al tiempo t en el estado xt = x ∈ X, y la acción
at = a ∈ A(x) ⊂ A es aplicada, entonces ocurren dos cosas:
se paga un costo C(x, a),
el sistema se traslada a un nuevo estado xt+1 mediante la ley de transición
Q(·|x, a) sobre X, es decir,
Q(B|x, a) = P r(xt+1 ∈ B|xt = x, at = a),
en donde B ∈ B(X), con B(X) la σ- álgebra de Borel en X y (x, a) ∈ K.

Una vez hecha esta transición a un nuevo estado, se elige una nueva acción y el
proceso anterior se repite.
Polı́ticas de control. Para introducir el concepto de estrategia o polı́tica, con-
sidérese un MCM y al espacio de las historias observadas del proceso hasta el tiempo
t, denotado por Ht , y definido como H0 = X y Ht = K × Ht−1 para cada t = 1, 2, ...
Un elemento de Ht , llamado t- historia, es un vector de la forma
ht = (x0 , a0 , x1 , a1 , . . . , xt−1 , at−1 , xt )
donde (xi , ai ) ∈ K para cada i = 0, ..., t − 1 y xt ∈ X.

Definición 15.2.1 Una polı́tica aleatorizada o simplemente polı́tica, es una suce-
sión π = {πt } de kérneles estocásticos, donde cada πt está definida sobre A dado
Ht y satisface que: πt (A(xt )|ht ) = 1 para cada ht ∈ Ht y t = 0, 1, 2, .... El conjunto
de todas las polı́ticas se denota por Π.
193
De acuerdo con esta definición, una polı́tica π = {πt } puede interpretarse como una
sucesión {at } de variables aleatorias sobre A, tales que, para cada t−historia y t =
0, 1, 2, ..., la distribución de at es πt (·|ht ), la cual está concentrada en el conjunto de
acciones admisibles A(xt ). En otras palabras, cuando usamos una polı́tica arbitraria,
la acción en cualquier tiempo t es una variable aleatoria y depende de todas las
t−historias.
Definición 15.2.2 Una polı́tica π ∈ Π es Determinista Markoviana, si existe
una sucesión {ft } ⊂ F, donde
F = {f : X → A|f es medible y f (x) ∈ A(x) para cada x ∈ X},
con la caracterı́stica de π(·|ht ) está concentrada ft (xt ) para cada ht ∈ Ht y t =

0, 1, 2, . . ..
Si existe f ∈ F tal que para toda t = 0, 1, 2, . . ., ft = f , entonces a π se le conoce
como polı́tica Determinista Markoviana Estacionaria.
Dados π = {πt } y x0 = x ∈ X por el teorema de Ionescu-Tulcea existe una única
medida de probabilidad Pxπ definida en el espacio canónico (Ω, F), donde Ω := (X ×
A)∞ y F es su correspondiente σ−álgebra producto. Además para cada B ∈ B(X),
C ∈ B(A) y ht ∈ Ht se tiene que:
Pxπ (at ∈ C|ht ) = π(C|ht ),

Pxπ (xt+1 ∈ B|ht , at ) = Q(B|xt , at ).
El proceso estocástico (Ω, F, Pxπ , {xt }) es llamado Proceso de Decisión de Mar-

kov a tiempo discreto.
Criterio de Rendimiento. Cada PDM estará dotado de una función real, llama-
da función objetivo o criterio de rendimiento, la cual medirá en algún sentido la
calidad de cada polı́tica, a través de la sucesión de costos que genera.
Sea un MCM fijo y un conjuntos de polı́ticas Π. Se define el criterio de rendimiento
Costo total α- descontado para π ∈ Π y x ∈ X, de la siguiente forma
"N −1 #
X
vα,N (π, x) := Exπ αt C(xt , at ) , (15.3)
t=0
en donde α ∈ (0, 1) es llamado factor de descuento y N es un entero positivo

conocido, llamado horizonte del problema de optimización.
La función de valor óptimo α−descontado se define como:
Vα∗ (x) := inf vα,N (π, x), ∀x ∈ X.

π∈Π
El problema de control óptimo α−descontado consiste en encontrar una polı́tica

π ∗ ∈ Π tal que
Vα∗ (x) = vα,N (π ∗ , x), ∀x ∈ X.
Observación 15.2.3 Cuando N = ∞, se tiene el criterio de costo total α−descontado

con horizonte infinito y se denota el criterio total α descontado con horizonte infi-
nito como vα .
194
15.3. Modelo de Inventario

Un inventario es un conjunto de mercancı́as o artı́culos acumulados en un al-
macén en espera de ser vendidos o utilizados mediante un proceso de producción.
En este caso estamos interesados en la modelación del flujo de mercancı́a en el in-
ventario, observándolo como un sistema dinámico. Las componentes a destacar en
un sistema de inventario son las siguientes:
Demanda: Cantidad de bienes o servicios que se ofrecen.
Tiempo de espera: El tiempo que transcurre desde que se hace el pedido hasta
que la empresa recibe el producto.
Tamaño del pedido: Número de artı́culos que conforman el orden del pedido.
Nivel de inventario: Número de artı́culos que se encuentran en el inventario.
Punto de reorden: Nivel de inventario en el que la empresa define en que
momento hacer un nuevo pedido.
El control y mantenimiento de los inventarios con bienes fı́sicos es un problema
común en todas las empresas. El mantenimiento de los inventarios es necesario para
cualquier empresa que se ocupe de productos fı́sicos, incluidos fabricantes, mayoris-
tas y minoristas. Por ejemplo, los fabricantes necesitan inventarios de los materiales
necesarios para fabricar sus productos, ellos administran el inventario de los produc-
tos terminados en espera de envı́o, del mismo modo, ambos mayoristas y minoristas
necesitan mantener los inventarios de los productos para que se encuentren dispo-
nibles a los clientes.
Los costos anuales asociados con el almacenamiento del inventario son muy grandes,
tal vez hasta una cuarta parte del valor del inventario. Por lo tanto, los costos que se
incurren para el almacenamiento de inventario en México se encuentran con los cien-
tos de miles de millones de pesos anualmente. Reducir los costos de almacenamiento
evitando inventarios innecesariamente grandes puede mejorar la competitividad de
cualquier empresa.
Los modelos matemáticos de inventarios se pueden dividir en dos amplias categorı́as:
modelos deterministas y modelos estocásticos, de acuerdo con la predictibilidad de
la demanda involucrada. La demanda de un producto en inventario es la cantidad
de unidades que deberán retirarse del inventario para algún uso durante un periodo
especı́fico. Si la demanda en periodos futuros puede pronosticarse con considerable
precisión, es razonable usar una polı́tica de inventario la cual asuma que todas las
ordenes siempre son exactas. Este es el caso de la demanda conocida donde un mo-
delo determinista serı́a el adecuado. Sin embargo, cuando la demanda no es conocida
es necesario utilizar un modelo de inventario estocástico, para el cual la demanda
en cualquier periodo es una variable aleatoria en lugar de una constante conocida.
En este trabajo estamos interesados en el estudio de modelos estocásticos.
15.3.1. Modelo Matemático

Consideremos las siguietes variables que describen a un sistema de inventarios
con demanda estocástica. En cada etapa t = 0, 1, ..., xt es el nivel en el almacén de
cierto producto, at la producción u orden, ξt+1 la demanda al finalizar el periodo y
195
ηt es una variable del tipo Bernoulli, la cual modela el arribo de producto ordenado
o producido en el almacén. En este trabajo supondremos que la relación entre las
variables presentadas satisface la siguiente ecuación en diferencias:
xt+1 = (xt + ηt at − ξt+1 )+ . (15.4)
El modelo (15.4) se denomina sistema con demanda no suplida, dicha ecuación se

encuentra motivada por el trabajo hecho por David Lindley [12]. Además, en años
recientes se ha retomado (15.4) para ejemplificar resultados de interés en la teorı́a
de PDMs, ver por ejemplo: [3], [7], [8] y [21].
De acuerdo a este modelo, el espacio de estados del proceso es X = R+ y el espacio
de acciones o controles es A = R+ . Consideremos el espacio de acciones admisibles
como A(x) = A para cada x ∈ R+ . De acuerdo a la notación utilizada en la sección
anterior, el conjunto de parejas estado-acción está dado por K = R+ × R+ .
La ecuación en diferencias dada en (15.4), induce el kérnel estocástico Q o ley de
transición de la siguiente forma.
Para cada B ∈ B(R+ ) se tiene que
Q(B|x, a) = Pxπ (xt+1 ∈ B|xt = x, at = a)

= Pxπ ((x + ηt a − ξt )+ ∈ B).
Q((−∞, y]|x, a) = Pxπ ((x + ηt a − ξt )+ ≤ y)

= Pxπ (x + ηt a − ξt ≤ 0, y ≥ 0)
+ Pxπ (0 ≤ x + ηt a − ξt ≤ y).
Observe que si y < 0, entonces
Q((−∞, y]|x, a) = 0.
En consecuencia, si y ≥ 0
Q((∞, y]|x, a) = Pxπ (x + ηt a − ξt ≤ 0) + Pxπ (0 ≤ x + ηt a − ξt ≤ y)

= pPxπ (x + a ≤ ξt ) + pPxπ (y ≤ ξt ≤ x + a)
+ (1 − p)Pxπ (x ≤ ξt ) + (1 − p)Pxπ (y ≤ ξt ≤ x + a)
= p(1 − Ft (x + a)) + (1 − p)(1 − Ft (x))
+ p(Ft (x + a) − Ft (y)) + (1 − p)(Ft (x) − Ft (y)),
en donde la función Ft representa la función de distribución de probabilidad de la

variable aleatoria ξt .
Suposición 15.3.1 Supongamos lo siguiente:
La sucesión de demandas, {ξt }t∈N son variables aleatorias independientes e
idénticamente distribuidas (v.a.i.i.d.) con función de distribución de probabi-
lidad F y función de densidad continua ∆.
Si ξ representa un elemento génerico de la sucesión {ξt }t∈N , entonces µ :=
E[ξ] < ∞.
196
La sucesión de variables {ηt }t∈N son independientes e idénticamente distri-

buidas con distribución Bernoulli con parámetro p ∈ (0, 1).
Como se mencionó anteriormente, en cada etapa se generan costos. En este trabajo
consideramos costos de almacenaje, producción y demanda no suplida. Dicho costo
se representa mediante la siguiente función definida sobre K,
C(x, a) = g(a) + H(x, a), (15.5)
en donde la función g : R → R+ , representa los costos de producción y la función

H : K → R+ los costos de almacenaje y demanda no suplida.
En [3] se presenta una propuesta de función de costo, definida de la siguiente manera:
g(a) := K1{a6=0} + ca,
H(x, a) := hE[x + ηa] + lE[(ξ − (x + ηa))+ ],
en donde
K > 0 es el costo fijo por producción, el cual también puede indicar un
impuesto,
c > 0 es el costo por unidad producida,
h > 0 es el costo por unidad almacenada,
l > 0 es el costo por unidad faltante.
Por lo tanto, para el modelo (15.4) se tiene la quı́ntupla (X, A, {A(x)|x ∈ X}, Q, C)
y ası́ podemos emplear resultados importantes de la teorı́a de los PDMs a tiempo
discreto.
En la sección anterior se mencioná el problema de control óptimo y las condiciones
que se requieren para encontrar una polı́tica óptima. Una clase de polı́ticas intere-
santes en el estudio de modelos de inventarios son frecuentemente conocidas como
punto de reorden, polı́tica con cantidad de orden s, o polı́ticas (s, S).
En la práctica ocurre lo siguiente con esta polı́tica: Cuando el inventario tiene un
nivel de productos por debajo de s, se ordena una cantidad de no más de S unidades
para estar por arriba de s.
En la Sección 4 se presenta la demostración de la optimalidad de esta clase de
polóticas. Cabe destacar que en la literatura se pueden encontrar resultados que de-
muestran la optimalidad de polı́ticas (s, S) para otros modelos de inventarios. Estos
resultados tienen sus inicios en el año 1966, con un resultado importante presentado
por Scarf [16]. Después podemos encontrar algunos resultados en [4], [10], [17], [18],
[19], [20].
15.4. Existencia
En esta sección, se demuestra la existencia de una polı́tica markoviana esta-
cionaria para el modelo (15.4) mediante la teorı́a de PDMs. El procedimiento de
197
programación dinámica permite caracterizar la función de valor óptimo, ası́ como

la polı́tica óptima. Más aún, el procedimiento permite garantizar la existencia de
una polı́tica markoviana estacionaria. Bajo condiciones adecuadas sobre la función
de costo y la ley de transición inducida por la dinámica (15.4), la función de valor
óptimo Vα se caracteriza mediante una ecuación funcional. Más aún el procedimien-
to permite obtener una polı́tica óptima estacionaria.
Dicho lo anterior, definimos las siguientes funciones.
Definición 15.4.1 Las funciones de iteraciones de valores óptimos se definen de
la forma siguiente, para cada x ∈ X y n = 1, 2, . . .,
Z
Vn (x) = inf C(x, a) + α Vn−1 (y)Q(dy|x, a) , (15.6)
a∈A(x) X
con V0 (x) = 0.
A continuación demostramos los siguientes resultados sobre el modelo (15.4).
Lema 15.4.2 Sea Q el kérnel estocástico inducido por la dinámica (15.4) entonces
Q es fuertemente continuo, es decir, para cada función u acotada y medible se tiene
que la integral de medida siguiente,
Z
u(y)Q(dy|x, a)
X
es continua y acotada sobre el espacio de acciones A.

Demostración. Sea u ∈ B(X), entonces se define la siguiente función:
Z
w(x, a) := u(y)Q(dy|x, a), ∀(x, a) ∈ K. (15.7)
X
Para probar que el kérnel Q es fuertemente continuo, debemos demostrar que w es

continua en A.
Ahora bien, consideremos x ∈ X fijo y {an } una sucesión definida en A. Supongamos
que la sucesión converge a algún a ∈ A. De esta forma, procedemos a realizar el
siguiente cálculo
Z
lim w(x, an ) = lim u(y)Q(dy|x, an )
n→∞ n→∞ X
= lim E[u(x + an η − ξ)+ ]
n→∞
Z
= p lim u((x + an − s)+ )dF (s)
n→∞ X
Z
+ (1 − p) lim u((x − s)+ )dF (s)
n→∞ X
= p lim u(0)F (x + an )
n→∞
Z x+an
+ p lim u(x + an − s)dF (s)
n→∞ 0
Z
+ (1 − p) u((x − s)+ )dF (s).
X
198
Utilizando la continuidad de la función de distribución F y que la función u es

acotada, por el Teorema de Convergencia Dominada [1], se tiene que
Z x+a
lim w(x, an ) = pu(0)F (x + a) + p u(x + a − s)dF (s)
n→∞ 0
Z
+ (1 − p) u((x − s)+ )dF (s)
X
= w(x, a).
Por lo tanto, w es una función continua en A y concluimos que el kérnel Q es
fuertemente continuo.
Lema 15.4.3 La función de costo definida en (15.5) es inf-compacta e inferior-
mente semicontinua (l.s.c.) sobre K.
Demostración. Para demostrar que es l.s.c., sólo basta con demostrar que la fun-
ción H(x, a) es una función l.s.c., debido a que
K1{a6=0} (a) + ca,
sı́ lo es, ya que es continua para a > 0 y l.s.c. para a = 0. Desarrollando la función H,
considerando que la variable aleatoria η tiene distribución Bernoulli con parámetro
p, entonces
Z ∞
H(x, a) = hp(x + a) + h(1 − p)x + lp (s − (x + a))dF (s)
x+a
Z ∞
+ l(1 − p) (s − x)dF (s).
x
Sean {xn } y {an } sucesiones convergentes con lı́mite x ∈ X y a ∈ A, respectiva-

mente, entonces
lim H(xn , an ) = lim (hp(xn + an ) + h(1 − p)xn )
n→∞ n→∞
Z ∞
+ lim lp (s − (xn + an ))dF (s)
n→∞ xn +an
Z ∞
+ lim l(1 − p) (s − xn )dF (s).
n→∞ xn
Luego,
lim (hp(xn + an ) + h(1 − p)xn ) = hp lim (x + a) + h(1 − p) lim xn
n→∞ n→∞ n→∞
= hp(x + a) + h(1 − p)x,
y
Z ∞ Z ∞
lim lp (s − (xn + an ))dF (s) + l(1 − p) (s − xn )dF (s)
n→∞ x +a xn
Zn∞ n
= lp lim I[xn +an ,∞) (s − (xn + an ))dF (s)
n→∞ 0
Z ∞
+ l(1 − p) lim I[xn ,∞) (s − xn )dF (s),
n→∞ 0
199
note que la función I[xn +an ,∞) (s − (xn + an )) ≤ s, y además se satisface la siguiente
propiedad
lim inf[0, xn ] ⊂ lim sup[0, xn ] ⊂ [0, x],
se tiene que I[0,xn ] converge a I[0,x] casi seguramente, análogamente I[0,xn +an ] con-
verge casi seguramente a I[0,x+a] , ası́ por el Teorema de Convergencia Dominada
[1],
Z ∞ Z ∞
lim lp (s − (xn + an ))dF (s) + l(1 − p) (s − xn )dF (s)
n→∞ x +a xn
Z ∞ n n Z ∞
= lp (s − (x + a))dF (s) + l(1 − p) (s − x)dF (s).
x+a x
Por lo tanto, H es continua para a > 0 y l.s.c. para a = 0.

Para probar que la función C es inf-compacta sobre K, primero vamos a demostrar
que la función K1{a6=0} (a)+ca sea inf-compacta sobre A = R+ . En efecto, considere
λ ∈ R y el conjunto de nivel asociado a λ ≥ K
λ − K1{a6=0}

Df (λ, A) := {a ≥ 0|K1{a6=0} (a) + ca ≤ λ} = 0, ,
c
el cual es cerrado y acotado en R, por tanto compacto. Si λ < K se tiene que
Df (λ, A) = {0},
un conjunto cerrado y acotado, entonces el conjunto es compacto. Por tanto, los

conjuntos de nivel de la función K1a6=0 (a) + ca son compactos por lo que la función
es inf-compacta, luego se tiene que la función de costo C es inf-compacta sobre K
ya que cada término de la función de costo C es positivo y l.s.c..
Con la función de costo definida en (15.5) se tiene el siguiente resultado para la
función de valor óptimo Vα∗ .
Lema 15.4.4 Vα∗ (x) < ∞ para cada x ∈ X.

Demostración. Consideremos la polı́tica estacionaria de nunca ordenar:
g(x) = 0, ∀x ∈ X.
Luego Vα∗ (x) ≤ vα (g, x), si probamos que vα (g, x) < ∞ para cada x ∈ X, se tiene
el resultado buscado.
Denotemos a xgt al proceso inducido por la dinámica (15.4) utilizando la polı́tica g.
Sea xg0 = x ≥ 0, entonces
xgt+1 = (xgt − ξt+1 )+ .
Consideremos el siguiente proceso de renovación
N (x) := sup{t|St ≤ x}, (15.8)
200
Pn
donde S0 = 0 y St = j=1 ξj . Observe que E[N (x)] < ∞ para cada x ≥ 0. Luego
"∞ #
X
vα (g, x) = Exg α t
C(xgt , 0)
t=0
= hx + lE[(ξ − x)+ ]
 
N (x)
X
f  t + 
+ Ex α (h(x − St ) + E[(ξt − (x − St )) ]
t=1
 
∞
X
+ Exf  αt E[ξk ]
t=N (x)+1
∞ ∞
" #
X X
≤ hx + lµ + E αt (hx + µ) + αt µ
t=1 t=0
α 1
= hx + lµ + (hx + µ) + µ < ∞.
1−α 1−α
En la última igualdad se utilizá la Suposición 15.3.1. Ası́, Vα∗ es finita.
Con los resultados anteriores se demuestra el siguiente resultado.
Teorema 15.4.5 Existe una polı́tica óptima determinista estacionaria para el pro-
blema de control óptimo con horizonte finito e infinito bajo el modelo (15.4). Además
las funciones de iteración de valor óptimo Vn ↑ Vα∗ .
Demostración. Por los Lemas 15.4.2, 15.4.3, 15.4.4 y por el Teorema de existencia
de una polı́tica óptima determinista estacionaria en [9] se tiene el resultado del
teorema.
15.5. Optimalidad de polı́ticas (s,S)

En esta sección se busca caracterizar a la politica óptima markoviana estacio-
naria garantizada en el Teorema 15.4.5. Para poder lograrlo, es necesario analizar
el comportamiento de las funciones de iteración de valor óptimo (15.6), ya que es
una herramienta útil que proporciona el método de programación dinámica para ir
resolviendo el problema de control óptimo por etapas.
Sea n ∈ N y considerando la función de costo definida en (15.5), se tiene lo siguiente
para cada estado inicial x ≥ 0 y función de iteración Vn .
Vn+1 (x) = inf {K1{a6=0} (a) + ca + hE[x + ηa] + lE[(ξ − (x + ηa))+ ]

a≥0
+ αE[Vn ((x + ηa − ξ)+ )]}

= min{K + Gn (x) + Hn (x), inf {Gn (x + a) + Hn (x)}}
a>0
= min{K + Gn (x), inf Gn (x + a)} + Hn (x).
a>0
donde
Gn (x + a) := (c + hp)(x + a) + αpE[Vn ((x + a − ξ)+ )] + pE[(ξ − (x + a))+ ],
201
Hn (x) := (h(1 − p) − c)x + α(1 − p)E[Vn ((x − ξ)+ )] + (1 − p)E[(ξ − x)+ ].
Realizando el cambio de variable y := x + a, el problema de optimización se rees-

tructura de la manera siguiente:
Vn+1 (x) = min{K + Gn (x), inf Gn (y)} + Hn (x), x ∈ X. (15.9)

y>x
A continuación presentamos el siguiente resultado sobre cada función Vn .

Lema 15.5.1 Para cada n = 1, 2, . . ., la función Vn cumple:
1. Vn es convexa sobre X,
2. limx→∞ Vn (x) = ∞.
Demostración. Primero, veamos que G0 es convexa. Por (15.5) y dado que V0 = 0
se tiene que
G0 (y) = (c + hp)y + pE[(ξ − y)+ ], y ≥ 0. (15.10)
Luego, (c + hp)y es convexa porque es una función lineal sobre la variable y, y
por Lema 15.5.2 la función E[(ξ − y)+ ] es convexa. Ası́ G0 es convexa, además
G0 (y) → ∞ cuando y → ∞, pues
Z ∞
0 ≤ E[(ξ − y)+ ] = sf (s)ds − y(1 − F (y)) ≤ E[ξI(y,∞) (ξ)],
y
entonces E[(ξ −y)+ ] → 0 cuando y → ∞. Análogamente se observa que H0 satisface

las mismas condiciones que G0 tomando en cuenta la hipótesis que c ≤ h(1 − p).
Ahora procedemos de manera inductiva sobre n, para n = 1,
V1 (x) = min{K + G0 (x), inf G0 (y)} + H0 (x),

y≥x
por el Lema 15.5.2 la función inf y≥x G0 (y) es convexa y la función min es también
convexa. Por otro lado,
lim V1 (x) = lim inf G0 (y) + lim H0 (x),

x→∞ x→∞ y≥x x→∞
para poder obtener el resultado, es necesario demostrar que
lim min{K + G0 (x), inf G0 (y)} = ∞,

x→∞ y≥x
para esto, tenemos que G0 es convexa y G0 (y) → ∞ cuando y → ∞, ası́ existe

y0∗ ≥ x para x ∈ X fijo, tal que
inf G0 (y) = G0 (y0∗ ),

y≥x
y por el cambio de variable tenemos que existe a∗0 ∈ A tal que
inf G0 (x + a) = G0 (x + a∗0 ),
a≥0
202
de esta forma, cuando x → ∞
inf G0 (x + a) → ∞.
a≥0
Por lo tanto, se tiene lo buscado para V1 .

Supongamos que para n se cumple que Vn es convexa y además
lim Vn (x) = ∞,
x→∞
entonces Gn y Hn son convexas. Por tanto, por el Lema 15.5.2 se tiene que Vn+1 es
convexa. Por otro lado,
lim Gn (y) = lim(G0 (y) + αpE[Vn ((y − ξ)+ )]) = ∞,

x→∞
lim Hn (x) = lim (H0 (x) + α(1 − p)E[Vn ((x − ξ)+ )]) = ∞.
x→∞ x→∞
Lo anterior por la continuidad l.s.c. de la función Vn y por la hipótesis inductiva.

Ası́, existe yn∗ ≥ x tal que
inf Gn (y) = Gn (yn∗ ),
y≥x
luego por el cambio de variable propuesto a y se tiene que existe a∗n ∈ A tal que
inf y≥x Gn (x + a∗n ) = Gn (x + a∗n ). Por tanto,
lim Vn+1 (x) = ∞. (15.11)

x→∞
Se demostró en el Lema 15.5.1 que para cada t = 0, 1, ... la función Gt y Ht son

convexas y además, Gt (y) → ∞ y Ht (y) → ∞ cuando y → ∞.
El siguiente resultado es una herramienta útil para demostrar la optimalidad de las
polı́ticas (s, S), su demostración se puede encontrar en [5].
Lema 15.5.2 Si g : R+ → R es una función convexa y g(y) → ∞ cuando |y| → ∞,
entonces existen escalares s > 0 y s < S con s ≤ S tal que
1. g(S) ≤ g(y) para cada y ≥ 0,
2. g(S) + K = g(s) < g(y) para cada y ≥ 0,
3. g(y) es una función decreciente en (−∞, s),
4. g(y) ≤ g(z) + K para cada y, z con s ≤ y ≤ z.
Por lo tanto, se sigue con la siguiente proposición.
Proposición 15.5.3 Para cada función Gn , donde n = 0, 1, 2, ..., existe sn > 0 y
s < Sn tales que cumplen las siguientes condiciones:
1. Gn (Sn ) ≤ Gn (y) para cada y,
2. Gn (Sn ) + K = Gn (sn ) < Gn (y) para cada y,
3. Gn (y) es una función decreciente en (−∞, sn ),
203
4. Gn (y) ≤ Gn (z) + K para cada y, z con sn ≤ y ≤ z.

Demostración. Por el Lema 15.5.1, cada función Gn es convexa y además Gn (x) →
∞ cuando x → ∞. Ası́ por el Lema 15.5.2, se tiene la existencia de sn y Sn que
cumplen las concluisiones 1 − 4.
Por las condiciones anteriores dadas en la Proposición 15.5.3 y por el cambio de
variable y = x + a, se tiene que la polı́tica (sn , Sn ) es óptima para el problema con
criterio de costo α-descontado con horizonte de tiempo n. Solo resta demostrar que
la polı́tica óptima para el criterio de costo α-descontado con horizonte infinito es
del tipo (s, S). Primero, considere la función de valor óptimo α-descontado, Vα . Por
el Teorema 15.4.5, se tiene que la función Vα es la única solución de la ecuación de
programación dinámica. Ası́, sustituyendo el costo definido en (15.5) en la ecuación
de programación dinámica se tiene que
Vα∗ (x) = min{K + G(x), inf G(x + a)} + H(x),

x>0
en donde
G(x + a) = (c + hp)(x + a) + pE[(ξ − (x + a))+ ] + αpE[Vα∗ ((x + a − ξ)+ )],
H(y) = (h(1 − p) − c)x + (1 − p)E[(ξ − x)+ ] + α(1 − p)E[Vα∗ ((x − ξ)+ )].
En el siguiente lema se tienen algunas consecuencias de la función Vα∗ .

Lema 15.5.4 La función de valor óptimo α-descontado, Vα∗ es convexa y Vα∗ (x) →
∞ cuando x → ∞.
Demostración. Por el Teorema 15.4.5 , se tiene que las funciones de iteración de
valor óptimo cumplen que Vn ≤ Vα∗ . Ası́
lim Vα∗ (x) = ∞.

x→∞
y por tanto Vn ↑ Vα∗ , ası́ Vα∗ es una función convexa.

Por último se tiene la optimalidad de la polı́tica (s, S) para el problema con horizonte
infinito, la cual se presenta en el siguiente resultado.
Proposición 15.5.5 Existen s > 0 y s < S que cumplen las siguientes condiciones:
1. G(S) ≤ G(y) para cada y,
2. G(S) + K = G(s) < G(y) para cada y,
3. G(y) es una función decreciente en (−∞, s),
4. G(y) ≤ G(z) + K para cada y, zaon s ≤ y ≤ z,
por lo tanto, la polı́tica (s, S) es óptima para el criterio de costo total α-descontado
con horizonte infinito.
Demostración. Por el Lema 15.5.4, la función G satisface las condiciones del Lema
15.5.2 entonces se tienen las conclusiones 1 − 4 de esta proposición. Luego por el
cambio de variable y = x + a y 1 a 4 se tiene que la polı́tica (s, S) es óptima.
204
15.6. Conclusiones
En este capı́tulo se propone un modelo de inventarios con demanda estocástica
y con la caracterı́stica de permitir mercancia no abastecida al inventario. Para di-
cho sistema se caracterizan polı́ticas óptimas del tipo (s, S), mediante la técnica de
programación dinámica y algunos resultados de funciones convexas. Los resultados
obtenidos permiten la implementación numérica de polı́ticas estructurales al con-
texto de teorı́a de inventarios. Trabajos futuros en esta lı́nea de investigación son
los siguientes:
Aplicar estos nuevos resultados teóricos para optimizar la gestión de un in-

ventario en México.
El modelo presentado de Lindley generalizado, tiene como hipótesis que la
sucesión de variables aleatorias i.i.d., {ηt } tienen distribución Bernoulli con
parámetro p, entonces se busca generalizar la distribución de estas variables
con el fin de seguir garantizando la optimalidad de polı́ticas (s, S).
Estudiar la optimalidad de las polı́ticas (s, S) pero utilizando el criterio de
costo promedio. Existen ya avances al respecto para otros modelos de inven-
tarios [5], pero en la literatura no hemos encontrado estudios para el modelo
con demanda no suplida.
205
Bibliografı́a
[1] Ash R. B. and Doleans-Dade C.A., Probability and Measure Theory Aca-
demic Press Elsevier, San Diego, 2005.
[2] Chen X. and Simchi-Levi D., Coordinating inventory control and pricing
strategies with random demand and fixed ordering cost: the infinite horizon
case. Operations Research Center,Vol 29, pp. 698-723, 2004.
[3] Daduna H., Knopov P. and Tur L., Optimal Strategies for an Inventory
System with Cost Functions of General Form. Cybernetic and Systems Analysis,
Springer, 1999.
[4] Ehrhardt R., The Power Approximation for Computing (s, S) Inventory Po-
licies. Management Science, pp. 777-786, 1979.
[5] Feinberg E., Optimality Conditions for Inventory Control, arxiv:1606.00957v1,
2016.
[6] Feinberg E. and Lewis M., On the Optimality of (s,S) Policies. ar-
xiv:1507.05125v1, 2015.
[7] Goldberg D., Dmitriy A., Yingdong L., Sharma M. and Squillante
M. Asymptotic Optimality of Constant-Order Policies for Lost Sales Inventory
Models with Large Lead Times. Septiembre 2014. arxiv:1211.4063v2.
[8] Guo X and Zhu Q., Average optimality for Markov decision processes in borel
spaces: a new conditions and approach. Journal of Applied Probability, Vol. 49,
2006.
[9] Hernández-Lerma O. and Lasserre J. B., Discrete-Time Markov Control.
Processes: Basic Optimality Criteria, Springer-Verlag, New York, 1996.
[10] Iglehart D., Optimality of (s,S) Policies in the Infinite Horizon Dynamic In-
ventory Problem. Institute for Operations Research and the Management Scien-
ces. pp. 259-267, 1963.
[11] Johansen G. and Shaler S., Control of Arrivals to a Stochastic Input-
Output System. Advances in Applied Probability, Vol. 12, No. 4, pp. 972-999,
1980.
[12] Lindley D., The Theory of Queues with Single Server, Proc. Cambridge Phi-
los. Soc. 48, pp. 277-289, 1952.
206
[13] Margono S. and Dwi Y., Determine the Appropriate Inventory Model in
Tang Company. Journal of Business and Management. Vol.4, No. 4, 2015.
[14] Özekici S. y Parlar M., Inventory models with unreliable suppliersin a
random environment. Operations Research, pp.123-136, 1999.
[15] Porteus E., On the Optimality of Generalized (s,S) Policies. Management
Science, 1971.
[16] Scarf H., The Optimality of (S,s) Policies in the Dynamic Inventory Problem.
Applied Mathematics and Statistics Laboratory, Standford University, Califor-
nia, No. 11, 1959.
[17] Schal M., On The Optimality of (s,S)- Policies in Dynamic Inventory Models
with Finite Horizon. Siam J. Appl. Math., Vol. 30, No. 3, 1976.
[18] Suresh P. and Feng C., Optimality of (s,S) Policies in Inventory Models with
Markovian Demand. Operations Research. Vol. 4, No. 6, pp. 931-940, 1995.
[19] Veinott A., On the Optimality of (s,S) Inventory Policies: New Conditions
and New Proof. SIAM J. Appl. Math. No. 14, pp. 1067-1089, 1966.
[20] Veinott A. and Wagner H., Computing Optimal (s,S) policies. Manage-
ment Science. Vol. 11, No. 5, pp. 525-552, 1965.
[21] Zipkin P., Old and New Methods for Lost Sales Inventory Systems Operations
Research. Vol. 56, No. 5, pp. 1256-1263, 2008.
207
Capı́tulo 16
Reemplazo óptimo de un equipo y algoritmo creciente de inducción hacia atrás.
Rosa M. Flores Hernández, Rocio Ilhuicatzi Roldán y Roberto Rosales Flores
Universidad Autónoma de Tlaxcala,

Facultad de Ciencias Básicas, Ingenierı́a y Tecnologı́a,
Calz. Apizaquito s/n, km. 1.5,
C.P. 90300, Apizaco, Tlaxcala,
rosam@xanum.uam.mx, rocioil@hotmail.com
rrosalesf@hotmail.com
Resumen. En este trabajo se presentan diversos modelos estocásticos de reem-

plazo, considerados en la teorı́a de procesos de decisión de Markov, con la finalidad
de comparar tales modelos y las formas correspondientes de implementación del
Algoritmo de inducción hacia atrás, para la obtención de las polı́ticas de decisión
óptimas. También, se incluye una versión creciente de tal algoritmo, la cual facilita
la obtención de una polı́tica óptima creciente. La teorı́a se ilustra con un caso par-
ticular de reemplazo.
Abstract. In this paper, different stochastic replacement models are presented,

considered in the theory of Markov decision processes, in order to compare such
models and the corresponding forms of implementation of the Backward Induction
Algorithm, to obtain the optimal decision policies. As well, an increasing version
of such an algorithm is included, which facilitates obtaining an increasing optimal
policy. The theory is illustrated with a particular case of replacement.
Palabras clave: Procesos de decisión de Markov, Modelos de reemplazo, Algo-

ritmo de inducción hacia atrás, polı́ticas óptimas monótonas.
Los modelos de reemplazo de máquinas tienen importancia principalmente den-
tro de los grandes sistemas productivos, en donde detener alguna lı́nea de producción
por causa de algún fallo en las máquinas genera grandes pérdidas monetarias. Por
otro lado, reparar máquinas constantemente también implica grandes costos. El
problema de reemplazo óptimo consiste, por ejemplo, en determinar los momentos
adecuados en que se debe reemplazar una máquina de tal manera que se minimicen
208
los costos.
En este trabajo se hace una recopilación de algunos modelos de reemplazo mo-

delados con la teorı́a de Procesos de Decisión de Markov (PDMs). Dicha teorı́a
considera procesos estocásticos observados en tiempo discreto, en donde se permite
tomar una decisión o aplicar un control, que interviene en el desarrollo del proceso,
incurriendo en un costo o en una recompensa (véase [2] o [4]). En el caso del pro-
blema de reemplazo óptimo, el proceso que es controlado es el proceso estocástico
de deterioro de una máquina, la cual se supone transita por ciertos niveles de dete-
rioro, pudiendo estar cada vez en un nivel peor. Las decisiones que usualmente se
toman son la de reemplazar o no reemplazar la máquina, dependiendo del nivel de
deterioro en que se encuentre (véase [3], [4] y [5]).
Como podrá verse, algunas de las variantes que presentan estos modelos, son que el
conjunto de niveles de deterioro puede ser finito o infinito numerable, o en lugar de
considerar costos, se pueden considerar recompensas; incluso, en algunos modelos,
se plantea la reparación de la máquina en lugar del reemplazo (véase [1]). Cabe
señalar que un supuesto importante en el modelado del problema de reemplazo, co-
mo un problema de control óptimo dentro de la teorı́a de PDMs, es que el reemplazo
es inmediato.
La intención de presentar diversos modelos de reemplazo, es mostrar las distintas

formas del Algoritmo de Inducción Hacia Atrás (AIHA), que resuelve el problema
de reemplazo óptimo, considerando el costo (o recompensa) total esperado(a) con
horizonte finito, como función objetivo. De la misma manera, se pretende destacar
la monotonicidad de las polı́ticas óptimas como una caracterı́stica de los modelos
de reemplazo, lo cual facilita su obtención, a través de una versión modificada del
AIHA.
Este trabajo, se encuentra estructurado de la siguiente manera: en la Sección 2,

se presentan conceptos básicos de la teorı́a de PDMs. En la Sección 3, se incluyen
tres modelos de reemplazo distintos y se resuelve un caso particular de ellos. En
la Sección 4, se da una condición que garantiza la existencia de polı́ticas óptimas
crecientes y una versión modificada del AIHA, para PDMs con costo total esperado,
horizonte finito y espacios de estados y decisiones finitos; también se ilustra dicha
teorı́a. Finalmente, se consideran las conclusiones y la bibliografı́a utilizada.
16.2. Procesos de decisión de Markov

En esta sección se mencionan algunos conceptos básicos y resultados de la teorı́a
de procesos de decisión de Markov, tomados de [2], necesarios para la comprensión
del capı́tulo.
Un proceso de decisión de Markov (PDM), a tiempo discreto, es un modelo

matemático de un sistema dinámico, sujeto a perturbaciones aleatorias, el cual es
observado periódicamente y se puede influir en su comportamiento a través de la
toma de decisiones.
209
Un PDM consta de 3 elementos:

1. Un modelo de decisión,
2. un conjunto de polı́ticas y
3. una función objetivo.
16.2.1. Modelo de decisión de Markov

Un modelo de decisión de Markov, estacionario a tiempo discreto, es una quı́ntu-
pla {X, A, {A(x) : x ∈ X}, Q, r)} (véase [2]), que consiste del espacio de estados
del sistema X, el conjunto de decisiones, controles o acciones A, los conjuntos de
decisiones admisibles A(x), cuando el sistema se encuentra en el estado x ∈ X, la
ley de transición Q y la recompensa por etapa r.
En este trabajo, los conjuntos X y A se consideran espacios discretos (finitos o infi-

nitos numerables), con σ− álgebras B(X) y B(A), respectivamente; si el espacio es
finito, la σ− álgebra correspondiente puede ser el conjunto potencia y, si el espacio es
numerable, podrı́a considerarse la σ− álgebra de Borel. Para cada x ∈ X, A(x) ⊂ A
es un conjunto no vacı́o, con la propiedad de que K := {(x, a) : x ∈ X, a ∈ A(x)},
el conjunto de parejas estado-decisión admisible, es un subconjunto de X × A. La
ley de transición Q(B|x, a), B ∈ B(X) y (x, a) ∈ K es un kérnel estocástico en X
dado K, i.e., Q(·|x, a) es una medida de probabilidad en X para cada (x, a) ∈ K fijo
y, Q(B|·, ·) es una función en K, para cada B ∈ B(X) fijo. Finalmente, r : K → R
es una función.
16.2.2. Polı́ticas
Una polı́tica estrategia es una colección de reglas de decisión
π = {f0 , f1 , . . .},
donde cada una de dichas reglas indica qué control aplicar, en cada instante de
tiempo.
Una polı́tica de decisión general π = {f¯0 , f¯1 , . . .} se define como una sucesión de
reglas (medibles, posiblemente aleatorias) para tomar decisiones y, en cada tiempo
t = 0, 1, ..., la decisión f¯t puede depender del estado actual y de todos los estados y
decisiones anteriores (véase [2]), es decir,
f¯t = f¯t (x0 , a0 , x1 , a1 , . . . , at−1 , xt ), t = 0, 1, . . . .
Denotaremos el conjunto de todas las polı́ticas por Π.
Sea F el conjunto de funciones de decisión o selectores, i.e., el conjunto de todas

las funciones f : X → A tal que f (x) ∈ A(x), para toda x ∈ X. Una sucesión
π = {ft } de funciones en F se denomina polı́tica de Markov ; ası́, la decisión tomada
en el tiempo t es at = ft (xt ).
210
Dado el estado inicial x0 = x y cualquier polı́tica π ∈ Π existe una medida de

probabilidad Pxπ , inducida por la pareja (x, π) en el espacio (X × A)∞ , con F la
σ-álgebra producto en una forma canónica (véase [2]). Se denotará el operador de
esperanza correspondiente por Exπ . El proceso estocástico (Ω, F, Pxπ , {xt }) se deno-
mina proceso de decisión de Markov.
16.2.3. Función objetivo

La función objetivo sirve para medir la calidad de cada una de las polı́ticas.
También se conoce como criterio de funcionamiento o ı́ndice de rendimiento.
Si π ∈ Π y x0 = x ∈ X, la Recompensa total esperada se define como

"N −1 #
X
π
J(π, x) := Ex r(xt , at ) + rN (xN ) , (16.1)
t=0
donde rN : X → R es conocida; rN (xN ) es una variable aleatoria que representa la

recompensa terminal.
16.2.4. Problema de decisión óptimo

Al considerar la función objetivo (16.1), el problema de decisión óptimo consiste
en maximizar la función π → J(π, x) sobre Π, para toda x.
Una polı́tica π ∗ ∈ Π es llamada polı́tica óptima si
J(π ∗ , x) = sup J(π, x), para toda x ∈ X. (16.2)

π∈Π
y, la recompensa máxima:
J ∗ (x) := J(π ∗ , x), x ∈ X
se denomina función de valor.
Observación 16.2.1 En algunos casos, es conveniente considerar una función de

costo por etapa c : K → R, en lugar de una recompensa por etapa r y, un costo
terminal cN : X → R, en lugar de una recompensa terminal rN . Ası́, si la recom-
pensa por etapa r(x, a) y la recompensa terminal rN (XN ) son reemplazadas por una
función de costo c(x, a), (x, a) ∈ K y un costo terminal cN (XN ), respectivamente,
entonces el problema de decisón óptimo consiste en minimizar la función objetivo
resultante, sobre Π, para toda x ∈ X.
Los problemas fundamentales que se presentan, en esta teorı́a, son los siguientes:
existencia, caracterización y aproximación de polı́ticas óptimas.
aproximación y caracterización de la función de valor.
211
16.2.5. Existencia de una polı́tica óptima

Existen diferentes condiciones para garantizar la existencia de una polı́tica mar-
koviana determinista, que es óptima para el problema de decisión, planteado en la
sección anterior. Por ejemplo, se tiene lo siguiente:
Suposición 16.2.2 (Proposición 4.4.3, [4])
Sea X un conjunto finito o numerable y,

a) A(x) es finito, para cada x ∈ X, o
b) A(x) es compacto, r(x, a) es continua en a, para cada x ∈ X, existe un M < ∞

para el cual |r(x, a)| ≤ M , para toda a ∈ A(x), x ∈ X y Q(y|x, a) es continua
en a, para cada x, y ∈ X, o
c) A(x) es compacto, r(x, a) es semicontinua superior en a (véase [2]), para cada

x ∈ X, existe un M < ∞ para el cual |r(x, a)| ≤ M , para toda a ∈ A(x),
x ∈ X y, para cada x, y ∈ X, Q(y|x, a) es semicontinua inferior en a (véase
[2]).
16.2.6. Obtención de una polı́tica óptima

El Algoritmo de Inducción Hacia Atrás (AIHA), proporciona un método para
resolver problemas de decisión de Markov a tiempo discreto y con horizonte finito.
éste consiste en lo siguiente (véase [4], p. 92):
Sean J0 , J1 , . . . , JN funciones en X definidas (hacia atrás) por
JN (x) := rN (x)
y, para t = N − 1, N − 2, . . . , 0,
X
Jt (x) := max r(x, a) + Jt+1 (y)Q(y|x, a) .
a∈A(x)
y∈X
Si para cada t = 0, . . . , N − 1, existe una regla de decisión ft ∈ F tal que para toda
x∈X X
Jt (x) := r(x, ft (x)) + Jt+1 (y)Q(y|x, ft (x)),
y∈X
entonces la polı́tica markoviana determinista π ∗ = {f0 , . . . , fN −1 } es óptima y, la

función de valor J ∗ , es igual a J0 .
16.3. Modelos de Reemplazo

En esta sección se presentan algunos modelos de reemplazo, representativos den-
tro de la teorı́a de procesos de decisión de Markov.
212
16.3.1. Modelo de reemplazo con espacio de estados finito y

costos por etapa.
El modelo que a continuación se describe es propuesto en [1], p. 8.
Considérese el problema de hacer funcionar eficientemente, sobre N periodos de

tiempo, una máquina que puede estar en cualquiera de n estados, denotados por
1, 2, . . . , n. Sea g(x) el costo de funcionamiento, por periodo, cuando la máquina
está en el estado x y, supóngase que
g(1) ≤ g(2) ≤ . . . ≤ g(n),
lo cual significa que el estado x es mejor que el estado x + 1 y, el estado 1 corres-
ponde a una máquina en la mejor condición.
Durante un periodo de funcionamiento, el estado de la máquina puede empeorar o

puede permanecer sin cambio. Se supone que las probabilidades de transición pxy ,
de pasar al estado y dado que el estado actual es x, satisfacen pxy = 0 si y < x.
Se considera que al inicio de cada periodo se conoce el estado de la máquina y

puede elegirse una de las dos opciones siguientes:
a) Permitir que la máquina funcione un periodo más en el estado en que se
encuentra actualmente.
b) Reparar la máquina hasta llevarla al mejor estado, 1, con un costo R > 0.
Se supone que la máquina, una vez reparada, permanecerá en el estado 1 por un pe-
riodo y, en periodos subsecuentes, puede deteriorarse a los estados y > 1 de acuerdo
a las probabilidades de transición p1y .
Por lo tanto, el objetivo es decidir sobre el nivel de deterioro (estado), en el cual es

conveniente pagar el costo de reparación de la máquina, obteniendo ası́ el beneficio
de menor costo de operación futuro. Obsérvese que la decisión también podrı́a estar
afectada por el periodo en que ésta se encuentre; por ejemplo, se podrı́a estar menos
inclinado en reparar la máquina cuando hay pocos periodos por delante.
De acuerdo con lo descrito anteriormente, el problema de reemplazo puede plan-

tearse como un modelo de decisión de Markov con las siguientes componentes:
Espacio de estados: X = {1, 2, . . . , n}.
A = A(x) = {0, 1}, donde la decisión 0 corresponde a la opción a) y, la decisión
1, corresponde a la opción b), descritas anteriormente.
Ley de transición:

0, y<x
Q(y|x, a = 0) =
pxy , y ≥ x
y, por tener la garantı́a de que una vez reparada la máquina ésta permanecerá
en el estado 1, por al menos un periodo,

1, y = 1
Q(y|x, a = 1) = .
0, en otro caso
213
Costo por etapa:

g(x), si a = 0
c(x, a) = .
R + g(1), si a = 1
En este modelo se considera cN (x) = 0.
En este caso, la función objetivo es el costo total esperado:

"N −1 #
X
π
J(π, x) := Ex c(xt , at ) + cN (xN )
t=0
y, el AIHA, correspondiente, es como sigue:
JN (x) = 0,
n
X
Jt (x) = min c(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=1
n
X
= min g(x) + Jt+1 (y)pxy , R + g(1) + Jt+1 (1) ,
y=x
t = N − 1, N − 2, . . . , 0.
16.3.2. Modelo de reemplazo con espacio de estados nume-

rable y recompensas por etapa.
La siguiente descripción del modelo de reemplazo se tomó de [4], pp. 109 y 248.
La condición de un equipo usado en un proceso de manufactura se deteriora con

el tiempo. El estado x ∈ X = {0, 1, . . .} representa la condición del equipo, en
cada época de decisión; entre mayor es el valor de x, peor es la condición del equi-
po. En cada época de decisión, puede tomarse una de dos decisiones del conjunto
A = A(x) = {0, 1}, para cada x ∈ X: la decisión 0 corresponde a hacer funcionar el
equipo como está por un periodo adicional y, la decisión 1, corresponde a desechar
el equipo y reemplazarlo inmediatamente por una pieza nueva e idéntica. Se supone
que, en cada periodo, el equipo se deteriora por z estados con probabilidad p(z),
independiente del estado al inicio del periodo. Las probabilidades de transición para
este modelo satisfacen:

0, y<x
Q(y|x, a = 0) =
p(y − x), y ≥ x
y,
Q(y|x, a = 1) = p(y), y ≥ 0.
La recompensa consiste de tres partes: un ingreso fijo de K unidades por periodo;
un costo de funcionamiento g(x), dependiente del estado, con g(x) creciente en x y,
un costo de reemplazo de R unidades. Ası́,

K − g(x), a=0
r(x, a) = .
K − R − g(0), a = 1
214
El valor de desecho del equipo, al final del horizonte de planeación, es rN (x), el cual
se supone decreciente en x.
Para este modelo, la recompensa total esperada es la siguiente:

"N −1 #
X
J(π, x) := Exπ r(xt , at ) + rN (xN )
t=0
y, el AIHA, es como sigue:
JN (x) = rN (x),
∞
X
Jt (x) = max r(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=0
X∞ ∞
X
= max K − g(x) + Jt+1 (y)p(y − x), K − R − g(0) + Jt+1 (y)p(y) ,
y=x y=0
t = N − 1, N − 2, . . . , 0.
16.3.3. Modelo de reemplazo con espacio de estados nume-

rable y costos por etapa.
El siguiente modelo aparece en [5], p. 129.
Considérese una máquina que puede estar en cualquiera de los estados {0, 1, . . .} y
supóngase que al comienzo de cada dı́a, el estado de la máquina es observado y se
toma la decisión sobre reemplazarla o no. Si se toma la decisión de reemplazarla,
entonces se supondrá que la máquina es reemplazada instantáneamente por una
máquina nueva cuyo estado es 0.
El costo de reemplazar la máquina es denotado por R > 0 y, además, se supo-

ne que el costo de mantenimiento cada dı́a que la máquina está en el estado x es
g(x).
También, sea pxy la probabilidad de que una máquina en el estado x, al comienzo

de un dı́a, estará en el estado y, al comienzo del dı́a siguiente.
Se sigue que lo anterior es un modelo de decisión de Markov en el cual la deci-

sión 1 es la acción de reemplazar y, la decisión 0, corresponde a la acción de no
reemplazar. Las probabilidades de transición y el costo de una etapa están dados
por:
Q(y|x, a = 1) = p0y , Q(y|x, a = 0) = pxy , x≥0
c(x, 1) = R + g(0), c(x, 0) = g(x), x≥0
Además, se supone que la sucesión de costos
{g(x), x ≥ 0}
215
es creciente y acotada, lo cual asegura que el costo de mantenimiento es una función

creciente del estado.
Al igual que en el modelo de la Subsección 16.3.1, la función objetivo es el costo

total esperado y, el AIHA es como sigue:
JN (x) = 0,
∞
X
Jt (x) = min c(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y=0
∞
X
= min g(x) + Jt+1 (y)pxy , R + C(0) + Jt+1 (0)p0y ,
y=x
t = N − 1, N − 2, . . . , 0.
La aplicación del AIHA es relativamente sencilla en los modelos de reemplazo

con espacio de estados finito, sin embargo, para modelos con espacio de estados
numerable podria ser más complicada, puesto que se pide calcular para cada estado
x ∈ X, en cada iteración t, la función Jt (x); lo que podrı́a disminuir tal esfuerzo
computacional son ciertas caracterı́sticas de las componentes del modelo de decisión
de Markov considerado, como se muestra en el ejemplo siguiente.
16.3.4. Ejemplo
Considérese que en el modelo de la Subsección 16.3.2, la probabilidad p(z), de te-
ner z niveles de deterioro, sigue una distribución geométrica con parámetro p = 0.4,
es decir, p(z) = (0.6)(0.4)z , z = 0, 1, . . .; dicha distribución es una de las principales
distribuciones discretas con soporte numerable, cuya estructura facilita los cálculos
en el AIHA, como podrá observarse a continuación. Además, sean N = 3 periodos,
K = 0, R = 5, g(x) = 2x y rN (x) = max{5 − x, 0}, x = 0, 1, . . ..
No es difı́cil observar que, en este caso, existe una polı́tica óptima, pues el mo-
delo considerado satisface la Hipótesis 16.2.2 a), pues X es un conjunto numerable
y A(x) = A = {0, 1}.
Luego, utilizando el AIHA para hallar la polı́tica óptima, se obtiene lo siguiente:
J3 (x) = max{5 − x, 0},

∞
X
Jt (x) = max r(x, a) + Jt+1 (y)Q(y|x, a)
a∈{0,1}
y∈X
∞
X ∞
X
= max − 2x + 0.6 Jt+1 (y)(0.4)y−x , −5 + 0.6 Jt+1 (y)(0.4)y ,
y=x y=0
para t = 2, 1, 0. Iterando se tiene lo siguiente:
216
Para t = 2,
∞
X ∞
X
y y
J2 (0) = max 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=0 y=0
∞
X 4
X
y
= 0.6 J3 (y)(0.4) = 0.6 (5 − y)(0.4)y = 4.34016,
y=0 y=0
con f2 (0) = 0.
∞
X ∞
X
J2 (1) = max − 2 + 0.6 J3 (y)(0.4)y−1 , −5 + 0.6 J3 (y)(0.4)y
y=1 y=0
4
X
= max − 2 + 0.6 (5 − y)(0.4)y−1 , −5 + 4.34016
y=1
= max{1.3504, −0.65984} = 1.3504,
con f2 (1) = 0.
∞
X ∞
X
J2 (2) = max − 4 + 0.6 J3 (y)(0.4)y−2 , −5 + 0.6 J3 (y)(0.4)y
y=2 y=0
4
X
= max − 4 + 0.6 (5 − y)(0.4)y−2 , −0.65984
y=2
= max{−1.624, −0.65984} = −0.65984,
con f2 (2) = 1.
∞
X ∞
X
y−3 y
J2 (3) = max − 6 + 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=3 y=0
4
X
y−3
= max − 6 + 0.6 (5 − y)(0.4) , −0.65984
y=3
= max{−4.56, −0.65984} = −0.65984,
con f2 (3) = 1.
∞
X ∞
X
J2 (4) = max − 8 + 0.6 J3 (y)(0.4)y−4 , −5 + 0.6 J3 (y)(0.4)y
y=4 y=0
4
X
= max − 8 + 0.6 (5 − y)(0.4)y−4 , −0.65984
y=4
= max{−7.4, −0.65984} = −0.65984,
217
con f2 (4) = 1.
Para x = 5, 6, . . .,
∞
X ∞
X
y−5 y
J2 (x) = max − 2x + 0.6 J3 (y)(0.4) , −5 + 0.6 J3 (y)(0.4)
y=5 y=0
= max{−2x, −0.65984} = −0.65984,
con f2 (x) = 1.
Los resultados obtenidos en esta iteración aparecen resumidos en el Cuadro 16.1.
x J2 (x) f2 (x)
0 4.34016 0
1 1.3504 0
2 -0.65984 1
3 -0.65984 1
4 -0.65984 1
.. .. ..
. . .
Cuadro 16.1: Resultados obtenidos al usar el AIHA, para t = 2.
Para t = 1,
∞
X ∞
X
y y
J1 (0) = max 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=0 y=0
∞
X
= 0.6 J2 (y)(0.4)y
y=0
∞
X
= 0.6 4.34016 + 1.3504(0.4) − 0.65984 (0.4)y
y=2
= 2.8226176,
con f1 (0) = 0.
∞
X ∞
X
y−1 y
J1 (1) = max − 2 + 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=1 y=0
∞
X
= max − 2 + 0.6 1.3504 − 0.65984 (0.4)y−1 , −5 + 2.8226176
y=2
= max{−1.453696, −2.1773824} = −1.453696,
con f1 (1) = 0.
218
Para x = 2, 3, . . .,
∞
X ∞
X
y−x y
J1 (x) = max − 2x + 0.6 J2 (y)(0.4) , −5 + 0.6 J2 (y)(0.4)
y=x y=0
∞
X
= max − 2x + 0.6(−0.65984) (0.4)y−x , −2.1773824
y=x
= max{−2x − 0.65984, −2.1773824} = −2.1773824,
con f1 (x) = 1.
Los resultados obtenidos en esta iteración se muestran en el Cuadro 16.2.
x J1 (x) f1 (x)
0 2.8226176 0
1 -1.453696 0
2 -2.1773824 1
3 -2.1773824 1
.. .. ..
. . .
Finalmente, para t = 0,
∞
X ∞
X
y y
J0 (0) = max 0.6 J1 (y)(0.4) , −5 + 0.6 J1 (y)(0.4)
y=0 y=0
∞
X
= 0.6 J1 (y)(0.4)y
y=0
∞
X
y
= 0.6 2.8226176 − 1.453696(0.4) − 2.1773824 (0.4)
y=2
= 0.996302336,
con f1 (0) = 0.
∞
X ∞
X
J0 (1) = max − 2 + 0.6 J1 (y)(0.4)y−1 , −5 + 0.6 J1 (y)(0.4)y
y=1 y=0
∞
X
y−1
= max − 2 + 0.6 − 1.453696 − 2.1773824 (0.4) , −5 + 0.996302336
y=2
= max{−5.0496, −4.003697664} = −4.003697664,
con f0 (1) = 1.
219
Para x = 2, 3, . . .,
∞
X ∞
X
y−x y
J0 (x) = max − 2x + 0.6 J1 (y)(0.4) , −5 + 0.6 J1 (y)(0.4)
y=x y=0
∞
X
= max − 2x + 0.6(−2.1773824) (0.4)y−x , −4.003697664
y=x
= max{−2x − 2.1773824, −4.003697664} = −4.003697664,
con f0 (x) = 1.
Los resultados obtenidos en esta última iteración se muestran en el Cuadro 16.3.
x J0 (x) f0 (x)
0 0.996302336 0
1 -4.003697664 1
2 -4.003697664 1
.. .. ..
. . .
Como podrá observarse en los Cuadros 16.1-16.3, las reglas de decisión ft , para
t = 2, 1, 0, son reglas de decisión óptimas crecientes. Por lo tanto, la polı́tica óptima
π ∗ = {f0 (x), f1 (x), f2 (x)} es creciente en x.
16.4. Polı́ticas óptimas crecientes

A continuación se enuncia una de las condiciones, que aparecen en [4], pp. 107-
108, bajo las cuales existen polı́ticas crecientes que son óptimas. Cabe señalar que
pueden existir otras polı́ticas óptimas que no sean crecientes.
Para ello, considérese que X es finito o numerable, A = A(x), x ∈ X, es finito

y, la definición de q(k|x, a), de la siguiente forma:
∞
X
q(k|x, a) := Q(y|x, a),
y=k
la cual representa la probabilidad de que el estado en la época de decisión t + 1

sea mayor que k − 1, cuando en la época de decisión t, se toma la decisión a, en el
estado x.
Además, una función G : K → R es superaditiva en K si
G(y, b) + G(x, a) ≥ G(y, a) + G(x, b),
siempre que x ≤ y en X y a ≤ b en A, con a, b ∈ A(x) ∩ A(y).
220
16.4.1. Una condición para obtener reglas de decisión cre-

cientes
La Suposición 16.2.2 y la siguiente condición implican que existen reglas de
decisión óptimas, ft (x), que son crecientes en x, para t = 0, . . . , N .
Condición 16.4.1 ([4], p. 108)

a) r(x, a) es decreciente en x, para toda a ∈ A,
b) q(k|x, a) es creciente en x, para toda k ∈ X y a ∈ A,
c) r(x, a) es una función superaditiva en K,
P∞
d) y=0 Q(y|x, a)u(y) es una función superaditiva en K, para u decreciente, y
e) rN (x) es decreciente en x.
16.4.2. Una versión creciente del Algoritmo de inducción ha-

cia atrás
Enseguida se presenta una versión modificada del AIHA para hallar reglas de
decisión crecientes. Para ello, se supondrá lo siguiente:
para cada t, existe una regla de decisión óptima creciente,
X = {0, 1, . . . , M }, con M finito,
A(x) = A, para toda x ∈ X, y A un conjunto ordenado.
Algoritmo de inducción hacia atrás creciente:

1. Sea t = N y JN (x) = rN (x), para toda x ∈ X.
2. Sustituir t por t − 1, considerar x = 0 y A0 (0) = A.

P
a) Sea Jt (x) = max r(x, a) + J
y∈X t+1 (y)Q(y|x, a) .
a∈A0 (x)

∗
P
b) Sea At (x) = argmax r(x, a) + y∈X Jt+1 (y)Q(y|x, a) .
a∈A0 (x)
c) Si x = M , ir al Paso 3, en otro caso, hacer
A0 (x + 1) = {a ∈ A : a ≥ max{a0 ∈ A∗t (x)}}.
d ) Sustituir x por x + 1 y regresar a 2a).

3. Si t = 0, parar, en otro caso, regresar al Paso 2.
A continuación, se presenta un ejemplo cuyo espacio de estados es numerable
(no es finito), pero su espacio de decisiones sı́ lo es; ello provoca que el algoritmo,
presentado anteriormente, después de cierto número de iteraciones, se detenga. Ésto,
abre la posibilidad de extender, en un futuro, dicho algoritmo.
221
16.4.3. Un ejemplo
Finalmente, se mostrará que para el modelo del ejemplo de la Subsección 16.3.4,
existe una polı́tica óptima creciente y se obtendrá ésta usando el algoritmo creciente
de inducción hacia atrás.
No es difı́cil verificar que dicho modelo satisface la Condición 16.4.1, pues:
1.
−2x, a=0
r(x, a) =
−5, a=1
es una función decreciente en x, para toda a ∈ {0, 1} y es una función super-
aditiva en K.
P∞ P∞
2. q(k|x, 0) = y=k 0.6(0.4)y−x y q(k|x, 1) = y=k 0.6(0.4)y son funciones cre-
cientes en x, para toda k ∈ X y a ∈ A.
P∞ y−x
P∞
3. y=0 0.6(0.4) u(y) y y=0 0.6(0.4)y u(y) son funciones superaditivas en K,
para cualquier función u decreciente.
4. rN (x) = max{5 − x, 0}, x = 0, 1, . . . es una función decreciente en x.
Por lo tanto, se puede concluir que existe una polı́tica óptima que es creciente.
Por otro lado, una ilustración de la versión creciente del AIHA, para este ejem-
plo, considerando los resultados obtenidos en la Subsección 16.3.4, es la siguiente:
Cuando t = 2 y x = 0, J2 (0) se calcula considerando A0 (0) = A = {0, 1}. Co-

mo f2 (0) = 0, entonces A∗2 (0) = {0} y, por lo tanto, A0 (1) = {0, 1}.
Luego, cuando x = 1, J2 (1) se calcula considerando A0 (1). Como f2 (1) = 0, en-

tonces A∗2 (1) = {0} y, por lo tanto, A0 (2) = {0, 1}.
Ahora, cuando x = 2, J2 (2) se calcula considerando A0 (2). Como f2 (2) = 1, en-

tonces A∗2 (2) = {1} y, por lo tanto, A0 (3) = {1}.
Lo anterior implica que A0 (4) = A0 (5) = . . . = {1} y, de ahı́ que la regla de decisión
óptima ft (x) = 1, para x = 2, 3, . . .. Obsérvese la reducción de cálculos que se tiene.
Observación 16.4.2 [4] p. 112.

Cualquier regla de decisión que seleccione acciones de A∗t (x), en el estado x,
en la época de decisión t, es creciente y óptima.
Este algoritmo difiere del AIHA en que la maximización se lleva a cabo sobre
los conjuntos A0 (x), donde se descartan decisiones cuando se incrementa x.
En el peor caso, A0 (x) = A, para toda x, y el esfuerzo computacional es igual
al de inducción hacia atrás; sin embargo, cuando una regla de decisión es
estrictamente creciente, los conjuntos A0 (x) disminuirán en tamaño, con el
aumento de x y de aquı́ se reduce el número de decisiones que necesitan ser
evaluadas en el Paso 2.
222
Si en algún estado x0 , A0 (x0 ) sólo contiene un elemento, por decir a∗ , entonces

no es necesario alguna maximización dado que esa acción será óptima para
todo x ≥ x0 y
X
Jt (x) = r(x, a∗ ) + Jt+1 (y)Q(y|x, a∗ ), para toda x ≥ x0 .
y∈X
16.5. Conclusiones
La monotonicidad de las polı́ticas óptimas en los modelos de reemplazo, con espacios
finitos, simplifica el algoritmo de inducción hacia atrás y puede facilitar la obtención
de polı́ticas óptimas incluso en modelos con espacio de estados numerable, como se
pudo observar en el ejemplo mostrado en la SubsecciÃ3 n16.4.3.P araello, seránecesarioreestructurarlaversiónc
223
Bibliografı́a
[1] Bertsekas D.P. Dynamic Programming and Optimal Control, Volume I. At-
hena Scientific, Third Edition, USA, 2005.
[2] Hernández-Lerma O. y Lasserre J.B. Discrete-Time Markov Control Pro-
cesses. Springer-Verlag, New York, 1996.
[3] Heyman D.P. y Sobel M.J. Stochastic Models in Operations Research, Vol.
II. Stochastic Optimization. McGraw-Hill, USA, 1984.
[4] Puterman M.L. Markov Decision Processes: Discrete Stochastic Dynamic Pro-
gramming. John Wiley & Sons, Inc., New Jersey, 2005.
[5] Ross S.M. Applied Probability Models with Optimization Applications. Dover
Publications, Inc., New York, 1970.
224
Capı́tulo 17
Juegos Estocásticos y criterios de rendimiento
Ciria Briones Garcı́a, Vı́ctor Vázquez Guevara y

Dionicio Zacarı́as Flores

216470295@alumnos.fcfm.buap.mx, vvazquez@fcfm.buap.mx,
jzacarias@fcfm.buap.mx
Resumen. Se presentan de manera concisa los aspectos de la Teorı́a de Juegos

Estocásticos para el caso en que dos jugadores toman decisiones sucesivas cuyos
efectos son observados en el estado de algún sistema asociado con el juego, donde
cada jugador busca maximizar algún criterio de recompensa. Para esto, se discutirán
conceptos como: “el valor del juego”, “equilibrio de Nash”, “juegos de suma cero”,
entre otros. Finalmente, se plantea la inquietud de aplicar la teorı́a analizada.
Abstract.In a concise manner, topics on Stochastic Game Theory in the case in

which two players take successive decisions whose effects are observed in the state
of some associated system with the game, where each player tries to maximize so-
me reward criteria. For this, some concepts will be discussed: “value of the game”,
“Nash equilibrium”, among others. Finally, the restlessness for applying the theory
analyzed is presented.
Palabras clave: juegos estocásticos, valor del juego, equilibrio de Nash, criterio
de rendimiento.
La Teorı́a de juegos se inicia formalmente en 1944 con la publicación del libro The
theory of games and economic behavior de John Von Neumann y Oskar Morgenstern,
quienes estudiaron dos planteamientos: primero el comportamiento no cooperativo y
segundo el cooperativo. John Forbes Nash escribió una tesis, dirijida por Albert W.
Tucker, donde expuso por primera vez una solución para juegos no cooperativos, a
la que llamó equilibrio de Nash, como consecuencia consguió un gran reconocimiento
entre los especialistas del área. Una situación en la que ninguno de los jugadores
siente la necesidad de cambiar de estrategia porque cualquier cambio implicarı́a una
disminución de las ganancias es un equilibrio de Nash.
225
El concepto de juego estocástico fue introducido por Shapley en 1953. Los juegos
estocásticos, son juegos dinámicos a diferencia de los juegos en forma normal; pueden
ser vistos como una generalización de los procesos de decisión de Markov, en los que
se permite que varios agentes tomen decisiones persiguiendo objetivos diferentes.
En 1997, Filar y Vrieze publicaron el libro Competitive Markov decision processes
cuyo tópico son los juegos estocásticos y los procesos de decisión de Markov.
17.2. Preliminares
En esta sección se presentan las definiciones básicas y notación necesarias para
exponer el modelo del juego. De aquı́ en adelante se considerarán juegos con solo
dos jugadores, cuando se tienen N > 2 jugadores el planteamiento se realiza de
forma análoga.
Llamaremos espacio de Borel a un subconjunto de Borel X de un espacio métrico
completo y separable. Su σ-álgebra de Borel se denotada por B(X). Solo trabaja-
remos con espacios de Borel, en este trabajo medible indicará “Borel medible”.
Dado un espacio de Borel X, denotamos por P(X) a la familia de medidas de
probabilidad en X, dotada de la topologı́a débil σ(P(X), Cb (X)), donde Cb repre-
senta el espacio de funciones acotadas continuas en X. Hay que notar que P(X) es
un espacio de Borel, además si X es compacto P(X) también lo es.
Definición 17.2.1 Sean X y Y espacios de Borel, un kernel estocástico en X dado
Y , o también conocida como probabilidad de transición de Y a X, es una función
medible ν(·|·) tal que
ν(·|y) es una medida de probabilidad sobre X para cada y ∈ Y , y
ν(D|·) es una función medible sobre Y para cada D ∈ B(X).
El conjunto de todos los kérneles estocásticos sobre X dado Y es denotado por

P(X|Y ). Si ν esta en P(X|Y ), entonces escribimos sus valores como ν(B|y) para
todo y ∈ Y y B ∈ B(X). Finalmente, si X = Y entonces ν se llama probabilidad
de transición de Markov en X.
17.2.1. Modelo del juego estocástico

Se considerará el modelo del juego estocástico de suma no cero de dos personas
GM := (X, A, B, KA , KB , Q, r1 , r2 ), (17.1)
en donde
X es el espacio de estados, que supondremos de Borel,
A y B son los espacios de acciones para los jugadores 1 y 2, respectivamente,
ambos de Borel,
KA ∈ B(X × A) y KB ∈ B(X × B) son los cojuntos de restricciones. Para
cada x ∈ X definimos la x-sección no vacı́a de A como el siguiente conjunto
A(x) = {a ∈ A : (x, a) ∈ KA },
226
que representa el conjunto de todas las aciones admisibles para el jugador 1

en el estado x. Análogamente, la x-sección no vacı́a de B, B(x), denota el
conjunto de todas las acciones admisibles para el jugador 2 en el estado x.
Ası́, podemos definir
K := {(x, a, b) : x ∈ X, a ∈ A(x), b ∈ B(x)}.
Q ∈ P(X|K) es un kernel estocástico, llamado la ley de transición. Si x es

el estado en alguna etapa del juego y los jugadores seleccionan las acciones
a ∈ A(x) y b ∈ B(x), entonces Q(·|x, a, b) es la distribución de probabilidad
del siguiente estado del juego,
ri : K → R es una función medible que representa la función de recompensa
para el jugador i = 1, 2.
En cada etapa t = 0, 1, . . ., los jugadores 1 y 2 observan el estado actual x ∈ X
del sistema, y eligen de manera independiente las acciones a ∈ A(x) y b ∈ B(x),
respectivamente. Como consecuencia, sucede que:
(1) el jugador i recibe una recompensa inmediata ri (x, a, b), i = 1, 2, y
(2) el sistema se mueve a un nuevo estado con distribución Q(·|x, a, b)

El objetivo de cada jugador es maximizar algún criterio de rendimiento.
Cuando el juego es de suma cero, en (17.1) consideramos a ri (·) = r(·) (i = 1, 2)
tal que r1 (·) = −r2 (·).
17.3. Estrategias
Sean H0 := X y Ht := K × Ht−1 para t = 1, 2, . . . Para cada t, un elemento
ht = (x0 , a0 , b0 , . . . , xt−1 , at−1 , bt−1 , xt )
de Ht representa una historia del juego hasta el tiempo t. Una estrategia aleatoria
π 1 para el jugador 1 es una sucesión π 1 = {πt1 , t = 0, 1, . . .} de kérneles estocásticos
πt1 en P(A|Ht ) tal que
πt1 (A(xt )|ht ) = 1 ∀ht ∈ Ht , t = 0, 1, . . . (17.2)
Denotamos por Π1 la familia de todas las estrategias para el jugador 1.

Definimos PA (x) := P(A(x)) para cada estado x ∈ X, y Φ1 como la clase de
todas las probabilidades de transición φ ∈ P(A|X) tal que φ(·|x) esta en PA (x) para
todo x ∈ X, es decir, Φ1 = {φ ∈ P(A|X) : φ(·|x) ∈ PA (x), ∀x ∈ X}.
Los conjuntos Π2 y Φ2 para el jugador 2 se definen de forma similar, escribiendo
B(x) en lugar de A(x) y PB (x) := P(B(x)).
Una estrategia π = {πt } se llama de Markov aleatorizada si πt ∈ P(A|X) para
cada t = 0, 1, . . ., esto es, cada πt depende solamente del estado actual xt del sistema.
El conjunto de todas las estrategias de Markov del jugador 1 será denotado por Π1M .
Una estrategia de Markov aleatorizada π = {πt } es estacionaria si existe f ∈ Φ1 tal
que πt = f para cada t = 0, 1, . . . En este caso la estrategia π se identificará con f .
227
Denotamos por Π1S al conjunto de todas las estrategias markovianas aleatorizadas

estacionarias del jugador 1. Tenemos,
Π1S ⊂ Π1M ⊂ Π1 .
Los conjuntos Π2M , Π2S de todas las estrategias de Markov y todas las estrate-
gias estacionarias, respectivamente, para el jugador 2 se definen de manera similar.
Sea (Ω, F) el espacio canónico medible que consiste del espacio muestral Ω :=
(X × A × B)∞ y su σ-álgebra producto. Entonces para cada par de estrategias
(π 1 ,π 2 ) ∈ Π1 × Π2 y cada estado inicial x ∈ X, por el Teorema de C. Ionescu-
1 2
Tulcea, existe una única medida de probabilidad Pxπ π y un proceso estocástico
{(xt , at , bt ), t = 0, 1, . . .} definido en (Ω, F) de manera canónica, donde xt , at y bt
representan el estado y los acciones de los jugadores 1 y 2, respectivamente, en cada
1 2
etapa t = 0, 1, . . . El operador de esperanza con respecto a Pxπ π se denota por
1 2
Exπ π .
Es importante recordar que los jugadores toman decisiones de manera indepen-
diente , es decir, que para cualquier par de estrategias π i ∈ Πi (i = 1, 2) y cualquier
estado inicial x ∈ X, los procesos {at } y {bt } son condicionalmente independientes,
esto quiere decir que
1
,π 2
Pxπ (at ∈ C, bt ∈ D|ht ) = πt1 (C|ht )πt2 (D|ht )
para todo C ∈ B(A), D ∈ B(B), ht ∈ Ht y t = 0, 1, . . .
17.3.1. Criterios de rendimiento

Para cada n = 1, 2, . . ., y cada historia h∞ := (x0 , a0 , b0 , x1 , a1 , b1 , . . .), sea
n−1
X
Jni,0 (h∞ ) := ri (xt , at , bt ) (17.3)
t=0
es la trayectoria de la muestra de n etapas cuando el jugador i(i = 1, 2) usa la

estrategia π i ∈ Πi , dado el estado inicial x0 = x. La ganancia esperada en la n-
ésima etapa es "n−1 #
π 1 ,π 2
X
i 1 2
Jn (x, π , π ) := Ex ri (xt , at , bt ) . (17.4)
t=0
A continuación definimos la ganancia media del camino de la muestra a largo
plazo (SPAP)
J i,0 (h∞ )
J i,0 (h∞ ) := liminf n , (17.5)
n→∞ n
y similarmente, la rentabilidad media esperada a largo plazo (EAP)
Jni (x, π 1 , π 2 )
J i (x, π 1 , π 2 ) := liminf . (17.6)
n→∞ n
Para introducir los criterios de optimalidad que nos interesan utilizamos los
siguientes conceptos. Las funciones en X definidas como
L(x) := sup inf J i (x, π 1 , π 2 ),
π 1 ∈Π1 π 2 ∈Π2
(17.7)
U (x) := 2inf sup J i (x, π 1 , π 2 ),
π ∈Π2 π 1 ∈Π1
228
se denominan el valor inferior y el valor superior (respectivamente). Es claro que

L(·) ≤ U (·) en general, pero si se sostiene la igualdad para todo x ∈ X, entonces la
función común se llama el valor del juego V (·).
17.4. Juegos de suma cero

Para iniciar con esta sección usaremos la ecuación (17.1) con ri (·) = r(·) (i =
1, 2), ası́ las ecuaciones (17.3), (17.4), (17.5) y (17.6) podemos reescribirlas como
Jn0 , Jn , J 0 y J, respectivamente.
Definición 17.4.1 Supongamos que el juego tiene un valor V (·). Entonces una
estrategia π 1∗ en Π1 es EAP óptima para el jugador 1 si
inf J(x, π 1∗ , π 2 ) = V (x) ∀x ∈ X. (17.8)

π 2 ∈Π2
Similarmente, π 2∗ ∈ Π2 es EAP óptima para el jugador 2 si
sup J(x, π 1 , π 2∗ ) = V (x) ∀x ∈ X. (17.9)

π 1 ∈Π1
Cuando se cumplen ambas igualdades, decimos que (π 1∗ , π 2∗ ) es un par EAP óptimo.
Para el caso SPAP introducimos la siguiente definición.

Definición 17.4.2 Supongamos que el juego tiene un valor V (·). Entonces un par
de estrategias (π 1∗ , π 2∗ ) ∈ Π1 × Π2 es SPAP óptimo es si satisface que para todo
x ∈ X y π i ∈ Πi (i = 1, 2),
1∗
,π 2∗
J 0 (h∞ ) = V (x), Pxπ c.s., (17.10)
1∗ 2∗
J 0 (h∞ ) ≥ V (x), Pxπ ,π
c.s., (17.11)
1∗
0 ,π 2∗
J (h∞ ) ≤ V (x), Pxπ c.s. (17.12)
Y para el criterio de par canónico utilizamos la siguiente notación. Para cualquier

función dada f : K → R y medidas de probabilidad ϕ ∈ PA (x) y ψ ∈ PB (x),
escribimos Z Z
f (x, ϕ, ψ) := f (x, a, b)ψ(db)ϕ(da), (17.13)
A(x) B(x)
siempre que las integrales esten bien definidas. En particular, para r y Q como en
la sección 2, Z Z
r(x, ϕ, ψ) := r(x, a, b)ψ(db)ϕ(da) (17.14)
A(x) B(x)
y Z Z
Q(·|x, ϕ, ψ) := Q(·|x, a, b)ψ(db)ϕ(da)
A(x) B(x)
229
Definición 17.4.3 Una cuatro-tupla (ξ∗ , u∗ , ϕ∗ , ψ∗ ) que consiste en una constante

ξ∗ ∈ R, una función medible u∗ : X → R y un par (ϕ∗ , ψ∗ ) ∈ Φ1 × Φ2 de estrategias
estacionarias es una cuatro-tupla canónica si se cumple que , para todo x ∈ X
Z
ξ∗ + u∗ (x) = r(x, ϕ∗ (x), ψ∗ (x)) +u∗ (y)Q(dy|x, ϕ∗ (x), ψ∗ (x)) (17.15)
X
Z
= max [r(x, ϕ, ψ∗ (x)) + u∗ (y)Q(dy|x, ϕ, ψ∗ (x))] (17.16)
ϕ∈PA (x)
ZX
= min [r(x, ϕ∗ (x), ψ) + u∗ (y)Q(dy|x, ϕ∗ (x), ψ)] (17.17)
ψ∈PB (x) X
Se dice que (ϕ∗ , ψ∗ ) es un par canónico de estrategias estacionarias.

Denotamos por (Φ1 × Φ2 )ca la familia de pares canónicos, por (Φ1 × Φ2 )eap la
familia de pares EAP óptimos y por (Φ1 × Φ2 )spap a la familia de pares SPAP
óptimos de estrategias estacionarias.
17.4.1. Suposiciones
Las siguientes suposiciones son necesarias para los teoremas que se mencionan
más adelante.
Suposición 17.4.4 a) Para cada estado x ∈ X, los conjuntos (no vacı́os) A(x)
y B(x) de acciones admisibles son compactos.
b) Para cada (x, a, b) en K, r(x, ·, b) es semicontinua superior (u.s.c.) en A(x) y
r(x, a, ·) es semicontinua inferior (l.s.c.) en B(x).
c) Para cada (x, a, b) en K y cada función medible acotada v definida en X, las
funciones Z Z
v(y)Q(dy|x, ·, b) y v(y)Q(dy|x, a, ·)
X X
son continuas en A(x) y B(x), respectivamente.

d) Existe una constante r̄ y una función medible w(·) ≥ 1 definida en X tal que
|r(x, a, b)| ≤ r̄w(x) ∀(x, a, b) ∈ K, (17.18)
y, además, la parte c) se cumple cuando v se reemplaza con w.
Suposición 17.4.5 Existe una medida de probabilidad ν ∈ P(X), un número po-

sitivo α < 1, y una función medible β : K → [0, 1] que cumplen lo siguiente, para
todo (x, a, b) en K y D en B(X):
a) Q(D|x, a, b) ≥ β(x, a, b)ν(D).
R
b) X w(y)Q(dy|x, a, b) ≤ αw(x) + β(x,R a, b)||ν||w , donde w(·) ≥ 1 es la función
de la Supoción 2.1 d) y ||ν||w := wdν.
Z
c) inf β(x, ϕ(x)ψ(x))ν(dx) > 0.
(ϕ,ψ)∈Φ1 ×Φ2 X
230
Suposición 17.4.6 Existe una medida σ- finita λ definida en X con respecto a

la cual, para cada par (ϕ, ψ) en Φ1 × Φ2 , la probabilidad de transición de Markov
Q(·|x, ϕ(x), ψ(x)) es λ-irreducible.
Definición 17.4.7 Bw (X) denota el espacio lineal de las funciones medibles reales
u definidas en X con una norma w finita que se define como
|u(x)|
||u||w := sup , (17.19)
x∈X w(x)
y Mw (X) representa el espacio lineal normado de las medidas finitas con signo µ
en X tales que Z
||µ||w := wd|µ| < ∞, (17.20)
X
donde |µ| := µ+ + µ− denota la variación total de µ.
Si las suposiciones 2.1, 2.2 y 2.3 se satisfacen, entonces el juego de recompensa

promedio (esperado) tiene un valor constante, digamos V (x) = V ∗ para todo x ∈ X,
y existe un par óptimo EAP de estrategias estacionarias.
Ver demostración en [7].
Suposición 17.4.8 Existe una medida σ-finita γ sobre X y una función de densi-
dad estrictamente positiva g(a, b, ·) tal que
Z
Q(D|x, a, b) = g(x, a, b, y)γ(dy)
D
para todo D ∈ B(X) y (x, a, b) ∈ K.x,
Teorema 17.4.9 Si las suposiciones 17.4.4, 17.4.5 y 17.4.8 se satisfacen, entonces

se tiene que
(Φ1 × Φ2 )ca = (Φ1 × Φ2 )eap . (17.21)
De hecho, existe una cuatro-tupla canónica (ξ∗ , u∗ , ϕ∗ , ψ∗ ) con u∗ en Bw (X) y (por
la Proposición 2.1) ξ∗ = V ∗ .
Sea Fn la σ-álgebra generada por (xt , at , bt ) para t = 0, . . . , n, esto es
Fn := σ{x0 , a0 , b0 , . . . , xn , an , bn }. (17.22)
Además, sea Jn0 como en la ecuación (17.3) y ξ∗ , u∗ como en el Teorema 2.1, y

luego defina el proceso estocástico
Mn (h∞ ) := Jn0 (h∞ ) + u∗ (xn ) − nξ∗ , (17.23)
para n = 1, 2, . . ., con M0 (h∞ ) = u∗ (x0 ). Finalmente, sea ∆ : K → R la llamada

función de discrepancia dada por
Z
∆(x, a, b) := r(x, a, b) + u∗ (y)Q(dy|x, a, b) − u∗ (x) − ξ∗ . (17.24)
X
231
Teorema 17.4.10 Bajo las hipótesis del Teorema 17.4.9, las siguientes expresiones
son equivalentes:
a) El par (ϕ∗ , ψ∗ ) ∈ Φ1 × Φ2 es EAP óptimo.
b) Para cada x ∈ X
∆(x, ϕ∗ (x), ψ∗ (x)) = max ∆(x, ϕ, ψ∗ (x))
ϕ∈PA (x)
(17.25)
= min ∆(x, ϕ∗ (x), ψ)) = 0.
ψ∈PB (x)
c) Para cada x ∈ X, π 1 ∈ Π1 , y π 2 ∈ Π2
c1) {Mn (h∞ ), Fn } es Pxϕ∗ ,ψ∗ -martingala,
2
c2) {Mn (h∞ ), Fn } es Pxϕ∗ ,π -submartingala,
1
c3) {Mn (h∞ ), Fn } es Pxπ ,ψ∗
-supermartingala.
Teorema 17.4.11 Supongamos que las hipótesis del Teorema 17.4.9 se satisfacen
y, además, existe una constante r̂ ≥ 0 tal que
r2 (x, a, b) ≤ r̂w(x) ∀(x, a, b) ∈ K. (17.26)
Entonces un par de estrategias en Φ1 × Φ2 es EAP óptimo si y solo si es SPAP

óptimo; entonces, por el Teorema 17.4.9
(Φ1 × Φ2 )eap = (Φ1 × Φ2 )ca = (Φ1 × Φ2 )spap . (17.27)
17.5. Juegos de suma no cero

En esta sección usaremos el criterio EAP y se dan condiciones para poder hallar
el equilibrio de Nash de un juego estocástico.
Definición 17.5.1 Un par de estrategias (π 1∗ , π 2∗ ) se llama equilibrio de Nash
(para el criterio EAP) si
J 1 (x, π 1∗ , π 2∗ ) ≥ J 1 (x, π 1 , π 2∗ ) ∀π 1 ∈ Π1 , x ∈ X,
y
J 2 (x, π 1∗ , π 2∗ ) ≥ J 2 (x, π 1∗ , π 2 ) ∀π 2 ∈ Π2 , x ∈ X.
232
En este caso la ecuación (17.14) queda de la siguiente forma

Z Z
ri (x, ϕ, ψ) := ri (x, a, b)ψ(db)ϕ(da).
A(x) B(x)
Además de las suposiciones de la sección anterior necesitaremos otras más y

hacemos un cambio en la Suposición 17.4.4 (b) Para cada (x, a, b) ∈ K, r1 (x, a, ·) es
u.s.c. sobre A(x) y r2 (x, ·, b) es u.s.c. sobre B(x).
Suposición 17.5.2 La densidad de transición es tal que
Z
lim |g(x, an , bn , y) − g(x, a, b, y)|w(y)γ(dy) = 0, (17.28)
n→∞ X
para todo x ∈ X, si an → a en A(x) y bn → b en B(x), donde w(·) es la función

de la Suposición 17.4.4 (d).
Las suposiciones siguientes necesitan que la ecuación (17.14) tenga una estruc-
tura ARAT (recompensa aditiva, ley de transición aditiva).
Suposición 17.5.3 Existen kérneles subestocásticos Q1 ∈ P(X|KA ) y Q2 ∈ P(X|KB )
tal que
Q(·|x, a, b) = Q1 (·|x, a) + Q2 (·|x, b)
para todo x ∈ X, a ∈ A(x), b ∈ B(x). Más aún, Q1 (D|x, ·) y Q2 (D|x, ·) son
continuos sobre A(x) y B(x), respectivamente, para cada D ∈ B(X).
Suposición 17.5.4 Para i = 1, 2 existen funciones medibles ri1 : KA → R y ri2 :

KB → R, tales que
(a) ri (x, a, b) = ri1 (x, a) + ri2 (x, b) para todo x ∈ X, a ∈ A, b ∈ B.
(b) Más aún, para cada x ∈ X, las funciones ri1 (x, ·) y ri2 (x, ·) son continuas
sobre A(x) y B(x), respectivamente, y
(c) max |ri1 (x, a)| ≤ w(x), y max |ri2 (x, b)| ≤ w(x).
a∈A(x) b∈B(x)
Ası́ para los juegos de suma no cero tenemos el siguiente teorema.
Teorema 17.5.5 Bajo las Suposiciones 17.4.4, 17.4.5, 17.4.8 y 17.5.2 - 17.5.4,
existe un par (ϕ∗ , ψ∗ ) ∈ Φ1 × Φ2 que es un equilibrio de Nash.
17.6. Ejemplo
Como ejemplo, usaremos el Dilema del Prisionero Iterado. La forma normal
estática del juego se representa en el Cuadro 17.1:
Consideremos las estrategias SC , SD , ST , SA , SG , SQ y SP , donde:
SC jugar siempre C,
233
Cuadro 17.1: Forma normal del juego.
J2
C D
J1 C 3,3 0,5
D 5,0 1,1
SD jugar siempre D,
ST inicia cooperando; a continuación hace lo que el otro jugador hizo en la

etapa anterior,
SG inicia cooperando y sigue cooperando hasta que el otro no lo haga, y luego

no coopera para siempre,
SA inicia no cooperando, a continuación hace lo que el otro jugador hizo en

la etapa anterior,
SQ coopera con probabilidad q y no coopera con probabilidad 1 − q,
SP inicia cooperando y sigue cooperando con probabilidad p y no coopera con

probabilidad 1 − p.
El modelo del juego estocástico es como el dado en (17.1), en donde:
X = {0, 1, 3, 5},
A = B = {0, 1} = A(x) = B(x) para todo x ∈ X, con C = 1 y D = 0,
Q ∈ P(X|K), con K = {(x, a, b)|x ∈ X, a ∈ A(x), b ∈ B(x)}, se define como:

(
1, si at = 1, bt = 0
Q({0}|xt , at , bt ) =
0, c.o.c.
(
1, si at = bt = 0
Q({1}|xt , at , bt ) =
0, c.o.c.
(
1, si at = bt = 1
Q({3}|xt , at , bt ) =
0, c.o.c.
(
1, si at = 0, bt = 1
Q({5}|xt , at , bt ) =
0, c.o.c.
234
Las estrategias para este juego quedan definidas de la siguiente forma:
SC = {πt1 |πt1 ({1}|ht ) = 1, t = 0, 1, . . .}.

SD = {πt1 |πt1 ({0}|ht ) = 1, t = 0, 1, . . .}.
ST es tal que π01 ({1}|ht ) = 1 y
(
1, si at = bt−1
πt1 ({at }|ht ) = , t = 1, 2, . . .
0, c.o.c.
SA es tal que π01 ({0}|ht ) = 1 y para t = 1, 2, . . . ,

(
1 1, si at = bt−1
πt ({at }|ht ) =
0, c.o.c.
SG es tal que π01 ({1}|ht ) = 1; para t = 1, 2 . . . ,

(
1 1, si at−1 = bt−1
πt ({1}|ht ) =
0, c.o.c.
y (
1, si at−1 = 0 o bt−1 = 0
πt1 ({0}|ht ) =
0, c.o.c.
(
q, si at = 1
SQ = {πt1 |πt1 ({at }|ht ) = t = 0, 1, . . .}
1 − q, si at = 0
SP es tal que π01 ({1}|ht ) = 1; para t = 1, 2, . . . ,

(
1 1, si bt−1 = 1
πt ({1}|ht ) =
p, si bt−1 = 0
y (
1 − p, si bt−1 = 0
πt1 ({0}|ht ) =
0, si bt−1 = 1
Nota: Todas las estrategias son estacionarias Markovianas. Por el Teorema 17.5.5
existe un par de estrategias que es un equilibrio de Nash.
De aquı́ observamos que los equilibrios de Nash son: (SD , SD ), (SG , SG ), (SG , ST ),
(ST , SG ), (ST , ST ) y (SQ , SQ ).
235
Cuadro 17.2: EAP de los jugadores con f (x) = −x2 + 3x + 1, g(x) = 1 − x,

h(x) = −2x2 + x(q − 4) + 1 e i(x) = 1 + 4q − x(1 + q).
17.7. Conclusiones
En teorı́a de juegos el objetivo es encontrar estrategias que optimicen el ren-
dimiento para cada uno de los jugadores, pero esto no siempre es sencillo. Los
resultados de la sección 4 nos aseguran que los 3 criterios que se presentaron son
equivalentes. Esto resulta de mucha utilidad pues nos permite elegir el criterio que
sea más sencillo al buscar dichos equilibrios. Por ejemplo en el Dilema del Prisionero
Iterado utilizamos el criterio EAP para hallar los equilibrios de Nash, cuya existen-
cia esta asegurada por el teorema de la sección 5. Aunque la elección del criterio
dependerá del problema que se este abordando.
236
Bibliografı́a
[1] Benı́tez, Medina, Existence of Nash equilibria in nonzero-sum ergodic stochas-

tic games in Borel spaces, MORFISMOS, 5(2), 19-35, 2001.
[2] Boros, Elbassioni, Gurvich, Makino, Markov decision processes and sto-
chastic games with total effective payoff, RUCTOR RESEARCH REPORT,
2014.
[3] Hernández, Lasserre, Further topics on discrete-time Markov control pro-
cesses, SPRINGER SCIENCE+BUSINESS MEDIA, 1999.
[4] Hernández, Lasserre, Zero-sum stochastic games in Borel spaces: average
payoff criteria, SIAM J. CONTROL OPTIM, 39(5), 1520-1539, 2001.
[5] Jassen, Stochastic games. (Tesis de maestı́a), UNIVERSITEIT LEIDEN, 2006.

[6] Luque, Vázquez, Zero-sum semi-Markov games in Borel spaces with discoun-
ted payoff, MORFISMOS, 6(1), 15-29, 2002.
[7] Nowak, Szajowski, Nonzero-sum stochastic games, MUNICH PERSONAL
REPEC, 1998.
[8] Ramı́rez, Existence of optimal strategies for zero-sum stochastic games with
discounted payoff, MORFISMOS, 5(1), 63-83, 2001.
[9] Soo Chang, Marcus, Two-person zero-sum Markov games: receding horizon
approach, in IEEE transactions on automatic control, vol. 48, 2003.
237
Capı́tulo 18
Probabilidad de localización de una partı́cula en un potencial isotónico cuántico
Maricruz Castillo Garcı́a y Mario Alberto Maya Mendieta

mari.c.g.fis@gmail.com, mmaya@fcfm.buap.mx
Resumen. El oscilador isotónico es uno de los pocos sistemas cuúnticos con

solución exacta. En este trabajo presentamos dos contribuciones sobre este proble-
ma. La primera consiste en proponer un método algebraico de solución más sencillo
que los que aparecen en la literatura. La segunda contribución se refiere al cálculo
de la probabilidad de localización de la partı́cula sujeta al potencial isotónico me-
diante fórmulas que determinan los lugares más probables en los que se encuentra
la partı́cula.
Abstract. The isotonic oscillator is one of the few quantum systems with exact
solution. In this work we present two contributions on this problem. The first is to
propose a algebraic method of solution easier than those that appear in the litera-
ture. The second contribution refers to the calculation of the probability of location
of the particle subject to the isotonic potential by using formulas that determine
the most likely places the particle.
Palabras clave: Operadores, potencial, funciones de onda, espetro de energı́a.
El potencial isotónico es un oscilador armónico con una barrera infinita de po-
tencial en el centro. Este es uno de los pocos problemas resueltos de forma exacta en
la mecánica cuántica. Tiene aplicaciones en óptica cuántica, en moléculas poliatómi-
cas, en teorı́a de muchos cuerpos, cadenas de espines para la computación cuántica.
En la literatura aparecen diversos enfoques para resolver la ecuación de Schrodinger
con este potencial. El que trataremos en este trabajo es un método algebraico por
medio de operadores de ascenso y descenso, como en el oscilador armónico [1], pero
a diferencia de este caso, en el que esos operadores contienen derivadas de primer
orden, los operadores para el potencial de tipo isotónico que hemos encontrado en
la literatura son de segundo orden [2], [3].
238
En este trabajo presentamos nuestra contribución al mejor conocimiento de este

sistema cuántico, en dos aspectos: el primero consiste en un método de solución,
tambien de tipo algebraico, en el que el orden de las derivadas en los operadores de
escalera se reducen de segundo orden a derivadas de primer orden, por medio de la
ecuación de Schrodinger. La simplificación en el cálculo de las funciones de onda es
considerable, como lo mostramos mas adelante
La segunda contribución que hacemos es sobre el comportamiento de la partı́cula
atrapada en el potencial isotónico. Para esto tomamos un modelo especı́fico de
oscilador isotónico [2] en el que las funciones de onda y el espectro de energı́a
dependen de un parámetro d, en principio abierto, que depende de la masa de la
partı́cula y de la intensidad de la barrera de potencial en x = 0. Este parámetro
nos permite modelar el potencial isotónico para localizar a la partı́cula en la zona
permitida por dicho potencial.
El plan de este trabajo es el siguiente: En la Sección 18.2 hacemos una revisión
breve del método de factorización de Dirac, el cual es un mecanismo de solución de
una ecuación diferencial de segundo orden, aplicado al oscilador armónico cuántico.
En la Sección 18.3 damos los resultados relevantes en [2] relevantes para nosotros.
En la Sección 18.4 presentamos nuestra propuesta para la simplificación en el orden
de las derivadas en los operadores de escalera y por lo tanto en la obtencion de
las funciones de onda y del espectro de energı́a. En la Sección 18.5 mostramos
como el parámetro d se puede utilizar para modelar la probabilidad de localización
de la partı́cula, y finalmente, en la Sección 18.6 comentamos brevemente nuestros
resultados y damos las conclusiones.
18.2. El método de factorización de Dirac

Esta manera de resolver la ecuación de Schrodinger consiste en proponer unos
operadores diferenciales llamados de escalera los cuales sirven para encontrar todas
las soluciones de dicha ecuación a partir de una sola de ellas. El hamiltoniano del
oscilador armónico es
2
b OA = − 1 d + 1 x2 .
H (18.1)
2 dx2 2
Debemos resolver la ecuación de Schrodinger
b OA Ψ = i ∂Ψ ,
H (18.2)
∂t
donde Ψ = Ψ (x, t) es la función de onda que describe el comportamiento de la
partı́cula sujeta al potencial
1 2
V (x) = x , x ∈ R. (18.3)
2
Debido a que el potencial (18.3) no depende del tiempo, es posible usar el me-
canismo de separación de las variables x y t para demostrar que la función de onda
tiene la forma
Ψ (x, t) = e−iEn t ψn (x) , x ∈ R, t ≥ 0. (18.4)
239
donde ψn (x) satisface la ecuación estacionaria de Schrodinger
H
b OA ψn (x) = En ψn (x) . (18.5)
La ecuación (18.5) es una ecuación de valor propio o de eigenvalor. El valor propio

En es precisamente la energı́a. Entonces debemos abocarnos al problema de resolver
la ecuación (18.5), lo cual haremos por el método de factorización de Dirac. El
hamiltoniano (18.1) está factorizado por los operadores ba± definidos por

± 1 d
a =√
b ∓ +x (18.6)
2 dx
de manera que se cumplen las condiciones
1
H
b OA = b a− +
a+ b (18.7)
2
1
H
b OA a− b
= b a+ − . (18.8)
2
Con (7) y (8) se encuentra la relación de conmutación
− +
a ,b
b a = 1. (18.9)
a± y el hamiltoniano H
Las relaciones más relevantes de los operadores b b OA son las
siguientes
h i
H a−
b OA , b a− ,
= b (18.10)
h i
H a+
b OA , b = a+ ,
−b (18.11)
pues de ellas se deduce que
− −
H a ψn (x) = (En − 1) b
b OA b a ψn (x) , (18.12)
+ +
H a ψn (x) = (En + 1) b
b OA b a ψn (x) . (18.13)
De (18.12) y (18.13) se deducen dos consecuencias

a− ψn (x) y b
1) Las funciones b a+ ψn (x) son también soluciones de la ecuación de
Schrodinger.
a− y b
2) Los operadores b a+ tienen la propiedad de bajar y subir, respectivamente,
la energı́a En en una unidad.
Debido a la segunda propiedad, a b a− se le llama operador de descenso o de
+
bajada y a b a de ascenso o de subida. A ambos se le aplica la denominación de
operadores de escalera. Por otro lado, de las ecuaciones de valor propio (18.12) y
(18.13) deducimos que
240
a− ψn (x) ,
ψn−1 (x) α b (18.14)
+
ψn+1 (x) α b
a ψn (x) . (18.15)
Por todo lo anterior se deduce que si de alguna manera encontramos una solución
ψn (x) de la ecuación de Schrodinger (18.5), podemos encontrar todas las demás.
En el caso del oscilador armónico, lo primero que debemos tomar en cuenta es que
la energı́a debe tener un valor mı́nimo E0 , ya que el potencial ası́ lo establece. Si
ψ0 (x) es la función de onda correspondiente a esta energı́a mı́nima, se debe cumplir
que
a− ψ0 (x) = 0.
b (18.16)
La ecuación (18.16) da lugar a la ecuación diferencial de primer orden
dψ0
+ xψ0 = 0 (18.17)
dx
cuya solución es
2
ψ0 (x) = e−x /2
, x ∈ R. (18.18)
Ahora ya tenemos una función de onda. Con el operador de ascenso podemos

encontrar todas las demás. De acuerdo con (18.12), la función correspondiente al
estado n = 1 es
a+ ψ0 (x)
ψ1 (x) ∼ b (18.19)
La correspondiente el estado n = 2 es
2
a+ ψ1 (x) ∼ b
ψ2 (x) ∼ b a+ ψ0 (x) (18.20)
y en general
n
a+
ψn (x) ∼ b ψ0 (x) (18.21)
2
Aplicando n veces a ψ0 (x) = e−x /2
se encuentra
2
ψn (x) ∼ Hn (x) ψ0 (x) = Hn (x) e−x /2
(18.22)
donde Hn es el polinomio de Hermite de grado n

Finalmente, utilizando la ecuación de Schrodinger se encuentra el espectro de energı́a
1
En = n + (18.23)
2
241
18.3. El potencia isotónico de Nagiyev

El hamiltoniano utilizado por Nagiyev en [2] tiene la forma
2
b N = − 1 d + 1 x2 + g ,
H (18.24)
2 dx2 2 x2
donde aparece el usual término cuadrático del oscilador armónico. La parte singular
de este hamiltoniano está caracterizada por la constante g.

± 1 d d + 1/2
c =√
b ∓ +x− (18.25)
2 dx x
La factorización del hamiltoniano es de la forma
c− + d + 1
c+ b

H
b N = ~ω b (18.26)
lo cual se puede demostrar sin mucha dificultad. En (18.26) aparece el parámetro d

el cual es
p
d = 1 + 8g (18.27)
y asume que g > −1/8 para que d sea real. El conmutador de los operadores (18.25)
es
− + d + 1/2
c ,b
c =1+ . (18.28)
x2
b
El hecho de que este conmutador dependa de la posición x a través de la variable

ξ indica que los operadores b c− , b
c+ no son de escalera, es decir, que no generan
a las funciones de onda ψn (x) soluciones de la ecuación de Schrodinger (18.2).
Es conocido que cuando en el potencial de un sistema cuántico hay dos terminos
dependientes de la posición, los operadores de escalera, si existen, son operadores
diferenciales de segundo orden. Es el caso del potencial de Nagiyev, el cual es
1 2 g
VN (x) = x + 2 , x > 0. (18.29)
2 x
Por la forma del potencial las condiciones de frontera son
lim ψn (x) = 0, (18.30)

x→0
lim ψn (x) = 0. (18.31)
x→±∞
Los operadores de escalera se proponen de la siguiente forma
b± = b
2 g
A a± − , (18.32)
x2
a− (18.6) del oscilador
a+ y descenso b
en donde aparecen los operadores de ascenso b
armónico
242

1 d
a± = √
b ∓ +x . (18.33)
2 dx
b± como
Podemos introducir (18.9) en (18.8) para tener la forma explı́cita de A
operadores difernciales de segundo orden:
2
b+ = 1 d − x d + 1 x2 − 1 − g ,

A 2
(18.34)
2 dx dx 2 x2
2
b− = 1 d + x d + 1 x2 + 1 − g .

A 2
(18.35)
2 dx dx 2 x2
b± tienen las siguientes propiedades:
Los operadores A
h i
b− , A
A b+ = H bN , (18.36)
h i
H b+ = A
bN , A b+ , (18.37)
h i
H b− = −A
bN , A b− . (18.38)
b+ es
Son precisamente las propiedades (18.13) y (18.14) las que aseguran que A
−
un operador de ascenso y que A es de descenso, respectivamente, pues
b
b+ ψn (x)
A = cn+1 ψn+1 (x) , (18.39)
b− ψn (x)
A = cn−1 ψn−1 (x) . (18.40)
siendo ψn (x) una solución de (18.2) correspondiente a la energı́a En . Las propie-

dades (13) y (14) garantizan que ψn+1 (x) y ψn−1 (x) tambien son soluciones de
(18.2).
18.4. Nuestro método de solución

Como hemos mencionado, los operadores de escalera del potencial de Nagiyev
son operadores diferenciales de segundo orden, como se puede ver en las formas
(18.10) y (18.11). Ahora vamos a demostrar que se pueden reducir a operadores
diferenciales de primer orden, si usamos la ecuación de Schrodinger (18.2) con el
potencial (18.7), en la forma
d2 ψn

1 2 g
= 2 [V (x) − En ] ψn = 2 x + 2 − En ψn . (18.41)
dx2 2 x
243
Si aplicamos los operadores (18.10) y (18.11) a la función ψn (x) podemos escribir

+ dψn 2 1
A ψn = −x
b + x − En − ψn = cn+1 ψn+1 (x) (18.42)
dx 2

b− ψn = x dψn + x2 − En + 1 ψn = cn−1 ψn−1 (x)
A (18.43)
dx 2
La expresiones (18.15) y (18.18) muestran un mecanismo que nos permite cons-

truir la función de onda ψn+1 (x) por medio de un operador diferencial de primer
orden, a diferencia del operador de ascenso (18.15) el cual es de segundo orden. El
ahorro en la cantidad de cálculos es considerable, pues siguiendo el procedimiento
usual de crear la función de onda ψn (x) a partir de la función del estado base ψ0 (x)
de acuerdo a
n
b+ ψ0 (x)
ψn+1 (x) = A (18.44)
tendrı́amos que realizar 2n derivadas usando (18.10), mientras que con (18.18) sólo
serı́an n derivadas, como lo vamos a hacer a continuación. Una restricción de (18.18)
y (18.19) es que sólo son válidas para soluciones ψn (x) de la ecuación de Schro-
dinger. A continuación calculamos ψ0 (x) con (18.19), con la hipótesis de que es la
función de onda correspondiente al estado de mı́nima energı́a. La afirmación de que
existe una energı́a mı́nima se basa en el hecho de que el potencial da lugar a una
fuerza que obliga a la partı́cula cuántica a moverse en una región
0 < x < ∞, (18.45)
es decir, está confinada. Lo anterior nos lleva a la condición
b− ψ0 = 0
A (18.46)
que por (18.18) se convierte en la ecuación diferencial

dψ0 1
x + x2 − E 0 + ψ0 = 0, (18.47)
dx 2
la cual se resuelve por separación de variables para llegar a
1 2
ψ0 (x) = xE0 − 2 e−x /2
, x ∈ R. (18.48)
La función (18.20) satisface automáticamente las condiciones de frontera. A

continuación calculamos la derivada de la función (18.21) por ser necesaria para
construir ψ0 (x) y todas las demás funciones ψn (x). El resultado es
244
"
1 1 2 #
E0 − E0 −

dψ0 2 2
= − −1+ −x ψ0 . (18.49)
dx x2 x
De (18.21) iniciamos la escalera de estados cuánticos:

dψ0 2 1
ψ0 = C1 ψ0 (x) Ld1 x2

ψ1 (x) = −x + x − E1 − (18.50)
dx 2

dψ1 1
+ x2 − E2 − ψ1 = C2 ψ0 (x) Ld2 x2

ψ2 (x) = −x (18.51)
dx 2
···
dψn−1 2 1
ψn−1 = Cn ψ0 (x) Ldn x2 (18.52)

ψn (x) = −x + x − En−1 −
dx 2
En las expresiones (18.23) es el polinomio de Laguerre de grado n y Cn es una

constante de normalización sujeta a la condición
Z ∞ Z ∞
2
Cn2 ψ0 (x) Ldn x2 2 dx = 1.

|ψn (x)| dx = (18.53)
0 0
La condición (18.24) es absolutamente necesaria para la correcta interpretación

probabilı́stica de la mecánica cuántica.
El espectro de energı́a es dado por
En = 2d + n + 1 (18.54)
18.5. La densidad de probabilidad

Entre los postulados de la mecánica cuántica está la identificación de las variables
fı́sicas con operadores herméticos. Ası́, si q es una cantidad fı́sica (energı́a, momento,
posición,...), entonces se le asocia un operador hermético que representamos con el
sı́mbolo Q.b La densidad de probabilidad es precisamente
2
ρ (x) = |ψn (x)| = ψn∗ (x) ψn (x) , x ∈ R. (18.55)
En nuestro caso la densidad de probabilidad tiene como parámetro a d, el cual

mide la intensidad del término singular del potencial de Nagiyev.
2 2
ρdn (x) = x4d+1 e−x Ldn x2

, x ∈ R. (18.56)
El valor promedio o valor esperado de la variable fı́sica q debe especificarse con

cuidado pues es su operador el que debe entrar en los cálculos. La manera que
concuerda con los experimentos es la siguiente
245
D E Z b
Q
b = ψn∗ (x) Qψ
b n (x) dx. (18.57)
a
En donde [a, b] es el intervalo en el cual está la partı́cula.
Para el oscilador isotónico de este trabajo el valor esperado en el estado n es
D E Z b
ψ0 (x) Ldn x2 Qψ
b 0 (x) Ldn x2 dx

Q
b = (18.58)
a
Introduciendo la forma especı́fica de ψ0 (x) según (21)
D E Z b
2
1
xE0 − 2 e−x /2 b E0 − 12 e−x2 /2 Ldn x2 dx
Ldn x2 Qx

Q
b = (18.59)
a
Esta fvrmula para el valor esperado de una cantidad fı́sica de una partı́cula
confinada por un potencial isotónico es el objetivo de este trabajo. Con (18.59) po-
demos calcular todos los valores que predice la mecánica cuántica para este sistema.
Para una aplicación de (18.59) hemos elegido la posición x. En este caso el operador
asociado a la posición es la misma variable x. Asói, la posición más probable de la
partı́cula en el estado n es la integral
Z ∞ d 2 2
2
hb
xin = x2E0 e−x Ln x dx (18.60)
0
Entonces
el valor esperado de la posición de la partı́cula en el estado base n = 0
y Ld0 x2 = 1 es:
Z ∞
2
hb
xin=0 = x2E0 e−x dx, (18.61)
Z0 ∞
2
hb
xi0 = x4d+2 e−x dx. (18.62)
0
Con la finalidad de simplificar la integral realizamos el siguiente cambio de

variable
1 1 1
u = x2 , x = u 2 , dx = u− 2 du
2
e introducimos la función gamma
Z ∞
Γ (x) = ux−1 e−u du. (18.63)
0
finalmente el valor esperado de la posición en el estado base se simplifica como
246
Figura 18.1: Gráfica de 12 Γ 2d + 3

2 como función de d.

1 3
hb
xi0 = Γ 2d + , d>0 (18.64)
2 2
También se representa gráficamente la densidad de probabilidad del estado base,
para algunos valores de la variable d:
Figura 18.2: Estado base: ρ00 (x) en rojo, ρ10 (x) en verde, ρ20 (x) en azul.
247
De forma similar podemos obtener hb

xi para cualquier estado. por ejemplo en los
primeros 3 estados:
2 2 2
Para la base n = 1 y Ld1 x2 = −x + d + 1 , el valor de la posición es
Z ∞ d 2 2
d 2
hb
xi1 = x4d+2 e−x L1 x dx (18.65)
0
d
reescribimos hb
xi1 , usando la función gamma

d 1 3 7
hb
xi1 = Γ 2d + d2 + 3d + , d > 0. (18.66)
2 2 4
d 7
1 3

xi1 = d2 + 3d +
Figura 18.3: Gráfica hb 4 2Γ 2d + 2 como función de d.
La representación de la densidad de probabilidad para n = 1, cuando d toma los

valores d = 0, 1, 2 es:
Figura 18.4: Estado n = 1: ρ01 (x) en negro, ρ11 (x) en rojo, ρ21 (x) en verde.
248
1
4
Por otra parte si n = 2 y Ld2 x2 = 2 x − 2 (d + 2) x2 + (d + 1) (d + 2) . El
valor esperado es:

d 1 3 1 4 3 43 2 290
hb
xin=2 = Γ 2d + d + 2d + d + 6d + , d > 0. (18.67)
2 2 4 8 128
Valor
esperado de la posición n = 3 y
Ld3 x2 = − 61 x6 − 3 (d + 3) x4 + 3 (d + 2) (d + 3) x2 − (d + 1) (d + 2) (d + 3)

Tenemos para d > 0

d 1 3 1 6 5 349 4 57 3 6427 2 1693 687
hb
xin=3 = Γ 2d + d + d5 + d + d + d + d+ .(18.68)
2 2 36 12 144 8 576 192 256
249
Observamos la representación de el valor esperado de x en los estados n =

0, 1, 2, 3 en la siguiente grafica
d d d d
Figura 18.5: hb
xi0 en rojo, hb
xi1 en azul y hb
xi2 en verde y hb
xi3 en gris.
18.6. Conclusiones
En este trabajo hemos realizado dos contribuciones que creemos son originales:
la primera es el método de solución por operadores diferenciales de primer orden,
el cual simplifica bastante los cálculos de las funciones de onda, y que puede ser
aplicado a otros sistemas cuanticos. La segunda consiste en dar una expresión exacta
para calcular los valores mas probables de la posición x de la partı́cula en el estado
cuántico n. Nuestro principal interés es en el tema de soluciones exactas de la
ecuación de Schrodinger, y este trabajo se encuadra en él, aunque esperamos que
nuestra contribución tenga alguna utilidad práctica. Además se encuentra que d
tiene un papel importante en el aspecto probabilı́stico
250
Bibliografı́a
[1] S.M. Nagiyev, E.I. Jafarov y R.M. Imanov, On a dynamical symmetry

group of the relativistic linear singular oscillator, arXiv math ph/0628057.
[2] David J. Griffiths Introduction to Quantum Mechanics. Pearson Education
India, 2005
[3] M. D. Fayer. Elements of Quantum Mechanics. New York, 2001
[4] P. Camiz et a. Exact solution of a time dependent quantal harmonic oscillators
with a singular perturbation, Journal of Mathematical Physics 12 (1971) 2040-
2043.
251
Capı́tulo 19
Análisis preliminar de la satisfacción laboral de un hospital del estado de Puebla
José Daniel Velázquez-Martı́nez, Juan Manuel Hernández-Ramos, Carolina Solı́s-

Peña y Jonathan Cuellar
Universidad Autónoma de Nuevo León,

Facultad de Ciencias Quı́micas,
Avenida Universidad sin número, San Nicolás de los Garza
Nuevo León, C.P. 66455. danielonmx@gmail.com
Resumen. Mejorar la seguridad del paciente ha llegado a ser uno de los ob-
jetivos clı́nicos y de investigación más importantes en las pasadas dos décadas y
actualmente, por consiguiente, en este trabajo de investigación se analiza la satis-
facción laboral vista como una dimensión esencial de la cultura de seguridad debido
a que la satisfacción laboral en general tiende a relacionarse con resultados positi-
vos y mayores ı́ndices de productividad. Por lo tanto, los objetivos de este estudio
son: llevar a cabo el análisis de la satisfacción laboral de un hospital del Estado de
Puebla, difundir el conocimiento, desarrollar y fortalecer esta lı́nea de investigación
en México. Para lo cual se llevo a cabo un estudio observacional del tipo transversal
con una muestra por conglomerados donde se pudo encuestar a más del 80 % del
personal (n = 30). Dentro de los hallazgos encontrados, se obtuvo una puntuación
media de la dimensión satisfacción laboral de 20,43±3,44 puntos en escala de Likert
de 25 puntos posibles, lo que indica que la satisfacción laboral es percibida como
positiva en el hospital en estudio sin llegar a ser completamente positiva, lo que
constituye un área de oportunidad para el hospital en estudio. Por otro lado, se
encontró una relación significativa entre la satisfacción laboral y algunas variables
sociodemográficas como por ejemplo los años trabajados en el hospital. Por lo que
podemos concluir que en el caso de esta investigación, la satisfacción laboral se per-
cibe más como una fortaleza que como una debilidad para el hospital en estudio,
pero que es necesario focalizar los esfuerzos en el área de oportunidad detectada a
fin de generar un proceso de mejora continua.
Abstract. Improving patient safety has become one of the most important cli-
nical and research objectives in the past two decades and today, therefore, in this
research work is analysed job satisfaction seen as an essential dimension of safety
culture because job satisfaction in general tends to be related to positive results
and higher productivity indexes. Therefore, the objectives of this study are: carry
out the analysis of job satisfaction of a hospital in the State of Puebla, dissemina-
te knowledge, develop and strengthen this line of research in Mexico. For which an
252
observational study of the transversal type was carried out with a sample by conglo-
merates where it was possible to survey more than 80 % of the personnel (n = 30).
Among the findings, we obtained an average score of the satisfaction dimension of
20,43 ± 3,44 points on the Likert scale of 25 possible points, which indicates that
job satisfaction is perceived as positive in the hospital under study without being
completely positive, which constitutes an area of opportunity for the hospital under
study. On the other hand, a significant relationship was found between job satisfac-
tion and some socio-demographic variables such as the years worked in the hospital.
So we can conclude that in the case of this research, job satisfaction is perceived
more as a strength than as a weakness for the hospital under study, but that it is
necessary to focus efforts in the area of opportunity detected in order to generate a
process of continuous improvement.
Palabras clave: Satisfacción Laboral, Cultura de Seguridad, Hospital, Seguridad del

Paciente.
Mejorar la seguridad del paciente ha llegado a ser uno de los objetivos clı́nicos
y de investigación más importantes en las pasadas dos décadas y actualmente. Es
importante mejorar la seguridad del paciente para poder prevenir y minimizar el
riesgo, por ejemplo el inherente al sistema de salud en el que se presta la atención
médica en pro de salvaguardar la vida de los pacientes y el de prevenir y proteger
tanto a pacientes como al personal al servicio de la salud, siempre tomando en
cuenta el contexto sociocultural, tecnológico, económico, demográfico, etc., donde
se presta la atención sanitaria. Al respecto, debe mencionarse que en este trabajo
de investigación, la satisfacción laboral es vista como parte de una dimensión de
la cultura de seguridad. En este sentido, es importante mencionar que en algunas
investigaciones destacan que personas motivadas y satisfechas con su trabajo y
con la organización, aumentan su rendimiento y la calidad de los servicios que se
prestan (ver [1] y [2]), ası́ como también mencionan que la satisfacción laboral no
solo influye en la práctica laboral y en la calidad de servicio, sino que también es un
factor determinante en la satisfacción de los usuarios [2]. En este mismo sentido, es
importante señalar que algunos reportes cientı́ficos manifiestan que la falta de apoyo
social, la insatisfacción laboral, la percepción de niveles altos de estrés, entre otras,
son antecedentes de niveles altos del burnout [3]. Por otro lado, encontramos que
según algunas investigaciones a partir de los escritos de porter y Lawler y Locke,
se señala que en las teorı́as motivacionales, se basan en el concepto de discrepancia
o desajuste, es decir que la satisfacción depende del grado en que coincide lo que
un individuo busca en su trabajo con lo que realmente consigue de él, ası́, cuanto
mayor sea la distancia entre lo que se quiere conseguir y lo que se obtiene del trabajo,
menor será la satisfacción laboral [2].
Desde otra perspectiva, otro estudio menciona que la exposición prolongada
al estrés laboral está asociada al sı́ndrome de desgaste profesional, este desgaste
profesional está caracterizado por elevados niveles de agotamiento emocional, que se
253
refiere a la disminución o la pérdida de recursos emocionales, la despersonalización

o desarrollo de actitudes negativas hacia los pacientes y, por último, la falta de
realización personal, lo que provoca tendencias a evaluar el propio trabajo de forma
negativa [4].
En México, se está en vı́as de desarrollo en esta área del conocimiento acerca de
los hospitales del paı́s, por lo que es importante desarrollar este tipo de investiga-
ciones para aprender y poder fortalecer la calidad y seguridad de la atención médica
en las instituciones hospitalarias. Al respecto, se señala que en 2004 se publico un
estudio acerca de la satisfacción de los usuarios de 15 hospitales de Hidalgo, México
donde se reporto entre otros resultados, que la insatisfacción de los usuarios fue del
15.06 %, ası́ como también se reporto una percepción de mala calidad asociada con
la insatisfacción del 10.8 % (p <0.05) [5].
Al respecto, en Bernal-González I et al. [6] se señala que evaluar las percepcio-
nes tanto de los usuarios como del trabajador mismo es una necesidad inherente del
acto médico y representa una oportunidad de mejora en la gestión de los servicios
sanitarios, es decir, se deben tomar en cuenta tanto las percepciones de los pacientes
como del personal de salud desde su organización interna, para comprender como se
organizan y se brindan los servicios. Por otro lado, Salinas-Oviedo C et al. [7], men-
ciona que la Dirección General de Servicios de Salud del departamento del Distrito
Federal desarrollo desde 1991 el programa integral de mejorı́a de la calidad, apoya-
do en los principios del desarrollo y cambio organizacional, por lo cual llevo a cabo
un estudio de la satisfacción laboral en un hospital de la ciudad de México donde
encontró en uno de sus resultados que la relación entre la percepción del usuario y
la del trabajador se manifestó en ambos grupos como de adecuada satisfacción [7].
Sin embargo, algunos reportes de investigación señalan que la evidencia actual
revela a la satisfacción laboral como un predictor de permanencia en el trabajo,
motivación y productividad laboral, pero en este mismo contexto podemos apreciar,
que el nivel de satisfacción laboral del personal de enfermerı́a está disminuyendo en
todo el mundo y que las principales fuentes de insatisfacción de enfermerı́a incluyen
la falta de personal, elevada presión asistencial y escaso reconocimiento profesional,
entre otras [4].
Mientras que para el caso especı́fico de los médicos, algunos reportes señalan que
su posición social se ha desdibujado con relación a décadas pasadas y que hoy se
puede observar que recurren al multiempleo como la última posibilidad de mantener
las caracterı́sticas adscriptas a su rol [8].
También y desde otro punto de vista se puede mencionar que en México los
reportes de investigación acerca de este tema no se consiguen con facilidad, se en-
cuentran dispersos y se publican de forma esporádica, por lo que es conveniente
aumentar este tipo de estudios para poder generar un ciclo de mejora continua, que
permita entender la situación que se vive en México y fortalecer a sus instituciones
de salud.
Debido a lo anterior expuesto, podemos destacar la importancia de la medición
de la satisfacción laboral en los trabajadores de las instituciones sanitarias dado a
que está implicada en la calidad asistencial, lo que le confiere una elevada impor-
tancia a su medición en los trabajadores de las instituciones sanitarias [9]. Por lo
que, el objetivo de este trabajo es: llevar a cabo el análisis de la satisfacción laboral
de un hospital del Estado de Puebla, difundir el conocimiento, ası́ como desarrollar
y fortalecer esta lı́nea de investigación en México.
254
19.2. Material y métodos

19.2.1. Cuestionario utilizado y población de estudio
Se llevó a cabo un estudio observacional del tipo transversal y se consideró
una muestra por conglomerados, mediante la aplicación del CAS-MX-II que es la
retraducción, adaptación y fiabilización del Cuestionario de Actitudes Seguras Ame-
ricano (SAQ Ambulatory), para las generalidades ver [10] y [11]. Cabe mencionar
que en este estudio se presenta el caso de la dimensión satisfacción laboral de un
hospital de la región de puebla, el hospital en estudio corresponde al segundo nivel
de atención y los cuestionarios fueron aplicados en las áreas de urgencias, hospital
y ambulatoria.
19.2.2. Instrumento: CAS-MX-II

Dicho cuestionario está diseñado para ser aplicado en áreas hospitalarias con pa-
cientes ambulatorios, de urgencias y hospitalizados con excepción de las unidades de
cuidado intensivo (UCI). Al personal al que estuvo dirigido este cuestionario, com-
prendió los siguientes participantes: Personal médico (médicos residentes, médicos
radiólogos, médicos pasantes, etcétera), Personal de enfermerı́a (Jefe(s) de enfer-
merı́a, enfermeras auxiliares), otros (psicólogos, trabajadoras sociales, asistentes de
consultorio, técnicos de laboratorio, técnicos radiólogos, etc.)
El cuestionario consistió de las siguientes secciones: sección 1, la cual tiene como
objetivo fundamental de conocer la calidad de comunicación y colaboración que
existe en estas áreas clı́nicas. La sección cuenta con la siguiente escala: ”Pésima”
(A), ”Mala” (B), ”Adecuada” (C), ”Buena” (D), ”Excelente” (E), y ”No aplica”
(X). La sección 2, la parte central del instrumento que consiste de un total de 39
ı́tems, de los cuales 5 ı́tems son para medir la dimensión de satisfacción laboral, para
su llenado se usa la escala Likert, es decir: ”Completamente en desacuerdo” (A),
”Ligeramente en desacuerdo” (B), ”Neutral” (C), ”Ligeramente de acuerdo” (D),
y ”Completamente de acuerdo” (E). Finalmente, la sección 3, consiste en obtener
la información demográfica de los participantes. El cuestionario toma de 5 a 10
minutos para completarlo.
19.2.3. Participantes
Para calificar para la inclusión, tanto el personal a jornada completa como el
personal de tiempo parcial tiene que haber trabajado en la unidad al menos un
mes antes de la administración del cuestionario. La ”regla de oro” que se aplica es
que todo el personal dentro de un área clı́nica, o bien influyen o son influenciados
por el ”ambiente de trabajo” en esa área clı́nica. Dentro del análisis estadı́stico y
con la finalidad de prevenir sesgos, las siguientes consideraciones fueron tomadas:
criterios de inclusión, exclusión y de eliminación. A continuación se describen bre-
vemente cada uno de ellos. El cuestionario fue suministrado uno por uno y de forma
voluntaria en el área de investigación por los investigadores, garantizando en todo
momento el anonimato a los encuestados.
255
19.2.4. Criterios de inclusión

Se consideró, por ejemplo, que los encuestados estén influenciados por la cultura
de su hospital o área clı́nica. El personal seleccionado para la investigación fueron:
médicos, enfermeras, otros (trabajadoras sociales y personal de apoyo médico y de
diagnóstico). Otras de las consideraciones fue el hecho de que el personal debió ha-
ber tenido al menos 4 semanas y 20 horas/semana laborales, para ser considerado
en el análisis. En el caso particular del personal médico, el criterio considerado fue
el hecho de que el médico que atienda a más de 2 pacientes a la semana puede ser
incluido en el análisis. El personal médico que realice cirugı́a debe ser incluido. El
personal voluntariamente debe estar de acuerdo en llenar el cuestionario proporcio-
nado.
19.2.5. Criterios de exclusión

Personal médico o de apoyo que trabaje con personas no vivas (por ejemplo,
anfiteatro). Personal que no esté relacionado directamente con la salud del paciente.
19.2.6. Criterios de eliminación

No se tomaron en cuenta para el análisis estadı́stico los cuestionarios o ı́tems sin
responder o ilegibles.
19.2.7. Limitaciones
En este rubro hubo limitaciones en cuanto a poder aplicar cuestionarios en di-
versos hospitales. Por ejemplo, en algunos hospitales se dio un protocolo de investi-
gación de acuerdo a sus normas internas; sin embargo, nunca emitieron respuesta,
ni dieron el permiso necesario para tener acceso a las instalaciones, etc.
19.3. Resultados
En la Figura 19.1, se puede observar el histograma de la satisfacción laboral de los
participantes encuestados del hospital en estudio, en el cual se tiene una puntuación
media de 20.43 puntos ±3.44 de un total de 25 puntos posibles en escala Likert, lo
que refleja una muy alta satisfacción laboral en general en el hospital en estudio.
Además, se llevo a cabo la Prueba de normalidad de Kolmogorov-Smirnov el cual
obtuvo un valor p > 0.192, y también se obtuvo el gráfico de normal esperado vs
valor observado,)véase la Figura 19.2, por lo que a partir de los resultados obtenidos
con esta prueba no se tiene evidencia suficiente para poder rechazar la normalidad.
Siguiendo con el análisis de los datos en la Tabla 19.1, se muestran los valores
de los estadı́sticos descriptivos de las variables analizadas: la satisfacción laboral
general, la edad actual, el estatus de trabajo, el puesto de trabajo, los años de expe-
riencia y los años trabajados en el hospital, de donde se tiene que la edad promedio
de los trabajadores fue de 36.20 ± 11.372 años, lo que indica que en promedio se
tiene una edad productiva adecuada en el hospital en estudio, en cuanto al estatus
de trabajo, se observa que el personal en promedio labora por tiempo completo y en
segundo lugar por medio tiempo, ası́ como también, los resultados indican que en
256
Figura 19.1: Histograma ”Total Satisfacción en el trabajo”, describe la puntuación

total obtenida de la satisfacción laboral en el hospital en estudio, se puede observar
también que la mayorı́a de los encuestados optaron por manifestarse en ligeramente
y completamente de acuerdo en cuanto a la satisfacción laboral percibida, debe
mencionarse además que en el grafico la frecuencia (eje Y) corresponde a los 5
puntos en escala likert y el total de la satisfacción en el trabajo (eje X) corresponde
a la satisfacción de las personas encuestadas.
Figura 19.2: En el gráfico de Normal esperado vs valor observado para la prueba

de normalidad de Kolmogorov-Smirnov, se puede observar que en general la nube
de puntos correlaciona con la lı́nea recta, por lo que gráficamente no se observa
un comportamiento que permita rechazar la ”normalidad”, lo que se también se
contrasta con el valor de la prueba K-S de p > 0,192.
257
promedio se tiene más personal de enfermerı́a. Siguiendo con el análisis, Se observa

una adecuada experiencia que es mayor a los 2 años de experiencia como mı́nimo,
en cuanto a los años trabajados en el hospital también se observa que se tienen
más de dos años laborados como mı́nimo en el hospital en estudio, lo cual permite
que el personal pueda tener una percepción relativamente adecuada acerca de la
satisfacción laboral en el hospital en estudio.
Con base en lo anterior, se procedió a verificar si existe una relación significativa
entre la satisfacción laboral como variable dependiente y las variables: edad actual, el
estatus de trabajo, el puesto, los años de experiencia, ası́ como los años trabajados en
el hospital como variables independientes o predictoras, obteniendo de acuerdo con
los resultados que existe influencia y/o una relación significativa entre la variables
predictoras y la variable de desenlace (ver Tablas 19.2 y 19.3), lo cual se puede
representar por medio de la Ec. 1 que es el modelo de regresión lineal múltiple
que se presenta a continuación: SL=14.738+(0.86)Edad Act+(3.009)Estatus Trab-
(2.112)Puesto-(0.282)AñosExp+(0.509)AñosTrabHosp.
La expresión anterior se analizó para verificar si existe una relación entre las
variables antes mencionadas, ası́ pues se procedió a llevar a cabo un análisis de
varianza (Tabla 19.2), ası́ como también pruebas de hipótesis (Tabla 19.3). En la
Tabla 19.2, se puede observar que las variables independientes se relacionan signi-
ficativamente con la satisfacción laboral con un nivel de confianza del 95 %, con un
valor p <0.042, por lo que de acuerdo con los resultados obtenidos se encuentra
evidencia significativa de que existe una relación entre los años trabajados en el
hospital, el puesto, el estatus de trabajo, la edad actual y los años de experiencia
con la variable de respuesta satisfacción laboral. Sin embargo, en la Tabla 19.3, se
pueden apreciar mediante las pruebas de hipótesis que el valor de la constante es
significativo, es decir que la lı́nea recta pasarı́a por un punto diferente al origen,
por otro lado, en el caso de la edad actual, el estatus de trabajo, el puesto, los
resultados fueron no significativos principalmente, lo que significa que no tendrı́an
influencia en la variable de respuesta pero al prescindir de estas variables el análisis
de varianza tiende a apuntar como no significativo, por lo que se decidieron dejar
en este análisis y verlas como una oportunidad de análisis más profundo, en cuanto
a los años de experiencia no son significativos al 95 % de nivel de confianza, sin
embargo convendrı́a tomarlo en cuenta ya que se encuentra muy cerca de la signifi-
cación, ası́ como también se debe mencionar que en las cuestiones socio-culturales
y organizacionales hay a menudo variabilidad, en el caso de los años trabajados en
el hospital resulto ser una variable significativa con un valor p <0.021, por lo que
en base a estos resultados se podrı́a apuntar que no hay suficiente evidencia para
contradecir, que los años trabajados en el hospital influyen significativamente en la
satisfacción laboral del hospital en estudio.
Siguiendo con el análisis de los datos obtenidos, se procedió a verificar mediante
el coeficiente de determinación si la relación entre las variables encontradas con
el modelo de regresión obtenido, permiten hacer estimaciones con una precisión
aceptable, lo cual se resume en la Tabla 19.4, de donde se tiene un coeficiente
de determinación de 0.529, es decir que el 52.9 % de la variación observada en la
satisfacción laboral es explicada por el modelo (lı́nea recta), por lo tanto la calidad
de ajuste no es satisfactoria a un coeficiente de determinación mı́nimo del 70 %,
pero es muy bueno para seguir profundizando en el tema. Por otro lado, debido
a que se tienen varios términos en la ecuación de regresión se prefiere observar la
258
Media Desviación tı́pica N

Total Satisfacción Laboral 20.40 3.733 20
Edad actual 36.20 11.372 20
Estatus de trabajo 1.55 0.510 20
Puesto 1.85 0.67082 20
Años de experiencia 11.20 8.841 20
Años trabajados en el hospital 9.70 6.860 20
Tabla 19.1: Estadı́sticos descriptivos de las variables socio demográficas que podrı́an
influir en la satisfacción laboral del hospital en estudio
Modelo Suma de cuadrados gl Media cuadratica F sig.

1 Regresión 139.953 5 27.991 3.139 0.042(a)
Residual 124.847 14 8.918
Total 264.80 19
Tabla 19.2: Muestra el Análisis de Varianza con las siguientes variables predictoras:
(Constante), años trabajados en el hospital, puesto, estatus de trabajo, edad actual,
años de experiencia. Y como variable dependiente: el total satisfacción en el trabajo.
Modelo Coeficientes no estandarizados Coeficientes estandarizados t Sig.

1 B Error tı́pico Beta
(Constante) 14.738 4.467 3.299 0.005
Edad actual 0.086 0.089 0.263 0.971 0.348
Estatus de trabajo 3.009 1.864 0.411 1.614 0.129
Puesto -2.112 1.28 -0.379 -1.650 0.121
Años de experiencia -0.282 0.147 -0.668 -1.919 0.076
Años trabajados en el hospital 0.509 0.196 0.936 2.593 0.021
Tabla 19.3: Se muestra la prueba de hipótesis la cual también nos sirve para ve-
rificar si existe relación entre cada una de las variables edad actual, estatus de
trabajo, puesto, años de experiencia y años trabajados en el hospital con la variable
satisfacción laboral.
259
R2 2adj la cual es aún más baja y con la cual solo se podrı́a explicar el 36 % de la
variación observada en la satisfacción laboral que es explicada por el modelo, en
cuanto a la intensidad de la relación lineal entre las variables estudiadas se observa
una correlación lineal aceptable positiva r = 0.727.
Por último, siguiendo con el análisis se puede apreciar en la Figura 19.3 que
se tiene el diagrama de cajas y bigotes, donde se muestra que en general se tuvo
una satisfacción laboral (de ligero acuerdo) por parte del personal médico, de en-
fermerı́a y otros, pero también se observa que como oportunidad de mejora se tiene
la posibilidad de llegar al completo acuerdo en la escala de likert de la satisfacción
laboral. Por otro lado, se puede observar un comportamiento atı́pico en el área de
enfermerı́a que debe tenerse en cuenta para su estudio, dada la importancia que
tiene la satisfacción laboral en el personal al cuidado de la salud.
19.4. Discusión
Los resultados obtenidos nos permiten visualizar que en general, en el personal
al cuidado de la salud del hospital en estudio se percibe en ligero acuerdo a la
satisfacción laboral del personal, por lo que es motivo de oportunidad de mejora el
estudiar las causas por las cuales no se alcanza la completa satisfacción laboral, lo
que coincide con el reporte de Silvia Portero et. al. Por otro lado, puede observarse
que en general en los profesionales del área de enfermerı́a se percibe un nivel de
satisfacción ubicado en el ligero acuerdo, sin embargo es de llamar la atención la
percepción de un profesional del área de enfermerı́a debido a que puntúa de manera
atı́pica lo que refleja ligera insatisfacción con su puesto de trabajo. Pero que en
general se coincide con otros estudios en cuanto a qué algunos de los aspectos mejor
valorados por los profesionales de enfermerı́a fueron los que hacen referencia a la
experiencia, los años trabajando en el hospital, entre otros factores, como podrı́a ser
también, la variedad de las tareas que realiza en su trabajo y a la estabilidad de su
empleo [2]. En otros estudios han mencionado que las posibilidades de promoción
suelen mostrar valoraciones bajas y que eso es causa de insatisfacción desde hace
años ya que estudios de la década de los 90 referı́an insatisfacción en este aspecto
[2]. Sin embargo en este estudio no se considero esa variable, lo que deberı́a ser
considerado para estudios posteriores.
También se coincide con otros estudios en considerar como necesario desarrollar
la teorı́a de la motivación-mantenimento de la satisfacción en el trabajo (la polı́tica
organizacional, la supervisión técnica, las relaciones interpersonales con mandos,
entre compañeros y con subordinados, la retribución, la seguridad en el trabajo, la
vida personal, las condiciones laborales y el estatus) y factores de ”mantenimiento”
(necesidades psicológicas y sociales del trabajador) [1], con el fin de incrementar la
satisfacción laboral en las instituciones de salud.
Respecto a las caracterı́sticas sociodemográficas asociadas con la satisfacción,
en este estudio, no se observa una gran diferencia entre la satisfacción del personal
médico en comparación con el de enfermerı́a y con el de otros profesionales al servicio
de la salud (ej. Técnicos radiólogos), como lo sugieren otros estudios al apuntar que
la satisfacción aumenta con el nivel profesional [1].
Siguiendo con el análisis de este estudio, coincidimos con otros estudios en
señalar que la implantación y revisión periódica de la atención ofrecida a los ciuda-
260
Modelo R R Cuadrado R cuadrado correjida Error tı́pico de la estimación

1 0.727 0.529 0.360 2.986
Tabla 19.4: Describe si las relaciones encontradas con el modelo de regresión lineal
múltiple, permiten hacer estimaciones con una precisión aceptable.
Figura 19.3: Diagrama de caja y bigotes del puesto de trabajo vs la satisfacción

laboral
261
danos ası́ como la satisfacción de los profesionales permitirá configurar un sistema

de información corporativa que facilite los procesos de reflexión y definición de las
polı́ticas y estrategias generales [ 1], por lo cual se tienen que promover y llevar a
cabo este tipo de estudios con más regularidad con el fin de poder tener un mejor
conocimiento del área laboral y poder establecer también las polı́ticas necesarias
que ayuden a mejorar en la dimensión de satisfacción laboral ası́ como también en
la seguridad y calidad de atención para los pacientes.
19.5. Conclusiones
En general se percibe como una fortaleza la satisfacción laboral en el hospital
en estudio, por lo que es necesario focalizar el área de oportunidad detectada a fin
de generar un proceso de mejora continua. La satisfacción laboral es una dimensión
muy importante, dado que esta puede relacionarse con la mejor atención y trato
para el paciente y por lo tanto incidir directamente sobre la seguridad del paciente.
Es necesario llevar a cabo más estudios de la satisfacción laboral en el personal de
salud en hospitales mexicanos, ası́ como también ampliar los tópicos a explorar en
este tipo de investigaciones.
262
Bibliografı́a
[1] ROBLES-GARCÍA M., DIERSSEN-SOTOS T., MARTÍNEZ-OCHOA

E., HERRERA-CARRAL P., DÍAZ-MANDI A.R., LLORCA-DÍAZ J.
Variables Relacionadas con la Satisfacción Laboral: un Estudio Tranversal a
Partir del Modelo EFQM. Gaveta Sanitaria, Vol. 19, No. 2, 2005.
[2] CARRILLO-GARCÍA C., RÍOS-RÍSQUEZ M.I., FERNÁNDEZ-CÁNO-

VAS M.L., CELDRÁN-GIL F., VIVO-MOLINA M.C., MARTÍNEZ-
ROCHE M.E. La Satisfación de la Vida Laboral de los Enfermeros de las
Unidades Móviles de Emergencias de la Región de Murcia. Enfermerı́a Global,
Vol. 14, 2015.
[3] PRECIADO M., POZOS E., COLUNGA C., VÁZQUEZ J., Y ÁVALOS
M. Relación Entre Factores Psicosociales, Agotamiento Emocional Laboral y
Burnout en Odontólogos Mexicanos. Universitas Psychologica, Vol.16 No. 2,
2017.
[4] PORTERO DE LA CRUZ S., VAQUERO ABELLÁN M. Desgaste pro-
fesional, estrés y satisfacción laboral del presonal de enfermerı́a en un hospital
universitario. Revista Latino-Americana de Enfermagem, Vol. 23 No. 3, 2015.
[5] ORTIZ ESPINOZA R.M., MUÑOZ JUÁREZ S., TORRES CARREÑO
E. Satisfacción de los usuarios de 15 hospitales de Hidalgo, México. Rev Esp
Salud Pública, Vol. 78 No. 4, 2004
[6] BERNAL GONZÁLEZ I, PEDRAZA MELO N.A., SÁNCHEZ LIMÓN

M.L. El clima organizacional y su relación con la calidad de los servicios publicos
de salud: diseño de un modelo teórico. Revista Estudios Gerenciales, Vol. 31,
2015.
[7] SALINAS-OVIEDO C., LAGUNA-CALDERON J., MENDOZA-

MARTÍNEZ M.R. La Satisfacción Laboral y Su Papel en la Evaluación de la
Calidad de la Atención Médica. Salud Publica de México. Vol. 36, 1994.
[8] PARIS L. Estrategias de Afrontamiento del Estres Asistencial y Satisfaccion
Laboral-Personal en Medicos y Enfermeros. Revista Interamericana de Psico-
logı́a Ocupacional, Vol. 26 No.2, 2007.
[9] CARRILLO-GARCÍA C. MARTÍNEZ-ROCHE M.E., GÓMEZ-
GARCÍA C.I., MESEGUER-DE-PEDRO M. Satisfacción Laboral de
263
los Profesionales Sanitarios de un Hospital Univeritario: Análisis General y

Catergorı́as Laborales. Anales de Psicologı́a, Vol. 31 No. 2, 2015.
[10] VELÁZQUEZ-MARTÍNEZ D, SANTOS-REYES J. Assessing the Safety
Climate in Operating Rooms: The Case of Healthcare Organizations in Mexico.
Nova Science Publishers, Inc., New York, 2012.
[11] VELÁZQUEZ-MARTÍNEZ J. D. Diagnóstico de la cultura de seguridad en

hospitales.Tesis de Doctorado. Centro de Investigacion en Ciencia Aplicada y
Tecnologı́a Avanzada. México DF, México: CICATA-Legaria.
264
Capı́tulo 20
Aplicación del modelo exponencial en hilados textiles
Ana Marı́a Islas Cortés1 , Gabriel Guillén Buendı́a2 y Yolanda Montoya Vargas1
1
Instituto Politécnico Nacional, ESIT,
AV. IPN s/n, U. P. Adolfo López Mateos, Lindavista,
07320 GAM, Ciudad de México, México.
2
Instituto Politécnico Nacional, ESIME,
Azcapotzalco. Av. De las Granjas No. 682, Santa Catarina,
02550, Azcapotzalco, Ciudad de México.
amislas@ipn.mx, yolanda mvarg@hotmail.com, gguillen@ipn.mx
Resumen. En este estudio fue ajustado el modelo exponencial con ası́ntota
sobre datos de la variación del diámetro de un filamento de poliamida de tı́tulo
nominal de 25 tex (peso en gramos de 1,000 metros de filamento) en función de la
tensión aplicada. El ajuste numérico fue realizado mediante el método de mı́nimos
cuadrados no lineales, ası́ como dos técnicas de transformación lineal del modelo en
estudio. Se concluye que los ajustes numéricos resultaron significativos al 99 %.
Abstract. In this study the exponential model with asymptote was fitted on dia-
meter variations data of a 25 tex polyamide filaments nominal title (weight in grams
of 1,000 meters of filament) in function to applied tension. Numerical fit was made
using nonlinear least squares method, as well as two linear transformation techni-
ques of the model under study. It is concluded that numerical fit was significant at
99 %.
Palabras clave: Estructuras textiles, Ecuación diferencial, Mı́nimos cuadrados.
El mejor conocimiento de las estructuras textiles a lo largo de la cadena de
producción permite que el consumidor final disponga de un producto que satisfaga
plenamente sus necesidades.
Varias caracterı́sticas o propiedades de hilados evolucionan como una función
exponencial, como es el caso de la contracción residual ( %) de un filamento de
poliéster de 17.0 tex con 68 multifilamentos que fue estirado en una máquina in-
dustrial a diversas temperaturas, se ilustra en la Figura 1. Es importante conocer
dicha propiedad porque nos indica la capacidad del material a deformarse cuando
265
es sometido al calor [1] .
Figura 20.1.- La contracción residual ( %) de multifilamentos de poliéster esti-

rados a diferentes temperaturas (◦ C) en una máquina industrial.
Otra propiedad que evoluciona de la misma manera es la resistencia especı́fica

(lbf ) de un hilado de algodón/poliéster de tı́tulo 40 tex, cuando se ha incrementado
el contenido de fibra natural ( %), como se muestra en la Figura 20.2. Aunque la
resistencia del hilado se reduce, gana en el confort que está muy relacionada con la
permitividad al vapor de agua del algodón.
Figura 20.2.- La resistencia especı́fica (lbf ) de un hilado algodón/poliéster cuan-

do se incrementa el contenido de fibra natural ( %).
Las propiedades de las estructuras textiles han sido estudiadas mediante mode-
los matemáticos, en este estudio el objetivo fue ajustar el modelo exponencial a una
caracterı́stica de los hilados textiles.
20.2. Diámetro de un filamento de poliamida so-

metido a tensión.
La variación del diámetro de un filamento de poliamida (mm) de tı́tulo 25 tex
cuando es sometido a diversos niveles de tensión (g), sin llegar a la rotura [3]; tam-
bién evoluciona como una exponencial, como se muestra en Figura 20.3.
266
Figura 20.3.- Variación del diámetro (mm) de un filamento de poliamida de tı́tu-

lo 25 tex cuando es sometido a diferentes niveles de tensión (g).
La evolución de la caracterı́stica del hilado ilustrada arriba cumple la expresión:
dφ
= −k (φ − φmin ) (20.1)
dσ
Donde:
φ es el diámetro del hilado, σ es la tensión aplicada al hilado, φmin es el diámetro
del hilado antes de romperse uando es sometido a una tensión deteminada, −k es
la constante de evolución del diámetro del hilado sometido a tensión.
Por separación de variables:
Z φ∗ Z σ
dφ
= −k dσ (20.2)
φ0 φ − φmin 0
Integrando:
φ∗ = (φo − φmin ) e− k σ + φmin (20.3)

El diámetro estimado del hilado φ∗ expuesto en la expresión (20.3) requiere de-
terminar numéricamente sus constantes, lo anterior mediante la técnica de mı́nimos
cuadrados no lineales [2], que en esencia minimiza la suma de cuadrados de las
desviaciones (o error) SSE entre los valores ajustados φ∗ a través del modelo y los
valores observados:
n
X 2
SSE = [φ∗ − φ ] (20.4)
i=1
267
Es decir,
n
X 2
(φ0 − φmin ) e−k σ + φmin − φ

SSE = ]
i=1
La SSE tiene un mı́nimo, ocurre para valores que satisfacen las derivadas par-
ciales:
∂SSE ∂SSE ∂SSE
= = = 0
∂ (φ0 − φmin ) ∂k ∂φmin
Se obtiene un sistema de tres ecuaciones no lineales con tres incógnitas, como

se indica:
n
X n
X n
X
(φ0 − φmin ) e−2 k σ + φmin e− k σ = φ e− k σ
i=1 i=1 i=1
n
X n
X n
X
(φ0 − φmin ) σ e−2kσ + φmin σ e−k σ = σ φ e−kσ
i=1 i=1 i=1
n
X n
X
(φ0 − φmin ) e−kσ + φmin n = φ
i=1 i=1
Mismo que se resuelve por un método iterativo, como es el método de Newton-

Raphson.
Existen otras técnicas de evaluación numérica de modelos no lineales mediante
su correspondiente transformación lineal, que también logra niveles de ajuste muy
significativos; su estimación requiere una calculadora de bolsillo que disponga de
regresión lineal simple.
A continuación, se exponen dos técnicas de transformación lineal del modelo
exponencial.
Una técnica usa un algoritmo que sirvió para evaluar las constantes numéricas
en cinética quı́mica [4]. En esencia indica que, tomando valores sobre el modelo
igualmente espaciados en las abscisas, se establecen dos subconjuntos de n/2 puntos
cada uno (σ, φ) y (σ 0 , φ0 ). Donde (σ, φ) son los primeros n/2 puntos de la curva y
(σ 0 , φ0 ) son los siguientes n/2 puntos de esta, y cumplen respectivamente:
σ → φ (20.5)
σ0 → φ0
268
A partir de estos subconjuntos de puntos se construye un arreglo rectangular,

en donde la diferencia entre cada una de las abscisas y sus correspondientes primas
es una constante de desplazamiento. Por ende:
σ0 = σ + τ
Aplicando la primera expresión (20.5) al modelo exponencial, se tiene:
φ − φmin = (φ0 − φmin ) e− k σ (20.6)

Para la segunda expresión de (5) al mismo modelo:
φ 0 − φmin = (φ − φmin ) e− k (σ + τ ) (20.7)

Dividiendo la ecuación (20.7) entre la ecuación (20.6) miembro a miembro, y
simplificando se llega a:
φ 0 = φ e− kτ + φmin 1 − e− k τ

(20.8)
k = − LNτ(m) , φmin = 1 − eb−k τ
Corresponde a la transformación lineal del modelo exponencial expuesto en an-
tecedentes, aplicando regresión lineal simple a la columna transformación versus
variable respuesta, se obtuvo la pendiente de la recta e intersección al eje verti-
cal. Con ello, fue posible hallar el valor de κ y φmin , como se indicó en (20.8).
Finalmente, despejando de la expresión (20.3) el último término, se llega a:
φ − φmin
φ0 − φmin = (20.9)
e−k σ
Está completa la estimación numérica del modelo exponencial en estudio.
La otra técnica que permite hallar las constantes numéricas del modelo expo-
nencial es a través de tres puntos de apoyo leı́dos sobre la curva [5]. Es decir, dos
puntos sobre los extremos de la curva, el tercer punto es:

σ1 + σ2
P1 (σ1 , φ1 ) , P2 (σ2 , φ2 ) , P3 , φ3
2
El primer punto por estar colocado en la curva cumple:
φ1 − φmin = (φ0 − φmin ) e− k σ1 ( 20.10)

Por la misma razón, el segundo punto se escribe:
φ1 − φmin = (φ0 − φmin ) e− k σ1 (20.11)

Entonces, el tercer punto:
σ1 + σ2
φ3 − φmin = (φ0 − φmin ) e− k σ( 2 ) (20.12)
Multiplicando las ecuaciones (20.10) y (20.11) miembro a miembro e igualando
con el cuadrado del tercer punto (20.12), y simplificando:
φ1 φ2 − φ23
φmin = (20.13)
φ1 + φ2 − 2 φ3
269
Con ello, fue posible realizar la transformación lineal del modelo exponencial:
LN (φ − φmin ) = −k σ + LN (φ0 − φmin ) (20.14)

k = − m , (φ0 − φmin ) = eb
Igual que la técnica anterior, al aplicar regresión lineal simple sobre la columna
transformación versus variable independiente se obtienen los valores numéricos de
la pendiente e intersección al eje vertical, de donde es posible obtener los valores de
κ y (φ0 - φmin ), como se indicó en (20.14).
20.3. Presentación y análisis de resultados.

El ajuste numérico del modelo exponencial se realizó sobre los datos de variación
del diámetro de filamentos sometidos a tensión sin llegar a la rotura, señalados en
la Tabla 1.
Tabla 20.1.- Datos de la variación del diámetro de un filamento de poliamida en

función de la tensión aplicada.
No. Tensión Diámetro No. Tensión Diámetro

σ (g) φ (mm) σ (g) φ (mm)
1 2 0.353 7 20 0.298
2 5 0.344 8 23 0.295
3 8 0.324 9 26 0.293
4 11 0.312 10 29 0.29
5 14 0.308 11 32 0.288
6 17 0.304 12 35 0.286
Aplicando los mı́nimos cuadrados no lineales conduce al modelo numérico-funcional

siguiente:
φ∗ = 0.0858 e− 0.0873 σ + 0.2829 (20.15)

r = 0.9945 R2 = 0.9891 χ2 = 1.76E −4
De acuerdo con el coeficiente de correlación, coeficiente de determinación y el

test de chi cuadrada, la bondad de ajuste numérico fue de 99 % de confianza es-
tadı́stica. En la figura 20.4 se aprecia el elevado nivel de ajuste numérico alcanzado.
270
Figura 20.4.- La bondad del ajuste numérico sobre la variación del diámetro de
un filamento en función de la tensión aplicada, fue del 99 % de confianza estadı́stica
usando los mı́nimos cuadrados no lineales.
De acuerdo con algoritmo de Guggenheim expuesto en antecedentes, se cons-

truyó el arreglo rectangular, Tabla 20.2:
Tabla 20.2.- Arreglo rectangular de Guggenheim usando los datos de la variación

del diámetro del filamento de poliamida sometido a diversos niveles de tensión.
σ σ0 φ φ0
(g) (g) (mm) (mm)
2 20 0.353 0.298
5 23 0.344 0.295
8 26 0.324 0.293
11 29 0.312 0.29
14 32 0.308 0.288
17 35 0.304 0.286
Como los datos fueron igualmente espaciados sobre la curva, permite determinar
la constante de desplazamiento:
τ = σ 0 − σ = 18
Procediendo a aplicar regresión lineal simple a los datos de la tabla 20.2, según
la expresión (20.8). Los parámetros de la recta de regresión se indican en Figura
20.5.
271
Figura 20.5.- Recta de regresión obtenida al relacionar tensión versus columna

de transformación lineal de acuerdo con el algoritmo de Guggenheim.
Con los valores de la pendiente e intersección al eje vertical de la recta de regre-

sión anterior, fue posible determinar parámetros −k y φmin . El tercer parámetro del
modelo exponencial se obtuvo de calcular el promedio de (20.9) usando los valores
de la Tabla 1.
Entonces, el modelo numérico-funcional resulta:
φ∗ = 0.0838 e− 0.0849 σ + 0.2826 (20.16)

r = 0.9941 R2 = 0.9883 χ2 = 1.88E −4
La bondad de ajuste numérico del modelo fue significativa al 99 %, de acuerdo

con el coeficiente de correlación, coeficiente de determinación y test de chi cuadrada.
En la Figura 20.6 fue ilustrada lo antes señalado, comparada con el ajuste realizado
por mı́nimos cuadrados no lineales.
Figura 20.6.- Ajustes numéricos del modelo exponencial realizados mediante la

técnica de mı́nimos cuadrados no lineales y el algoritmo de Guggenheim ilustrados
en color rojo y negro respectivamente.
Continuando con el estudio, se procedió a determinar las constantes del mode-

lo no lineal mediante la técnica de tres puntos de apoyo. Los puntos considerados
fueron:
272
P1 (2, 0.353) , P2 (35, 0.286) , P3 (18.5, 0.3)
Al sustituir dichos puntos en la expresión (20.13) se llega:
φmin = 0.2809 (20.17)
Con ello, al aplicar regresión lineal simple a los datos de la tabla 20.1, de acuerdo
con la transformación lineal (20.14) se obtuvo Figura 20.7.
Figura 20.7.- Recta de regresión obtenida al relacionar la tensión versus columna

de transformación lineal de acuerdo con la técnica de los tres puntos de apoyo.
De la pendiente e intersección al eje vertical de la ecuación de regresión lineal

anterior, se obtienen los valores de κ y (φ0 - φmin ). Por ende, el modelo numérico-
funcional obtenido es:
φ∗ = 0.0836 e− 0.0781 σ + 0.2809 (20.18)

r = 0.9936 R2 = 0.9872 χ2 = 2.06E −4
La bondad de ajuste numérico fue significativa al 99 % de acuerdo con el co-

eficiente de correlación, coeficiente de determinación y test de chi cuadrada. En
la Figura 20.8 aparece la bondad de ajuste numérico antes indicado (color negro),
comparado con el alcanzado con los mı́nimos cuadrados no lineales (color rojo).
273
Figura 20.8.- Ajustes numéricos del modelo exponencial realizados mediante la

técnica de tres puntos de apoyo y mı́nimos cuadrados no lineales, ilustrados en color
negro y rojo respectivamente.
20.4. Conclusiones
Las técnicas de transformación lineal del modelo exponencial aquı́ expuestas
condujeron a ajustes numéricos significativos al 99 % de confianza, muy similar a la
bondad de ajuste numérico obtenido con regresión no lineal. Las primeras tienen la
ventaja que pueden resolverse con el uso de una calculadora de bolsillo que disponga
de regresión lineal simple.
274
Bibliografı́a
[1] AGUIRRE, F. Influencia de las condiciones del proceso de texturizado en las

propiedades mecánicas de hilos de poliéster, Tesis de Maestrı́a en Ciencias, SEPI
ESIT, Instituto Politécnico Nacional, 2009.
[2] GUILLEN, G., ET AL. Contracción residual de multifilamentos texturiza-

dosRevista electrónica Humanidades, Tecnologı́a y Ciencia del IPN, ISSN 207-
1957. Ejemplar 18, Enero-Junio 2018.
[3] HEARLE, J.W.S., GROSBERG, P. AND BACKER, S. Structural Me-
chanics of Fibers, Yarns and Fabrics, Vol. 1.Wiley Interscience. 1969
[4] ISLAS, A. M., ET AL. Alternativas al gráfico de probabilidad normal como

test de validación. Revista electrónica Humanidades, Tecnologı́a y Ciencia del
IPN, ISSN 207-1957. Ejemplar 16, Enero-Junio 2017.
[5] ISLAS, A. M., ET AL. La ecuación de Gompertz como modelo de crecimiento
Revista electrónica Humanidades, Tecnologı́a y Ciencia del IPN, ISSN 207-1957.
Ejemplar 15, Julio-Diciembre 2016.
[6] WACKERLY , D., MENDENHALL, W. AND SCHEAFFER, R. Es-
tadı́stica matemática con aplicaciones. Séptima edición, CENGAGE Learning.
2013.
275
PROBABILIDAD, ESTADÍSTICA Y SUS APLICACIONES
Editores:
Dr. Hugo Adán Cruz Suárez.
Dr. Fernando Velasco Luna.
Dr. José Dionicio Zacarías Flores.
Dr. Francisco S. Tajonar Sanabria.
Dra. Hortensia J. Reyes Cervantes.
Dr. Bulmaro Juárez Hernández.
Dr. Víctor Hugo Vázquez Guevara (Responsable)
Se terminó de imprimir en Septiembre de 2018
en los talleres de A.L. Digital
El cuidado de la edición y la producción editorial son
de Víctor Hugo Vázquez Guevara.
El tiraje es de 1000 ejemplares

Probabilidad, Estadística y Sus Aplicaciones

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Probabilidad, Estadística y Sus Aplicaciones

Încărcat de

Drepturi de autor:

Formate disponibile

|

Probabilidad, Estadística y sus

Benemérita Universidad Autónoma de Puebla

DR © Benemérita Universidad Autónoma de Puebla

4 sur 104, Col. Centro Histórico, Puebla, Pue. CP 72000

Teléfono: 01 (222) 229 55 00

Dirección General de Publicaciones

2 norte 1404, Col. Centro Histórico, Puebla, Pue. CP 72000

Teléfonos: 01 (222) 246 85 59 y 01 (222) 229 55 00 Ext. 5768 y 5764

Facultad de Ciencias Físico Matemáticas

Teléfonos: 01 (222) 229 55 00 Ext. 7552

BENEMÉRITA UNIVERSIDAD AUTÓNOMA DE PUEBLA • Rector: José Alfonso Esparza Ortiz

• Secretario General: José Jaime Vázquez López • Vicerrector de Extensión y Difusión de la

Impreso y hecho en México

Printed and made in Mexico

Guillermo Olivera Lozano y Olga Victoria Serrano Sánchez

Centro Regional de Investigaciones Multidisciplinarias,

Abstract. In this paper, we estimate a house quality index (HQI) based on

Palabras clave: Calidad de la vivienda, componentes principales, estadı́stica

1.2. Fuente de información

Las variables que se utilizan son:

a) Proporción de viviendas con paredes o muros construidas con tabique, ladrillo,

d) Proporción de viviendas que tienen cuarto para cocinar.

g) Proporción de viviendas que obtienen el agua de llaves o mangueras que están

i) Proporción de viviendas con taza de baño exclusiva de la vivienda.

1.3.3. Análisis de Componentes Principales (CP)

Mediante el análisis de componentes principales, se transforma al conjunto de

El procedimiento de componentes principales genera un número reducido de va-

Generalmente, en la práctica sólo se consideran las primeras combinaciones li-

invita a consultar “Componentes Principales. Análisis de Datos sobre calidad de la vivienda en el

transformadas pueden conducir ellas mismas a esta interpretación en términos de

Es importante mencionar que el método de componentes principales puede ser

Componente Valores propios % de variación % de variación de acumulados

Cuadro 1.1: Valores propios de la matriz de correlaciones.

En el cuadro 1.2, se presentan los vectores principales correspondientes a las tres

El ı́ndice de calidad representado por la primera componente principal, se presen-

la que mejor explica la variabilidad del conjunto de variables originales.

rrollados en un trabajo posterior.

Cuadro 1.2: Vectores propios de la matriz de correlaciones.

En la Figura 1.3, se observa la regionalización de las entidades federativas, ba-

Figura 1.1: Índice de calidad de la vivienda en México.

Los resultados del ı́ndice de calidad que se obtuvieron, como lo mostraremos

Cuadro 1.3: Identificación de Entidad Federativa.

Figura 1.2: Indicadores compuestos de las 32 entidades federativas.

Figura 1.3: Índice de calidad de las viviendas en México.

[3] Diario Oficial de la Federación, Programa Nacional de Vivienda, 204-

[5] Jolliffe, I.T., Principal Component Analysis, New York: Springer-Verlag,

Catherine Menkes Bancet, Itzel A. Sosa Sánchez y Leopoldo Núñez

Centro Regional de Investigaciones Multidisciplinarias,

Resumen. El objetivo principal del presente trabajo consiste en identificar

Palabras clave: Adolescentes, pareja sexual, protección sexual, regresión logı́sti-

La sexualidad adolescente también ha adquirido mayor visibilidad en la agenda

Si bien la prevalencia del preservativo masculino en los adolescentes y jóvenes en

blación, e incrementan los riesgos de contraer enfermedades de transmisión sexual

Paralelamente, la información reciente en relación al uso del condón sugiere que

Respecto a los hombres, se ha sugerido que los varones se enfrentan a presiones

El objetivo principal del presente trabajo consiste en identificar qué caracterı́sti-

En primer lugar se presentan algunas caracterı́sticas socio-demográficas de la pare-

Posteriormente, para conocer la asociación de la protección sexual con las carac-

Índice sobre balance de poder en la sexualidad con la pareja actual:

5. ¿Tienes relaciones sexuales sin protección porque tu pareja prefiere no usar-

En el caso de las preguntas 3, 4, 6 y 7, cuando las respuestas de los estudiantes fue-

Abuso sexual del novio/de la novia o pareja: