Sunteți pe pagina 1din 9

ANÁLISIS DE CORRESPONDENCIAS

MÚLTIPLES

Jhonathan Daniel Cano Rivera∗ ; Taína Targelia Sánchez Valencia∗∗


∗ Universidad del Valle, Facultad de Ingeniería, Escuela de Estadistica
e-mail: jhonathan.daniel.cano@correounivalle.edu.co
∗∗ Escueal de Estadística, Universidad del Valle, Facultad de Ingeniería
e-mail: taina.sanchez@correounivalle.edu.co

Resumen: Se realizará un análisis de correspondencias múltiples con una base de datos real, identificando las respuestas
más frecuentes con base a unas pregunta de interés, adicional, se realzara una regresión logística de respuestas binarias
y con esto, hacer una comparación entre ambos métodos analizando diferencias entre los resultados.

Palabras claves: Correspondencias, frecuencias, logit, comparación, métodos, diferencias.

1. INTRODUCCIÓN 2. METODOLOGÍA

2.1 Tipo y diseño de la encuesta

En la mayoría de los casos, no es posible trabajar con Para fortalecer el análisis de consistencia de la
variables cualitativas o categóricas nominales, debido información se elaboran documentos de contexto
que, al hacer un modelo de regresión o un análisis por actividad, en los cuales se describen los aspectos más
de componentes principales, la codificación que se importantes del comportamiento económico del país en
le asigna a cada característica suelen ser arbitrarias el período correspondiente. Adicionalmente, de acuerdo
a la codificación son arbitrarios y las estimaciones o con la disponibilidad de los datos, para cada una de
conclusiones pueden variar. las actividades investigadas, se comparan los resultados
de la encuesta con otras fuentes de información, con el
propósito de cotejar la consistencia de los resultados que
Por esto, en este caso se emplearan otras alternativas se publican en la EAS. Los anexos estadísticos de la MMH
para trabajar con variables cualitativas o categóricas, y la MTS) o bien externas, tales como la información
como lo es el análisis de correspondencias multiples, el producida por gremios, ministerios, superintendencias,
cual permite describir grandes tablas binarias, donde las institutos de investigación, etc. Antes de ser publicados,
filas son en general los individuos u observaciones y las los resultados y el boletín de prensa se presentan ante el
columnas son las modalidades de variables nominales, Comité Interinstitucional de Servicios, conformado por
la mayorías de las veces modalidades de respuestas a un delegado del Banco de la República, del Ministerio de
las preguntas (Lebart and et al). Y los modolos logísticos Comercio, Industria y Turismo, del DNP y del DANE (2).
de respuesta binaria, permiten estimar o predecir el
comportamiento de una o más variables a partir de
otras variables, con las que se encuentran fuertemente 2.2 Base de datos
correlacionadas. Además, se hará una comparación entre
ambos métodos para determinar que diferencias existen La base de datos seleccionada fue, encuesta anual de
entre cada uno. A partir de 1999 se ha utilizado para servicios del año 201 (1), este censo se realizo en
estudiar como los individuos toman decisiones (3). empresas donde se realizan prestaciones de servicios.
Jhonathan Daniel Cano Rivera; Taína Targelia Sánchez Valencia– ACM

de la cual se seleccionaron algunas de las variables con 3. RESULTADOS


respuestas binarias, en total 16. Para generarla muestra se
realizó un sample en R, el valor inicial fue 1994 y a partir 3.1 Inercia
de ahí se contaron 1000 datos.

Com1 Com2 Com3


Inercia 0.2073 0.1387 0.1185
Porcentaje de inercia 20.73 13.87 11.85
acumulado 20.73 34.6 46.46
2.3 variables

Las tres primeras componentes explican el 46.46 % de la


inercia total, para análizar y relizar la nube de individuos
y de variables se seleccionó la primera y segunda
Variable Significado componente.
B_1_A Computador de escritorio
B_1_B Computador portáctil
B_1_C Tableta 3.2 Contribuciones y cosenos cuadrados
B_1_D Teléfono móvil (smartphone)
B_1_E PDA-DCM 3.2.1 Contribuciones variables
Fueron comprados para el uso
B_2_1
exclusivo de la empresa Como se observa en la tabla ??, las modalidades que
La empresa pago por más contribuyen en el primer eje son, Portatil.no,
B_2_2
un servicio periódico Tablet.si, Smartphone.no, creado.si y aplicaciones.si.
Fueron desarrollados o Estas modalidades son las que reúnen la mayor cantidad
B_2_3
creados por la empresa de individuos que se encuentran cercanos a este eje.
Uso de Aplicaciones (que
B_12_K
requieren Internet)
Fueron descargados o de Por otra parte, en el eje 2 las modalidades que
B_2_4 más contribuyen son, escritorio.no, portátil.no,
acceso gratuito
¿La empresa usó internet en Smartphone.no, comprado.no, y aplicaciones.si. como se
el año de referencia para el puede ver, hay algunas que se repiten lo que indican que
B_3 podrían estar cerca del centro de gravedad y esto implica
desarrollo de sus actividades?
Si=1, No=2 que estas variables no poseen mucha variabilidad, es
Redes para conectar decir, que la mayoría de individuos que se alojan entre
B_10 computadores. Red de Área estas modalidades portan características similares a nivel
Local (LAN). global.
Redes para conectar
B_10_A computadores. Red de Área
Amplia (WAN). Dim.1 Dim.2 Dim.3
Redes para comunicación y Escritorio.no 1.30 11.51 3.92
B_11 compartir información. Escritorio.si 0.05 0.48 0.16
Extranet. Portatil.no 12.00 9.07 0.26
Portatil.si 1.58 1.19 0.03
Tablet.no 4.96 1.13 0.03
Tablet.si 13.41 3.05 0.07
Smartphone.no 9.86 8.97 1.86
2.4 ACM Smartphone.si 4.35 3.96 0.82
PDA.DMC.no 0.11 0.12 0.36
Una tabla disyuntiva (Z) separa las variables respecto a PDA.DMC.si 2.93 3.42 10.02
las categorías que esta posea y le añade el valor de uno Comprado.no 0.00 17.16 42.92
en su posición respectiva de cada categoría. entonces, si Comprado.si 0.00 2.96 7.40
s = 14 columnas en la base de datos se obtendrán p Servicio.no 8.14 8.19 3.97
columnas de la tabla disyuntiva, y equivale al número Servicio.si 7.90 7.95 3.86
de modalidades o categorías. Para este caso se obtuvo un Creado.no 4.06 1.32 2.93
total de p=28 modalidades. Al tener la tabla Z, se halla Creado.si 13.88 4.51 10.03
B=Z’Z (tabla de las caras del hipercubo de contingencia) Aplicaciones.no 4.36 4.22 3.19
asociada a Z, sobre la cual realizamos es análisis de Aplicaciones.si 11.13 10.78 8.16
correspondencias y descomposición.

2 Universidad del Valle - Facultad de Ingeniería - Escuela de Estadística


Heurística 18, ISSN: 2422-5177, Abri 2019. p.1-5

figura 1, Las variables que más contribuyen a los ejes son utilizan el servicio de internet que comparten estas
características de manera global.
Contribution of variables to Dim−1

Dim.1 Dim.2 Dim.3


10
Escritorio.no 0.03 0.15 0.04
Escritorio.si 0.03 0.15 0.04
Contributions (%)

Portatil.no 0.25 0.13 0.00


5 Portatil.si 0.25 0.13 0.00
Tablet.no 0.34 0.05 0.00
Tablet.si 0.34 0.05 0.00
0
Smartphone.no 0.27 0.16 0.03
i

no

si

i
o.s

t.s

s.s

.s

.s

.s

.s

.s
.n

.n

t.n

s.n

o.n

.n

.n

.n
til.
io

rio

do
ne

C
til.
ble

Smartphone.si 0.27 0.16 0.03


io

io

do
ne

C
ne
ad

ble

ta
ic

ne

ad

pra
ito
ho
ta

M
ic

or
rv

pra
ho

A.D
Ta

io

r
re

rv

Po

A.D
r

Ta

io

re

it

cr
tp
Po

Se
ac

om
C

cr
tp

Se

ac

om
C

Es
ar

PD

Es
lic

ar

PD
lic

C
Sm

C
Sm
Ap

Ap

PDA.DMC.no 0.06 0.04 0.11


Figura 1. Contribuciones de las modalidades PDA.DMC.si 0.06 0.04 0.11
Comprado.no 0.00 0.25 0.54
Contribution of individuals to Dim−1
Comprado.si 0.00 0.25 0.54
0.8

Servicio.no 0.30 0.20 0.08


Servicio.si 0.30 0.20 0.08
0.6

Creado.no 0.33 0.07 0.14


Creado.si 0.33 0.07 0.14
Contributions (%)

0.4

Aplicaciones.no 0.29 0.19 0.12


0.2 Aplicaciones.si 0.29 0.19 0.12

0.0

En el eje 1, las variables que más están relacionadas a


1

30

34

48

71

74

76

4
23

10

32

45

48

57

83

91

88

12

12

16

24

25

Figura 2. Contribuciones de los individuos. este eje son: Tablet, Smartphone, portátil y aplicaciones y
creado, ya que en sus ambas modalidades presentan un
porcentaje por encima del 20 %, ya en el eje 2 cambian
un poco las variables que son más significativas, las
cuales son servicio, comprado y aplicaciones pero sus
1.5

● ●





1.0

porcentajes son un poco más discretos en comparación


● ●
● ●



● ●

1.0




● ●




● ●

de las variables en el primer eje.




0.5


0.5

Y en el eje 2 las variables que más se relacionan con


0.0

0.0

este eje son: Escritorio, Comprado, servicio, aplicaciones.


−0.5

−0.5

Esto se puede ver como el grado de correlación que se


−1.0

genera desde el eje con respecto a estas variables en la



−1.0

● ●

Eje 1 Eje 2 Eje 3 Eje 4

agrupación de los individuos que marcaron de manera


similar algunas características de la encuesta como tal.
Figura 3. Distribucion de los ejes del ACM

Al investigar un poco como es el comportamiento de los 3.3 Nube de individuos


ejes principales del ACM, se observa que en los primeros
2 ejes tienen un comportamiento muy similar, ambas Se observa que en general, la nube de individuos esta
distribuciones se comportan de manera muy similar, condensada de manera compacta, esto quiere decir, que
aunque en el eje 2 existe un punto o un conjunto de la mayoría de estos poseen los mismos elementos u
puntos atipicos, los cuales se estudiaran mas adelante, objetos y por lo que sus respuestas son muy similares.
Por otra parte, comparando el eje 3 con el eje 4 se observa Sin embargo, se observa que algunos individuos están
una diferencia notable en la distribucion, teniendo el eje un poco alejados, como lo son los individuos 134,589,123
4 un comportamiento muy encogido lo cual se puede ver y el 578, los cuales se encuentran alejados en una
reflejado en valores muy homogeneos y tambien cuenta forma negativa en ambas componentes. Además, se
con una presencia anormal de datos atipicos, los cuales encuentran muy cercanos a las modalidades protráctil.no
pueden afectar la calidad de la estimacion. y escritorio.no y smartphone.no por lo que se puede
deducir que aquellos individuos no tienen computador
de escritorio, portátil o smartphone.
3.2.2 Cosenos cuadrados

También se puede observar que existe una alta También, el individuo 231, se encuentra muy alejado del
correlación entre estas modalidades lo que permite resto, pero con altos valores de la primera componente
identificar de manera óptima a los individuos que y muy cercano a ese eje, por lo que posiblemente esta

Universidad del Valle - Facultad de Ingeniería - Escuela de Estadística 3


Jhonathan Daniel Cano Rivera; Taína Targelia Sánchez Valencia– ACM

Variable categories − MCA

1
PDA.DMC.si
entre si, por lo que se puede pensar que no existen
Servicio.no
muchas diferencias en el comportamiento de los datos y
Tablet.si
Aplicaciones.no
Creado.no
Comprado.si
Escritorio.si
Smartphone.si
Portatil.si por ende la variabilidad no es muy alta. es decir que usar
PDA.DMC.no

internet se relaciona muy bien con otras modalidades.


0
Tablet.no
Dim2 (13.9%)

Servicio.si
Creado.si
Smartphone.no
Aplicaciones.si Pero, aún así hay modalidades e individuos que están
−1
Portatil.no

Comprado.no
muy dispersos, esto se debe a que su frecuencia es muy
mínima o no tengan ninguna repetición.
Escritorio.no

−2
−1.5 −1.0 −0.5 0.0 0.5 1.0
Dim1 (20.7%)

Figura 5. Nube de individuos


135
149
200
232
259
306
377
421
487
706
793
857
855
897
925
924
944
27
102
137
164
178
255
299
319
321
352
391
401
424
434
449
492
518
507
528
533
713
715
721
758
846
911
989105
162
169
188
191
190
197
278
290
294
358
382
398
409
413
418
428
436
438
441
446
463
454
451
506
527
522
529
584
597
594
591
590
607
641
647
651
656
676
690
699
703
702
728
726
732
751
776
762
760
811
835
848
847
862
881
923
962
961
982
999
991
42
80
214
213
207
301
346
412
423
437
439
555
571
587
667
696
708
815
977
107
143
181
221
217
298
335
353
362
361
385
394
440
488
495
623
664
705
714
804
826
35
151
172
185
194
279
297
502
609
845
893
953
471
511
634
783
797
109
147
173
291
384
443
450
565
731
949
95 11
32
44
77
81
Comprado.si 268
276
354
491
600
743
LAN.si
Internet.si 41
50
117
111
269
315
332
336
347
366
388
395
411
432
472
504
610
629
640
689
683
677
749
802
833
854
877
886
900
935
671
Escritorio.si 154
175
189
390
616
612
700
863
964
981
813
419
735
885
159
622
937
229
819 25
66
1939
18
24
88
645
148
242
320
359
387
739
920
916
311
357
370
539
602
692
800
62
153
256
271
328
333
429
545
561
639
650
697
850
950
980
28
33
827
837
124
233
331
414
560
569
720
853
884572
653
694
29
36 86
874
22
234
386
426
617
757
907
974 ● ●●
● ●978
16
54
72
68
82
101
94
138
150
161
182
199
206
204
203
215
227
262
312
427
456
480
486
484
482
514
538
546
627
646
674
684
734
756
765
780
792
828
858
878
905
Servicio.no
57
208
212
235
267
277
293
304
430
455
453
457
465
543
542
553
643
652
7
784
825
968
967
37
160
220
286
313
425
433
513
530
663
670
678
718
883
898
99245
727 ●●
● ●●



●●
●●

cl1







●●


● ●
●●
●●●
●●
●●


●●

●●
251
759
● 741
868
52
93
104
116
195
202
210
240
282
383
381
448
469
466
614
685
887
933
986
51
49
337
380
494
505
541
596
606
785WAN.no
280
657
733
966
61
90Extranet.no
216
308
356
415
588
778
803
799
919
947
993
798
795
5819
125
211
605
789
832
829
Aplicaciones.no
●●
226
224
515288
303
899
140
152
Creado.no
7887
583
307
579
901
43165
289
302
867
Tablet.no
156●

272
693
●● ●
840
263
130
503
0 Smartphone.si
550
89
97
636
687 338
805
843
26
305
349
633
772
801
796
859
363
183
225
295
470
468
523
564
589
625
753
812
918
345
990 40
47
807
253
630
809
998
880
Portatil.si
517
155
201
270
375
479
573
637
682
788
186
258
351
525
568
786
132
139
170
324
343
478
509
608
619
655
665
791
818
842
972
983
115
593
970
14
327
339
374
393
790
959
621
635
938
123
322
442
603
638
467
475
704
876
113
273
402
852
100
461
540
611
624
265
810
103
129
142
218
248
247
246
552
582
642
754
861
952
45
820 73
943
174
314
405
831
710
917
275
145
309
444
666
838
498
55
556
890
926
928
392
769
782
787
871
519 4●●●●
56●●● ●●


●●


●●●
●●




●●
●●
●●


●●




●●
●●









●●


●●
●●





● ●

141
●●

●● 979

●●


●891
230
960

144
196
447
500
549
688
725
748
228
422

136
179
499
661
771

292
973
● ●
12
236
330
334●531
559
126
458
477
875
198283
PDA.DMC.no

781
5927Smartphone.no
239
420
8
750
841
996
716
747
510
524
969
995
● 94
75 Portatil.no
834
168
408
830
839
96
485
654
717
879
770
252
261
547
932
238
431
763
108
526
954
971
187
209
205
397
496
544
648
673
672
724
719
915
939
34
934
866
325
740 85
120
146
364
581
976
122
176
323
459
534
574
613
628
822
940
948
985
296
869
64
79 7
133
300
554
816
489
737
379
400
578
167
373
711
71
118
851
896
Extranet.si
975
326
287
595
166
264
396
567
575
649
767
902
601
709
56
316
39991
532
521
266
285
342
576
773
988
403
76 8
338 cl2


●●







●●




●●













●●











●●



●●●

● ●





●●




●●
●●

● ●●● ●

● 965

●●●●● ●●
83
416669
284
823
956
PDA.DMC.si 134
Servicio.si
681
406
849
856
Tablet.si
632
865
892
48
114
171
237
244
257
317
348
350
360
474
493
497
537
536
566
662
660
659
675
698
730
744
755
774
844
889
921
927
23
70
75
WAN.si
249
516
794
888
30245
483
752
882
121
344
110
223
615
128
127
241
254
318
369
378
404
473
476
501
558
570
580
585
598
626
658
817
870
936
963
74
548
84
92
193
814
599
464 ●●
● ● ●●

● ●
●●

●●
●●

●●







●●

●●●




644



15
260
462
668
707
951
274
371
490
562
631
686
701
729
903
946
984
20
46
98
163
821
994
192
222
65







●●

●●


●●●●


●●

●●●


2●●●●●●● ●●●●●●●21777
909

112
873
860
914
864
779
231
766
Aplicaciones.si
Creado.si ● ●● ●



158 551
680
872
957
586
955
736
157
368
931
930
929

●●
63
435
895
912

942
281●●

367
922
243
445
67
131
806
389
177
250
520
958
219
410
535
691
768
808
10
31
60341

340
679
99
17
722
941
512
53
908

723
761
824
945
997 13
987
618
●●


● ● ● 310
372 746
119
407
695
417 ●●●●
59
●●
904 ●
●●
● ● ●● ●
184
563
365
● ●764 ● 738
69●
180712
460
Comprado.no
355
376 604
620508
906
557
910

−2 ● 452
481
577
836
913
742

variable contribuye mucho a la formación e inercia del −4


Escritorio.no

Factor 2: 0.1336 (13.4%)


cl3

eje 1.
329
106

−6

−8 LAN.no

MCA − Biplot −10

PDA.DMC.si

1 727
550 −12

843
805
26 820

869
296
97
89
79
64
740
● Internet.no
949
944
925
924
897
859
857
855
801
796
793
772
743
731
706
633
600
565
491
487
450
443
421
384
377
354
349
306
305
291
276
268
259
232
200
173
149
147
135
109
95
50
41
27
1 115 ●


Servicio.no 687
671
636
363 ●
888 −10 −5 0 5 10 15 20
999
991
989
982
977
962
961
935
923
911
900
886
881
877
862
854
848
847
846
835
833
815
811
802
776
762
760
758
751
749
732
728
726
721
715
713
708
703
702
699
696
690
689
683
677
676
667
656
651
647
641
640
629
610
607
597
594
591
590
587
584
571
555
533
529
528
527
522
518
507
506
504
492
472
463
454
451
449
446
441
439
438
437
436
434
432
428
424
423
418
413
412
411
409
401
398
395
391
388
382
366
358
352
347
346
336
332
321
319
315
301
299
294
290
278
269
255
214
213
207
197
191
190
188
178
169
164
162
137
117
111
105
102
88
81
80
77
44
42
32
24
18
11 ● 34
30
● 970
885
839
830
735
638
603
593
442
419
408
322
168
123
96
14 Tablet.si
516
249

794 ●
519
Aplicaciones.no511
868
807
797
783
741
634 813 952
918
861
812
800
786
754
753
692
642
625
602
589
582
568
564
552
539
525
523
470
468
370
357
351
311
295
258
248
247
246
225
218
186
183
142
129
103
62
45 ●

990
871
787
782
769
392
345
Smartphone.si ● Factor 1: 0.1864 (18.6%)
Comprado.si 47 ●
937
852
622
471
402
338
273
159
113
40 ● ●

101
986
981
978
964
933
905
887
878
863
858
828
792
785
780
765
756
734
700
685
684
674
646
627
616
614
612
606
596
546
541
538
514
505
494
486
484
482
480
469
466
456
448
427
390
383
381
380
337
312
282
262
240
227
215
210
206
204
203
202
199
195
189
182
175
161
154
150
138
116
104
94
93
82
72
68
66
54
52
51
49
25
16 Creado.no 983
980
972
950
884
853
850
842
826
818
804
791
720
714
705
697
665
664
655
650
639
623
619
608
569
561
560
545
509
495
488
478
440
429
414
394
385
362
361
353
343
335
333
331
328
324
298
271
256
233
221
217
181
170
153
143
139
132
124
107
36
35
33
29
28
9151
959
953
893
845
837
827
819
790
609
502
393
374
339
327
297
279
229
194
185
172
22

Portatil.si 489 231
992
966
899
898
883
733
718
678
670
663
657
530
513
433
425
313
303
286
280
220
160
156
58
37 ● Escritorio.si
● ●
39 932
831
709
601
576
547
405
342
314
285
266
261
252
174
56
287
934
866
816
554
399
316
300 ●
998
810
809
645
630
517
265
253
55 ● 15 532 ●
770 ●

644 140 ● 971
954
902
879
767
717
654
649
575
567
526
485
396
264
166
108
736 ● ●
3
0 ●
874 764
635
621
152 21
PDA.DMC.no


985
948
940
917
822
710
628
613
574
534
459
323
176
122
7325 ●
955
586
158
880
49899 ●
43148
993
947
920
919
916
803
799
788
778
739
694
682
653
637
588
573
572
479
415
387
375
359
356
320
308
270
242
216
201
155
90
86
61
798
795
759
515
251
226
224
4

8177
958
951
942
773
707
668
520
462
260
250● ●
92
968
967
840
832
829
825
789
784
745
652
643
605
553
543
542
465
457
455
453
430
304
293
288
277
267
235
212
211
208
125
57
19 59 Tablet.no
909 693
579
307
272
141
78
891
867
● ● ●
922
736
63
17
974
939
915
907
838
757
724
719
673
672
666
648
624
617
611
544
540
496
461
444
426
397
386
309
234
209
205
187
145
100
5 994●521
821
281
● ● ● ● 963
936
892
870
865
817
711
658
632
626
598
585
580
570
558
501
476
473
404
403
378
373
369
318
254
241
167
128
127
76
74
71
48
163 ● 134
Dim2 (13.9%)

● ● 938
595
91 ●

Figura 6. Cluster Mixto.


● ●
901
126 263 984
957
946
903
872
808
768
748
729
725
701
691
688
686
680
631
562
551
549
535
500
490
447
410
371
274
219
196
144
98
60
46
31
20
10
2192
912
895
435
222
65120
976
960
943
581
364
230
146
38

● ●
● ● ● 133 ●
928
927
926
921
896
890
889
851
844
774
755
744
730
698
675
662
660
659
566
556
537
536
497
493
474
360
350
348
326
317
257
244
237
171
118
114
75
70
23 814
512
193
599
559 ●
365 979
876
763
704
475
467
431
275
238
85806
131 ●
746● ● ●
956 130
873
823
777
284
112 583
503
422
228
87 ● 914
904 ● 681
548
483
245
84● 110
Servicio.si 988
737
615
223

531
302
289
165 679
592
367
779 198
563
184 ● ● ● 344
121
340 ●
● Creado.si
● ● ●● ●
875
771
661
499
477
458
389
330
236
179
136
12781 ●
941
882
752
722
445
243

53 ●157
997
Smartphone.no
742 995
969
750
524
510 ● ● 618 975
931
930
929
856
849
578
406
400
379
368 355 766
464
996
841 ● ●
67 723● ●
908
417

860
738
● ●
864 283 508 Aplicaciones.si●
973
341
334
292 695
407
119 460
69
13 ● ●
372
834 ● ●
● ● ● ● 910
557
945 ●
761 ● ●
894
747
716
420
416
239
83
775
669

180 ●
● ●

604 824
987
965 620
376
Portatil.no 712 ● ● ●

−1 ●

310
913
836
577
481
452
329
106 ● Comprado.no

906

Escritorio.no

−2
−1.5 −1.0 −0.5 0.0 0.5 1.0
Dim1 (20.7%)

Figura 4. Nube de variables 3.6 Modelo logit de respuesta binaria

3.4 Nube de variables para este caso se realizo el modelo tomando como
variable de respuesta, y = B_3 ¿La empresa usó internet
en el año de referencia para el desarrollo de sus
Se evidencia variable más alejada del resto es la de
actividades?, donde y =0 si la respuesta es no y 1 si es
PDA-DMC.si (Asistente Digital Personalizado) en el
si.
primer cuadrante del gráfico, lo que indica que la
Como variables independientes se tomaron las siguientes
frecuencia de los usuarios o individuos que usan este
modalidades. ted in R 3.5.2 by xtable 1.8-3 package Al
dispositivo es muy alta con respecto al resto.

Luego, se tiene que parte de las variables que componen


Escritorio.no Smartphone.no Servicio.no
la modalidad del si (Tener o no cierta característica) esta
Escritorio.si Smartphone.si Servicio.si
mejor definida en el eje 1 ya que sus contribuciones en
Portatil.no PDA-DMC.no Creado.no
los primeros ejes son los valores más altos. También,
Portatil.si PDA-DMC.si Creado.si
se nota que las categorías de las variables portátil.no y
Tablet.no Comprado.no Aplicaciones.no
escritorio.no, se encuentran muy alejadas de los ejes de
Tablet.si Comprado.si Aplicaciones.si
forma negativa, lo que indica que estas modalidades
presentan poca frecuencia; es decir, las personas que no
poseen portátil o computadores de escritorio son pocas.
hallar las estimaciones y el Anova, algunas valores de
En general,se puede concluir que gran partes de las variable s fueron excluidos y quedaron los que veran a
modalidades están muy asociadas y puede ser que continuación en a tabla. Como se observa, ninguna de
las frecuencias de cada una puede ser muy similar. las variables son significativas y han quedado reducidas
y que aquellas modalidades que están más agrupadas a la mitad, y son las correspondientes a las del no.
corresponden a "si"tener cierta categoría (escritorio, Debido a que una característica de los modelos logist
portátil, Smartphone, Tablet y PDA). es que todas sus variables sean significativas se hará
una selección de variables y evidenciar aquellas variables
que son más significativas. se nota que a medida que
3.5 Cluster Mixto aumentan la frecuencia de personas no tienen escritorio
disminuye la probabilidad de que se el individuo pueda
al realizar el clúster mixto se observa, que tanto las usar internet para realizar sus actividades. Es decir, esta
modalidades como los individuos están muy cercanos variable influye negativamente en la variable B_3

4 Universidad del Valle - Facultad de Ingeniería - Escuela de Estadística


Heurística 18, ISSN: 2422-5177, Abri 2019. p.1-5

Estimate z value Pr(>|z|) específicos, algunos usuarios ingresan a la internet


(Intercept) 58.1621 0.00 0.9989 por dispositivos no muy comunes y existen otros
Escritorio.no -13.0566 -0.00 0.9993 que ingresan a este por medio de la WAN ( Red de
Portatil.no -8.6477 -0.00 0.9995 área Amplia), la cual es solo posible acceder desde
Tablet.no -6.7529 -0.00 0.9997 un sistema cerrado, o desde una empresa.
Smartphone.no 0.9492 0.00 0.9999
‘PDA-DMC.no‘ 5.6577 0.00 0.9999
Comprado.no -11.8097 -0.00 0.9994 REFERENCIAS
Servicio.no -7.9271 -0.00 0.9996
Creado.no -5.7640 -0.00 0.9997 [1] Dane (2017a). Archivo nacional de datos. http://
Aplicaciones.no -9.8948 -0.00 0.9995 microdatos.dane.gov.co/index.php/home.

[2] Dane (2017b). Colombia - encuesta anual de


Al hacer la selección de variables StepAiC se obtuvo servicios - eas - 2017. file:///C:/Users/PC1/Downloads/
que el mejor modelo es el conformado por las variables ddi-documentation-spanish-583%20(2).pdf .
Escritorio.no y Portátil.no, es decir, que por medio de la
regresión logísticas las variables que más relación tienen [3] Dau, M. A., Rueda, K. A., and Altamar, L. (2016).
con la variable de respuestas son esas. Aplicación de los modelos de respuesta binaria a
los determinantes de la demanda de postgrado en
colombia. Escenarios, 14(1):7–18.
Estimate Std. Error z value Pr(>|z|)
(Intercept) 43.7539 8289.7767 0.01 0.9958 [Lebart and et al] Lebart and et al. Análisis de
Escritorio.no -21.9241 5827.1116 -0.00 0.9970 correspondencias múltiples.
Portátil.no -20.7313 5896.2373 -0.00 0.9972

ANEXOS
3.7 Logit Vs ACM
• Base de datos.
Al realizar ambos métodos se puede observar tienen
un poco de relación al momento de seleccionar aquellas
variables con mayor peso al momento de describir
una característica. debido a que si, revisamos en el
caso del ACM las contribuciones gran parte de las
modalidades correspondientes al no, contienen la mayor
influencia en la formación de los ejes y con los valores
correspondientes más altos, Por otro lado, si se análiza
el gráfico ambas modalidades del seleccionadas en el
modelo logit demasiado alejadas del resto y con valores
que duplican los demás. Esta es la estructura general de la base de
datos, como se puede observar, son 10 variables
cualitativas dicotomicas en donde se le pregunta al
4. CONCLUSIONES usuario si utiliza o no o conoce o no los distintos
criterios para acceder a internet. Se tomaron 999
• El análisis de correspondencia múltiple (ACM) datos por medio de un sample por medio del
es muy útil debido a su amplia capacidad software estadistico R
de análisis cuando existe información cualitativa
que en ocasiones es muy difícil trabajar con
técnicas normales, especialmente en los casos
particulares donde existen demasiadas variables
es particularmente efectiva el ACM. Este ejercicio
fue muy enriquecedor de realizar ya que se
logra adquirir un conocimiento fundamental en el
análisis estadístico y fortaleciendo las bases con
las que se propone realizar investigaciones mas
adelante.

• En el caso particular de nuestra base de datos,


se observa que la gente en general si conoce y
utiliza los servicios de internet, ya sea que acceda
a ellos por medios diferentes. En algunos casos

Universidad del Valle - Facultad de Ingeniería - Escuela de Estadística 5


CÓDIGO.

tabla <- read.table("clipboard", header = T)


colnames(tabla) = c("Escritorio","Portatil","Tablet","Smartphone","PDA-DMC","Comprado","Servicio",
"Creado","Aplicaciones","Internet","LAN","WAN","Extranet")

tablas <- read.table("clipboard", header = T)

colnames(tablas) = c("Escritorio","Portatil","Tablet","Smartphone","PDA-DMC","Comprado","Servicio",
"Creado","Aplicaciones","Internet","LAN","WAN","Extranet")

attach(tabla)
attach(tablas)
fix(tabla)
library("ade4")
library("FactoMineR")
n<-nrow(tabla)
tablas <- list(tab=tabla[,1:9,11:14],funcion = tabla[,10])

table(Internet,Internet)
t <- list(tab=tabla[,10],funcion = tabla[,10])
p<-acm.burt(t$tab,t$tab)
s<-ncol(tablas$tab)
str(tablas)
p.disj<-acm.disjonctif(tablas$tab)
p.disj
xtable( matrix(colnames(p.disj),6,3))
attach(p.disj)
fix(p.disj)
p<-ncol(p.disj)
str(tablas)
p.burt5<-acm.burt(tablas$tab,tablas$tab)
attach(p.burt5)
str(tabla)
a <- t(as.matrix(p.disj))%*%as.matrix(p.disj)
p.acm<-dudi.acm(tablas$tab,scannf=FALSE,nf=14)
p.acm_burt<-dudi.acm(p.burt,scannf=FALSE,nf=2)
barplot(L)
L<-p.acm$eig
sum(L) ## Inercias
Fi<-p.acm$li ## Coordenadas de los individuos
s.label(Fi)
dim(Fi)
dim(G)
G <-p.acm$co ## Coordenadas de las modalidades
s.label(G)
windows()
biplot(p.acm,col=c(2,3))
##
biplot(p.acm)
scatter(p.acm)
boxplot(p.acm) ## como se hace
## Hacer la representacion simultanea
xx<-data.frame(p.acm$li[,1],p.acm$li[,2])
boxplot(xx,names = c("Eje 1","Eje 2"))
boxplot(p.acm$li[,1])
boxplot(p.acm$li[,2])

yy<-data.frame(p.acm$li[,3],p.acm$li[,4])

boxplot(yy,names = c("Eje 3","Eje 4"))


### Representación simultanea
s.label(p.acm$li,box=FALSE)
s.label(p.acm$co,add.plot=TRUE)
### Cosenos y Contribucciones
Iner <- inertia.dudi(p.acm, row.inertia = TRUE, col.inertia = TRUE)
Iner$col.abs/10000
Iner$row.abs/10000
## cuantos ejes genera el acm
screeplot(p.acm)
summary(p.acm)
##### Distribución de términos según el primer eje.#####
##### Distribución de términos según el segundo eje. #####
boxplot(p.acm)

#--- para las categorías de las variables:


get_mca_var(p.acm)$coord[,1:3]
xtable(get_mca_var(p.acm)$coord[,1:3])
get_mca_var(p.acm)$cos2
xtable(get_mca_var(p.acm)$cos2[,1:3])
get_mca_var(p.acm)$contrib[,1:3]
xtable(get_mca_var(p.acm)$contrib[,1:3])
#contribuciones del eje 1

#--- para las categorías de las variables:


windows()
fviz_contrib(p.acm, choice ="var", axes = 1)

#--- para los individuos:


# seleccionando los 20 más importantes
windows()
fviz_contrib(p.acm, choice ="ind", axes = 1, top = 20)

#--- para los individuos:


# Colores por grupos
# Con elipses de concentración

grp <- as.factor(tabla[,"Internet"])

a<-fviz_mca_ind(p.acm, var = "blue", habillage = grp,


addEllipses = TRUE, repel = TRUE) + theme_minimal()
#--- para las categorías de las variables:
fviz_mca_var(p.acm, repel = TRUE)

fviz_mca_ind(p.acm,repel = T)

#--- las 10 más importantes


windows()
fviz_mca_var(p.acm, select.var = list(contrib = 50))

a
#--- O por nombres:

windows()
fviz_mca_var(p.acm,
select.var= list(name = c("Escritorio.si","Portatil.si","Tablet.si","Smartphone.si",
"PDA-DMC.si","Comprado.si","Servicio.si","Creado.si",
"Aplicaciones.si","LAN.si","WAN.si","Extranet.si")))
windows()
fviz_mca_var(p.acm,
select.var= list(name = c("Escritorio.no","Portatil.no","Tablet.no","Smartphone.no",
"PDA-DMC.no","Comprado.no","Servicio.no","Creado.no",
"Aplicaciones.no","LAN.no","WAN.on","Extranet.no")))

windows()
fviz_mca_var(p.acm,
select.var= list(name = c("LAN.si","WAN.si")))
#--- y la visualización conjunta:
fviz_mca_biplot(p.acm, repel = TRUE) + theme_minimal()

## cluster

# biplot chevere
windows()
fviz_mca_biplot(p.acm, select.ind = list(contrib = 999), select.var = list(contrib = 18)) + theme_minimal()

###

windows()
fviz_screeplot(p.acm, addlabels = TRUE,
main="Valores propios",ylab="Porcentaje de Variación")

#####

res.mfa <- MFA(tabla, group=c(5,4,3),


type=c("s","n","n"),graph = F,
name.group = c("quanti.sub","Equipos","Redes"))
Código
######################

# Ward Hierarchical Clustering

d <- dist(a, method = "euclidean") # distance matrix


fit <- hclust(d, method="ward.D")
windows()
plot(fit) # display dendogram
groups <- cutree(fit, k=4) # cut tree into 5 clusters
rect.hclust(fit, k=3, border="red") # draw dendogram with red borders around the 5 clusters

## Cluster Mixto

library(FactoClass)

?FactoClass

facto=FactoClass(p.disj1, dudi.pca,nf = 51,nfcl = 51,scanFC = F,k.clust = 4)

facto$indices ## Indices de Nivel

################Modelo Binomial probit

M2 <- glm(Internet ~ Aplicaciones+ Comprado+Creado+Escritorio+


Extranet+LAN+WAN+tabla[,5]+Portatil+Servicio+Smartphone+Tablet+Servicio,family = binomial(link = logit))
summary(M2)
Mfinal <- step(M2, test = "Chisq")
library("ade4")
library("FactoMineR")

attach(tabla)
attach(tablas)
fix(tabla)
M2 <- glm(Internet~ Escritorio.no+Escritorio.si+Portatil.no+ Portatil.si+Tablet.no+
Tablet.si+Smartphone.no+Smartphone.si+`PDA-DMC.no`+`PDA-DMC.si`+Comprado.no+Comprado.si+Servicio.no+
Servicio.si+Creado.no+Creado.si+Aplicaciones.no+Aplicaciones.si,family = binomial(link = logit),dat=p.disj)
library(xtable)
xtable(summary(M2))
Mfinal <- step(M2, test = "Chisq")
xtable(Mfinal)

S-ar putea să vă placă și