Documente Academic
Documente Profesional
Documente Cultură
Duitama (ZCBOY)
Versión 4 – 2014.
CONTENIDO
Primera Unidad Capítulos Lecciones
1. Introducción
1. Conceptos Básicos e Historia.
I. LENGUAJES 2. Alfabetos,
Cadenas y
REGULARES
Lenguajes
3. Autómatas y
Lenguajes.
4. Lenguajes
Regulares
5. Autómata
6. Definición
2. Autómatas Finitos Formal de
Autómatas
Finitos
7. Autómatas
Finitos
Determinísticos
(AFD)
8. Autómatas
Finitos no
Determinísticos
(AFND)
9. Autómatas
Finitos con
Transacciones
10. Lenguaje
Aceptado por
Autómata Finito
11.Lenguajes
3. Expresiones Regulares Regulares y
Expresiones
Regulares
12. Significado
de las
Expresiones
Regulares
13. Autómatas
Finitos y
Expresiones
Regulares
14 Equivalencia
de Autómatas
Finitos
Determinísticos
y Autómatas
Finitos no
Determinísticos
15
Minimización
de Autómatas
Capítulos
Segunda Unidad Lecciones
16. Gramáticas
Regulares
II. LENGUAJES 17. Lenguajes
INDEPENDIENTES libres de
DEL contexto y sus
máquinas
CONTEXTO
18. Arboles de
derivación
19.
Transformación
de las GLC y
Formas
Normales
20.Limitacioes
de los LLC
4. Conceptos Generales
21. Definición
5. Autómatas a Pila de Autómata
con Pila
22.
Funcionamiento
de Autómata
con Pila
23. Diseño de
Autómata con
Pila.
24. Funciones
que se aplican
sobre los stacks
(Pilas)
25.
Combinación
modular de los
autómatas con
Pila
26. Lenguaje
6. Propiedades de Lenguajes aceptado por
Independientes de Contexto un AP
27. Relación
entre los AP y
los LLC
28.
Propiedades de
clausura de los
Lenguajes
Libres de
Contexto
29. Algoritmos
de decisión
para los LLC
30.Problemas
Indecibles para
Lenguajes
Libres de
Contexto
Capítulos
Tercera Unidad
III. LENGUAJES 31.
ESTRUCTURADOS 7. Máquinas de Turing. Formalización
POR de las MT
FRASES 32.
Funcionamiento
de la Máquina
de Turing.
33. Diferencias
entre un
Computador y
una
Máquina de
Turing
34. La Máquina
Universal de
Turing
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Tabla de contenido
LISTA DE FIGURAS................................................................................................................................ 8
LISTA DE TABLAS................................................................................................................................ 10
INTRODUCCIÓN ................................................................................................................................. 11
I. GENERALIDADES: ............................................................................................................ 16
I.III RELACIONES:........................................................................................................................ 20
LECCIÓN 24. FUNCIONES QUE SE APLICAN SOBRE LOS STACKS. (PILAS). ................................ 98
6
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 27. RELACIÓN ENTRE LOS AUTÓMATAS DE PILA Y LENGUAJES LIBRES DE CONTEXTO
................................................................................................................................................. 102
LECCIÓN 28. PROPIEDADES DE CLAUSURA DE LOS LENGUAJES LIBRES DE CONTEXTO .......... 105
LECCIÓN 29. ALGORITMOS DE DECISIÓN PARA LOS LENGUAJES LIBRES DE CONTEXTO. ....... 106
LECCIÓN 30. PROBLEMAS INDECIDIBLES PARA LENGUAJES LIBRES DE CONTEXTO. .............. 108
LECCIÓN 33. DIFERENCIAS ENTRE LAS COMPUTADORAS Y LAS MÁQUINAS DE TURING ..... 116
LECCIÓN 44. APLICACIONES DE LAS MAQUINAS DE ESTADOS. ALGORITMO DE TRELLIS. ..... 135
7
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 45: ALGORITMO DE VITERBI ..................................................................................... 149
LISTA DE FIGURAS
Pág
8
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 29: Equivalencia de una AFND con un AFD 60
Figura 30: AF distintos que aceptan un miso lenguaje. 61
Figura 31: Árbol de comparación de AF. 62
Figura 32: Autómata a minimizar 64
Figura 33: Eliminación de estados en un autómata AF 66
Figura 34: Eliminación de otros estados en un autómata AF 66
Figura 35: Eliminación de otros estados en un autómata AF 67
Figura 36: Tabla de estados distinguibles 68
Figura 37: Autómata obtenido de la Gramática 1. 73
Figura 38: Autómata obtenido de la Gramática 1 generado con un simulador. 73
Figura 39: Autómata obtenido de la Gramática 2. 74
Figura 40: Autómata obtenido de la Gramática 2 generado con un simulador. 75
Figura 41: AFD y su gramática. 76
Figura 42: Árbol de derivación para una secuencia de paréntesis
bien balanceados. 80
Figura 43: Árbol de derivación para la cadena aabbaa 80
Figura 44: Árbol de derivación para la cadena aabbaa generado en JFLAP 81
Figura 45: Derivaciones por la izquierda, generadas en JFLAP 81
Figura 46: Arboles de derivación para la gramática G3 82
Figura 47: Arboles de derivación para una gramática ambigua 83
Figura 48: Arboles de derivación para una gramática ambigua para a5 84
Figura 49: Arboles de derivación para a5 84
Figura 50: Arboles de derivación para paréntesis balanceados 87
Figura 51: Arboles de derivación para paréntesis balanceados 89
Figura 52: Arboles de derivación en el lema de bombeo 91
Figura 53: Formalización de un PDA 93
Figura 54: Transición de un PDA 95
Figura 55: Estructura de un PDA para =aabb 97
Figura 56: Diseño de un PDA para =aabb 97
Figura 57: Funciones de la Pilas. 99
Figura 58: Unión de AP. 100
Figura 59: Autómata AFPD. 101
Figura 60: Grafo para L finito y L infinito. 107
Figura 61: Componentes de una MT 111
Figura 62: Máquina de Turing simulada en JFLAP 115
Figura 63: Modelo de un sistema de comunicaciones digitales 139
Figura 64: Código secuencial 140
Figura 65: Codificador convolucional de m etapas 141
Figura 66: Máquina de estados. Registro de desplazamiento convolucional
de ratio ½ y una etapa 142
Figura 67: Máquina de estados. Registro de desplazamiento convolucional
(datos 000 y 100) 142
Figura 68: Máquina de estados. Registro de desplazamiento convolucional
(datos 010 y 110) 143
Figura 69: Diagrama de estados para el codificador convolucional de ratio 1/2 143
9
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 70: Codificador convolucional de ratio 1/3 y m=3 144
Figura 71: Árbol para un codificador convolucional de ratio 1/2 144
Figura 72: Diagrama de Trellis (transición de estados). 145
Figura 73: Diagrama de Trellis completo (transición de estados). 146
Figura 74: Datos correctos codificados 148
Figura 75: Distancia de Hamming 150
Figura 76: Distancia de Hamming Nivel 1. 150
Figura 77: Distancia de Hamming Nivel 2. 151
Figura 78: Distancia de Hamming Nivel 3. 151
Figura 79: Diagrama de Viterbi.. Trayecto de recorrido óptimo. 152
Figura 80: Solución final Trellis y Viterbi. Datos de entrada 11010011. 153
LISTA DE TABLAS
Pág
10
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
INTRODUCCIÓN
Los contenidos que s e documentan y explican, llevan al lector a que asimile dos temáticas básicas
para esta área de conocimiento:
• Junto al anterior bloque, el lector comprenderá y abordará los tres tipos de máquinas
correspondientes para el reconocimiento de esos lenguajes como son: (autómatas finitos,
autómatas a pila y máquinas de Turing) y las propiedades fundamentales de las familias
de lenguajes por ellos definidas, también realiza el estudio de las condiciones
necesarias para que un lenguaje sea de un tipo determinado.
La necesidad objetiva de comprender las temáticas, sumada a las dificultades que muchos
lectores presentan para comprender y asociar la automatización a la solución de problemas
reales mediante máquinas abstractas o a la identificación de problemas solubles, insolubles
e indecidibles, me ha llevado a hacer uso de raciocinios sencillos sin necesidad llegara
demostraciones matemáticas, jugando un papel secundario la implementación de
algoritmos.
11
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Se presentan temáticas que son base para comprender los lenguajes de programación de
alto y bajo nivel y que propician la distinción entre lenguajes formales con reglas
sintácticas y semánticas rígidas, concretas y bien definidas, de los lenguajes naturales
como el inglés o el español, donde la sintaxis y la semántica no se pueden controlar
fácilmente. Los intentos de formalizar los lenguajes naturales, lleva a la construcción de
gramáticas, como una forma de describir estos lenguajes, utilizando para ello reglas de
producción para construir las frases del lenguaje. Se puede entonces caracterizar un
lenguaje mediante las reglas de una gramática adecuada.
Muchos autores referenciados en las fuentes bibliográficos y de los cuales se han tomado
análisis y ejercicios clave para poder comprender la temática, usan diferentes tipos de
nomenclaturas, fórmulas y símbolos, ya que como tal, los lenguajes, expresiones regulares,
funciones entre otros deben representarse matemáticamente. Para estandarizar de manera
sencilla, se presenta como Anexo a este libro, la lista de símbolos usados y su significado.
Finalmente les he desarrollado un material en video que les apoya el desarrollo de los
ejercicios de este libro, unos tomados de otras fuentes documentales y otros de autoría
propia y que están a disposición para su descarga o visualización.
13
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Símbolo Nombre Significado /Ejemplo
AZUL Estados Para efectos de representar diagramas de Moore, tablas de
NARANJA Transiciones transición: El libro representa los componentes diferenciando
NEGRO Símbolos y colores: Ejemplo:
cadenas
ROJO
Estado inicial
Estado final
(doble círculo)
∑ Sigma Alfabeto
L Letra Ele Lenguaje sobre un determinado alfabeto ∑
mayúscula
M Eme Máquina de estados Finitos
A A Autómata
K Ka Suele denotar el conjunto de estados de un autómata
F Efe Suele denotar el conjunto de estados finales de un autómata
S Ese Suele denotar el estado inicial de un autómata
Sigma Denota una función.
Ro Función de transición de un autómata
Omega Denota una cadena o palabra sobre un alfabeto
Upsilon Denota una cadena o palabra sobre un alfabeto
Alpha Otras cadenas. En algunos caso indica una Expresión Regular (ER)
Beta Otras cadenas. Muy usado en denotar cadenas en gramáticas.
Lambda Representa una cadena vacía
∆ Delta
Gamma Suele denotar el Alfabeto de una Pila (AP) ó (PDA)
Gammar Suele denotar un conjunto de cadenas de un PDA
G Ge Representa una gramática
Unión
Intersección
≤ Comparación Menor o igual que
≥ Comparación Mayor o igual que
< Comparación Menor que
ANEXO 1:
Los siguientes son los símbolos usados en el presente libro y son la base para todos los
ejercicios y temáticas expuestas. Muchos autores difieren en el tipo de simbología usada,
pero se ha procurado consolidar y usar los más comunes acorde a su significado y
aplicabilidad.
14
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
ANEXO 2: PRESABERES: TEORÍA DE CONJUNTOS
I. GENERALIDADES:
Las nociones básicas de la Teoría de conjuntos, son necesarias para el inicio del estudio de la
Teoría de la Computación.
Dado dos conjuntos A y B, estos son exactamente iguales si contienen exactamente los
mismos elementos: A={1,2,3} y B ={2,3,1}, es válido afirmar y escribir que A=B. No se tienen
en cuenta las repeticiones de elementos ni tampoco el orden de estos.
Es relevate para este estudio diferenciar que a y {a} no son lo mismo a {a}.
Teorema 2. Si A B y B C , entonces A C
16
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Conjunto Vacío: Es llamado también nulo y es aquel que no tiene elementos. Se denota
como . El conjunto vacío es un subconjunto de todos los conjuntos; por lo cual es válido
denotar: A para todo conjunto A.
B= {x A | x cumple la propiedad P}
Sea P(x) una proposición sobre x. La notación {x | P(x)} se interpreta como: “el conjunto de
todos los x tales que P(x)”, denota el conjunto de todos los x para los cuales P(x) es una
proposición verdadera. Ejemplo 4:
En aritmética básica se pueden trabajar tres operaciones: sumar restar y multiplicar dos
números. E la teoría de conjuntos existen tres operaciones que son análogas a la suma, resta
y multiplicación.
17
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Conjunto Potencia: Se denota como 2A . La colección de todos los subconjuntos de A es a
su vez un conjunto llamado conjunto potencia. Al conjunto potencia de A también se le suele
llamar conjunto de las partes de A y se nota como P(A).
O de igual forma: 2A {x | x A}
El conjunto vacío siempre forma parte de todo conjunto potencia. La notación 2A recuerda que
el tamaño del conjunto potencia de A es 2 elevado a la potencia del tamaño de A, esto es, |2A |
= 2|A| .
Ejemplo 12: Sea U (El Universo de los números naturales), el complemento de los números
múltiplos de tres (3) {3,6,9,12,15,...}c = {1,2,4,5,7,8,10,11,13,14, ….}.
I.III RELACIONES:
Ejemplo 13: Sea el conjunto A = {a, b, c}. El grafo de la figura (1) representa una relación
binaria definida en A, puesto que los pares (c,a), (b,a) (b,b) constituyen un subconjunto de A
x A.
20
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 1: Grafo relación binaria
Fuente:<El autor>
Ejemplo 14: La relación “ ≤” contiene los pares de los números naturales tales que el primer
componente es menor o igual al segundo, esto es,
≤ = {(1,1),(1,2),(1,3),(1,4),(2,3)…}
Téngase en cuenta que se llama par ordenado a una pareja de objetos escritos entre
paréntesis y separados por comas.
Por ejemplo, (a,b) es un par ordenado y a,b son los componentes del par ordenado. No es lo
mismo (ya que el orden si influye), lo siguiente:
(a, b) {a , b}
(a , b) (b, a )
Sin embargo: {a , b} {b , a}
El orden si influye, sin embargo, no todos los subconjuntos del producto cartesiano,
pueden ser aceptados como la relación de la condición que exprese. Algunas
características de estas relaciones son:
21
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 3: Una Relación Antireflexiva.
Fuente:<El autor>
Simétrica: Cada relación de ida tiene otra de vuelta. Ejemplo 18 Si A={1,2,3,4} y R es tal
que R = {(-1, -1), (-1, -3), (2, 2), (2, 4), (-3, -1), (-3, -3), (4, 2), (4, 4)}.
Fuente:<El autor>
Antisimétrica: Ninguna flecha de ida tiene otra de vuelta, salvo en el caso de los bucles,
que están permitidos. Ejemplo 19 Si A = {1, 2, 3, 4} y R es la relación “ ser menor o igual
que”, se tiene: R = {(1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4), (1, 1), (2, 2), (3, 3), (4, 4)}
Figura 5: Una Relación Antisimétrica
Fuente:<El autor>
Transitiva: Si existen dos relaciones o flechas consecutivas, debe haber otra que una el
primer elemento con el tercero. Ejemplo 20 Si A = {1, 2, 3, 4} y R es la relación “ser mayor
que”, se tiene: R = {(3, 2),(2, 1), (3, 1), (4, 1), (4, 2), (4, 3)}
23
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 6: Una Relación Transitiva
Fuente:<El autor>
Otra forma de interpretar esta relación dice que siempre que contiene los pares (x,y) y (y,
z) también contiene (x, z ). Por ejemplo, la relación {(1,2), (2,3), (1,1), (1,3)} es transitiva,
pero {(2,3), (1,2), (1,1)} no lo es.
Fuente:<El autor>
I.IVFUNCI
ONES:
Las funciones son un caso particular de las relaciones. Simplemente son asociaciones,
combinaciones o relaciones en las que no hay dos pares ordenados que tengan el mismo
primer componente. Es decir, los pares ordenados asocian a cada primer componente un
único segundo componente. Por ejemplo, la relación {(1,2), (2,3), (1,3)} no es una función,
pero {(1,2), (2,3), (3,3)} sí lo es.
En conjuntos, la notación habitual suele ser : f(1) = 2 que significa que a partir de la
entrada 1 se obtiene la salida 2. (se usa la f como indicador de la función). En Autómatas.
La función suele denotarse con el símbolo
24
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Para la teoría de autómatas. Las funciones son vistas desde la perspectiva de lenguajes
aceptados, por eso la temática que aborda as funciones en conjuntos como las funciones
totales, inyectivas y sobreyectivas, pueden referenciarse en:
Se da inicio a un concepto: Máquinas secuenciales, que hacen parte también del estudio
de la teoría de autómatas y que tienen sus inicios en el campo de la Ingeniería Electrónica.
El fin de los modelos no es la de describir detalles de los componentes de hardware de un
computador, sino de determinar características poco visibles o intangibles de estas
máquinas como por ejemplo capacidad de proceso, memoria, procesamiento de datos e
información. Es por ello que se han dividido en diferentes áreas de conocimiento este tipo
de estudio como por ejemplo: Arquitectura de computadores, Sistemas de información,
sistemas Distribuidos lógica Matemática, Ensamble de máquinas, entre otros.
Los Lenguajes más sencillos son los considerados lenguajes regulares, es decir, los que se
pueden generar a partir de lenguajes de un elemento con la aplicación de ciertas
operaciones estándar realizadas un número finito de veces.
Estos son pues los lenguajes que pueden reconocer los dispositivos llamados Autómatas
finitos (AF) que son máquinas de cómputo con memoria muy restringida. En esta
unidad se considera como segundo aspecto la idea de que un lenguaje no sea regular,
además de proporcionar un modelo sencillo de computación que se puede generalizar
en las unidades siguientes.
1845 -1918 Iniciada por Godel, Church, Post, Turing y Kleene, tiene sus raíces en la
Lógica Matemática. Ya se había inventado la Teoría de Conjuntos
1
<NAVARRETE,Isabel. Teoría de Autómatas y lenguajes Formales. Departamento Ingeniería. Universidad de Murcia. P 133.
Sept 2008>
26
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Turing
>Calculan los algoritmos A y B la misma función? (Problema de la
equivalencia)
>Parará el algoritmo A para una de sus entradas? (Problema de la parada)
> Parará el algoritmo A para todas sus entradas? (Problema de la totalidad)
> Parará el algoritmo A la función f? (Problema de la verificación)
1954 - 1969 El matemático norteamericano Shanon (que luego se haría famoso por su
Teoría de la Información) vino a establecer las bases para la aplicación de
la Lógica Matemática a los circuitos combinatorios y posteriormente
Huffman en 1954 los amplio a circuitos secuenciales y utiliza conceptos
Máquinas como estado de un autómata y tabla de transición. A lo largo de las décadas
secuenciales y siguientes, las ideas de Shanon se desarrollaron considerablemente, dando
Autómatas finitos. lugar a la formalización de una Teoría de las Maquinas Secuenciales y de
los Autómatas Finitos (1956). Otros trabajos importantes sobre maquinas
secuenciales son debidos a Mealy (1955) y Moore.
1956 en adelante Noam Chomsky propone en 1956 tres modelos para la descripción de
lenguajes, que son la base de su futura jerarquía de los tipos de lenguajes
Noam Chomsky (1959), que ayudo también en el desarrollo de los lenguajes de
propone varios programación. Chomsky estableció una clasificacion de gramáticas de
modelos para acuerdo con el formato de sus producciones y distinguió cuatro clases
clasificar: fundamentales de lenguajes y relaciones de inclusión entre ellas.
Gramáticas y
Lenguajes formales.
Fuente: El Autor
http://youtu.be/tO-WgRXKcAo
Tras las huellas de la mente de Alan Turing. La polémica historia de esta brillante mente.
Un reto complejo para quienes quieran entender y seguir sus pasos. "Un genio trágico".
Solo escúchenla y quedarán sorprendidos del legado que Alan Turing ha dejado.
Historia de Alan Turing. (23 de Junio de 1912 - 7 de Junio de 1954). Matemático inglés.
Historia contada al estilo de Diana Uribe. (Historiadora Colombiana a quién admiro y le
expreso mi más sentido agradecimiento por contarnos todas las historias que han
marcado el rumbo de la humanidad). Le reconozco sus derechos intelectuales por esta
narración que comparto a quienes me siguen en este reto de comprender como
funcionan las máquinas computacionales.
Película que cuenta la historia de un genio controvertido "Alan Turing". Con subtítulos http://youtu.be/uoKLtu2Am6k
en español.
DANGEROUS KNOWLEDGE. “Conocimientos peligrosos”. El documental, narrado por PARTE 1: CANAL VIMEO
David Malone, se centra en la vida de cuatro brillantes matemáticos - Georg Cantor, http://vimeo.com/30482156
Ludwig Boltzmann, Kurt Gödel y Alan Turing -, lo que rodeó sus descubrimientos y las PARTE 2: CANAL VIMEO
reacciones de la comunidad científica hacia ellos, así como la evolución de sus http://vimeo.com/30641992
personas hasta el declive. Sus trabajos han llegado a influir enormemente incluso en
ámbitos no científicos, o en la perspectiva de como observamos el mundo en general y
nuestro pequeño entorno en particularmente. Desafortunadamente sus mentes
privilegiadas no pudieron impedir que llegaran a enloquecer hasta el punto de cometer
suicidio.
O consulta esta URL:
http://www.mates.byethost4.com/audiovisuales/matematicas/documentales-bbc.html
Secretos de la segunda guerra mundial. “El código Eigma”. El trabajo de los http://youtu.be/EVQNosg6wEQ
criptógrafos.
Tabla 4:
Recursos
web
referentes a
la historia
de la
temática.
28
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
problema. Los símbolos de un alfabeto pueden ser números, letras, entre otros y suelen estar
escritos en minúsculas.
Ejemplo: Sea A = {0,1} indica el Alfabeto A compuesto por los símbolos 0,1
No hay que confundir los símbolos del alfabeto B con los símbolos del lenguaje (o más precisamente
meta-lenguaje) que usamos para expresarnos todos los días. Son dos cosas totalmente distintas.
Nosotros para comunicarnos usamos un lenguaje que tiene unos símbolos que son las letras del
alfabeto latino, los números, las letras del alfabeto griego, y una serie de símbolos especiales propios
del lenguaje matemático (el meta-lenguaje). Con este lenguaje también definimos los conceptos de
alfabeto y símbolo.
Definición2. Una palabra o cadena sobre un alfabeto ∑ es una sucesión finita de elementos de ∑. Se
suele denotar con la letra omega
Ejemplo 21: Si A = {0,1} entonces 0111 es una palabra sobre este alfabeto.
Definición3. Si *
entonces la longitud de la palabra es el número de símbolos de ∑
que contiene.
Definición4. La palabra vacía es la palabra de longitud cero. Es la misma para todos los alfabetos y
se denota como
Definición5. Al conjunto de todas las palabras o cadenas sobre el alfabeto ∑ en las que se
excluya la cadena vacía se denota como:
Tabla 5: Recursos web para alfabetos, cadenas y lenguajes.
DESCRIPCIÓN DE VIDEO CANAL CANAL
29
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
*
OPERACIONES SOBRE EL CONJUNTO UNIVERSAL DE CADENAS
*
Las operaciones fundamentales que se derivan del tratamiento del conjunto , son las de
concatenación:
Ejemplo 22 Para definir la concatenación: Dada las siguientes cadenas , formadas desde el
alfabeto ∑ :
*
Concatenación: Si , , a1.....an, b1.....bn , se llama concatenación de y
| . | | | | |, , *
Asociativa: .( .) ( . ). , , , *
Elemento neutro: . . , *
*
Si entonces 0
y i 1 i
. , para todo i 0
Se define una cadena inversa así:
* 1 *
Si a1...an entonces la cadena inversa de es la cadena an...a1
Se notan los siguiente ejemplos de algunos lenguajes (sin definir su jerarquía que se verá
en la siguiente lección) sobre el alfabeto ∑
L1 {a,b,c, } Lenguaje uno compuesto por los símbolos a,b,c de un determinado alfabeto
incluyendo la cadena vacía.
30
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
2
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 3. AUTÓMATAS Y LENGUAJES
Los (LP) se rigen por reglas de sintaxis y semántica más complejas y definidas y que
finalmente son manejadas por los computadores. En los lenguajes naturales (LN), estos
no están tan definidos ni delimitados, ya que están controlados por reglas gramaticales que
evolucionan y derivan nuevos lenguajes.
Gracias a las estructuras definidas de los lenguajes de programación (LP) (las reglas
gramaticales (sintaxicas y semánticas) han posibilitados la construcción de traductores
automáticos para estos lenguajes. Algunas definiciones que contextualizan estas temáticas
referencian a los Compiladores como software que traduce un programa escrito en un
determinado lenguaje de programación a otro lenguaje de programación, con el objeto de
generar u programa equivalente que una máquina computacional pueda interpretar para
podérselo mostrar al usuario.
Los pasos de definir e identificar reglas gramaticales, son claves en el proceso de traducción.
2
Tomado de https://es.wikipedia.org/wiki/Int%C3%A9rprete_%28inform%C3%A1tica%29 con acceso Julio de
2013
32
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 8: Proceso de traducción realizado por un compilador
Fuente:<El autor>
LECCIÓN 4.
LENGUAJES REGULARES
33
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 9: Clasificación de los Lenguajes. Jerarquía de Chomsky. N
Fuente:<El autor>
A → bC
A→b
A→
dónde: A,C VN y b VT
A → Cb
A→b
A→
Para cada Gramática lineal por la derecha existe una Gramática lineal izquierda que
genera el mismo lenguaje y viceversa.
Los Lenguajes Regulares son lenguajes formales que tienen estas características:
34
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Puede ser descrito mediante una expresión regular (expresar de forma compacta cómo
son todas las cadenas de símbolos que le pertenecen).
Puede ser generado mediante una gramática regular (obtener todas las cadenas de
símbolos que le pertenecen).
Puede ser reconocido mediante un autómata finito (saber si una cadena de símbolos
pertenece a él o no)
Los lenguajes generados por este tipo de gramáticas se llaman lenguajes libres del contexto
y la clase es L2, que incluyen a los Lenguajes Regulares. Por ejemplo, la mayoría de los
lenguajes de programación son Lenguajes Libres de Contexto.
A →
Los lenguajes generados por las gramáticas de tipo 1 se llaman lenguajes sensibles al Contexto
y su clase es L1:
TIPO 0: (Gramáticas con estructura de frase) Son las gramáticas más generales, que por
ello también se llaman gramáticas sin restricciones. Esto quiere decir que las producciones
pueden ser de cualquier tipo permitido, es decir, de la forma:
Los lenguajes generados por estas gramáticas son los lenguajes con estructura de frase,
que se agrupan en la clase L0: Estos lenguajes también se conocen en el campo de la
Teoría de la Compatibilidad como lenguajes recursivamente enumerarles.
35
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
La siguiente tabla muestra la asociación de las gramáticas con el lenguaje que genera y el tipo
de máquina abstracta que la trabaja:
Fuente:<El autor>
Cuanto menor es el tipo, mayor es el poder expresivo del lenguaje generado y más complejidad tiene
su tratamiento por parte de una máquina.
Esto es: L3 L2 L1 L0
Un lenguaje se dice que es de tipo i (i= 0;1;2;3) si y solo si es generado por una gramática de tipo i.
La clase o familia de lenguajes de tipo i se denota por Li.
LECCIÓN 5. AUTÓMATA
La palabra autómata evoca algo que pretende imitar las funciones propias de los seres
vivos, especialmente relacionadas con el movimiento, por ejemplo el típico robot
antropomorfo. Un ejemplo de una “maquina real” que automatiza un proceso puede ser
una máquina empacadora de algún producto que se fabrique en serie y con una serie de
instrucciones, pasos y características definidas e iguales para cada salida (producto final).
36
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
En el campo de los Traductores, Procesadores, Compiladores e Intérpretes, lo
fundamental no es la simulación del movimiento, sino la simulación de procesos para tratar
información. Este es el enfoque dado a la temática de este curso.
Las maquinas que se estudiarán son abstracciones matemáticas que capturan solamente
el aspecto referente a las secuencias de eventos que ocurren, sin tomar en cuenta ni la
forma de la maquina ni sus dimensiones (aspectos de hardware por referir una analogía).
En esta parte estudiaremos las maquinas abstractas más simples, los autómatas finitos, las
cuales están en relación con los lenguajes regulares
Los estados son la base de un diseño de los modelos que estamos estudiando, pues “recuerdan” las
situaciones básicas por las que pasa el proceso.
Las condiciones asociadas a los estados deben ser excluyentes, esto es, no deben
verificarse varias simultáneamente.
37
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Las condiciones asociadas a los estados deben ser comprensivas. Se deben
cubrir todas las combinaciones posibles entre todos los estados.
Fuente:<El autor>
La cabeza lectora se coloca en los segmentos de cinta que contienen los caracteres que
componen la palabra de entrada, y al colocarse sobre un símbolo lo “lee” y manda esta
38
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
información al control (digámoslo así controlado por unas reglas o producciones). El recorrido puede
ser a izquierda o derecha según el diseño de la máquina.
La “aguja” del control puede estar cambiando de posición, (de un estado a otro) y hay
algunas posiciones llamadas finales (como la indicada por un punto, q3) que son
consideradas especiales, porque permiten determinar si una palabra es aceptada o
rechazada.
Pero para describir los lenguajes (caracterizarlos) se suelen usarlas Expresiones Regulares (ER), que
abordaremos en lecciones siguientes con detenimiento.
Otra forma de describir la sintaxis de los lenguajes es usando gramáticas y sus reglas de
producción. El objetivo de caracterizar lenguajes es proporcionar una forma concisa y
relativamente sencilla (aunque menos intuitiva) para describir los lenguajes regulares,
exponiendo detalles de su estructura que no quedan tan claros en las otras
caracterizaciones.
“Los símbolos y notaciones matemáticas usados, serán los que durante todo el desarrollo del contenido se
aplicarán para describir matemáticamente estas máquinas. Otros autores usan otra
39
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
simbología, que solo difiere en la forma mas no en la interpretación de las definiciones formales de
estas máquinas. Se ha estandarizado las simbología más sencilla para efectos de didáctica e
interpretación”
∑ es el alfabeto de entrada.
s K es el estado inicial.
Tabla de transiciones.
Diagrama de Moore.
Tabla de transiciones: Consiste en una tabla, con tantas filas como estados y tantas
columnas como entradas. El estado inicial en la columna izquierda está indicado con una
flecha. El estado final en la columna izquierda está indicado con un numeral. (No confundir
esto con la estrella de kleene que se verá más adelante en la lección de Expresiones
Regulares). Ejemplo 24 Se puede representar el autómata finito dado por:
este ejemplo:
Donde la función δ : {q0, q1, q2, q3 } × {0, 1} → {q0, q1, q2, q3} viene dada por:
δ(q0, 0) = q0 δ(q0, 1) = q1
δ(q1, 0) = q0 δ(q1, 1) = q2
δ(q2, 0) = q3 δ(q2, 1) = q1
δ(q3, 0) = q3 δ(q3, 1) = q2
40
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
La tabla de transición correspondiente a este autómata será:
Diagramas de Moore: Los diagramas de Moore son otra forma de representar las
funciones de transición y salida de un autómata . El diagrama de Moore es un grafo
orientado en el que ca da nodo corresponde a un estado. Para el ejemplo 24, el diagrama
de Moore equivalente estaría definido así:
Los estados son el único medio de que disponen los AF para recordar los eventos que
ocurren (por ejemplo, que caracteres se han leído hasta el momento); esto quiere decir que
son máquinas de memoria limitada. En última instancia, las computadoras digitales son
máquinas de memoria limitada, aunque la cantidad de estados posibles de su memoria
podría ser enorme.
42
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Otras apreciaciones de estos AFD lo definen como otro mecanismo para describir
lenguajes. En vez de pensar en generar las cadenas (como las ERs), un AFD describe un
lenguaje mediante reconocer las cadenas del lenguaje, y ninguna otra.
1. se coloca en la cinta de entrada, con un símbolo en cada celda. (en este caso es aaabab )
Ciclo de ejecución básico del autómata: Como cualquier computador, una vez se ha inicializado,
comienza la ejecución desde la palabra de entrada .
1. se lee el símbolo actual, que es el apuntado por el cabezal de lectura. Si el cabezal apunta a una
celda vacía entonces el AFD termina su ejecución, aceptando la palabra en caso de que el estado
actual sea final y rechazando la palabra en caso contrario. Esto ocurre cuando se ha leído toda la
palabra de entrada, y se produce una situación similar a tener una condición “fin de chero" en la
ejecución de un programa
2. se calcula el estado siguiente a partir del estado actual y del símbolo actual según la función de
transición, esto es, (estado actual; símbolo actual) = estado siguiente
donde la función de transición está dada por: : {q0, q1, q2, q3 } × {x, z} → {q0, q1, q2, q3}
→ q0 → { q3}
43
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
La tabla de transición correspondiente a este autómata será: (tabla generada en el
simulador Visual Autómata Simulator VAS 3)
Figura 13: Tabla de transición para un Autómata Finito generado con software simulador VAS.
El diagrama de transición de un AFD tiene por cada nodo un solo arco etiquetado con
cada uno de los símbolos del alfabeto.
el diagrama de transición de un AFD tiene por cada nodo un sólo arco et iquetado
con cada uno de los símbolos del alfabeto.
33
VAS. Visual Autómata Simulator. Disponible en internet <http://www.vas.org>
44
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Otra condición es que debe haber exactamente un estado inicial.
la cantidad de estados finales puede ser cualquiera, inclusive cero (para algunos modelos),
hasta un máximo de |K| (la cantidad de estados).
Entiéndase por configuración un par (q, ) donde q es un estado y una palabra. En este
orden q será el estado en el que se encuentra el autómata y lo que queda por leer en un
momento dado.
Una extensión a los autómatas finitos deterministas es la de permitir que de cada nodo del
diagrama de estados salga un número de flechas mayor o menor que Así, se puede permitir
que falte la flecha correspondiente a alguno de los símbolos del alfabeto, o bien que haya
varias flechas que salgan de un solo nodo con la misma etiqueta. Inclusive se permite que
las transiciones tengan como etiqueta palabras de varias letras o hasta la
45
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
palabra vacía. A estos autómatas finitos se les llama no Determinísticos o no deterministas
(abreviado AFND). Al retirar algunas de las restricciones que tienen los autómatas finitos
Determinísticos, su diseño para un lenguaje dado puede volverse más simple.
Dado que los AFND tienen menos restricciones que los AFD, resulta que los AFD son un caso
particular de los AFND, por lo que todo AFD es de hecho un AFND.
Recordemos que para un AFD dado el estado actual y el siguiente caracter, el AFD pasa
exactamente a un siguiente estado. Por eso se lo llama determinístico. Una versión en
principio más potente es un AFND, donde frente a un estado actual y un siguiente caracter,
es posible tener cero, uno o más estados siguientes.
La configuración en quíntupla de elementos es la misma que las de un AFD (Lección 6), excepto la
función de transición que se define ahora como:
: K x ∑ → (K)
Donde (K) denota el conjunto de las partes de K o conjunto potencia 2K
Ejemplo 25 Si se tiene (q,a) = {q1, q2, …. , qm) lo que indica que estando en un estado
actual q y un símbolo de entrada a, el estado siguiente puede ser cualquier estado entre q1
y qm.
Ejemplo 26 Puede darse el caso que (q,a) = Ø lo que indica que el estado siguiente no está
definido.
46
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
= {(q1,a,q2),(q1,a,q3),(q2,b,q4),(q2,b,q2),(q3,a,q3),(q3,b,q4),(q4,a,q4)}
: K x (∑ U { }) → (K)
47
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Si se tiene un AFND- representado en su diagra ma de transición en la figura 16 , si se
evalúa el estado q6 y el símbolo actual que guarda en memoria ese estado es cero (0), el
autómata puede decidir en forma “no determinista” entre leer la cadena vacía y llegar al
estado q7 conservando el símbolo y terminar o aceptar la palabra en el estado q8, o bien
decidir si pasa al estado q4 y luego leer un 1 y seguir el recorrido.
LECCIÓN 10.
LENGUAJE ACEPTADO POR UN AF
Los AF reconocen cierto tipo de lenguajes, pero esto depende de la configuración del
autómata. Esta configuración viene dada por el instante del autómata en un momento
dado y la porción de cadena de entrada que le queda por leer (no la cadena completa).
48
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Configuración de aceptación: (qF, ) donde qF, es un estado final del autómata. Una vez
alcanzada esta configuración el autómata puede aceptar lapalabra.
Por lo que se concluye: que un AFD reconoce o acepta una palabra si se cumplen las siguientes
condiciones:
1. Se consumen todos los caracteres de dicha palabra de entrada, siguiendo las transiciones y
pasando en consecuencia de un estado a otro;
2. al terminarse la palabra, el estado al que llega es uno de los estados finales del autómata (los
que tienen doble círculo en los diagramas, o que son parte del conjunto F en la representación
formal).
Intuitivamente, un AFND acepta una palabra de entrada siempre que sea posible
comenzar por el estado inicial y que exista una secuencia de transiciones que nos lleven a
consumir la palabra y acabe el autómata en un estado final. Puede que tengamos otras
secuencias de transiciones que no acaben en estado final, pero basta que exista una que
acabe en estado final para que la palabra sea aceptada.
49
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
∑ = {a,b}, F = {q 2} s = {q 0} y K = { q0, q 1 , q 2 } y representado en el diagrama de estados
de la figura 17.
Fuente:<El autor>
50
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
CAPITULO 3: EXPRESIONES Y LENGUAJES REGULARES
Los Lenguajes regulares son los más simples y restringidos dentro de la jerarquía de
Chomsky. Estos lenguajes pueden además ser descritos mediante dos representaciones
que veremos: las Expresiones Regulares y las Gramáticas Regulares que serán los temas
a tratar en las siguientes lecciones. También son descritos mediante AFD y AFND.
Algunas propiedades se aplican a estos Lenguajes Regulares como por ejemplo si se combinan dos
lenguajes regulares, también se obtiene un lenguaje regular. L1 U L2 = L3
Definición 10: Un lenguaje L es regular si y solos i se cumple al menos una de las siguientes
condiciones:
• L es finito;
• L es la unión o la concatenación de otros lenguajes regulares R1 y R2, L = R1 U R2 o L=
R1R2 respectivamente
Una expresión regular (ER) es una notación normalizada para representar lenguajes
regulares, es decir, lenguajes generados por gramáticas de tipo 3. Las expresiones
regulares permiten describir con exactitud y sencillez cualquier lenguaje regular. Para definir
una ER se pueden utilizar todos los símbolos del alfabeto ∑ y, además y . Los
operadores que también se pueden utilizar son:
+ representa la unión.
representa la concatenación (este símbolo no se suele escribir).
* representa el cierre de Kleene () modifican las propiedades de
los demás operadores.
51
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Una ER también se define bajo los siguientes criterios: (Se muestran también los lenguajes que
describen estas ER)
L + = L UL
5. Si y son ER entonces también lo es y representa al lenguaje
L = L L
6. Si es una ER entonces * también lo es y representa el lenguaje
* i 0 i El orden de
Este orden puede alterarse mediante paréntesis, de forma análoga a como se hace con las
expresiones aritméticas.
31:Sea ∑ = {0,1}
Ejemplos
1. 01+001 es una ER que representa el Lenguaje L={01,001} (acepta una cadena 01
ó una 001, pero no ambas ni la combinación de las mismas).
2. 0*10* es una E R que representa a cualquier cadena binaria en la que hay un solo
1. L={0n10m │ n,m ≥ 0}.
53
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
6. (1 + 10)* representa el lenguaje de las cadenas que comienzan por 1 y no tienen dos
ceros consecutivos.
7. (0 + 1 )* 011 representa el lenguaje de las cadenas que terminan en 011
8. 0* 1* representa el lenguaje de las cadenas que no tienen un 1 antes de un 0 9. Si ∑ =
{a,b,c} y si (a + ) b* es una ER que denota el Lenguaje
L = {a b : i = 0,1 : j ≥ 0 }
i j
Hasta ahora, la relación entre los autómatas finitos y las expresiones regulares se ha tratado
de una manera intuitiva. Ahora formalizaremos dicha relación probando que para cualquier
expresión regular exista un autómata finito equivalente. Lo que se establece ahora con un
teorema fundamental en el estudio de los Autómatas:
Teorema5 de Kleene: Un lenguaje es regular si y sólo si es aceptado por algún autómata finito.
Hasta ahora hemos confirmado como las, ERs, AFDs y AFNDs son mecanismos equivalentes para
denotar los lenguajes regulares.
Para ello se usan las gráficas de transición (GT). Estas últimas son esencialmente AFND en
que las etiquetas de las flechas tienen expresiones regulares, en lugar de palabras. Entonces
se definen las gráficas de transición (GT) así: son por lo tanto quíntuplos
En este ejemplo en particular se evidencia que se d ebe aceptar palabras que tienen
s s
primero una sucesión de a‟ , luego repeticiones de ab, y finalmente repeticiones de b‟ .
({q0, q1}, {a, b}, {(q0, a, q0), (q0, (ab)*, q1), (q1, b, q1)}, q0, {q1})
Los AFN son un subconjunto propio de las GT, puesto que las palabras en las etiquetas
de un AFN pueden ser vistas como expresiones regulares que se representan a sí
mismas.
55
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
La figura 2 1 muestra un proceso de eliminación gradual de los operadores de las ER en
donde Gn AFND con las operaciones elementales y necesarias. Para eliminar los
operadores de las ER en Gi, aplicamos reemplazamientos de ciertas transiciones por
otras, hasta que no sea posible aplicar ninguno de estos reemplazamientos.
4
Ejemplo 32: Tomado de: Dada la ER= (a + ba)* bb , obtener el AFN que acepta el
lenguaje de dicha ER.
4
<BRENA,R; Autómatas y lenguajes, un enfoque de diseño. 2003. Monterey. 214p>
56
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
CONVERSIÓN DE AF a ER: El procedimiento indica que se deben ir eliminado
gradualmente nodos de una GT que inicialmente es el AFN que se quiere transformar, hasta
que únicamente queden un nodo inicial y un nodo final.
El procedimiento aplica los siguientes pasos: Para ello se ilustra el siguiente ejemplo:
La figura 24 muestra estas acciones realizadas (se adiciona un nuevo estado inicial y final) para
este primer paso para el ejercicio 33 propuesto.
5
Bis(4).
57
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 24: Obtención de una ER a partir de un AF PASO1
PASO 2 : Eliminación de nodos intermedios. Eliminamos primero el nodo q1. Para ello,
consideramos que trayectorias o “rutas” pasan por el nodo a eliminar. Por ejemplo, en la
figura 23 vemos solamente una trayectoria que pasa por q1, la cual va de q0 a f.
Ahora nos proponemos eliminar el nodo q1, pero sin modificar “lo que se gasta” para
pasar de q0 a f. Es fácil ver que para pasar de q0 a f se gasta primero una a y luego algún
número de repeticiones de a o b (para llegar de q1 a f no se gasta nada). Esto
corresponde a la ER a(a + b)* , que sería la etiqueta de la nueva “ruta directa” de q0 a f,
sin pasar, por q1, como se evidencia en a figura 25.
58
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 26: Obtención de una ER a partir de un AF PASO3. Eliminación de nodo.
59
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 14.
EQUIVALENCIA AFD
DE Y AFN
D
M = (∑, K , , q , F)
0
dado por (obsérvese que lo único que no cambia es el
alfabeto):
K = P(K)
q0 = {q0}
= (∑,a) = * (∑,a)
60
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
En el que se concluye: Teorema 6: Un AFND M y su correspondiente Autómata determinístico M
aceptan el mismo lenguaje.
De igual forma y a manera inversa para el teorema: dado un autómata finito determinístico
AFD M = (∑, K, , q0, F). se puede construir uno no-determinista: M = (∑, K, , q0, F).
(q0,a) = { (q0,q)}: en el que en cada situación solo hay un camino posible que es el que determine
la función de transición .
Para los autómatas de la figura 28; Reconocen el lenguaje formado por todas las cadenas
que empiezan por 1 excepto las terminadas en dos ceros consecutivas, Además se debe
incluir la cadena vacía. Ambos autómatas reconocen el mismo lenguaje.
Teorema 7: Dos autómatas M1 y M2 son equivalentes, M1 M2, cuando aceptan exactamente el mismo
lenguaje.
Ejemplo 35: Tomado de: 6El siguiente ejemplo muestra cómo puede darse el caso en el que
varios AF distintos acepten un mismo lenguaje. La figura 30 muestra los autómatas (a) y
(b) que aceptan el lenguaje a*. Lo que se indaga ahora es si estos son equivalentes. Lo
que se concluye también que para comprobar la equivalencia se debe realizar una
demostración de igualdad de lenguajes (operación que suele ser compleja si son lenguajes
infinitos).
6
Bis (4)
61
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Método usado para probar los AF y determinar equivalencia: Son muchos y de diversas formas
de aplicación. El que se propone acá es basado en el teorema:
Teorema 8: Teorema de Moore: Existe un algoritmo para decidir si dos autómatas finitos
son equivalentes o no. Este algoritmo consiste en la construcción de un árbol de
comparación de autómatas. Este árbol permite convertir el problema de la comparación de
los lenguajes aceptados en un problema de comparación de estados de los autómatas.
Definición 11: dos estados q y q´ son compatibles si ambos son finales o ninguno de los dos
es final. En caso contrario, son estados incompatibles.
El único problema con esta idea estriba en que hay que garantizar que sean cubiertas todas
las posibles cadenas de caracteres w, las cuales son infinitas en general. Por ello se pensó
en explorar todas las posibles combinaciones de estados mediante un árbol. Dicho árbol de
comparación se construye de la manera siguiente, para dos autómatas:7
7
Bis (4)
62
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
La explicación del árbol es la que se describe así:
1. Inicialmente la raíz del árbol es el par ordenado (s, s´) que contiene los estados
iniciales de M y M´ respectivamente.
2. Si en el árbol hay un par (r, r´), para cada caracter en ∑ se añaden como hijos suyos
los pares (r ,r´ )donde r = (r, ), r´ (r´, )en caso de que no estén.
En el caso de los AFD, vamos a entender por simplificación la reducción en el número de estados,
pero aceptando el mismo lenguaje que antes de la simplificación.
De manera general: El único problema con esta definición es que, para verificar si dos
estados dados p y q (para el ejercicio sería q1 y q6) son equivalentes, habría que examinar,
64
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
para cada palabra posible de entrada, si intercambiarlos en las configuraciones altera o no
la aceptación de esa palabra. Esto es evidentemente imposible para un lenguaje infinito. La
definición nos dice qué son los estados equivalentes, pero no cómo saber si dos estados
son equivalentes.
Para saber si dos estados q1 y q6 son equivalentes, se les pone a ambos como estado
inicial de sendos autómatas M1 y M2 , y se procede a comparar dichos autómatas. Si éstos
últimos son equivalentes, quiere decir que los estados q1 y q6 son equivalentes.
Si dicha comparación de AFDs da un resultado de equivalencia, se concluye que los estados son
redundantes.
Una vez que se sabe que dos estados son equivalentes, se puede pensar en eliminar uno
de ellos, para evitar redundancias y hacer más eficiente a AFD. Sin embargo, la eliminación
de un estado en el AFD plantea el problema de qué hacer con las flechas que conectan al
estado eliminado con el resto del autómata. Esta cuestión se resuelve con los siguientes
criterios:
Entrada: (el autómata inicial sin minimizar) : Un AFD M = (∑, K, , q0, F) donde ∑
= {0,1}, F = {q2} s = {q0} y K = {q0, q1, q2 ,q3, q4, q5, q6, q7 }.
Salida: (un AFD mínimo como resultado): M = (∑, K”, ”, q0 “, F”) (nótese que el alfabeto no
cambia)
En la figura 33 se han identificado los estados q6 y q1 como candidatos a ser comparados para
eliminar (en este caso q6).
65
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 33: Eliminación de estados en un autómata AF
66
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Claramente se ve que el estado q7 es inaccesible, (o le llegan transiciones además) por
tanto, se puede eliminar este estado y sus transiciones. El autómata ya minimizado y
concluido se observa en la figura 35
Vamos a definir la noción de estados distinguibles, que intuitivamente quier e decir que si
dos estados son distinguibles, ya no pueden ser equivalentes. La definición es inductiva:
Los estados p y q son distinguibles si son incompatibles (es decir, uno es final y el otro no
final). Esta es la base de la inducción. Se puede verificar el ejercicio.
4. CONSTRUCCIÓN DE TABLA:
Construir tabla T con filas desde q1 hasta qn y columnas desde q0 hasta qn-1
Obsérvese que en la tabla Figura 3 6 se omite la diagonal principal, pues no tiene caso
confrontar cada estado contra sí mismo.
67
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 36: Tabla de estados distinguibles.
Empezamos en la parte inferior (eje horizontal) de menor a mayor desde q0 hasta qn-1
Luego el eje vertical de arriba hacia abajo: q1 hasta qn
Se aprecian signos “ ” en las celdas, que se obtienen directamente del hecho de que
son p ares de estados incompatibles – por lo tanto distinguibles . En otras palabras lo que
hemos hecho es: marcar (par (qi , qj)) donde un estado del par es final y el otro no.
Una manera de organizar el trabajo de verificar qué pares de estados de un AFD son
distinguibles, consiste en construir una tabla en que los renglones y las columnas son los
nombres de los estados, y en cada cruce de renglón con col umna se indica con una
cuando son distinguibles.
Resultado final: Al final quedan sin marcar PAR (q3,q0) y PAR (q6,q1) y por lo tanto:
q0 q3 y q1 q6
Todo el proceso de minimización además de otras características las puede visualizar en:
68
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Tabla 12: Recursos web para minimización de autómatas
DESCRIPCIÓN DE VIDEO CANAL CANAL
Los lenguajes independientes del contexto que también se conocen con el nombre de
gramáticas de contexto libre son un método recursivo sencillo de especificación de reglas
gramaticales con las que se pueden generar cadenas de un lenguaje.
Es factible producir de esta manera todos los lenguajes regulares, además de que existen ejemplos
sencillos de gramáticas de contexto libre que generan lenguajes no regulares.
Las reglas gramaticales de este tipo permiten que la sintaxis tenga variedad y refinamientos
mayores que los realizados con lenguajes regulares, en gran medida sirven para
especificar la sintaxis de lenguajes de alto nivel y otros lenguajes formales.
69
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
reglas para formar correctamente las frases de un lenguaje (ejemplo la gramática del
español, inglés, francés, etc).
Las características y notación específica de gramática fue dada por Chomsky,N, quién basó
esta descripción en las denominadas “Reglas Gramaticales”.
V = Es el alfabeto de variables
∑ = Es el alfabeto de constantes
A → aB o bien A → a
A → Ba o bien A → a
En donde A y B son las variables que pertenecen a V y a es un carácter terminal o constante que
pertenece a ∑.
70
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Ejemplo 37: La gramática G dada por V = {S,A} y ∑ ={0,1} y las producciones:
1. S → 0A 1. S → S10
2. A → 10A 2. S → 0
3. A →
Genera el mismo lenguaje: L(G) = 0(10)*
4. S → aA La idea para aplicar una gramática es que se parte de una variable, llamada símbolo
inicial (que en este caso es
S → bA
5. S), y se aplican repetidamente las reglas gramaticales,
6. A → aB (en este ejemplo hay 7 reglas gramaticales) hasta que ya no haya variables en la
palabra (las dos variables para
7. A → bB este ejemplo son a y b). En ese momento se dice que la palabra resultante es
generada por la gramática, o en
A→a
8. forma equivalente, que la palabra resultante es parte del lenguaje de esa gramática.
9. B → aA
Las constantes de esta gramática son a y b.
10. B → bA
L={ (a,b)* │ ∑ (que acepta las palabras en {a, b} de longitud par terminadas en a}
Se pueden derivar muchas otras palabras como bababa L(G) y que pertenecen también
al lenguaje generado por la gramática. Formalmente esta gramática se representaría como:
({S, A,B}, {a, b}, {(S, aA), (S, bA), (A, aB), (A, bB), (A, a), (B, aA), (B, bA)}, S)
71
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Una cadena ∑ (esto es, formada exclusivamente por constantes) es derivable a partir de
una gramática G si existe una secuencia de pasos de derivación:
S 1 2…
Definición 14: El lenguaje generado por una gramática G, L(G), es igual al conjunto de las
palabras derivables a partir de su símbolo inicial. Es decir:
L (G) = { ∑* │ S * }
Teorema 10: Si L es un lenguaje generado por una gramática regular, entonces existe un autómata
finito determinístico que lo reconoce.
Teorema 11: La clase de los lenguajes generados por alguna gramática regular es exactamente la de
los lenguajes regulares.
La prueba de estos teoremas consiste en proponer un procedimiento para, a partir de una gramática
dada, construir un autómata finito, y viceversa.
Para el caso de las reglas A → b, se tienen transiciones (A, b,Z), donde Z es un nuevo
estado para el que no hay un no terminal asociado; Z es el ´único estado final del autómata.
Ejemplo 39: Obtener un autómata finito para la gramática regular G1 siguiente: (V, ∑, R, S). Se
denota la gramática en un formato comprimido: (en fila):
S → aA │ S → bA │ A → aB │ A → bB │A → a │ B → aA │ B →bA Es
lo mismo que:
S → aA │ bA │, A → aB │ bB │ a │ , B → aA │ bA
72
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 37: Autómata obtenido de la Gramática 1.
En la Figura 3 8, haciendo uso del simulador JFLAP 8 , que dentro de sus opciones nos
permite introducir una gramática y generar el AF, se muestra el resultado de la conversión
automática de G → AF (de Gramática a Autómata Finito).
8
JFLAP Version 7.0 RELEASED August 28, 2009. Last update May 15, 2011. Disponible en internet.
<http://www.jflap.org/>
73
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
El autómata resultante será: M = (∑, K, , s, F) donde:
K {[ ] : ( S) ( A V, , talesque . A R )}
q0 = [S]
F = {[ ]}
Si a Ʃy ( *V ) , entonces ([ a ], a ) [ ]
Pasar a no -finales los estados finales originales y unir estos mediante una
transición nula con el nuevo estado final.
74
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Fuente: <Generado con JFLAP – El Autor>
75
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 41: AFD y su gramática.
LECCIÓN 17.
LENGUAJES LIBRES DE CONTEXTO Y SUS MÁQUINAS
.
76
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
1. Gramáticas regulares, o de tipo 3: Las reglas son de la forma A→ aB o bien A→ a,
donde A y B son variables y a es constante. Estas gramáticas son capaces de
describir los lenguajes regulares.
Los lenguajes de tipo 0 incluyen a los de tipo 1, estos a los de tipo 2, etc.
Las GLC tienen reglas menos rígidas que las gramáticas regulares. Así toda gramática regular es
GLC pero no viceversa
Algunos autores “ Brena R.” 9definen: Al proceso de aplicar una regla se le conoce como
“paso de derivación”, y se denota usando una flecha de dirección: . Una secuencia de
pasos de derivación a partir de una variable especial de la gramática llamada “símbolo
inicial” se llama simplemente “derivación”.
(V, ∑, R, S) en donde:
V = Es el alfabeto de variables
9
Bis (6)
77
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
∑ = Es el alfabeto de constantes, también llamadas terminales. En el que V y ∑ son disyuntos, es
decir: V ∩ ∑ = Φ
S ...
El lenguaje L(G) generado por una gramática (V, ∑, R, S) es el conjunto de palabras hechas
exclusivamente de constantes, que son derivables a partir del símbolo inicial:
L { * | S ... }
Las GLC tienen la propiedad de que las derivaciones pueden ser representadas en forma
de árbol ramificado o arboles de derivación, o también arboles de compilación por usarse
extensivamente en los compiladores y son de vital importancia para la teoría de los
compiladores de los lenguajes de programación.
Se puede considerar que un árbol de derivación es más abstracto que una derivación
“lineal” es decir, una sucesión S ... en el sentido de que para un solo árbol de derivación
puede haber varias derivaciones lineales, según el orden en que se decida “expandir” los
no terminales.
Definición15: Sea: G = (V, ∑, R, S) una GLC. Entonces el árbol de derivación cumple las siguientes
propiedades:
78
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
2. La raíz tiene etiqueta S.
3. La etiqueta de los nodos que no son hojas debe estar en V, y las de las hojas en:
∑U
4. Si un nodo n tiene etiqueta A, y los nodos n1, …., nm son sus hijos (de izquierda a derecha),
con etiquetas respectivamente A1, .., Am, entonces A → A1, …., Am R.
Definición 16: La cadena de caracteres que resulta de concatenar los caracteres terminales
encontrados en las etiquetas de los nodos hoja, en un recorrido en orden del árbol de
derivación, se llama el producto del árbol.
Ejemplo 42: Para explicar como un árbol de derivación ilustra diferentes derivaciones para
una misma cadena, es típico ejemplificar el caso de describir las secuencias de unos
paréntesis bien balanceados, en el que se presenta el caso ideal que nunca se han cerrado
más paréntesis de los que se han abierto y en el que al final los números coinciden.
S → Ss
S→
Y que formalmente se escribiría como:
El árbol de derivación para este ejemplo estaría dado en la figura 42 (las distintas órdenes de
derivación no son los únicos responsables de que existan distintas formas de derivar
79
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
una misma cadena. Es posible que una misma cadena tenga dos árboles de derivación
distintos.)
Figura 42: Árbol de derivación para una secuencia de paréntesis bien balanceados.
Analizamos la cadena o palabra = aabbaa que genera un árbol y que puede provenir
de varias cadenas de derivaciones distintas así:
Derivación por la izquierda: Cuando en cada paso siempre se sustituye primero la primera
variable (más a la izquierda) de la palabra que tenemos.
Derivación por la derecha. Cuando en cada paso siempre se sustituye primero la última
variable (más a la derecha) de la palabra que tenemos
Las derivaciones por la izquierda son mostradas en la figura 4 5. Fueron generadas con
software simulador JFLAP.
81
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Ejemplo 44: Para la Gramática G3 = S → aSbS │ bSaS │ Sus árboles de derivación
son los mostrados en la figura 46.
Se concluye: En efecto, hay GLC en las cuales para ciertas palabras hay más de un árbol
de derivación.
Definición 17: Una GLC G es ambigua si existen dos árboles de derivación distintos para
G que generan una misma cadena L(G).
Definición 18: Todo lenguaje Regular es Libre del Contexto. El conjunto de los lenguajes
LC incluye al de los regulares.
Ejemplo 45: Dada la siguiente GLC para las expresiones aritméticas de las variables:
10
MORAL, S. Modelos de Computación. p. 92
82
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
1. E → E + E Con esta gramática, para la expresión x+y * x existen dos árboles de derivación (Figura
47). El hecho de que existan dos árboles de
2. E → E * E derivación para una misma expresión es indeseable, pues cada árbol indica una manera
distinta de estructurar la expresión.
E→x
3. En efecto, en el árbol de la izquierda, al resultado de la suma (x + y) se
4. E → y multiplica con x, mientras que en el de la derecha sumamos x al
resultado de multiplicar x con y; por lo tanto el significado que se asocia a
ambas expresiones puede ser distinto.11
E → E + T │T │ ; T→T * F │ F │; F → (E) │ x │ y
Con esta nueva GLC, el árbol de derivación de la figura 46 (a) se elimina, quedando finalmente una
adaptación del árbol de la figura 46 (b) a la GLC con términos y factores.
11
(Bis)4
12
MORAL, S; Modelos de computación. 130 p.
83
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Es sufi ciente que haya una palabra con dos árboles de derivación distintos para que la
gramática sea ambigua. Esto quiere decir que existe otra gramática de tipo 2 no ambigua
y que genera el mismo lenguaje. El lenguaje generado es {a 2 3i
:i 0} y otra
gramática no ambigua que también genera este lenguaje es:
LECCIÓN 19.
TRANSFORMACIÓN
DE LAS GLC Y FORMAS NORMALES
Se trata de “ modificar las reglas de la gramática ” para que cumplan ciertas propiedades o
por simple estandarización o facilidad de implementación computacional ; pero sin
modificar el lenguaje aceptado.
84
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
S x
El algoritmo para eliminar los símbolos y producciones inútiles consta de dos pasos fundamentales:
1. Eliminar las variables desde las que no se puede llegar a una palabra de ∑ y las producciones en las
que aparezcan.
2. Eliminar aquellos símbolos que no sean alcanzables desde el estado inicial, S, y las producciones en
las que estos aparezcan.
1. V´ = 0
B se introduce en V´
7. Eliminar todas las producciones donde aparezca una variable de las eliminadas en el paso anterior
1. J = {S}
85
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
V” = {S}
∑‟ = Φ
2. Mientras J ≠ Φ
6. Si B no está en V” añadir B a J y a V”
S → AB, S → a, A → a
S → a, A → a
86
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
agregar una regla B → , en que directamente ya se reemplazó A por . Una vez
hecho esto, se pueden suprimir todas las reglas de la forma A → , pues resultan
redundantes.
87
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
directamente SS a partir de S. La idea de eliminar las reglas de la forma A → B viene de
observar que dichas reglas no producen nada úti l, simplemente introducen símbolos
intermediarios, que es posible eliminar.
Si en una gramática hay las reglas A→B y B→ i entonces es posible añadir reglas
A → i sin modificar el lenguaje. Ahora bien, si hacemos esto siempre que sea posible,
las reglas de la forma A → B se vuelven inútiles, pues toda derivación:
4.
88
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 51: Arboles de derivación para paréntesis balanceados
Eliminación de reglas inaccesibles: Dada la gramática GLC con las siguientes reglas:
S → aXbb, X → bSa, Y → SX
La tercera regla es inútil, porque no hay nadie que produzca la Y necesaria para que
dicha regla se aplique. A reglas como éstas se les llama inaccesibles.
13
Definición 19: Una regla X → de una gramática (V, ∑, R, S ) es inaccesible si no hay
una derivación S 1 X 2 donde 1, 2 (V U ∑)*.
Para eliminar una regla inaccesible no se necesita hacer ninguna otra modificación a la
gramática más que simplemente borrarla. La equivalencia de la gramática sin la regla
inaccesible y la original está garantizada por el hecho de que dicha regla no participa en
ninguna derivación.
Formas Normales: 14Cuando es necesario expresar una GLC siguiendo formatos más
preciso de las reglas que la simple forma A → . Estos estándares reciben el nombre de
13
BREANA, R; Autómatas y Lenguajes un enfoque de diseño . 214 p.
14
Bis (13)
89
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
formas normales. Y una de estas formas formales más conocidas es la forma normal de
Chomsky (FNCH). La FNCH consiste en que las reglas pueden tener dos formas:
1. A → a, con a
Se procede a dividir la palabra de entrada en dos pedazos, , para luego tomar una
regla S → AB, y tratar de verificar si se puede derivar a a partir de A y b a partir de B, es decir:
S ... si:
El objetivo es verificar que dado un lenguaje L no cumple que sea LLC. El “teorema de
bombeo” permite verificar esta condición. Este lema de bombeo también puede verse como
una condición necesaria que deben de cumplir todos los lenguajes libres de contexto.
Lema de Bombeo para lenguajes libres de contexto: Sea L un lenguaje libre de contexto.
Entonces, existe una constante n, que depende solo de L, tal que si z L y │z│ ≥ n ,
entonces z se puede escribir de la forma uvwxy de forma que:
1. │vx│ ≥ 1
2. │vwx│≤ n, y
3. i 0,uvi wxi y L
90
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Demostración. Sólo vamos a indicar una idea de cómo es la demostración. Supongamos
que la gramática no tiene producciones nulas ni unitarias (si existieses siempre se podrían
eliminar).
Asumamos un árbol de derivación de una palabra generada por la gramática. Es fácil ver
que si la longitud de es suficientemente grande, en su árbol de derivación debe de existir
un camino de longitud mayor que el número de variables. Sea N un número que garantice
que se verifica esta propiedad. En dicho camino, al menos debe de haber una variable
repetida. Supongamos que esta variable es A, y que la figura 52 representa el árbol de
derivación y dos apariciones consecutivas de A.
Un Autómata de pila (AP) ó PushDown Automata (PDA) no es más que un AF con un poder
adicional de cálculo (memoria). Dado que los AF no son tan poderosos para ciertas
operaciones ni para aceptar los LLC, los AP si lo son
Si para las expresiones regulares se tenían ciertas maquinas abstractas, autómatas finitos,
que las reconocían, para las CFG (Gramáticas fuera de contexto) vamos a usar otro tipo de
maquina reconocedora denominada autómata de pila. Estas se diferencian de los
autómatas finitos en que se ayudan para sus transiciones de una memoria con estructura
de pila. Como en los anteriores, la transición entre estados depende del símbolo leído y del
estado actual. Cada transición implica la modificación de la pila.
91
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 21
. DEFINICIÓN DE AUTÓMATA CON PILA
K es el conjunto de estados
∑ es el alfabeto de entrada
es el alfabeto de la pila
S K es el estado inicial
Z0 es el símbolo inicial de la pila (o también se denota como Z simplemente)
F K es un conjunto de estados finales.
∆ ( K x ∑* x *) x ( K x *) es la relación (función) de transición.
92
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 53: Formalización de un PDA
LECCI
ÓN 22. FUNCIONAMIENTO DEAUTÓMATAS
LOS DE PILA
La pila funciona de manera que el ultimo caractér que se almacena en ella es el primero
en salir (“ LIFO” por las siglas en ingles), como si se apilaran platos uno encima de otro, y
naturalmente el primero que quitaremos es el ´último que hemos colocado. Un aspecto
crucial de la pila es que solo podemos modificar su “tope”, que es el extremo por donde
entran o salen los caracteres. Los caracteres a la mitad de la pila no son accesibles sin
quitar antes los que están encima de ellos.
93
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
La pila tendrá un alfabeto propio, que puede o no coincidir con el alfabeto de la palabra de
entrada. Esto se justifica porque puede ser necesario introducir en la pila caracteres
especiales usados como separadores, según las necesidades de diseño del autómata.
Al iniciar la operación de un AP, la pila se encuentra vacía. Durante la operación del AP, la
pila puede ir recibiendo (y almacenando) caracteres, según lo indiquen las transiciones
ejecutadas. Al final de su operación, para aceptar una palabra, la pila debe estar
nuevamente vacía.
En los AP las transiciones de un estado a otro indican, además de los caracteres que se
consumen de la entrada, también lo que se saca del tope de la pila, así como también lo
que se mete a la pila.
(q, , ) ( K x ∑* x *) en donde:
94
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 54: Transición de un PDA
Al igual que los AF, los AP tienen estados finales, que permiten distinguir cuando una
palabra de entrada es aceptada. De hecho para que una palabra de entrada sea aceptada
en un AP se deben cumplir todas las condiciones siguientes:
Aunque en el caso de los AP no hay metodologías tan generalmente aplicables como era
el caso de los autómatas finitos, siguen siendo válidas las ideas básicas del diseño
sistemático, en particular establecer claramente qué es lo que “recuerda” cada estado del
AP antes de ponerse a trazar transiciones a diestra y siniestra. Para los AP, adicionalmente
tenemos que establecer una estrategia clara para el manejo de la pila.
95
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
En resumen, a la hora de diseñar un AP tenemos que repartir lo que requiere ser
“recordado” entre los estados y la pila. Distintos diseños para un mismo problema pueden
tomar decisiones diferentes en cuanto a qué recuerda cada cual.
Se recuerda que un AP no puede realizar ningún movimiento si la pila está vacía. Por lo
que un AP reconocerá una cadena de entrada por estado final si partiendo de su
configuración inicial (q0, t, Z0), llega a una configuración final (qf, , ) empleando
movimientos válidos y se expresa como:
Ejemplo 51 Diseñar un AP que acepte exactamente el lenguaje con palabras de la forma anbn,
para cualquier número natural n.
96
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 55: Estructura de un PDA para w=aabb
La construcción en diseño indica utilizar la pila como “ contador” para recordar la cantidad
de a´s que se consumen, y luego confrontar la cantidad de b´s. Una primera versión de
este diseño utiliza un solo estado q, con transiciones a/ /a y b / a / de q así mismo.
El diseño del autómata se ve en la figura 56.
97
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Para verificar el funcionamiento del autómata, podemos simular su ejecución, listando las
situaciones sucesivas en que se encuentra, mediante una tabla que llamaremos “traza de
ejecución”. Las columnas de una traza de ejecución para un AP son: el estado en que se
encuentra el autómata, lo que falta por leer de la palabra de entrada, y el contenido de la pila.
Por ejemplo, la traza de ejecución del AP del último ejemplo, para la palabra aabb, se muestra a
continuación en la tabla 13:
q .aabb
q .abb
.a
q .bb
.aa
q .b
.a
q
Concluimos que el AP efectivamente puede aceptar palabras como anbn. Sin embargo,
hay un problema: ¡el AP también acepta palabras como abab, que no tienen la forma
deseada! (es fácil construir la traza de ejecución correspondiente para convencerse de ello).
El problema viene de que no hemos recordado cuando se terminan las a y principian las b,
por eso ha sido posible mezclarlas en abab. Una solución es utilizar los estados para
memorizar las situaciones de estar consumiendo a o estar consumiendo b. El diagrama de
estados correspondiente se muestra en la figura 55(b).
Stacks: Podemos identificar las pilas con ciertos lenguajes y ciertas funciones sobre un alfabeto
del modo siguiente:
98
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 57: Funciones de la Pilas.
100
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Para el caso del ejemplo 52 para la cadena válida o aceptada = xxx las transiciones dadas están
definidas así para el recorrido de la Pila:
(q0, xxx, Z) ├ (q1, xxx, Z) ├ (q1, xx, xZ) ├ (q1, x, xxZ) ├ (q1, , xxxZ)
La pila quedó llena xxxZ y el autómata en el estado q1 reconoció por completo la cadena.
Para la cadena válida = xxy las transiciones dadas están definidas así para el recorridao de la Pila:
(q0, xxy, Z) ├ (q1, xxy, Z) ├ (q1, xy, xZ) ├ (q1, y, xxZ) ├ (q2, , xZ)
Aunque la pila no quedó del todo vacía (quedó xZ) se reconoció toda la cadena completa y
el autómata quedó en un estado de aceptación q2.
Para la cadena válida = xxyy las transiciones dadas están definidas así para el recorrido de la Pila:
(q0, xxyy, Z)├ (q1, xxyy, Z)├ (q1, xyy, xZ) ├ (q1, yy, xxZ) ├ (q2, y, xZ) ├ (q2, ,Z) ├ (q3, ,Z)
La cadena es procesada por completo, en la pila queda el símbolo inicial de pila y por tanto la
cadena es aceptada.
Para la cadena no válida o no aceptada = xyy las transiciones dadas están definidas así
para el recorrido de la Pila:
(q0, xyy, Z)├ (q1, xyy, Z)├ (q1, yy, xZ) ├ (q2, y, Z)
102
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
El funcionamiento de este AP ante la palabra abcba aparece en la siguiente tabla:
Estado Falta leer Pila
pq abcba S
qq abcba aSa
qq abcba Sa
qq bcba bSba
qq bcba Sba
cba cba
cba ba ba a
a
Existe sin embargo un problema técnico: si observamos la “corrida” para la palabra abcba,
nos daremos cuenta de que no estamos aplicando las reglas en el orden descrito en el
párrafo anterior, esto es, primero la transición del grupo 1, luego las del grupo 2 y finalmente
las del grupo 3, sino que más bien en la cuarta línea de la tabla se consume un caracter a
(aplicación de una transición del grupo 3) seguida de la aplicación de una transición del
grupo 2. Esto no es casualidad; lo que ocurre es que las variables no pueden ser
reemplazadas por el lado derecho de una regla si dichas variables no se
104
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
encuentran en el tope de la pila. En efecto, recuérdese que los AP solo pueden accesar el caracter
que se encuentra en el tope de la pila.
Por esto, se hace necesario, antes de reemplazar una variable por la cadena del lado
derecho de una regla, “desenterrar” dicha variable hasta que aparezca en el tope de la pila,
lo cual puede hacerse consumiendo caracteres de la pila (y de la entrada, desde luego)
mediante la aplicación de transiciones del tipo 3.
Unión
Concatenación
Clausura Demostración:
Sean G1 = (V1, T1, P1, S1) y G2 = (V2, T2, P2, S2) dos gramáticas libres de contexto y L1 y
L2 los lenguajes que generan. Supongamos que los conjuntos de variables son disjuntos.
Demostraremos que los lenguajes L1 U L2, L1 L2 y L1* son libres de contexto, encontrando
gramáticas de tipo 2 que los generen.
G3 = (V1 U V2 U {S3}, T1 U T2, P3, S3), donde S3 es una nueva variable, y P3 = P1 U P2 más las
producciones S3 → S1 y S3 → S2
L1L2. Una gramática que genera este lenguaje es G4 = (V1 U V2 U {S4}, T1 U T2, P4, S4),
donde S4 es una nueva variable, y P4 =P1 U P2 más la producción S4 → S1S2.
L1* Una gramática que genera este lenguaje es G5 =(V1 U {S5}, T1,P5,S5 ) donde P5 es P1
más las producciones S5 →S1S5 y S5 → .
Algunas propiedades de clausura de los lenguajes regulares no se verifican en la clase de los
lenguajes libres de contexto, como las que expresan el siguiente teorema.
Demostración. Sabemos que el lenguaje L = {aibici │ i ≥ 1} no es libre de contexto. Por otra parte
los lenguajes L2 ={ aibicj | i ≥ 1 y j ≥1} y L3 ={ aibicj | i ≥1 y j ≥1} si lo son.
105
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
El primero de ellos es generado por la gramática:
S → AB
A → aAb | ab
B → cB | c
S → CD
C → aC | a
D → bDc │ bc
Existen una serie de problemas interesantes que se pueden resolver en la clase de los
lenguajes libres de contexto. Por ejemplo, existen algoritmos que nos dicen si un
Lenguaje Libre de Contexto (dado por una gramática de tipo 2 o un autómata con pila no
determinístico) es vacío, finito o infinito. Sin embargo, en la clase de lenguajes libres de
contexto comienzan a aparecer algunas propiedades indecidibles. A continuación,
veremos algoritmos para las propiedades decidibles y mencionaremos algunas
propiedades indecidibles importantes.
a) vacío
b) finito
c) infinito
106
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Demostración.
a) En la primera parte del algoritmo para eliminar símbolos y producciones inútiles de una
gramática, se determinaban las variables que podían generar una cadena formada
exclusivamente por símbolos terminales. El lenguaje generado es vacío si y solo si la
variable inicial S es eliminada: no puede generar una palabra de símbolos terminales.
A → BC, A → a
Se construye entonces un grafo dirigido en el que los vértices son las variables y en el
que para cada producción de la forma A → BC se consideran dos arcos: uno de A a B y
otro de A a C. Se puede comprobar que el lenguaje generado es finito si y solo si el grafo
construido de esta forma no tiene ciclos dirigidos.
S → AB
A → BC | a
B → CC | b
C→a
107
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 30. PROBLEMAS INDECIDIBLES PARA LENGUAJES LIBRES DE CONTEXTO.
Los lenguajes libres de contexto tienen una aplicación a los compiladores, aunque existen
otras aplicaciones como la compartición de información. Es aquí donde se presentan
interrogantes a las denominadas “gramáticas sensibles al contexto”.
Para gramáticas sensibles al contexto, el problema de decidir si el lenguaje que genera es vacío
o no también es un problema indecidible.
La última Unidad de este módulo (Unidad 3: Lenguajes estructurados por frases) le llevará
a comprender como se ha demostrado que hay infinitos problemas para los que no se va a
tener una Máquina de Turing (MT) que los resuelva (ni siquiera los reconozca). También se
ha formulado la tesis de Church-Turing, que determina el límite de los computadores
actuales. Si esto es así, llegamos al caso de formular la pregunta:
Es otro contexto que podrá concluir cuando se analice la MUT (Máquina Universal de
Turing) como una máquina programable. Para demostrar esta afirmación, se puede
proceder primero simulando una MT con un computador y segundo simular un computador
con una MT.
Para el primer paso, si tenemos una MT con cinta semi-infinita, la unidad de control se
simula por el procesador, cada uno de los símbolos de cinta se codifican como la
información que se permiten guardar en la memoria del computador. Los estados, al ser
finitos, se pueden guardar en una tabla (en realidad sería el estado del procesador, que
incluye el contador de programa) y las transiciones se simulan mediante un programa. La
cinta se simularía con la memoria. El inconveniente de que un computador tiene
una memoria finita se soluciona suponiendo que siempre es posible añadirle, de
forma indefinida, más memoria. De esta forma un computador simularía el funcionamiento
de una MT cualquiera.
108
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
El segundo paso, pasar de un computador a una MT de varias cintas, es también casi
inmediato. El programa y los datos de entrada al programa que se introducen en la memoria
antes de ejecutarse en el computador se pueden codificar como un par (M, ω), donde M es
la secuencia de instrucciones que hay que computar y ω son los datos de entrada al
programa, almacenándose en la primera cinta. En la segunda cinta almacenaremos las
posiciones de memoria a las que va a acceder el programa para su lectura/escritura. En la
tercera cinta almacenaremos el contador de programa (el estado), que es el que determina
la dirección de la computación. De esta forma la MT simularía el funcionamiento de un
computador muy básico. La memoria caché, los registros, la UAL (Unidad aritmeticológica)
son ampliaciones que se han hecho para mejorar la eficiencia.
En las Unidades precedentes se han estudiado lo que se puede considerar las máquinas
abstractas que permiten solucionar ciertos tipos de algoritmos, los algoritmos en los
que no puede recordarse más que una cantidad fija de información y otros en los que
la información desarrollada durante la ejecución del algoritmo puede recuperararse solo en
concordancia con la regla “lifo” últimos en entrar primeros en salir, en esta unidad se
describe una maquina abstracta, llamada Máquina de Turing , que es aceptada de manera
amplia como modelo general de computación, aunque las operaciones básicas de esta
máquina son comparables en su sencillez a las de las máquinas estudiadas en las unidades
anteriores, las nuevas máquinas pueden realizar una amplia variedad de operaciones de
computo. Además de aceptar lenguajes les es posible computar funciones y de conformidad
con la tesis de Church-Turing, ejecutar casi cualquier procedimiento algorítmico concebible.
Los modelos abstractos de computación tienen su origen en los años 30, bastante antes de
que existieran los ordenadores modernos, en el trabajo de los lógicos Church, Gödel,
Kleene, Post, y (Alan Mathison Turing). Estos primeros trabajos han tenido una profunda
influencia no solo en el desarrollo teórico de las Ciencias de la Computación, sino que
109
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
muchos aspectos de la práctica de la computación que son ahora lugar común de los
informáticos, fueron presagiados por ellos; incluyendo la existencia de ordenadores de
propósito general, la posibilidad de interpretar programas, la dualidad entre software y
hardware, y la representación de lenguajes por estructuras formales basados en reglas de
producción.
Así como en secciones anteriores vimos como al añadir al autómata finito básico una pila
de almacenamiento auxiliar, aumentando con ello su poder de cálculo, cabría ahora
preguntarnos qué es lo que habría que añadir a un autómata de pila para que pudiera
analizar lenguajes como {anbncn}. Básicamente se trata del diseño de un Autómata con
mayor poder de reconocimiento y proceso de lenguajes, que tomas y fusiona aspectos de
un AF y de un PDA.
A Turing propuso en los años 30 un modelo de maquina abstracta, como una extensión de
los autómatas finitos, que resultó ser de una gran simplicidad y poderío a la vez. La máquina
de Turing es particularmente importante porque es la más poderosa de todas las maquinas
abstractas conocidas.
Gracias a ser tan simples, resulta más fácil demostrar que algo no se puede resolver con ellas.
Gracias a su equivalencia con los lenguajes de programación, entonces facilitan la
demostración de que cierto problema, no se puede resolver con un lenguaje de programación.
Mecanismo de cómputo muy sencillo de definir. Pero tan potentes como los lenguajes de
programación de muy bajo nivel.
Por ser tan de demasiado de “Bajo Nivel” no resultan prácticas para programar.
La parte final del estado de las máquinas de Turing nos lleva a analizar la “Tesis de Church”,
que dice que las Máquinas de Turing son equivalentes a cualquier modelo de computación
factible de construir.
111
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
La función de transición del control finito debe considerar como entradas el estado actual,
que es un elemento de K –pero que no puede ser h– así como el caracter leído en la cinta,
que es elemento de .
K x ( U { L,R }
Así, si (q, a) = (p, b), donde b , esto quiere decir que estando la MT en el estado q
con la cabeza lectora sobre un caracter a, la función de transición enviar al autómata a un
estado p, y adicionalmente escribir el carácter b. Similarmente si (q, a) = (p, L) la cabeza
de la MT hará un movimiento a la izquierda además de la transición de estado.
Ejemplo 55: Sea la MT siguiente: K = {s, h}, (solo está el estado inicial, además del “halt”) donde:
Puede verse por la función de transición que esta MT ejecuta un ciclo repetitivo en que
mueve la cabeza hacia la derecha en tanto siga leyendo un caracter a, y se detiene (hace
halt) en cuanto llega a un blanco.
Nótese que, puesto que es una función, en principio debe tenerse por cada estado y
cada caracter una transición. Esto quiere decir que cada estado debe tener una cantidad
de flechas de salida igual a | |. Por ejemplo, si = { Ц, a, b}, y K = {q, h}, entonces debe
haber flechas de salida de q con a, de q con b y también de q con Ц.
En la práctica, sin embargo, una gran cantidad de flechas tiende a hacer menos
comprensible un diagrama, por lo que solamente incluiremos las flechas “necesarias”,
suponiendo en consecuencia que las demás flechas pueden tener una salida cualquiera,
sin afectar esto el funcionamiento de la MT. Por ejemplo, a partir del estado inicial
112
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
podemos suponer, sin arriesgarnos, que no es posible encontrar más que el caracter blanco, por lo
que no tiene caso dibujar flechas del estado inicial con a, con b, etc.
Tiene, como los autómatas que hemos visto antes, un control finito, una cabeza lectora
y una cinta donde puede haber caracteres, y donde eventualmente viene la palabra de
entrada.
La cinta es de longitud infinita hacia la derecha, hacia donde se extiende
indefinidamente, llenándose los espacios con el caracter blanco (que representaremos
con “ Ц”).
La cinta no es infinita hacia la izquierda, por lo que hay un cuadro de la cinta que es el
extremo izquierdo, como el que se muestra en la figura 61.
En la MT la cabeza lectora es de lectura y escritura, por lo que la cinta puede ser
modificada en curso de ejecución.
En la MT la cabeza se mueve bidireccionalmente (izquierda y derecha), por lo que
puede pasar repetidas veces sobre un mismo segmento de la cinta.
Estas dos acciones son excluyentes, es decir, se hace una o la otra, pero no ambas a la vez.
Cuando queremos que una palabra no sea aceptada, desde luego debemos evitar que la
MT llegue al halt. Podemos asegurarnos de ello haciendo que la MT caiga en un ciclo
infinito.
El lenguaje aceptado por una MT es simplemente el conjunto de palabras aceptadas por ella.
Al diseñar una MT que acepte un cierto lenguaje, en realidad diseñamos el autómata finito
que controla la cabeza y la cinta, el cual es un autómata con salida (acepta cadenas
válidas). Así podemos usar la notación gráfica utilizada para aquellos autómatas para
indicar su funcionamiento. En particular, cuando trazamos una flecha que va de un estado
p a un estado q con etiqueta /L, quiere decir que cuando la entrada al control finito (esto
es, el caracter leído por la cabeza de la MT) es , la cabeza lectora hace un movimiento a
la izquierda, indicada por el caracter L (left, en inglés); similarmente cuando se tiene una
flecha con /R el movimiento es a la derecha. Cuando la flecha tiene la etiqueta / , donde
es un caracter, entonces la acción al recibir el caracter consiste en escribir el caracter
en la cinta. Con estos recursos es suficiente para diseñar algunas MT, como en el ejemplo
que se visualiza en el recurso web.
• Cambia un 0 por una X y se mueve hacia la derecha, pasando por encima de los ceros
e Y, hasta llegar al primer 1.
• Cambia el 1 por la Y y se mueve hacia la izquierda por encima de todos los Y y de todos
los ceros hasta llegar a una X y se repite el proceso hasta que solo queden X´s y Y´s.
Aparte de la capacidad de memoria, las diferencias entre una MT y una computadora de estructura
Von Neuman son:
116
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 34. LA MAQUINA UNIVERSAL DE TURING.
Hasta aquí hemos considerado cada esquema funcional asociado a su MT propia. Pero es
posible concebir una MT capaz de ejecutar cualquier algoritmo; es decir capaz de realizar
los cálculos que realizaría cualquier otra MT, o sea, capaz de simular (tener el mismo
comportamiento) cualquier MT particular.
Esta máquina Universal no debe ser diseñada para realizar un cálculo específico, sino para
procesar cualquier información (realizar cualquier cálculo específico -MT particular- sobre
cualquier configuración inicial de entrada correcta para esa MT particular).
Resultaría sumamente tener un modelo similar para MTs. En particular, elegimos las MTs
como nuestro modelo de máquina \ cableada" y a la vez como nuestro modelo de lenguaje
de programación. La Máquina Universal de Turing (MUT) recibirá dos entradas: una MT M
y una entrada , codificadas de alguna forma, y simulará el funcionamiento de M sobre .
La simulación se detendrá, se colgará, o correrá para siempre según M lo haga con En
caso de terminar, dejará en la cinta la codificación de lo que M dejaría en la cinta frente a
.15
15
NAVARRO, A: Fundamentos de la ciencia de la computación. 178 p.
117
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 35. LENGUAJES ACEPTADOS POR LA MAQUINA DE TURING.
El lenguaje aceptado o reconocido por una Máquina de Turing (MT), que se denota como
L(MT), es el conjunto de palabras formadas con el alfabeto ∑*, que hace que la máquina de
Turing se detenga al alcanzar un estado final.
L(M) = { ∑ : q0 ├* 1p 2, p }
Los lenguajes formales que son aceptados por una máquina de Turing son exactamente
aquellos que pueden ser generados por una gramática formal. El cálculo Lambda es una
forma de definir funciones. Las funciones que pueden se computadas con el cálculo Lambda
son exactamente aquellas que pueden ser computadas con una máquina de Turing. Estos
tres formalismos, las máquinas de Turing, los lenguajes formales y el cálculo Lambda son
formalismos muy disímiles y fueron desarrollados por diferentes personas. Sin embargo,
ellos son todos equivalentes y tienen el mismo poder de expresión. Generalmente se toma
esta notable coincidencia como evidencia de que la tesis de Church-Turing es cierta, que
la afirmación de que la noción intuitiva de algoritmo o procedimiento efectivo de cómputo
corresponde a la noción de cómputo en una máquina de Turing.
Los computadores electrónicos, basados en la arquitectura Von Neumann así como las
máquinas cuánticas tendrían exactamente el mismo poder de expresión que el de una
máquina de Turing si dispusieran de recursos ilimitados de tiempo y espacio. Como
consecuencia, los lenguajes de programación tienen a lo sumo el mismo poder de expresión
que el de los programas para una máquina de Turing y en la práctica no todos
118
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
lo alcanzan. Los lenguajes con poder de expresión equivalente al de una máquina de
Turing se denominan Turing completos.
Para cada gramática G existe una máquina de Turing no determinista M de 2 cintas que aceptas el
lenguaje generado por G.
Construcción de la máquina:
4. Si la cinta 2 contiene sólo símbolos terminales, se compara con la cadena de la cinta 1. Si son
iguales, el proceso ha terminado. Si no, provocar una terminación anormal.
Sea M una máquina de Turing; se dice que L=L(M) es un lenguaje recursivamente enumerable si:
x L, M se DETIENE en q
x L, M se DETIENE en q o bien NO se DETIENE,
119
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
L es un lenguaje recursivo si existe una MT M tal que L(M) = L y M se DETIENE con todas las
cadenas de entrada.
Se dice que L es un lenguaje recursivo si existe al menos una MT M tal que L = L(M) y
x L, M se DETIENE en q
x L, M se DETIENE en q
Segundo nivel: se clasifican en función del tiempo que tardan en ejecutarse. Se conocen con
el nombre de problemas indecidibles, impracticables o solucionables.
Tercer nivel: comprende aquellos problemas que por ejemplo requiere un tiempo linealmente
proporcional a su tamaño.
PRINCIPIO DE CHURCH-TURING:
Todo proceso físico puede ser simulado por un dispositivo universal de computación."
120
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
ENUNCIADOS: CHURCH
"La clase de las funciones que pueden ser calculadas mediante un algoritmo coincide con la
clase de las funciones recursivas." (Tesis de Church).
Apoyado en esta tesis junto a la definición de función definible, encontró varios ejemplos de
problemas cuya resolución era irresoluble llegando a manifestar que el
„Entscheidungsproblem‟ era uno de estos problemas
ENUNCIADOS: TURING
Es decir, si una función es computable entonces puede ser computada por una máquina de
Turing.
CHURCH Y TURING
"Todos los modelos computacionales efectivos son equivalentes a una máquina de Turing
121
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
"Todo lo que es computable por un humano es computable por una máquina de
Turing"
"Toda función que pueda ser considerada naturalmente como computable, puede
ser computada por una máquina de Turing
"Toda función que pueda ser físicamente computable, puede ser computada por una
máquina de Turing"
ORIGEN
ÉXITO DE LA TESIS
122
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 37. VARIANTES DE UNA MAQUINA DE TURING.
Hay otras definiciones de las máquinas de Turing que son equivalentes. Algunos de esos
modelos alternativos son mucho más complicados aunque todos tienen la misma potencia
computacional (o de cálculo). Muchas de ellas dotan de mayor flexibilidad al diseño de una
máquina de Turing que resuelva un problema en particular.
MTs que usan varias cintas, MTs con varios cabezales, MTs con cinta infinita hacia ambos
lados, MTs con cinta k-dimensional, etc. De todos esos mecanismos, el más útil es la MT
con k cintas, Una MT de k cintas tiene un cabezal en cada cinta. En cada paso, lee
simultáneamente los k caracteres bajo los cabezales, y toma una decisión basada en la
kupla. Esta consiste de pasar a un nuevo estado y realizar una acción en cada cinta.
Máquina no determinista: Máquina de Turing con una única cinta y control finito único.
Máquina de Turing de Cinta infinita en una Dirección: Máquina de Turing que usa una cinta
que se extiende infinitamente en una única dirección. Generalmente, se tiene una cinta que
se extiende infinitamente hacia la derecha. No está permitido realizar ningún movimiento
hacia la izquierda a partir de la celda del extremo izquierdo. Desde luego, cualquier máquina
de Turing de esta forma puede ser simulada por una de las que responden a la definición
original. Para cada computación, simplemente se marca una de las celdas de la cinta infinita
por los dos lados, como la celda que se encuentra en el límite izquierdo.
Máquina de Turing en Dos Direcciones: Una máquina de Turing con una cinta infinita en
un sentido puede simular una máquina de Turing con la cinta infinita en los dos sentidos
pero con dos pistas. Sea M una máquina de Turing con una cinta infinita en los dos sentidos.
La máquina de Turing M‟, que tiene una cinta infinita en un sentido, puede simular a M si
tiene una cinta con dos pistas. La cinta superior contiene la información correspondiente a
la parte derecha de la cinta M, a partir de un punto de referencia dado. La pista inferior
contiene la parte izquierda de la cinta M (en orden inverso).
¿Las matemáticas son 'completas', esto es, cada afirmación matemática se puede probar?
¿Las matemáticas son 'consistentes', esto es, es posible probar paralelamente una afirmación y su
negación?
¿Las matemáticas son 'decidibles', esto es, se puede encontrar un método definido
aplicable a cualquier afirmación matemática, que nos de cómo resultado si es o no cierta la
aseveración evaluada?
124
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
La intención de Hilbert era conseguir un modelo matemático formal, completo y consistente,
en el que a través de un algoritmo, se pudiese determinar la veracidad o falsedad de
cualquier proposición formal. Este problema recibió el nombre de “Entscheidungsproblem”,
resolverlo significaría que para cualquier problema bien definido existiría un algoritmo capaz
de resolverlo.
Los problemas de Hilbert son una lista de 23 problemas matemáticos compilados por el
matemático alemán David Hilbert para la conferencia en París del Congreso Internacional
de Matemáticos de 1900. Los problemas estaban todos por resolver en aquel momento, y
varios resultaron ser muy influyentes en la matemática del siglo XX. Hilbert presentó diez
de los problemas (1, 2, 6, 7, 8, 13, 16, 19, 21 y 22) en la conferencia, en un acto el 8 de
agosto en La Sorbona.
Aunque se han producido intentos de repetir el éxito de la lista de Hilbert, ningún otro
conjunto tan variado de problemas o conjeturas ha tenido un efecto comparable en el
desarrollo del tema y obtenido una fracción importante de su celebridad. Por ejemplo, las
conjeturas de Weil son famosas pero fueron poco publicitadas. Quizá el propio
temperamento de André Weil evitó que intentase ponerse en posición de competir con
Hilbert. John von Neumann produjo una lista, pero no obtuvo reconocimiento universal.
A primera vista, este éxito podría atribuirse a la eminencia del autor de los problemas.
Hilbert estaba en la cúspide de su poder y reputación en aquel momento y continuó
dirigiendo la sobresaliente escuela de matemática en la Universidad de Göttingen. Un
examen más cuidadoso revela que el asunto no es tan simple.
La matemática de aquel tiempo era aún discursiva: la tendencia a sustituir palabras por
símbolos y apelaciones a la intuición y conceptos mediante axiomática pura seguía
subyugada, aunque se volvería fuerte durante la siguiente generación. En 1900, Hilbert no
pudo acudir a la teoría axiomática de conjuntos, la integral de Lebesgue, los espacios
topológicos o la tesis de Church, que cambiarían sus respectivos campos de forma
permanente. el análisis funcional, fundado en cierto modo por el propio Hilbert como noción
central de los testigos del espacio de Hilbert, no se había diferenciado aún del cálculo de
variaciones; hay en la lista dos problemas de matemática variacional, pero nada, como
podría asumirse inocentemente, sobre teoría espectral (el problema 19 tiene una conexión
con la hipoelipticidad).
125
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
tanto, su valor documental es el de ensayo: una visión parcial, personal. Sugiere algunos programas
de investigación y algunas direcciones a seguir sin fin concreto.
De hecho, muchas de las preguntas daban una falsa idea del matemático profesional del
siglo XXI, o incluso de 1950, en que la forma de una solución a una buena pregunta tomaría
la forma de un artículo publicado en una publicación matemática. Si este fuera el caso de
todos los veintitrés problemas, se hubiera simplificado el comentario hasta el punto de poder
dar una referencia a una revista, o considera la pregunta como abierta todavía. En algunos
casos el lenguaje usado por Hilbert se sigue considerando un tanto "negociable", en cuanto
al significado real de la formulación del problema (en ausencia, repetimos, de fundamentos
axiomáticos, basados en matemática pura, empezando con el propio trabajo de Hilbert
sobre geometría euclidiana, pasando por el Principia Mathematica, y terminando con el
grupo Bourbaki y el "terrorismo intelectual" para terminar el trabajo). Los problemas Primero
y Quinto se encuentran, quizá sorprendentemente, en un estado de formulación de una
claridad menos que total (véanse las notas). En casos como el Vigésimo, el problema se
podría leer de forma razonable en una versión "interna", relativamente accesible, en la que
el lector puede saber a qué estaba apuntando Hilbert; o como una penumbra "externa" y
especulativa.
Dicho todo esto, por tanto, la razón más importante es la gran rapidez con la que aceptó la
lista de Hilbert la comunidad matemática de aquel momento (lo cual es una fórmula menos
convencional que ahora, ya que por entonces habían pocos líderes investigadores, que
generalmente se encontraban en unos pocos países Europeos y se conocían todos entre
ellos). Los problemas se estudiaron con gran atención; resolver uno labró reputaciones.
El estilo fue al menos tan influyente como el contenido de los problemas. Hilbert solicitaba
clarificaciones. Pidió soluciones en principio a preguntas algorítmicas, no a algoritmos
prácticos. Pidió un fortalecimiento de los cimientos de partes de la matemática que a los no
practicantes aún se antojaban guiadas por intuiciones opacas (el cálculo de Schubert y la
geometría enumerativa).
Estas actitudes fueron adoptadas por muchos seguidores, aunque también fueron
discutidas, y continúan siéndolo. Treinta años después, Hilbert había endurecido su
postura: véase ignorabimus.
Problema 1. La hipótesis del continuo (esto es, no existe conjunto cuyo tamaño esté estrictamente entre
el de los enteros y el de los números reales) Se ha probado la
126
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
imposibilidad de probarlo como cierto o falso mediante los axiomas de Zermelo-Fraenkel.
No hay consenso al respecto de considerar esto como solución al problema.
Problema 2. Probar que los axiomas de la aritmética son consistentes (esto es, que la
aritmética es un sistema formal que no supone una contradicción). Parcialmente resuelto:
hay quienes sostienen que se ha demostrado imposible de establecer en un sistema
consistente, finitista y axiomático Sin embargo, Gentzen probó en 1936 que la consistencia
de la aritmética se deriva del buen fundamento del ordinal ε0, un hecho sujeto a la intuición
combinatoria.
Problema 3. ¿Se puede probar que dos tetraedros tienen igual volumen (bajo ciertas asunciones)?
Resuelto. Resultado: no, probado usando invariantes de Dehn
Problema 4. Construir todas las métricas cuyas rectas sean geodésicas. Demasiado vago para
decidir si se ha resuelto o no.
Problema 8. La hipótesis de Riemann (la parte real de cualquier cero no trivial de la función
zeta de Riemann es ½) y la conjetura de Goldbach (cada número par mayor que 2 se puede
escribir como la suma de dos números primos). Abierto
Problema 9. Encontrar la ley más general del teorema de reciprocidad en cualquier cuerpo
numérico algebraico. Parcialmente resuelto
Problema 10. Encontrar un algoritmo que determine si una ecuación diofántica polinómica
dada con coeficientes enteros tiene solución entera. Resuelto. Resultado: no, el teorema
de Matiyasevich implica que no existe tal algoritmo.
Problema 11. Resolver las formas cuadráticas con coeficientes numéricos algebraicos. Parcialmente
resuelto
Problema 12. Extender el teorema de Kronecker sobre extensiones abelianas de los números
racionales a cualquier cuerpo numérico de base. Abierto
127
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Problema 13. Resolver todas las ecuaciones de 7º grado usando funciones de dos parámetros.
Resuelto. Lo probó posible Vladimir Arnold.
Problema 14. Probar la finitud de ciertos sistemas completos de funciones. Resuelto. Resultado: no,
en general, debido a un contraejemplo
Problema 15. Fundamento riguroso del cálculo enumerativo de Schubert. Parcialmente resuelto
Problema 17. Expresión de una función definida racional como cociente de sumas de
cuadrados. Resuelto. Resultado: se estableció un límite superior para el número de
términos cuadrados necesarios
Problema 18. ¿Existe un poliedro irregular y que construya otros poliedros? ¿Cuál es el apilamiento
compacto más denso?. Resuelto.
Problema 19. ¿Son siempre analíticas las soluciones de los Lagrangianos? Resuelto.
Resultado: sí
Problema 20. ¿Tienen solución todos los problemas variacionales con ciertas condiciones
de contorno?. Resuelto. Ha supuesto un área importante de investigación durante el siglo
XX, culminando con las soluciones al caso no lineal.
Problema 22. Uniformización de las relaciones analíticas por medio de funciones automórficas.
Resuelto
Problemas de decisión: Un problema de decisión (PD) es aquel formulado por una pregunta
(referida a alguna propiedad) que requiere una respuesta de tipo “si/no”.
Problemas de decisión.
128
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Un problema de decisión es:
Si es soluble.
• ¿Existe un algoritmo para decidir si dos autómatas finitos cualesquiera son equivalentes?
Si es un problema soluble.
No es insoluble.
Un lenguaje decidible es aquel lenguaje L para el cual existe una máquina de Turing que le
puede aceptar cualquier cadena { L}.
Hay lenguajes formados por cadenas tales que una máquina de Turing logra un estado final
con las cadenas que reconoce y acepta, solamente. En este caso se dice que la máquina
de Turing semidecide al lenguaje. Los lenguajes semidecididos por una MT se llaman
recursivos numerables. Las gramáticas sin restricciones son las que generan los lenguajes
recursivos numerables. De aquí en adelante será suficiente referirse a los lenguajes
recursivos numerables, pues estos generalizan a los lenguajes recursivos, los
129
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
cuales generalizan a los lenguajes libres de contexto, y estos a los lenguajes regulares. Lo
anterior tiene relación directa con que los autómatas de Turing generalizan a los de la pila
y estos a su vez a los autómatas finitos. Por otro lado, pese a que lenguajes formales más
generales que los recursivos numerables no son reconocidos por un autómata de Turing,
no existe hasta el momento ningún autómata más poderoso capaz de reconocerlos
• Un algoritmo es una implementación de una máquina de Turing tal que el conjunto de sus entradas
es el lenguaje decidible.
Es decir, si un dado un conjunto de entradas bajo las cuales una MT logra un estado de
parada para cada entrada, la maquina corresponde a la implementación de un algoritmo.
Esta es la Tesis de Church – Turing. No es un teorema pues no se puede demostrar
matemáticamente, de manera general y categórica. Es solo la afirmación de que el concepto
informal del algoritmo corresponde a un objeto matemático. Al ser solo una afirmación no
demostrable, puede suceder que luego fuera refudada. Para que esto ocurra, se necesitaría
encontrar un autómata más potente que uno de Turing tal que fuese la implementación de
un algoritmo. Si bien hay algunas propuestas interesantes que pretende generalizar a la
MT, hasta la fecha ninguna de ellas ha sido aceptada para sustituir nuestro actual concepto
de procedimiento comprable.
Por otro lado, mientras que los lenguajes computables son una infinidad numerable, los
lenguajes no computables son una infinidad no numerable. Por ello, son más los lenguajes
no computables o indecidibles. Una teoría lógica (TL) se define a partir de un conjunto de
enunciados dados llamados axiomas, unas reglas de inferencia y un esquema de
derivación. A partir de los axiomas y aplicando la regla de inferencia y el esquema de
derivación se infieren los teoremas de la teoría. El conjunto de teoremas de la teoría forma
un lenguaje formal.
Si es posible definir una máquina de Turing tal que reconozca al lenguaje de los teoremas,
este lenguaje es decidible y la teoría también lo es en consecuencia. Dicho en otras
palabras, si el conjunto de teoremas visto como un lenguaje es reconocido por una máquina
de Turing, entonces la TL es decidible. Y viceversa. Puede hablarse entonces de
130
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
manera indistinta de teorías lógicas o de lenguajes decididles, como aquellos para los que
existe una máquina de Turing capaz de reconocerlos. Luego la correspondencia entre la
sintaxis de una teoría lógica (lenguaje formal) y reconocimiento simbólico del mismo por
parte de un autómata queda establecida.
Definición:
Sea M una máquina de Turing arbitraria con un alfabeto de entrada Σ. ¿Puede decidirse si la
máquina M se detendrá con la entrada ?
Solución:
Por otro lado, son muchos los problemas interesantes que se han demostrado computables.
Todas las funciones construidas por recursividad primitiva o minimalización a partir de
funciones calculables resultan ser calculables como consecuencia de los trabajos de
Church y Turing. Pero además, otras funciones más complejamente definidas también son
computables, siendo el resultado más significativo en relación con esta cuestión el dado por
el siguiente teorema:
Primer teorema de Recursión. Todo operador entre funciones calculables que sea recursivo
(esto es que se defina la imagen de f mediante una función calculable en términos de una
parte finita de f), tiene una función parcial computable que es el menor punto fijo, es decir,
esta función es un punto fijo y cualquier otro punto fijo del operador es una extensión de
esa función.
132
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Este teorema recibe su nombre porque podemos definir una función mediante una ecuación
recursiva más general que la permitida por la recursividad primitiva, a saber dónde es un
operador recursivo. El primer teorema de recursión nos dice que esta definición es posible;
hay una función recursiva que satisface esta ecuación. Como en matemáticas se requiere
que la definición sea unívoca, se dice que dicha ecuación define el menor punto fijo del
operador. Así, y de acuerdo al primer teorema de recursión, la clase de las funciones
calculables es cerrada bajo una muy general forma de definición por recursión.
FUNCIONES COMPUTABLES:
Las llamadas máquinas de Turing no constituyen ni el primero ni el único formalismo para expresar
cómputos, pero sí el que más ha perdurado.
El modelo en el que se inspiró fue el de una persona real llevando a cabo un cálculo mecánico, por
ejemplo una multiplicación de dos grandes números en el sistema decimal.
Las funciones computables son usadas para discutir computabilidad sin referirse a ningún modelo
de computación concreto, como el de la máquina de Turing o el de la máquina de registros.
Ejemplo:57 Se presenta un ejemplo que explica la solución de estos problemas “indecidibles” mediante
“Reducibilidad”:
Se cita un ejemplo:
Hay que hacer notar que este método no hace referencia a la manera en la que se soluciona
P1 o P2, sino que determina como la solución de P2 conduce a solucionar P1. También se
puede ver que P2 es un problema más general que P1. De hecho este método no
funcionaría en el sentido inverso: siempre se reduce un problema a otro más general.
Otro ejemplo más típico: El jefe al fin se ha decidido a dar las vacaciones, pero estamos a
30 de julio y queremos ir con la familia, que resulta que está en Australia. El problema
entonces se reduce a encontrar un billete de avión a este destino.
En términos de máquinas de Turing, dado un lenguaje L1, que define un problema, su decisión se
reduce a otro lenguaje L2 que es decidible. Para ello se debe encontrar un
134
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
algoritmo que convierta una cadena ω de L1 en otra cadena ω‟ de L2 (L2 puede tener
más cadenas aceptables, pero nos interesan las que se pueden obtener por el algoritmo
desde L1), decidiéndose entonces si ω‟ pertenece a L2.
Que haya que demostrar que L2 es RE. Para ello partimos de la certeza de que L1 es RE
(por ejemplo Lu) y lo reducimos a L2. Se supondrá que este último es decidible, es decir,
que se puede encontrar una MT que, siendo la entrada una cadena ω de L1, esta se puede
convertir en una cadena ω‟ de L2, y decidir si esta última pertenece a L2 o no. Si se
encuentra al algoritmo de conversión, se habrá encontrado una MT que es capaz de reducir
L1 a L2, y por tanto, la manera de decidir L1. Pero esto es una contradicción, pues sabemos
de antemano que L1 es RE, por lo que, forzosamente, L2 no puede ser decidible. Se llega
a la conclusión de que L2 también es RE.
Que haya que demostrar que L2 no es RE. Para ello partimos de la certeza de que L1 no
es RE (por ejemplo Ld) y lo reducimos a L2. Se supondrá que este último es RE, es decir,
que se puede encontrar una MT que, siendo la entrada una cadena ω de L1, esta se puede
convertir en una cadena ω‟ de L2, y aceptarla si esta última pertenece a L2. Si se encuentra
un algoritmo de conversión, se habrá encontrado una MT que es capaz de reducir L1 a
L2, y por tanto la manera de aceptar L1. Pero esto es una contradicción, pues sabemos
de antemano que L1 no es RE (ninguna MT puede aceptarlo), por lo que, forzosamente,
L2 no puede ser RE. Se llega a la conclusión de que L2 tampoco es RE.
Hemos visto como la Teoría de Autómatas, que engloba también al estudio de las
Máquinas secuenciales, tiene su origen en el campo de la Ingeniería Eléctrica. El
135
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
matemático norteamericano Shannon Claude 16(siendo lo más notable de su trabajo todo lo
referente a la Teoría de la información17, un desarrollo que fue publicado en 1948 bajo el
nombre de Una Teoría Matemática de la Comunicación), dio los primeros usos a una
máquina de estados.
Más tarde en otros trabajos destacados, vino a establecer las bases para la aplicación de
la Lógica Matemática a los circuitos combinatorios y posteriormente Huffman en 1954 los
amplió a circuitos secuenciales y utiliza conceptos como estado de un autómata y tabla de
transición.
19
ALGORITMO DE TRELLIS Y VITERBI:
16
<C. E. Shannon, ``A mathematical theory of communication,'' Bell System Technical Journal, vol. 27, pp.
379-423 and 623-656, July and October, 194>
17
< W. Weaver and C. E. Shannon, The Mathematical Theory of Communication, Urbana, Illinois: University
of Illinois Press, 1949, republished in paperback 1963 .>
18
Reprinted with corrections from The Bell System Technical Journal, Vol. 27, pp. 379–423, 623–656, July,
October, 1948. Disponible en internet < http://cm.bell-labs.com/cm/ms/what/shannonday/shannon1948.pdf >. 19
The Viterbi Algorithm: A Personal History. Disponible en internet:
<http://arxiv.org/pdf/cs/0504020v2.pdf>
136
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
puede explicarse gracias a las numerosas ventajas que posee con respecto a los métodos analógicos.
Hasta unos años, la transmisión digital de señales analógicas (voz, vídeo,
etc.) resultaba técnica y económicamente costosa. Sin embargo, “recientemente” han
sucedido hechos que originaron importantes avances en esta área de las comunicaciones:
APLICACIONES DEL ALGORITMO: Como resultado de estos avances, las fronteras del
mundo de las comunicaciones digitales se han expandido en todos los sentidos: (a) las
distancias entre transmisor y receptor se han incrementado considerablemente
(comunicaciones satelitales, telemetría de sondas espaciales, etc.); (b) es posible
establecer comunicaciones de buena calidad en ambientes de gran interferencia (telefonía
celular); (c) los espacios lógicos (y físicos) necesarios para almacenar la información se han
reducido radicalmente (DVD).
Entre todos los avances que han permitido este extraordinario desarrollo de las
comunicaciones, se encuentran las técnicas de codificación. Estas mejoran el
comportamiento de los sistemas de comunicaciones mediante la inclusión de redundancia
en la información a transmitir. Esta información adicional permite detectar, corregir y/o
prevenir errores en transmisiones por canales ruidosos.
Entre los métodos de protección más utilizados en la actualidad se encuentran los codificadores
convolucionales con decodificación de Viterbi (CC-DV).
La Modulación Codificada de Trellis (Trellis coded modulation) mejor conocida por la sigla
TCM, se ha desarrollado a lo largo de las últimas cuatro décadas. Este sistema
137
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
combina las técnicas de codificación y la modulación para transmisiones digitales sobre
canales con banda limitada. Su ventaja principal, y por la que ha hecho una revolución en
las telecomunicaciones, radica en el hecho que permite una ganancia significativa de
codificación sobre las modulaciones convencionales de multinivel, sin comprometer la
eficiencia del ancho de banda.
El primer esquema de TCM fue propuesto en 1976 por Gottfried Ungerboeck. Seguido por
una publicación en la revista information theory del IEEE en el año de 1982, con la cual se
dio una revolución en las investigaciones de su teoría y métodos, además se estableció un
lugar a las posibles implementaciones de TCM.
La decodificación de Viterbi fue propuesta por Andrew Viterbi en su trabajo “Error Bounds
for Convolucional Codes and an Asymptotically Optimum Decoding Algorithm” publicado en
la IEEE Transactions on Information Theory, en Abril de 1967.
CC-DV son utilizados en los sistemas de telefonía celular digital como es el caso del
estándar IS-95 (utilizado en nuestro medio por CTI), como así también en comunicaciones
de satélites geoestacionarios como las redes VSAT (Very Small Aperture Terminal). Las
ganancias que se logran con estos sistemas de codificación se reflejan en la reducción del
consumo de los transmisores o en la reducción del tamaño de las antenas (o simplemente
en la mejora de las tasas de transmisión).
La teoría de la codificación redundante se basa en los principios que Shannon formuló para
canales ruidosos al considerar que existe una probabilidad de error en la transmisión de
ráfagas de símbolos para cualquier velocidad, dentro de la capacidad del canal e
independientemente del tipo de información que se envié. Entonces, es indispensable
138
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
saber cuáles de los bits recibidos están errados, especialmente si se requiere una altísima veracidad
por la transmisión de datos.
Con la introducción de una cierta cantidad de símbolos redundantes dentro de una cadena,
la parte emisora permite anticiparse al ruido del canal que pueda perjudicar la información,
de este modo, en tal caso, se le brinda a la parte receptora la posibilidad de corregir errores.
Después del codificador de canal CC, la señal codificada es modulada para su transmisión,
por una línea de comunicación o para su conservación, en una cierta memoria.
Los códigos secuenciales son utilizados también con el propósito de identificación, pero se
asignan en el orden en el cual los clientes entran al sistema.
Los códigos pueden dividirse en subconjuntos o subcódigos, caracteres que son parte del
número de identificación que tienen un significado especial. Los subcódigos indican al
usuario información adicional sobre el artículo, Ejemplo La clase de producto, el proveedor,
esta información se lleva a través de dígitos significativos.
El problema está en cómo elegir los 2Rn vectores que se van a enviar, es decir, en la decisión. Al
sistema que realiza dicha decisión se le llama codificador.
140
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Los códigos convolucionales realizan esta selección, son c ódigos lineales que tienen la
propiedad de que la suma de dos palabras de código cualesquiera también es una
palabra de código. Luego, el codificador convolucional, es una manera de reducir el
número de mensajes que enviamos por el canal, cumpliendo de est a forma la
recomendación de Shannon. (Básicamente el codificador convolucional es una máquina
de estados que aplica la Teoría de Autómatas).
141
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
k es el número de bits de la palabra de datos.
m es la memoria del código o longitud restringida
A este cociente se le denomina ratio del codificador. He definido para esta aplicación un
codificador convolucional (2,1,3), es decir: un bit para representar la palabra de datos, dos
bits de palabra de codificación por cada bit de palabra de datos y tres bits de longitud de
registro. En nuestro caso el ratio es ½.
Figura 66: Máquina de estados. Registro de desplazamiento convolucional de ratio = ½ y una etapa
142
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Cargado todo con ceros, le metemos un cero y un uno:
Figura 67: Máquina de estados. Registro de desplazamiento convolucional (datos 000 y 100)
Seguimos con el caso de que hemos introducido un uno porque con el cero observamos
que se forma un bucle. Ahora en la situación (1, 0, 0) veamos cómo codifica el sistema
usando una máquina de estados si le introducimos un cero y cómo si es un uno el bit que
entra al canal:
Figura 68: Máquina de estados. Registro de desplazamiento convolucional (datos 010 y 110)
En los diagrama s, cada estado del codificador convolucional se representa mediante una
caja y las transiciones entre los estados vienen dadas por líneas que conectan dichas
cajas. Para saber de una manera rápida en qué estado se encuentra el codifica dor, basta
143
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
con observar los dos bits del registro de memoria más alejados de la entrada. Puede
comprobarse interpretando la máquina de estados correspondiente. Para el codificador de
la Figura 69, el diagrama de estados correspondiente es:
ÁRBOLES: Para la descripción, utilizaremos un caso particular con m=3, k=1 y n=2.
Consideramos el codificador convolucional de la figura 70
144
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 71: Árbol para un codificador convolucional de ratio 1/2
DIAGRAMAS DE TRELLIS:
Una manera de representar las distintas transiciones y los caminos que éstas describen
es mediante un Diagrama de Trellis. Una descripción de Trellis de un codificador
convolucional muestra cómo cada posible entrada al codificador influye en ambas salidas
y a la transición de estado del codificador. Un código de longitud restringida m tiene un
Trellis con 2k(m-1) estados en cada intervalo ti. Así que tendremos cuatro estados en ti. De
cada estado parten otros dos, uno si el bit enviado es un „1‟ y otro si es un „0‟.
145
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 72: Diagrama de Trellis (transición de estados).
El sistema tiene memoria: la codificación actual depende de los datos que se envían
ahora y que se enviaron en el pasado. Por lo tanto, el diagrama completo que obtenemos
con nuestro codificador.
En nuestro caso (2,1,3), una vez enviado el último bit, tendremos que enviar dos ceros para
finalizar la secuencia en cero y de esta forma volver a poner el codificador a cero. Así,
queda listo para otro envío futuro y se facilita por lo tanto el proceso.
Sea una entrada de datos de 8 bits. Una vez elegido el codificador convolucional con ratio
1/2, procedemos como se ha explicado en la teoría para obtener la secuencia de 16 bits
correspondientes a la palabra codificada.
Datos a la entrada: 1 1 0 0 1 0 1 1
Hemos dicho que el codificador parte del estado todo cero. Fijándonos en la máquina de
estados de las figura 69, partimos del estado 00, si entra un 1, se ha explicado como entra
al codificador, cuál es la salida codificada (11) y a qué estado pasa (10). A este nuevo
estado le llamaremos estado presente. En nuestro ejemplo:
1º Dato entrada: 1
Dato codificado: 11
Estado presente: 10
2º Dato entrada: 1
Dato codificado: 10
Estado presente: 11
3º Dato entrada: 0
Dato codificado: 10
Estado presente: 01
4º Dato de entrada: 0
Dato codificado: 11
147
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Estado presente: 00
Estado presente: 10 11 01 00 10 01 10 11
Entrada codificada: 11 10 10 11 11 01 00 10
Representamos cómo sería el camino de Trelli s seguido por los datos correctos ya
codificados. Para esto nos fijamos en la secuencia de estados presentes:
148
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
LECCIÓN 45: ALGORITMO DE VITERBI
Estado Presente 10 11 01 00 10 01 10 11
Codificado 11 10 10 11 11 01 00 10
Recibido 10 10 11 11 01 01 00 10
149
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Veamos las distintas representaciones gráficas que desarrollan el proceso según dicta
nuestra máquina de estados. Sobre cada línea de unión de estados colocaremos en rojo
el número de errores acumulados en relación con la señal recibida.
DISTANCIA DE HAMMING.
En los códigos no recurrentes (o sea que utilizan estructura de bloques) son formados con
agrupaciones de n bits llamadas bloques, cada bloque se diferencia de otro de acuerdo
con la distancia que exista entre ellos. Como lo muestra la siguiente figura 75:
1.- El primer y segundo nivel son fijos para cualquier entrada. Del estado 00 tenemos dos
posibles ramas, hacia el estado 00 y hacia el 10
150
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 76: Distancia de Hamming Nivel 1.
3.- A partir del tercer nivel, en cada estado convergerán dos ramas, analizamos los
errores en la métrica de cada camino posible en relación con la señal recibida.
151
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 78: Distancia de Hamming Nivel 3.
4.- Según el número de errores acumulados en relación con la señal recibida, elegimos un
camino u otro. Nos quedamos con el de menor error acumulado. Así pues, partimos de
menos ramas para el siguiente nivel del proceso.
5.- De cada nodo parten de nuevo otras dos ramas Colocamos únicamente los errores
correspondientes al último nivel, para una mejor visualización:
6.- Procedemos del mismo modo que para el tercer nivel y nos quedamos con las ramas
de menor error acumulado:
7.- Con esta metodología aplicada al resto de niveles, las cuatro ramas seleccionadas que
llegarían a los cuatro últimos estados dada su menor acumulación de error acumulada
serán:
Por lo tanto, el trayecto óptimo es aquel que fin aliza en el estado 11, ya que tiene tres
errores acumulados frente a los cuatro de los otros estados. Así pues, el trayecto
recorrido óptimo es
152
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 79: Diagrama de Viterbi.. Trayecto de recorrido óptimo.
153
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Figura 80: Solución final Trellis y Viterbi. Datos de entrada 11010011.
Una explicación del algoritmo, puede ser visualizada en los recursos de la tabla 17.
Sigue al autor
154
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
ANEXO: EJERCICIOS DE REPASO
Se presentan ejercicios que han sido banco de evaluaciones formuladas en el curso: Se recomienda
que repase, evalúe y sintetice el análisis de cada uno.
Ejercicio 1: Una de las operaciones que se puede formar con las palabras de un alfabeto
es “La potencia”. Dada una palabra w ∑* se define inductivamente la potencia n-ésima
de w, que se denota w n , como: w 0 = cadena vacía, w n = w . w n 1 para n > 0 Si w = aba es
un palabra sobre el alfabeto {a,b} entonces:
2
A. = aabb
2
B. = abaaba
2
C. = abab
2
D. = ababab
Ejercicio 2: Indique cuál de las siguientes afirmaciones referidas a lenguajes del alfabeto
∑ = {0,1,2} son ciertas:
1. El lenguaje de las cadenas con a lo sumo una pareja de 0´s consecutivos y a los
sumo una pareja de 1´s consecutivos no es regular.
2. El lenguaje de las cadenas equilibradas con igual número de 0´s y de 1´s tales que
ningún prefijo de cualquiera de ellas posee más de dos 0´s que 1´s ni más de dos
1´s que 0´s es un lenguaje regular.
3. No existe ningún autómata determinista que reconozca el lenguaje de las cadenas
en las que toda pareja de 0´s contiguos aparece antes de cualquier pareja de 1´s
contiguos.
4. Si L es un lenguaje regular también lo es el lenguaje consistente en las inversas de
las cadenas de L.
Ejercicio 3: Sea el alfabeto ∑= {a,b} con la Expresión Regular: a(a+b), identifique las cadenas
válidas que se pueden generar:
A. {aba, aab,}
B. {a, aab, abb}
C. {aa, ab,}
D. {a, b, aa, bb}
156
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Ejercicio 3.1 Para el siguiente autómata, identifique cuál es la Expresión Regular (ER)
que mejor lo representa:
A. (ab+ba) + a
B. (ab + aba)*
C. a +(ab)*
D. ab +(ab)*
1. La ER (0+1)*01 genera cadenas válidas para el autómata del ejercicio doce (12)
pero no para las del autómata del ejercicio once (11).
2. La ER (0+1)*01 genera las mismas cadenas para el Autómata del ejer cicio dos
(2) y del ejercicio doce (12)
3. La ER (0+1)*11(01)* genera cadenas válidas para el autómata del ejercicio
dos (2) pero no para las del autómata del ejercicio doce (12).
4. La ER (1*00*1(00*1)*1)*1*00*1(00*1)* genera las mismas cadenas para
el Autómata del ejercicio doce (12) y del ejercicio once (11).
157
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Dado el alfabeto: ∑= {a,b} una representación válida de la expresión regular y su
lenguaje sería:
Q es un conjunto de estados.
∑ es el alfabeto de entrada
f: Q X ∑ → Q es la función (total) de transición.
q0 Q es el estado inicial.
F Q es el conjunto de estados finales.
159
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
n *
A. L = (A 2 ) = {0, 001, 01111, …} = { 1(10) /n ≤ 0} La expresión regular es: 0(01)
n *
B. L = (A 2 ) = {1, 101, 10101, …} = { 1(01) /n ≥ 0} La expresión regular es: 1(01)
n
C. L = (A 2 ) = {0, 111, 11100, …} = { 1(10) /n = 0} La expresión regular es: 1(01)
n *
D. L = (A 2 ) = {0, 001, 00100, …} = { 1(01) /n ≠ 0} La expresión regular es: 0(01)
A. (10 + 0)* 10
B. (10 + 0)
C. (10 + 0)*
D. (0+1+0*)
160
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
1. La función de transición puede no estar definida para alguna combinación (x,q) y,
por el contrario, puede definir para otras combinaciones (x,q) más de un estado.
2. La función de transición define para cada posible combinación (x,q) un estado
nuevo.
3. Es un autómata no determinístico (AFND), con un conjunto finito de estados y
símbolos de entrada, un estado inicial, un conjunto de estados finales, y una
función de transición de estados.
4. Es un autómata determinístico (AFD), con un conjunto finito de estados y símbolos
de entrada, un estado inicial, un conjunto de estados finales, y una función de
transición de estados.
Ejercicio 13: Dado los siguientes dos autómatas A y B, analice los enunciados dados e
identifique cuales son verdaderos.
162
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Pero no fue válido porque:
Para el ejercicio analice la cadena sin te ner en cuenta si es válida o no, (aceptada
o no aceptada)
Ejercicio 16: Para el siguiente autómata finito determinístico (AFD), identifique que
afirmaciones son válidas para la expresión:
Tenga en cuenta que se denomina cadena, palabra o frase a una secuencia finita de
símbolos de un alfabeto ∑. Estas cadenas son denotadas como w.
163
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
A. Reconoce las palabras sobre a,b que terminan en un número par de a´s
contiguas
B. Reconoce solo las frases sobre a,b que empiezan por b
C. Reconoce las palabras sobre a,b que tienen un número par de a´s contiguas.
D. Reconoce solo las cadenas sobre a,b que empiezan por a
A. 0110
B. 0111
C. 0101
D. 0011
Ejercicio 19: Identifique de los cuatro autómatas que se muestran a continuación, (A, B,
C o D), cuál reconoce las cadenas que contienen la subcadena aba y cuya definición
formal sería la siguiente:
K = {1,2}
Σ={a,b}
s={1}
F={2}
={((1,a),1),((1,b),1),((1,aba),2),((2,a),2),((2,b),2)}
165
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Ejercicio 21: Dado el Autómata con la siguiente tabla de transición, identifique las
cadenas que son válidas para el lenguaje que acepta.
166
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
A. Solo acepta cadenas vacías (lambda).
B. Es un AFND y acepta cualquier cadena que inicie con cero (0).
C. {101, 210, 20,110, 200}
D. {22, 0,1,001122, 12, 012, 022}
Ejercicio 22: Indique cuál de las siguientes afirmaciones referidas a los autómatas de la
figura, son ciertas. (Observe que hay una trans ición que no lee ningún símbolo de la
cadena de entrada):
1. Los autómatas reconocen el lenguaje formado por todas las cadenas que
empiezan por 1 y que no terminan en dos ceros consecutivos.
2. Ambos autómatas reconocen el mismo lenguaje incluyendo la cadena vacía.
3. El autómata A es más potente por ser No Determinista.
4. Cualquier autómata no determinista que reconozca el mismo lenguaje que el
autómata B tiene al menos cuatro estados.
167
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
El conjunto de cadenas que es capaz de aceptar este autómata es {b,bb,bbb} PORQUE
este AFD está compuesto por un símbolo b que converge a tres estados de aceptación q3 ,
q4 y q5 y a un estado final q5.
Ejercicio 26: La relación entre un AP y un LLC (Lenguaje Libre de contexto) permite que
dada una Gramática G, existe entonces un AP que acepta exactamente el lenguaje
generado por G. Dado el siguiente autómata de pila (AP) cuyo funcionamiento se
representa en la siguiente tabla, identifique la gramática correcta y sus reglas que aceptan
el LLC dado por el AP.
168
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
A. S –> 0A0 | 1S2 | 1 | 0
B. S –> 0A0 | 1S2 | 10
C. S –> 0A0 | 1S1 | 2
D. S –> 0A0 | 1S0 | 2 | 0
Ejercicio 27: Dadas las siguientes gramáticas, asócielas a los enunciados que se
presentan de forma correcta. Tenga en cuenta que como Símbolo inicial se toma a “S”
que son los estados iniciales y como símbolos no terminales los estados en el orden de su
nombramiento. El conjunto finito de símbolos terminales son los símbolos del alfabeto ∑
del autómata.
169
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
1. La Gramática D corresponde a una representación válida del lenguaje que acepta
el Autómata del ejercicio dos (2).
2. La Gramática C corresponde a una representación válida del lenguaje que acepta
el Autómata con lambda transiciones del ejercicio tres (3).
3. La Gramática A corresponde a una representación válida del lenguaje que acepta
los Autómatas del ejercicio doce (12).
4. La Gramática B corresponde a una representación válida del lenguaje que acepta
el Autómata del ejercicio cuatro (4).
Ejercicio 28: Dada la siguiente gramática G= (VN= {S, A}, VT= {0,1}, S, P) donde P son
las producciones:
Ejercicio 29: Las Gramáticas regulares pueden ser de dos formas: Lineales por la
derecha y Lineales por la izquierda. También pueden ser ambiguas si existen dos árboles
de derivación distintos para una misma palabra . Dada la Gramática G = {S, A}, T= {0,1}
representada en los dos árboles de derivación siguiente, identifique el tipo de
producciones y el lenguaje que generan:
170
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
1. El Árbol de Derivación A representa una gramática lineal por la derecha.
2. El Árbol de Derivación B representa una gramática lineal por la izquierda y genera
el lenguaje 0(10)*
3. El Árbol de Derivación A representa una gramática lineal por la izquierda y genera
el lenguaje 0(10)*
4. El Árbol de Derivación A no es lineal, es ambigua (puede tener producciones por la
izquierda y la derecha) y genera el lenguaje (10)*
Ejercicio 30: Para el autómata del ejercicio anterior, (ejercicio 201 – 1ESTE ES )
determine que afirmación es válida si se presenta la siguiente gramática. Para el análisis,
asigne un nombre a los estados del autómata que apliquen a la gramática dada.
S → xS
S → yA
S → zB
A → yA
A → yB
B → zB
B→
A → xzS | B A → xzS | yz |
B → yz |
Gramática G Gramática G
1 2
171
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Indique cuál de las siguientes afirmaciones es cierta (donde denota la inclusión estricta):
Ejercicio 32: Las gramáticas del ejercicio anterior (ejercicio 31), tienen dos particularidades que son
válidas afirmarlas:
1. Las reglas de las gramáticas difieren por que tienen diferentes terminales.
2. La palabra generable por la gramática G1 y G2 es xxzyzy
S → aA | bA
A → aB | bB | a
B → aA | bA
A. {a,b}
B. El conjunto de cadenas que pueda generar la ER = a*b*a
C. {aa, aaaa, bbba, ba, bba, baaa, baba}
D. {baaaa, aaaaa, bba}
172
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Ejercicio 35: Cuando se diseñan AP o se formalizan, se utilizan notaciones gráficas
parecidas a la de los diagramas de los AF. Con respecto a esto: ¿qué aspectos de
diseños son válidos para formalizar un AP.?
Ejercicio 36: Al combinar los diagramas de tran siciones de las siguientes máquinas M 1
y M2 :
173
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
El funcionamiento correcto de la máquina M es.
Ejercicio 37: Con referencia a la funcionalidad y creación de una Máquina Universal de Turing
(MUT), es válido afirmar:
1. Una Máquina Universal de Turing es capaz de decidir cualquier lenguaje independiente del
contexto.
2. En el estado de parada de una MUT no puede salir ningún arco
3. En una MUT el lenguaje aceptado por esta máquina no puede contener una cadena vacía.
4. La MUT se diseñó para realizar cálculos específicos.
Ejercicio 38: Un problema de decisión (PD) es aquel formulado por una pregunta (referida
a alguna propiedad) que requiere una respuesta de tipo “si/no”. Para la Teoría de
Lenguajes, un problema de decisión es “insoluble” cuando:
Ejercicio 39: Dada la siguiente Máquina de Turing (MT), determine que afirmaciones son válidas
para su análisis:
174
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
1. Si la primera letra no es una “a” la MT cae en un ciclo infinito leyendo y escribiendo
“a”
2. La máquina acepta palabras que empiezan con “b”
3. La máquina acepta palabras que empiezan con “a”
4. Si la primera letra no es una “a”, la MT cae en un ciclo infinito leyendo y
escribiendo “b”
Ejercicio 40: Con referencia a una Máquina de Turing (MT) de dos direcciones: Una
Máquina de Turing con una cinta infinita en un sentido puede simular una Máquina de Turing
con la cinta infinita en los dos sentidos. Sea M una Máquina de Turing con una cinta infinita
en los dos sentidos, entonces:
1. La Máquina de Turing M que tiene una Cinta Infinita en un sentido, puede simular
a M si tiene una cinta con dos pistas.
2. La cinta superior contiene información correspondiente a la parte derecha de la
cinta M a partir de un punto de referencia dado.
3. La pista inferior contiene tanto la parte izquierda como la derecha de la cinta M
(en orden inverso).
4. La pista inferior y superior leen los datos simultáneamente en ambos sentidos.
Luego y dependiendo de los estado repetitivos, se detiene una pista y continúa
la que menos celdas tenga ocupada.
Ejercicio 42: identifique las cadenas válidas que generan las siguientes ER: muestre
algunas, pero más que las cadenas identifique el lenguaje que representa. Genere
el diagrama de moore o grafique la máquina correspondiente.
si A = {0,1}
a) 0*+1*(01)
b) 10* + 10
c) 01* + 0
d) (1.11*0) *
e) (1 + 10) + 0
f) 1* 0*10
g) 00* 11*
176
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
h) (0+1)*11(1+0)*
178
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
2. Identifique los elementos (tupla) que es.
3. Obtener el autómata Finito para la gramática (plasme los diagramas de
Moore)
4. Identifique el Lenguaje que generan. Identifique si es lineal por la derecha
o la izquierda.
5. Plasme la secuencia y árbol de derivación la cadena 0101 (Use el simulador
para verificarla). E identifique que producciones intervienen. Para justificar
sus respuestas puede apoyarse en la simulación que le dé el software JFLAP.
Ejercicio 46: Diseñe una MT que reconozca el lenguaje de cadenas Máquina que
acepta el lenguaje de palabras sobre {0,1} que comienzan y acaban con el mismo
símbolo
180
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Realice el diagrama de Treslis y Viterbi corrigiendo el dato (ruta correcta). Pare
ello debe mostrar la ruta correcta identificando la s distancias de haming y la
selección dada para seguir la ruta
Tabla 24: Código convolucional. Codificación y decodificación..
181
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Tabla 25: Cálculo de un dato de entrada a partir de un dato codificado con error.
(Nótese que hay interacciones con símbolo vacío, diferente a cadena vacía)
PARTE 1
PARTE 2: Para cada una de las Expresiones Regulares siguientes (ER) realice:
184
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
6. Identifique el lenguaje que representa: (tenga en cuenta como se plasma o
identifica un lenguaje aceptado: módulo página 47 lección 10)
7. Genere tres cadenas válidas y dos no válidas
8. Plasme las tres cadenas válidas para cada ER en una tabla (identificando
jerarquía de operadores regulares, identificando colores). Para ello
apóyese en el video: http://youtu.be/JZPAHHA2PnE (minuto 14 al 33)
9. Identifique en la misma tabla por que las dos cadenas seleccionadas no se
aceptan o en que parte se trunca la jerarquía y orden de los operadores.
10. Seleccione una ER (solo una) y expórtela o genere el autómata o el
diagrama de Moore que sea válido.
EXPRESIONES REGULARES:
Primera: (a+b)*b(b+a)b(b+a)*
Segunda: (0+1)*11(1+0)0(1+10*)*
Tercera: 0*1*+(01)*+(11*00*+01)
185
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
BIBLIOGRAFIA
JFLAP, (2004, 2008) JFLAP Version 7.0 Release August 28, 2009. Extraído el 30
de Mayo de 2011 desde http://www.jflap.org/
186
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MODULO CURSO: 301405 – AUTÓMATAS Y LENGUAJES FORMALES. Ing. (Msc). Carlos Alberto Amaya Tarazona
Brena, R; (2003), Autómatas y Lenguajes. Un enfoque en diseño.
Tecnológico de Monterey. P 214.
187