Documente Academic
Documente Profesional
Documente Cultură
ISSN: 1560-9146
iifi@unmsm.edu.pe
Universidad Nacional Mayor de San Marcos
Perú
INTRODUCCIÓN
RESUMEN
Cuando se escriben programas en un lenguaje convencional de programa-
El artículo presenta una clase parser en Java ción, que tienen que ver con la evaluación de expresiones, se tiene el
para evaluar expresiones algebraicas problema que la expresión a evaluar desde la entrada no siempre es la
empleando algoritmos fundamentales para la misma o del mismo tipo. Por ello el programador debe escribir el código
construcción de compiladores, pasando por la necesario para que la entrada de sus programas sea lo más general posi-
conversión de expresiones de infija a postfija, ble, permitiendo un comportamiento adecuado frente a expresiones y/o
la evaluación de expresiones en notación funciones en la entrada.
postfija, el algoritmo de evaluación por
precedencia de operadores, el algoritmo
parsing de precedencia y el algoritmo de LA CLASE PARSER
construcción de funciones de precedencia. El
objetivo del artículo es escribir un analizador Para evaluar expresiones, se hace uso de algunas técnicas utilizadas en
léxico en un lenguaje convencional de el diseño de compiladores. Las expresiones según su notación pueden
programación de sistemas, utilizando las ser:
posibilidades de entrada y salida del lenguaje
Java para leer las expresiones a evaluar Notación infija.- operando-operador-operando. Ejemplo: A + B
desde la entrada; procesarlas y enviar los Notación prefija.- operador-operando-operando. Ejemplo: + A B
resultados a la salida. Notación postfija.- operando-operando-operador. Ejemplo: A B +
Palabras Clave: Parser, analizador léxico, Al hacer uso de las expresiones infijas, la expresión 1 + 5; consiste de un
evaluación de expresiones postfijas, operador binario junto con sus operandos (argumentos). Una expresión
algoritmo de precedencia de operadores. más elaborada es: 1 + 5 * 2; la cual matemáticamente es evaluada a 11,
debido a que, el operador * (de multiplicación) tiene mayor precedencia
que el de suma. Si no se tiene en cuenta la precedencia, la respuesta
A PARSER CLASS IN JAVA TO EVALUATE
será 12. Esto nos lleva a concluir que una simple evaluación de izquierda
ALGEBRAIC EXPRESSIONS
a derecha no basta.
ABSTRACT
The article presents a Parser class in Java to En expresiones donde están presentes los operadores de resta y poten-
evaluate algebraic expressions using cia ¿Cuál de ellos debe evaluarse primero? Para responder a la pregunta
fundamental algorithms for the construction of considere las expresiones
compilers, passing from the conversion of
expressions from infix to postfix, the evaluation of (1) 6 – 3 – 1,
postfix expressions, the evaluation for precedence (2) 2 ^ 3 ^ 2
of operators, parser algorithms of precedence
and construction algorithm of precedence Para la expresión (1) el resultado es 2; pues las restas se evalúan de
functions. The goal of the article is to write a lexical izquierda a derecha. En el caso (2), las potencias se evalúan de derecha
2 3 2
analyser in a conventional language of systems a izquierda; y la expresión reflejará 2 3 en lugar de (2 ) .
programming, using the possibilities of input and
output of Java language in order to read Las expresiones en postfija, proporcionan un mecanismo directo de eva-
expressions to evaluate from the input, to process luación; existiendo algoritmos de pila para la resolución.
them and to send the results to the output.
Key words: Parser, lexical analyser, postfix (1) Ingeniero Industrial. Profesor del Departamento de Ingeniería de Sistemas e Informática, UNMSM.
expressions evaluation, operators algorithm E-mail: eruizl@unmsm.edu.pe
precedence. (2) Ingeniero Industrial. Profesor del Departamento de Ingeniería de Sistemas e Informática, UNMSM.
E-mail: eraffol@unmsm.edu.pe
SISTEMAS E I NFORMÁTICA
Stack Stack
opStack postfixStack
Parser
StringTokenizer
E xp resión p ostfija : 1 5 2 * +
String string
2 * sqrt ( x + 2 )
pila vacia
Parser p = Parser( String string );
apilar el operando
1
apilar el operando
p.getValue( ) 2
2
desapilar 2 y 5
opStack postfixStack
10 efectuar 2 * 5 = 10
apilar 10
1
StringTokenizer str *
desapilar 10 y 1
...
efectuar 10 + 1 = 11
11 apilar 11
en trada : 2 ^ 4 - 1 /**
* Construct an evaluator object.
* @param s the string containing the expression. */
public Parser( String s )
2 {
opStack = new Stack( );
2 postfixStack = new Stack( );
string = unary2Binary(s);
2 str = new StringTokenizer(string,"+*-/^()xyz ",true);
^
opStack.push( new Integer( EOL ) );
^ }
2 4
Figura 7. Constructor para la clase Parser
^
Figura 6. Conversión de infija a postfija Figura 8. Algoritmo del parser por precedencia de operadores
Para realizar el análisis sintáctico, se ejecuta algo- El análisis sintáctico, propone dos pilas: una para
ritmo en pseudo código presentado en la figura 8. operandos y otra para operadores; luego compara la
precedencia entre operadores consecutivos. Cuan-
En la figura 9, se presenta el código en java que do un operador de más alta precedencia, se encuen-
implementa el algoritmo para evaluar expresiones. tra en la cima (el top o tope de la pila), entonces el
handle, llamado también mango; como lo llamare-
Tabla Driven mos de aquí en adelante, consiste de dos operandos,
Las gramáticas de operadores describen un lenguaje combinados con este operador.
de propósitos especiales, o un subjuego de un lengua-
je típico de programación, como por ejemplo snoboll. Se formaliza las relaciones de precedencia, por la
introducción de 3 relaciones disjuntas:
Las relaciones de precedencia, son especificadas entre
•
un conjunto de operadores, para esa gramática. <. (=) .
>
SISTEMAS E I NFORMÁTICA
donde a < . b significa, que a tiene precedencia me- El proceso continua y como E → ( E ) se tiene,
•
nor que b, a = b, significa que a tiene la misma •
precedencia que b, y a .> b significa, que a tiene $ <. ( = ) .> $
mayor precedencia que b. Por ejemplo, | |
•
+ <. * , ( = ), y * .> + $ E $
3. Ignorar el no terminal para reinsertar, las relacio- Una producción de la forma: N → a A t B β. Donde
nes de precedencia t, es un terminal y A y B son no terminales; cum-
ple con la relación:
$ <. (<. id + <. id .> ) .> $
| | Trailing ( A ) .> t <. Leading ( B )
E E
| | E
$ ( id + id ) $
Repitiendo el algoritmo
E E
$ <. (<. + .> ) .> $
| |
$ ( id + id ) $
el mango es ahora E + E; es decir
N→aAtBβ
N Algoritmo construcción tabla de precedencia
Figura 12. Trailing ( A ) .> t <.Leading ( B ) Figura 13. Algoritmo de construcción de la tabla de precedencia
S ISTEMAS E I NFORMÁTICA
g+ f+
f- g-
g* f*
f/ g/
g^ f^
vv
f v
gid
vv
id
g( v
f(
v v
f) g)
v
g$ f$
+ - * / ^ ( ) Id $
f 2 2 4 4 4 0 6 6 0
g 1 1 3 3 5 5 0 5 0
g+ f+ f+ = 2
g+ = 1
f$
f- g- f- = 2
g- = 1
f$
g+ f- g* f^ f( = 0
g( = 5
g( f(
f$
g+ f- g*
fid = 6
gid = 5
f/
g^
f$ fid g id
>>> Edgar Ruiz L. y Eduardo Raffo L. Edgar Ruiz L. y Eduardo Raffo L. >>>
a. 3.14159*(1+(x/2)^2)^2
ANÁLISIS LEXICOGRÁFICO
Expresión ingresada para evaluar la integral de dicha
función en el intervalo [0, 2] con n = 16, con el método
Existen tres métodos generales de implantación de
de Trapecio; siendo el resultado 11.744961918792724,
un analizador léxico. [AHO]
el cual es el esperado y correcto.
1. Utilizar un generador de analizadores léxicos, como
b. 1+eXp(0-x)*sin(4*x)
el compilador LEX, utilizado para producir el anali-
Expresión ingresada para evaluar la integral de di-
zador léxico a partir de una configuración basada
cha función en el intervalo [0, 1] con n = 3, aplicán-
en expresiones regulares. En este caso, el gene-
dole método de Simpson 3/8; se obtiene como
rador proporciona rutinas para la entrada y mane-
resultado 1.3143968149336276, el cual es el es-
jarla con buffers.
perado y correcto.
2. Escribir el analizador léxico en un lenguaje con-
vencional de programación de sistemas, utilizan-
c. y*(x*x-1)
do las posibilidades de entrada y salida de este
Expresión ingresada para evaluar la ecuación di-
lenguaje para leer la entrada.
ferencial ordinaria del problema del valor inicial con
3. Escribir el analizador léxico en lenguaje ensamblador
y0=1.0, el intervalo [0, 2], n = 4; y evaluado con el
y manejar explícitamente la lectura de la entrada.
método de Runge Kutta 2, se obtienen los siguien-
tes puntos de evaluación.
Para el desarrollo del trabajo, se considera el segundo
método y el lenguaje a utilizar es el JAVA, de Sun.
Muchos compiladores son del tipo parser-driven, lo
CONCLUSIONES
cual significa que el analizador sintáctico llama al
analizador lexical.
El programa presentado consigue el objetivo de es-
cribir un analizador léxico en un lenguaje convencio-
Los token, son la unidad básica lexical; así como las
nal de sistemas para evaluar expresiones y/o funcio-
palabras y la puntuación son las unidades básicas
nes desde la entrada. Los resultados obtenidos con
en una sentencia; sea en el lenguaje español o en el
las pruebas realizadas, son los esperados y correc-
inglés. La figura 19, presenta la clase Token. Los
tos teniendo muy buena precisión y exactitud.
token son descritos en dos partes; un tipo y un valor:
Token = ( type, value).
REFERENCIAS BIBLIOGRAFICAS
Por ejemplo:
Token ( MINUS );
1. Aho, Alfred V.; Sethi, Ravi; Ulman, Jeffrey D. 1990.
Token ( VALUE, equiz);
“Compiladores: Principios, técnicas y herramientas”
Token ( VALUE, zeta);
1ra.edición, Addison-Wesley Iberoamericana S.A. USA.
Esto se presenta en la clase EvalTokenizer mostra-
2. Deitel, Harvey & Deitel, Paul. 2003. “Java How to
da en la figura 20.
program” Fith Edition, USA.