Sunteți pe pagina 1din 8

Centro de Enseanza Tcnica Industrial

Plantel Colomos

Informtica y computacin

1M2

Ivan Alejandro Agraz De Santiago

12300005

Historia del cdigo EBCDIC,ASCII Y UNICODE

EBCDIC (Extended Binary Coded Decimal Interchange Code) es un cdigo estndar de 8 bits usado por computadoras mainframe IBM. IBM adapt el EBCDIC del cdigo de tarjetas perforadas en los aos 1960 y lo promulg como una tctica customercontrol cambiando el cdigo estndar ASCII.

EBCDIC es un cdigo binario que representa caracteres alfanumricos, controles y signos de puntuacin. Cada carcter est compuesto por 8 bits = 1 byte, por eso EBCDIC define un total de 256 caracteres.

Existen muchas versiones ("codepages") de EBCDIC con caracteres diferentes, respectivamente sucesiones diferentes de los mismos caracteres. Por ejemplo al menos hay 9 versiones nacionales de EBCDIC con Latn 1 caracteres con sucesiones diferentes.

El siguiente es el cdigo CCSID 500, una variante de EBCDIC. Los caracteres 0x00 0x3F y 0xFF son de control, 0x40 es un espacio, 0x41 es no-saltar pgina y 0xCA es un guion suave.

0123456789ABCDEF 40 [.<(+!

50 & ] $ * ) ; ^ 60 - / , % _ > ? 70 ` : # @ ' = " 80 a b c d e f g h i 90 j k l m n o p q r A0 ~ s t u v w x y z B0 | C0 { A B C D E F G H I -

D0 } J K L M N O P Q R E0 \ S T U V W X Y Z F0 0 1 2 3 4 5 6 7 8 9 Espacio en blanco - 0 1 0 0 0 0 0 0

Letras maysculas de la A a la Z: se dividen en tres grupos (A-I), (J-R), (S-Z) y en las primeras cuatro posiciones se identifica el grupo al cual pertenece la letra y en las restantes cuatro posiciones el dgito correspondiente a la posicin de la letra en el grupo. A-11000001 B-11000010 C-11000011 D-11000100 E-11000101 F-11000110 G-11000111 H-11001000 I-11001001 J-11010001 K-11010010 L-11010011 M-11010100 N-11010101 O-11010110 P-11010111 Q-11011000 R-11011001 S-11100010 T-11100011 U-11100100 V-11100101 W-11100110 X-11100111 Y-11101000 Z-11101001

La letra se representa 0 1 1 0 1 0 0 1

Los dgitos del cero (0) al nueve (9): se identifican con un uno en las primeras cuatro posiciones y en las restantes cuatro posiciones el dgito en binario. 0-11110000 1-11110001 2-11110010 3-11110011 4-11110100 5-11110101 6-11110110 7-11110111 8-11111000 9-11111001 Cdigo ASCII El cdigo ASCII se desarroll en el mbito de la telegrafa y se us por primera vez comercialmente como un cdigo de teleimpresin impulsado por los servicios de datos de Bell. Bell haba planeado usar un cdigo de seis bits, derivado de Fieldata, que aada puntuacin y letras minsculas al ms antiguo cdigo de teleimpresin Baudot, pero se les convenci para que se unieran al subcomit de la Agencia de Estndares Estadounidense (ASA), que haban empezado a desarrollar el cdigo ASCII. Baudot ayud en la automatizacin del envo y recepcin de mensajes telegrficos, y tom muchas caractersticas del cdigo Morse; sin embargo, a diferencia del cdigo Morse, Baudot us cdigos de longitud constante. Comparado con los primeros cdigos telegrficos, el cdigo propuesto por Bell y ASA result en una reorganizacin ms conveniente para ordenar listas (especialmente porque estaba ordenado alfabticamente) y aadi caractersticas como la 'secuencia de escape'.

La Agencia de Estndares Estadounidense (ASA), que se convertira ms tarde en el Instituto Nacional Estadounidense de Estndares (ANSI), public por primera vez el cdigo ASCII en 1963. El ASCII publicado en 1963 tena una flecha apuntando hacia arriba () en lugar del circunflejo (^) y una flecha apuntando hacia la izquierda en lugar del guion bajo (_). La versin de 1967 aadi las letras minsculas, cambi los nombres de algunos cdigos de control y cambi de lugar los dos cdigos de control ACK y ESC de la zona de letras minsculas a la zona de cdigos de control.

ASCII fue actualizado en consecuencia y publicado como ANSI X3.4-1968, ANSI X3.41977, y finalmente ANSI X3.4-1986.

Otros rganos de estandarizacin han publicado cdigos de caracteres que son idnticos a ASCII. Estos cdigos de caracteres reciben a menudo el nombre de ASCII, a pesar de que ASCII se define estrictamente solamente por los estndares ASA/ANSI:

La Asociacin Europea de Fabricantes de Ordenadores (ECMA) public ediciones de su clon de ASCII, ECMA-6 en 1965, 1967, 1970, 1973, 1983, y 1991. La edicin de 1991 es idntica a ANSI X3.4-1986.[4] La Organizacin Internacional de Estandarizacin (ISO) public su versin, ISO 646 (ms tarde ISO/IEC 646) en 1967, 1972, 1983 y 1991. En particular, ISO 646:1972 estableci un conjunto de versiones especficas para cada pas donde los caracteres de puntuacin fueron reemplazados con caracteres no ingleses. ISO/IEC 646:1991 La International Reference Version es la misma que en el ANSI X3.4-1986. La Unin Internacional de Telecomunicaciones (ITU) public su versin de ANSI X3.41986, Recomendacin ITU T.50, en 1992. A principios de la dcada de 1970 public una versin como Recomendacin CCITT V.3. DIN public una versin de ASCII como el estndar DIN 66003 en 1974. El Grupo de Trabajo en Ingeniera de Internet (IETF) public una versin en 1969 como RFC 20, y estableci la versin estndar para Internet, basada en ANSI X3.41986, con la publicacin de RFC 1345 en 1992. La versin de IBM de ANSI X3.4-1986 se public en la literatura tcnica de IBM como pgina de cdigos 367.

El cdigo ASCII tambin est incluido en su probable relevo, Unicode, constituyendo los primeros 128 caracteres (o los 'ms bajos'). ASCII (acrnimo ingls de American Standard Code for Information Interchange Cdigo Estndar Estadounidense para el Intercambio de Informacin), pronunciado generalmente [ski] o [sci] , es un cdigo de caracteres basado en el alfabeto latino, tal como se usa en ingls moderno y en otras lenguas occidentales. Fue creado en 1963 por el Comit Estadounidense de Estndares (ASA, conocido desde 1969 como el Instituto Estadounidense de Estndares Nacionales, o ANSI) como una refundicin o evolucin de los conjuntos de cdigos utilizados entonces en telegrafa. Ms tarde, en 1967, se incluyeron las minsculas, y se redefinieron algunos cdigos de control para formar el cdigo conocido como US-ASCII.

El cdigo ASCII utiliza 7 bits para representar los caracteres, aunque inicialmente empleaba un bit adicional (bit de paridad) que se usaba para detectar errores en la transmisin. A menudo se llama incorrectamente ASCII a otros cdigos de caracteres de 8 bits, como el estndar ISO-8859-1 que es una extensin que utiliza 8 bits para proporcionar caracteres adicionales usados en idiomas distintos al ingls, como el espaol.

ASCII fue publicado como estndar por primera vez en 1967 y fue actualizado por ltima vez en 1986. En la actualidad define cdigos para 32 caracteres no imprimibles, de los cuales la mayora son caracteres de control obsoletos que tienen efecto sobre cmo se procesa el texto, ms otros 95 caracteres imprimibles que les siguen en la numeracin (empezando por el carcter espacio).

Casi todos los sistemas informticos actuales utilizan el cdigo ASCII o una extensin compatible para representar textos y para el control de dispositivos que manejan texto como el teclado. No deben confundirse los cdigos ALT+nmero de teclado con los cdigos ASCII. Cdigo UNICODE Unicode es un estndar de codificacin de caracteres diseado para facilitar el tratamiento informtico, transmisin y visualizacin de textos de mltiples lenguajes y disciplinas tcnicas, adems de textos clsicos de lenguas muertas. El trmino

Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad y unicidad.[1]

Unicode especifica un nombre e identificador numrico nico para cada carcter o smbolo, el code point o punto de cdigo, adems de otras informaciones necesarias para su uso correcto: direccionalidad, capitalizacin y otros atributos. Unicode trata los caracteres alfabticos, ideogrficos y smbolos de forma equivalente, lo que significa que se pueden mezclar en un mismo texto sin la introduccin de marcas o caracteres de control.[2]

Este estndar es mantenido por el Unicode Technical Committee (UTC), integrado en el Unicode Consortium, del que forman parte con distinto grado de implicacin empresas como: Microsoft, Apple, Adobe, IBM, Oracle, SAP, Google o Yahoo, instituciones como la Universidad de Berkeley, y profesionales y acadmicos a ttulo individual.[3] El Unicode Consortium mantiene estrecha relacin con ISO/IEC, con la que mantiene desde 1991 el acuerdo de sincronizar sus estndares que contienen los mismos caracteres y puntos de cdigo.[4]

El establecimiento de Unicode ha sido un ambicioso proyecto para reemplazar los esquemas de codificacin de caracteres existentes, muchos de los cuales estn muy limitados en tamao y son incompatibles con entornos plurilinges. Unicode se ha vuelto el ms extenso y completo esquema de codificacin de caracteres, siendo el dominante en la internacionalizacin y adaptacin local del software informtico. El estndar ha sido implementado en un nmero considerable de tecnologas recientes, que incluyen XML, Java y sistemas operativos modernos.

La descripcin completa del estndar y las tablas de caracteres estn disponibles en la pgina web oficial de Unicode [1]. La referencia completa se publica, adems, en forma de libro impreso cada vez que se libera una nueva versin principal. La versin digital de este libro est disponible de forma gratuita. Las revisiones y adiciones se publican de forma independiente.

Tabla simplificada de caracteres del cdigo ASCII

S-ar putea să vă placă și