Documente Academic
Documente Profesional
Documente Cultură
Contenido
Ejemplo de HTML....................................................................................................................................................7
Ejemplo de XML.......................................................................................................................................................8
3.4 XHTML..............................................................................................................................................................8
Bibliografa ........................................................................................................................................................................ 12
Uno de los retos iniciales a los que se tuvo que enfrentar la informtica fue el de cmo almacenar la
informacin en los archivos digitales. Como los primeros archivos slo contenan texto sin formato, la
solucin utilizada era muy sencilla: se codificaban las letras del alfabeto en nmeros y estos se almacenaban en
formato binario.
De esta forma, para almacenar un contenido de texto en un archivo electrnico, se utiliza una tabla de
conversin que transforma cada carcter en un nmero. Una vez almacenada la secuencia de nmeros, el
contenido del archivo se puede recuperar realizando el proceso inverso.
Una vez resuelto el problema de almacenar el texto simple, se presenta el reto de almacenar los contenidos de
texto con formato. En otras palabras, cmo se almacena un texto en negrita? Y un texto de color rojo? Y
otro texto azul, en negrita y subrayado?
La solucin que se emplea para guardar la informacin con formato consiste en que el archivo electrnico
almacene tanto los contenidos como la informacin sobre el formato de esos contenidos. Si, por ejemplo, se
quiere dividir el texto en prrafos y se desea dar especial importancia a algunas palabras, se podra indicar de
la siguiente manera:
<prrafo>
Texto con <importante>algunas palabras</importante> resaltadas de forma especial.
</prrafo>
El principio de un prrafo se indica mediante la palabra <prrafo> y el final de un prrafo se indica mediante
la palabra </prrafo>. De la misma manera, para asignar ms importancia a ciertas palabras del texto, se
encierran entre <importante> y </importante>.
El proceso de indicar las diferentes partes que componen la informacin se denomina marcar. Cada una de
las palabras que se emplean para marcar el inicio y el final de una seccin se denominan etiquetas.
Un lenguaje de marcado o lenguaje de marcas es "una forma de codificar un documento que, junto con el
texto, incorpora etiquetas o marcas que contienen informacin adicional acerca de la estructura del texto o su
presentacin".
Los archivos de texto plano son aquellos que estn compuestos nicamente por texto sin formato, slo
caracteres. Ejemplos seran los ficheros editables con el Vi de UNIX, el bloc de notas (Notepad) de Windows
ficheros con extensin .txt o el VIM de Linux.
<ficha>
<nombre>Pepe</nombre>
<apellido>Prez</apellido>
<apellido>Rodrguez</apellido>
<datos_profesionales>
<cuerpo>grupo A</cuerpo>
<especialidad>informtica</especialidad>
<destino>Ayuntamiento de Burgos</destino>
</datos_profesionales>
</ficha>
Algunas de las ventajas que ofrecen los lenguajes de marcas en el tratamiento de la informacin son:
Una mayor portabilidad de los programas para ser implementados en cualquier arquitectura de
hardware o software.
El amplio uso y reutilizacin de los programas, ya que son de cdigo abierto.
Facilidad de mantenimiento debido a que los archivos son ms comprensibles por humanos, y
porque tanto datos como programas pueden ser creados y modificados en cualquier editor de textos.
Generan documentos independientes del dispositivo o dispositivos a los que vayan destinados.
Se pueden mezclar con cdigo de otros lenguajes, de marcas o no (php, JavaScript).
Tambin existen las hojas de estilo o los lenguajes de transformacin, que permiten la "traduccin" de
anotaciones de tipo estructural a anotaciones de carcter tipogrfico.
3.1 SGML
Estndar internacional definido por ISO (International Standards Organization organizacin internacional de
estndares) para la definicin de la estructura y el contenido de documentos electrnicos. Est basado en
GML de IBM. Permite definir lenguajes de marcas orientados al tratamiento de tipos concretos de
documentos pero, an as, fcilmente intercambiables. SGML no ofrece un conjunto de etiquetas, sino la
sintaxis mediante la que crear etiquetas propias. El gran problema de SGML es su enorme complejidad.
Aunque HTML es un lenguaje que utilizan los ordenadores y los programas de diseo, es muy fcil de
aprender y escribir por parte de las personas. El lenguaje HTML es un estndar reconocido en todo el mundo
y cuyas normas define el W3C (http://www.w3.org/). Como se trata de un estndar reconocido por todas las
empresas relacionadas con el mundo de Internet, una misma pgina HTML se visualiza de forma muy similar
en cualquier navegador de cualquier sistema operativo.
El propio W3C define el lenguaje HTML como "un lenguaje reconocido universalmente y que permite
publicar informacin de forma global". Desde su creacin, el lenguaje HTML ha pasado de ser un lenguaje
utilizado exclusivamente para crear documentos electrnicos a ser un lenguaje que se utiliza en muchas
aplicaciones electrnicas como buscadores, tiendas online y banca electrnica.
Segn el Diccionario de la R.A.E., hipertexto es "texto que contiene elementos a partir de los cuales se puede
acceder a otra informacin". En 1980 el fsico Tim Berners-Lee, trabajador del CERN, propuso un nuevo
sistema de hipertexto para compartir documentos. Junto al ingeniero de sistemas Robert Cailliau, Berners-
Lee gan una convocatoria organizada para desarrollar un sistema de hipertexto para Internet. Su propuesta
se llamaba World Wide Web (W3).
El primer documento formal con la descripcin de HTML se public en 1991 bajo el nombre HTML Tags
(etiquetas HTML).
http://www.w3.org/History/19921103-hypertext/hypertext/WWW/MarkUp/Tags.html
La primera propuesta oficial para convertir HTML en un estndar se realiz en 1993 por parte del organismo
IETF (Internet Engineering Task Force grupo de trabajo de ingeniera de Internet). Aunque se consiguieron
avances significativos (en esta poca se definieron las etiquetas para imgenes, tablas y formularios) ninguna
de las dos propuestas de estndar, llamadas HTML y HTML+ consiguieron convertirse en estndar oficial.
En 1995 IETF organiz un grupo de trabajo de HTML, publicando el 22 de septiembre de ese mismo ao el
estndar HTML 2.0 (primer estndar oficial de HTML a pesar de su nmero de versin). A partir de 1996 el
W3C se encargara de publicar los estndares de HTML.
La versin HTML 3.2 se public el 14 de enero de 1997. Incorpora los ltimos avances de las pginas web
desarrolladas hasta 1996, como applets de Java y texto que fluye alrededor de las imgenes.
HTML 4.0 se public el 24 de abril de 1998 (siendo una versin corregida de la publicacin original del 18
de diciembre de 1997) y supone un gran salto desde las versiones anteriores. Entre sus novedades ms
destacadas se encuentran las hojas de estilos CSS, la posibilidad de incluir pequeos programas o scripts en las
pginas web, mejora de la accesibilidad de las pginas diseadas, tablas complejas y mejoras en los
formularios.
La ltima especificacin oficial de HTML se public el 24 de diciembre de 1999 y se denomina HTML 4.01.
Se trata de una revisin y actualizacin de la versin HTML 4.0, por lo que no incluye novedades
significativas.
Desde la publicacin de HTML 4.01, la actividad de estandarizacin de HTML se detuvo y el W3C se centr
en el desarrollo del estndar XHTML. Por este motivo, en el ao 2004 las empresas Apple, Mozilla y Opera,
mostrando su preocupacin por la falta de inters del W3C en HTML, decidieron organizarse en una nueva
asociacin llamada WHATWG (Web Hypertext Application Technology Working Group grupo de trabajo de
tecnologas de aplicacin de hipertexto en web). La actividad actual del WHATWG se centra en el futuro
estndar HTML 5, cuyo primer borrador oficial (http://www.w3.org/TR/html5/) se public el 22 de enero
de 2008. Debido a la fuerza de las empresas que forman el grupo WHATWG y a la publicacin de los
borradores de HTML 5.0, en marzo de 2007 el W3C decidi retomar la actividad estandarizadora de HTML.
Es multiplataforma.
Tiene una curva de aprendizaje muy plana.
Barato (hay muchos editores, visores, verificadores, etc. gratuitos y comerciales).
Base de informacin grande.
Los navegadores son baratos, sencillos de construir y de usar.
Ejemplo de HTML
<html>
<head>
<title>Brazil</title>
</head>
<body>
<h1>Brazil</h1>
<font size="2"><b>Director:</font></b> Terry Gilliam <br>
<font size="2"><b>Protagonista:</font></b> Jonathan Pryce <br>
</body>
</html>
3.3 XML
XML (eXtensible Markup Language lenguaje extensible de marcas). Al igual que SGML, no es un lenguaje de
marcas, sino un metalenguaje (especifica una sintaxis para crear lenguajes de marcado, de ah su cualidad de
extensible). Cubre un subconjunto de caractersticas de SGML ms sencillas de manejar (segn John Boshack,
XML incorpora el 80% de la funcionalidad de SGML con el 20% de su cdigo). XML naci en febrero de
1998 como borrador para una recomendacin del W3C.
pelicula
director actores
actor
Ejemplo de XML
<?xml version="1.0"?>
<pelicula>
Brazil
<director>Terry Gilliam</director>
<actores>
<actor>Jonathan Pryce</actor>
<actor>Robert de Niro</actor>
</actores>
</pelicula>
3.4 XHTML
El lenguaje XHTML es muy similar al lenguaje HTML. De hecho, XHTML
no es ms que una adaptacin de HTML al lenguaje XML. Se han incluido
todas las etiquetas HTML, pero siguiendo las directrices de XML.
Tcnicamente, HTML es descendiente directo del lenguaje SGML, mientras
que XHTML lo es del XML (que a su vez, tambin es descendiente de
SGML).
Las pginas y documentos creados con XHTML son muy similares a las pginas y documentos HTML. Las
discusiones sobre si HTML es mejor que XHTML o viceversa son recurrentes en el mbito de la creacin de
contenidos web, aunque no existe una conclusin ampliamente aceptada. Actualmente, entre HTML 4.01 y
XHTML 1.0, la mayora de diseadores escogen XHTML.
Ejemplo de XHTML
<html>
<head>
<title>Brazil</title>
</head>
<body>
<h1>Brazil</h1>
<font size="2"><b>Director:</b></font> Terry Gilliam <br/>
3.5 CSS
CSS es un lenguaje de hojas de estilos creado para controlar el aspecto o presentacin de los documentos
electrnicos definidos con HTML y XHTML. CSS es la mejor forma de separar los contenidos y su
presentacin y es imprescindible para crear pginas web complejas.
Al crear una pgina web, se utiliza en primer lugar el lenguaje HTML/XHTML para marcar los contenidos,
es decir, para designar la funcin de cada elemento dentro de la pgina: prrafo, titular, texto destacado, tabla,
lista de elementos, etc. Una vez creados los contenidos se utiliza el lenguaje CSS para definir el aspecto de
cada elemento: color, tamao y tipo de letra del texto, separacin horizontal y vertical entre elementos,
posicin de cada elemento dentro de la pgina, etc.
Mediante CSS se pueden crear distintas presentaciones para el mismo documento, facilitando su visualizacin
en varios tipos de dispositivos (ordenador, telfono mvil, iPad, impresora, pdf).
Principales
GML > SGML > XML > Dialectos XML
Documentos en general
Lenguajes descriptivos
ASN.1, EBML, YAML
Lenguajes de presentacin
5 Estndares web
El W3C elabora las normas que deben seguir los diseadores de pginas web para crear las pginas HTML.
Las normas oficiales se pueden consultar de forma gratuita en las siguientes direcciones:
Especificacin oficial de HTML 4.01 (http://www.w3.org/TR/html401/)
Especificacin oficial de XHTML 1.0 (http://www.w3.org/TR/xhtml1/)
El estndar XHTML 1.0 incluye el 95% del estndar HTML 4.01, ya que slo aade pequeas mejoras y
modificaciones menores. Afortunadamente, no es necesario leer las especificaciones y recomendaciones
oficiales de HTML para aprender a disear pginas con HTML o XHTML. Las normas oficiales estn
escritas con un lenguaje bastante formal y algunas secciones son difciles de comprender.
Con la utilizacin de los estndares web se acorta el tiempo de desarrollo, los sitios creados son fciles de
actualizar y mantener, se mejoran los rankings de los motores de bsqueda y, adems, se mejora la
accesibilidad, haciendo las pginas ms accesibles a ms gente, especialmente a los discapacitados, algunos de
los cuales no pueden utilizar navegadores estndar.
El enfoque de los creadores de estndares web se basa en separar contenido, estructura y significado de la
informacin de su presentacin visual y su diseo, de modo que se utilice la herramienta adecuada para cada
trabajo.
Separando contenido (las palabras e imgenes) y presentacin (cmo aplicar estilos a esas palabras e
imgenes), se reducen considerablemente los tiempos de descarga de la pgina y se facilita el mantenimiento.
El diseo de todo un sitio web puede cambiar por otro nuevo y mejorado actualizando simplemente la hoja
de estilo. Se pueden crear hojas de estilo personalizadas para PDAs , telfonos mviles y otros dispositivos
distintos de los ordenadores.
Bibliografa
Xml Juan Diego Gutirrez Gallardo (Anaya)
HTML y CSS Christopher Murphy y Nicklas Persson
HTML & XHTML: The Definitive Guide, 6th Edition Bill Kennedy y Chuck Musciano (OReilly)
Lenguajes de marcas y sistemas de gestin de informacin Juan Manuel Castro Ramos y Jos Ramn Rodrguez Snchez (Garceta)
en.wikipedia.org / es.wikipedia.org
jhh.med.virginia.edu/main/stxml/uploads/SGML.ppt