Sunteți pe pagina 1din 26

Capitolul 4.

Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

CURS 10 Gestiunea documentelor

Capitolul 41 INTRODUCERE N HTML i XML 4.1 World Wide Web, HIPERTEXTE, LIMBAJE DE ADNOTARE 4.1.1 Internet, WWW, pagini de Web 4.1.2 Conceptul de hipertext. Limbaje de adnotare 4.2 INTRODUCERE N HTML 4.2.1 Noiuni introductive despre limbajul HTML 4.3 INTRODUCERE N XML 4.3.1 Caracteristici generale, domenii de utilizare ___________________________________________________________
1

Acest material este realizat pe baza lucrrii Introducere n HTML i XML, autori D. Crstoiu, V.E. Oltean, Ed. Printech 2004.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

4.3.2 Elemente fundamentale ale XML Sintaxa n XML -recapitulare R1. Prima linie dintr-un fiier XML, numit declaraia XML, definete - versiunea XML i - standardul de codificare a caracterelor. R2. Un document XML are o structur de arbore, cu un unic element rdcin (sau printe2), marcat printr-o pereche de directive rdcin. R3. Directivele XML sunt plasate ntre paranteze ascuite, < i >. Toate elementele XML sunt delimitate printr-o directiv de deschidere i o directiv de nchidere. R4. Directivele XML sunt sensibile la scrierea cu majuscule sau cu litere mici. R5. Toate elementele XML trebuie s fie imbricate3 corect. R6. n XML se conserv spaiile goale introduse de la tastatur. R7. Caracterul CR/LF adic Carriage Return/Line Feed este convertit n LF, adic trecerea la o linie nou se realizeaz prin tastarea CR. Aceast proprietate NU exist n HTML.
2 3

Parent, n limba englez. Nested, n limba englez.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

R8. Directivele pot avea atribute. Valorile atributelor se scriu obligatoriu ntre caractere ghilimele, i . R9. n XML, comentariile au o sintax similar cu aceea din HTML, adic: <!COMENTARIU --!> i pot aprea practic oriunde n document. Elemente XML - proprieti Documentele XML: 1. sunt extensibile, 2. ntre elementele lor exist relaii dictate de structura de arbore a documentului XML (R2), 3. elementele au coninut i 4. denumire. Convenim s identificm elementul prin numele directivei care l delimiteaz.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

Extensibilitate. Documentele XML sunt extensibile, n sensul c la elementele deja existente se pot aduga altele noi, n scopul mbogirii coninutului informaional. Exemplul 3.3. O posibil extindere a documentului XML din exemplul 3.2. <?xml version="1.0" encoding="ISO<?xml version=1.0 encoding=ISO8859-1"?> 8859-1?> <mesaj> <mesaj> <destinatie>Ionescu</destinatie> <data>1-03-2007</data> <sursa>Popescu</sursa> <ora>16:00</ora> <titlu>Memento</titlu> <locsursa>Bucuresti UPB</locsursa> <continut>Nu uita manuscrisul cursului <destinatie>Ionescu</destinatie> GD!</continut> <sursa>Popescu</sursa> </mesaj> <titlu>Nu uita</titlu> <continut>Nu uita manuscrisul cursului GD!</continut> </mesaj>

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

Relaii ntre elemente. Un document XML are o structur de arbore (R2), astfel nct ntre elementele componente exist relaii de rudenie, de tip printe-descendent, adic ierarhice, sau de tip sor-sor, ntre elementele situate pe acelai nivel ierarhic. Coninutul elementelor. Prin coninutul unui element se nelege blocul delimitat de o directiv de nceput i de directiva pereche de nchidere. ntr-un document XML, coninutul unui element poate fi de mai multe tipuri: 1. coninut definit de elementele n relaie de descendeni cu elementul respectiv (ca elementul curs sau elementul autori din exemplul 3.4); 2. coninut simplu (n exemplul 3.4, coninutul elementelor autor, sau cel al elementelor sec); 3. coninut mixt (n exemplul 3.4, coninutul primului element capitol const att din text propriu-zis ct i din coninuturile elementelor sec descendeni); 4. coninut vid (n exemplul 3.4, coninutul elementului prod, care nu poart nici o informaie).

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

De asemenea, dup cum s-a menionat (R8), la fel ca n HTML, un element, mai exact o directiv, poate avea atribute (de exemplu directiva prod). Numele elementelor. S-a artat c n XML numele directivelor, i deci ale elementelor marcate de acestea, pot fi alese liber, cu respectarea, ns, a urmtoarelor reguli: 1. Numele pot conine litere, numere sau alte caractere (cu excepia caracterului rezervat :). 2. Numele NU poate ncepe cu cifre sau semne de punctuaie. 3. Numele NU ncep cu nici unul din irurile: a. Xml b. XML c. xml, 4. Numele NU conin spaii goale (de exemplu, <titlul_cursului> este permis, dar nu <titlul cursului>. Este recomandabil s nu se scrie nume prea lungi. Adesea documentele XML corespund unor baze de date. n aceast situaie, o regul care uureaz programarea este ca denumirile cmpurilor dintr-o baz de date s coincid cu numele elementelor din documentul XML surs.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

n general, n numele elementelor XML este permis s apar i caractere diacritice (, , , etc.), dar utilizarea documentului XML poate fi n acest caz limitat de software-ul utilizat. Atribute La fel ca n HTML, n XML elementele pot avea atribute4 plasate n directiva de nceput (Rol: a specifica informaii suplimentare privind elementul adnotat). n general, folosirea atributelor poate fi evitat prin transferul informaiei respective ntr-un element descendent suplimentar. De exemplu: <student sex=masculin> <student> <nume>Georgescu</nume> <sex>masculin</sex> <prenume>Mihai</prenume> <nume>Georgescu</nume> <prenume>Mihai</prenume> </student> </student>

Subliniem din nou c valoarea oricrui atribut trebuie scris ntre caracterele "i ", iar ntr-o adnotare nu poate aprea de dou ori acelai atribut.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

Informaia specificat de un atribut poate fi expandat i n mai multe elemente de tip descendeni. n general, se recomand mbogirea elementelor prin adugarea de elemente descendeni, mai degrab dect prin adugarea de atribute directivelor de marcare. Documente XML valide, erori sintactice i vizualizare Documentele XML corecte din punct de vedere sintactic sunt bine formate, iar documentele XML validate conform DTD (Document Type Definition) se numesc documente XML valide (esenial: respect structura de arbore). Un document XML valid este, n primul rnd, un document bine format, care, n plus, se conformeaz regulilor unei DTD. Prezena unor erori n sintaxa documentului va opri interpretarea, cu afiarea unui mesaj corespunztor. n general, fiierele XML pot fi vizualizate cu browserele IE0.5 i Netscape 6. Vizualizarea unui document XML n sine pune n eviden doar structura i coninutul acestuia, fr a-l formata n nici un fel.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

Formatarea documentelor XML. Insule de date. Documentele XML sunt scrise nu numai spre a stoca i structura date i informaii, dar i pentru ca aceste informaii, sau o selecie a lor, s poat fi citite/vizualizate. n acest scop, un document XML trebuie formatat. Exist mai multe procedee de formatare a documentelor XML: 1. Cu ajutorul unei foi de stil CSS (Cascading Style Sheet); 2. Folosind o foaie de stil programat n limbajul XSL (eXtensible Stylesheet Language); 3. Cu ajutorul unui fiier HTML separat, n care se insereaz o insul de date XML (Data Island), selectndu-se pentru afiare, eventual doar anumite elemente din documentul XML; 4. Cu ajutorul unui document HTML separat, n header-ul cruia se insereaz un script - creat n JavaScript sau VBScript. Insule de date XML n pagini HTML. XML a fost conceput pentru a descrie i structura date i informaii, n timp ce HTML este destinat specificrii manierei de afiare a acestor date.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

10

Conceptul de insule de date XML implementeaz aceast filozofie, permind afiarea, selectiv doar a anumitor elemente - sau total, a datelor coninute ntr-un document XML, dintr-o pagin HTML. Tehnica se bazeaz pe directiva neoficial <xml>, plasat n pagina HTML i prin care se realizeaz un link spre fiierul XML de date. Exemplul 3.7. Afiarea selectiv unui document XML ca insul de date ntr-o pagin HTML folosind un tabel. Se consider fiierul XML de descriere a unei biblioteci. Vom numi acest fiier biblioteca.xml. Se dorete s se afieze doar coninutul elementelor titlu i autor.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

11

Folosind IE0.5, documentul biblioteca.xml este vizualizat astfel:

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

12

Pentru afiarea informaiilor cuprinse n biblioteca.xml se creeaz o pagin HTML ce urmeaz s afieze doar coninutul elementelor titlu i autor, folosind tabele bordate. Iat fiierul HTML corespunztor i rezultatul afirii cu IE0.5.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

13

<html> <body> <xml id="bib" src="biblioteca.xml" async="false"></xml> <table border="1" datasrc="#bib"> <thead> <th><i>Titlu</i></th> <th><i>Autor</i></th> </thead> <tr> <td><b> <span datafld="titlu"></span></b></td> <td> <span datafld="autor"></span></td> </tr> </table </body> </html>

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

14

Sunt necesare cteva explicaii suplimentare: - n directiva <xml id="bib" src="biblioteca.xml" async="false"> documentul XML cu numele biblioteca.xml este ncrcat n pagina HTML sub forma unei insule de date cu numele bib. - Atributul async="false" asigur faptul c nici o alt prelucrare HTML nu are loc nainte ca datele din fiierul XML s fie complet ncrcate. - Pentru ca datele din insula XML s poat fi vizualizate din pagina HTML, elementele fiierului XML trebuie legate de elemente din pagina HTML. Pentru aceasta se adaug un atribut data source (datasrc) la directiva <table>: <table border="1" datasrc="#bib"> unde #bib este numele insulei de date XML deja ncrcate. n plus, se adaug atribute de specificare a cmpurilor de date, adic data field (datafld) la directivele <span> din tabel: <td><b><span datafld="titlu"></span></b></td> <td><span datafld="autor"></span></td>

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

15

Se observ c valorile atributelor datafld sunt chiar numele elementelor XML ce vor fi afiate. Obs. Pentru a vizualiza un document XML ca insul de date ntr-o pagin HTML nu este ntotdeauna nevoie s se construiasc tabele n HTML. O tehnic alternativ se bazeaz JavaScript: - se insereaz, de regul n header-ul fiierului HTML, un script5 care ncarc documentul XML apoi - cu ajutorul directivei <span>, se leag elementele XML ncrcate referite prin numele lor - de pagina HTML.

Detalii n cursul tiprit.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

16

5.3.3 Cteva concluzii Fr a epuiza lista, enumerm n continuare, pe scurt, cteva din avantajele utilizrii documentelor XML: 1. Informaiile nestructurate sau semi-structurate sunt transformate, prin includerea ntr-un document XML, n informaii cu un coninut structurat. n general, majoritatea documentelor scrise au o structur intrinsec de arbore titlu, preambul, seciune, paragraf, etc., ce poate fi transpus n structura de arbore a documentelor XML. 2. Informaiilor structurate din documentele XML li se pot aplica tehnici de cutare i indexare, iar consecina este economia de timp. 3. Un document XML este scris, de regul, o singur dat, dar poate fi publicat/afiat de multe ori, n formate diferite. 4. Un document XML poate fi scris pentru mai muli utilizatori/clieni cu interese diferite, care pot seleciona din document doar informaia dorit. 5. Datorit posibilitii programrii de foi externe de stil, la conceperea unui document XML autorul se concentreaz doar asupra coninutului.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

17

6. ntr-un document XML se pot recupera i insera relativ uor fragmente din documente mai vechi, rezultnd o manier simpl de actualizare i mbogire a documentului. 7. Cu ajutorul XML se pot agrega informaii din surse diferite, aflate pe servere Web diferite. De exemplu, un document XML produs de o companie de distribuire a unui produs poate fi transmis i stocat pe serverul Web al companiei productoare, care l poate apoi include ntrun document XML mai amplu, reprezentnd un raport de activitate i evaluare. [Gu00] T. Gugoiu (2000), HTML prin exemple, Ed. Teora. [Phil01] Lee Ann Phillips (2001), XML, Ed. Teora. [Rad00] Fl. Rdulescu (2000),Baze de date n Internet, Editura Printech [Tr00] t. Truan-Matu (2000), Interfaa evoluat om-calculator, MatrixRom, Bucureti. [Tr01] t. Truan-Matu (2001), Prelucrarea documentelor folosind XML i Perl, MatrixRom, Bucureti.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

18

Capitolul 56

COMUNICAIA PRIN FAX MODEM 5.1 INTRODUCERE n acest capitol, se va trata comunicaia de date de tip end to end, fr a se utiliza infrastructura specific de reea: comunicaia este de tip unu la unu, n sensul c, la un moment dat, un calculator comunic cu un altul, pentru transmiterea de date. Din punctul de vedere al mediului de comunicaie, sunt posibile dou situaii: o comunicaie prin legtur serial, utiliznd un protocol simplu i eficient, respectiv o comunicaie utiliznd dispozitive de tip modem, cu protocoale specifice.

Acest material este realizat pe baza lucrrii Gestiunea documentelor, autori D. Crstoiu, V.E. Oltean, Ed. Printech 2000.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

19

5.2 PRINCIPII DE COMUNICAIE SERIAL Principal caracteristic: utilizarea unui circuit specializat pentru conversie paralel-serial la transmisie i invers la recepie. Comunicaia asincron se bazeaz pe trimiterea de cuvinte, cu lungimea informaiei utile de 7 sau 8 bii, n funcie de tipul datelor transmise. Cele dou interfee seriale trebuie s fie programate cu aceeai parametri, pentru a se asigura o recepie corect. Cel mai simplu, pentru comunicaie sunt necesare 3 fire: o Transmit Data (TxD), o Receive Data (RxD) i o un fir de mas.
TxD RxD TxD Masa

Transmitor

RxD

Receptor

Firul TxD de la transmitor este conectat cu firul RxD de la receptor i invers. Distana: o legtur serial asigur, n funcie de mediul i de calitatea cablului de legtur, o conexiune sigur, ce poate acoperi maximum 12 m.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

20

Parametrii de setare ai legturii seriale (opional): Numrul biilor cuvntului de date: parametru ce specific numrul biilor informaionali dintr-un cuvnt transmis, ce poate fi setat la: o 7 bii, pentru comunicaia de text sau ASCII, respectiv la o 8 bii, pentru comunicaia de date. Numrul biilor de START: n mod uzual, se utilizeaz 1 bit de START, aezat naintea cuvntului de date. Numrul biilor de STOP, aezai dup cuvntul de date: acest parametru poate fi setat ca fiind 1 sau 2 (bii). Control paritate: apare ca un bit suplimentar, dac se insereaz bitul de control al paritii, procedur cunoscut sub denumirea de control simplu al corectitudinii recepiei. La transmitor, se calculeaz paritatea, n conformitate cu tipul de paritate setat, iar la receptor, paritatea, calculat n funcie de paritatea setat, este comparat cu bitul de paritate recepionat. Dac paritatea calculat este identic cu paritatea transmis, se consider c s-a recepionat un cuvnt corect; altfel, bitul de stare denumit eroare de paritate este setat, pentru a fi prelucrat prin procedurile software de tratare a erorii. Se

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

21

spune c, prin controlul de paritate, se detecteaz erorile simple deoarece, prin paritate, se poate detecta schimbarea strii unui numr impar de bii. Tip paritate (par sau impar): este un parametru ce permite calculul paritii, n funcie de numrul, par sau impar, al biilor aflai n starea 1. Dac comunicaia este cu control al paritii, acest bit apare dup cuvntul de date, nainte de bitul (sau de biii) de stop. Viteza de comunicaie este reprezentat prin numrul de bii pe secund transmii i se msoar n baud. Acest parametru nu este acelai cu numrul de bii informaionali pe secund, ntruct se iau n consideraie i biii de control (Start, Stop, Paritate). Raportul dintre numrul de bii pe secund transmii i numrul de bii informaionali are valori cuprinse ntre 11/7 i 10/8. Observaie. Pot fi fcute transmisii de date fr a se utiliza controlul de paritate, situaie n care nu se insereaz bitul de control paritate i lungimea cuvntului este mai mic, nsa nu este posibil detectarea erorilor simple de comunicaie.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

22

5.3 UN PROTOCOL SIMPLU DE COMUNICAIE SERIAL un protocol simplu, ce asigur transmisia de date cu confirmare. un protocol ce asigur confirmarea, ce va fi tratat n ambele situaii i anume, cu lungimea blocului fix i, respectiv, variabil. Principi: mprire a irului de date, ce se transmite, n blocuri de lungime specificat (fix sau variabil). Organizarea n blocuri a datelor. Caracterele de control: STB STB STX Lungime Lungime Lungime STX STart of teXt; STB STart of Bloc; EOT End Of Text; Sum control Sum control Sum control EOB End Of Bloc.
EOB
EOB
EOT

dimensiune mare a blocului de date crete ansa apariiei erorilor de comunicaie, pe cnd o dimensiune mic a blocului de date determin un raport inacceptabil ntre informaia transmis i informaia util.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

23

Dac se utilizeaz o comunicaie bazat pe blocuri cu lungime fix, atunci cuvntul lungime nu mai este necesar, el fiind implementat efectiv n software-ul protocol, iar locul su este luat de un cuvnt de date. Pentru calculul sumei de control, se pot utiliza metode simple, bazate pe sum transversal sau metode complexe, bazate pe coduri ciclice. Cu ct metoda de calcul a sumei de control este mai complex, cu att probabilitatea detectrii erorilor este mai mare. Vom considera faptul c iniierea transmiterii de date este fcut de ctre una dintre entiti, dup formularea unei cereri.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

24

Transmitor
ENQ

Receptor

Transmitor
ENQ

Receptor

NACK
ACK

ENQ
Bloc date

ACK

ACK
. .

Bloc date

ACK
a)
b)

Confirmare pozitiv (a), confirmare negativ (b).

formularea cererii este fcut prin trimiterea unui cuvnt de control ENQ (ENQuire), la care partenerul va rspunde cu: o ACK (Acknowledge, i.e. confirmare pozitiv), o NACK (Not Acknowledge, i.e. confirmare negativ, adic cuvntul de control recepionat nu este asimilat cu ENQ) sau o WACK (Wait Acknowledge, semnificnd faptul c s-a recepionat corect ENQ, ns partenerul este ocupat sau nu are nimic de comunicat).

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

25

Intrepretarea cuvntului WACK presupune introducerea unui timp de ateptare, pn la o nou ncercare de iniiere a comunicaiei. O situaie special este cea n care receptorul nu rspunde, indicnd transmitorului faptul c: legtura fizic este defect sau protocolul implementat la receptor nu este operaional. n aceast situaie, nainte de a declara legtura defect, transmitorul reia interogarea, de un numr de ori precizat n informaia de setare. Aceeai interpretare este fcut i n situaia n care se primesc mai multe rspunsuri NACK consecutive. Dup agrearea comunicaiei ntre cei doi parteneri, se trece la transmiterea efectiv a blocurilor de date, ateptnd, dup fiecare bloc, confirmarea cu un cuvnt de control ACK, dac recepia este corect. Un bloc la care se primete confirmare negativ (NACK) sau la care nu se rspunde cu nici o confirmare n timpul de ateptare specificat, va fi retransmis.

Capitolul 4. Introducere n HTML i XML

_____________________________________________________________________________________________________________________________________________________________________________________________________________________

CURS 10

26

Acest exemplu este o bun explicaie a modului n care dou echipamente comunic ntre ele, prin schimbarea de mesaje, organizate n blocuri de date. De fapt, aceasta este modalitatea de comunicaie n majoritatea protocoalelor, cu diferenieri legate de modul de calcul al sumei de control i al dimensiunii pachetului. Filozofia este pstrat i la comunicaia n reea, cu observaia major c, n acest caz, este utilizat o stiv de protocoale i, n acelai timp, multe din informaiile de control sunt transmise prin header-e.

S-ar putea să vă placă și