Sunteți pe pagina 1din 3

Alexandru Adoliu

Programator
DIP, CST

Formatul Comma-Separated Values i meta-limbajul


Extensible Markup Language
n prezent n Departamentul informatic de Proces al Teletrans se stocheaz
informaii att n fiiere .csv ct i n fiiere .xml. Fiierele .csv sunt generate
de interfaa web a sistemului Historical Information System , de sistemul Energy
Management System (care genereaz fiiere hintorders), de Macro-uri Excel pentru
trimitere de date catre server-ul Transelectrica denumit AlphaDen (pentru aplicaii
de monitorizare tensiuni, de reduceri puteri ct i pentru site). n cadru aplicaiei de
Prognoz a Energiei Eoliene, productori de energie regenerabil furnizeaz
prognoze intrazilnice i pentru ziua urmtoare. Fisiere .xml sunt generate n
prezent de Sistemul Historical Information System pentru a fi transmise ctre Piaa
de Echilibrare si de grafiul de curbe de consum de pe server-ul RNCWEB2, n
viitor se va folisi formatul .xml pentru procese asociate Platformei europene de
transparen.

Asemnri dintre cele dou formate


Amndou formatele sunt fiiere lizibile de ctre editoare text indiferent de
platform sistemului de operare (Microsoft-Windows, Apple-iOS sau S.O. Unix/Linux).
Ambele formate sunt bine definite pe hard-disk spre deosebire de informaii aflate in
tabele ale bazelor de date, unde alocrile fizice a informailor sunt manageriate de
aplicaii specializate a bazelor de date.
Fiierele accept modificri ulteriore. Aceast caracteristic este important n
contextul actual dat fiind faptul c aplicaiile sunt dinamice. Dinamica aplicaiilor
poate s solice ai fi aduse informaii n plus, mai puine, sau/i ntr-o codificare
diferit (encoding).
n cadrul fiierelor sunt informaiile sunt separate n mod lizibil, n cazul .csv prin
separatorul de rnd i printr-un sepator caracter (cel mai uzual este , , de unde si
numele formatului, dar pot fi folosite i altele de exemplu caracterul tabulator
, spaiul sau semicolon ; ). Pentru .xml informaiile sunt
stocate in tag-uri i atribute de tag-uri
( <nume_tag nume_atribut=informaie_tip_atribut> informaie_a_nume_tag
</nume_tag>)

Deosebiri eseniale

Alexandru Adoliu
Programator
DIP, CST
Formatul .csv poate stoca informaiile folosind mai puin spatiu de pe hard disk
dect .xml . De exemplu coloanele din tabelul de mai jos explica cum aceleai
informaii sunt
Consum orar.csv

Consum orar.xml

Moment, Valoare
22-07-2014 11:59:26,7026
22-07-2014 11:49:36,7063
22-07-2014 11:39:46,6968
22-07-2014 11:29:56,7101
22-07-2014 11:20:06,6920
22-07-2014 11:10:16,6989
22-07-2014 11:00:26,6925
22-07-2014 10:50:36,6942
22-07-2014 10:40:46,6990
22-07-2014 10:30:56,6922
22-07-2014 10:21:06,6927
22-07-2014 10:11:16,6891
22-07-2014 10:01:26,6900

<?xml version="1.0" encoding="UTF-8"?>


<dateconsum>
<nod1><moment>22-07-2014 11:59:26</moment><valoare>7026</valoare></nod1>
<nod2><moment>22-07-2014 11:49:36</moment><valoare>7063</valoare></nod2>
<nod3><moment>22-07-2014 11:39:46</moment><valoare>6968</valoare></nod3>
<nod4><moment>22-07-2014 11:29:56</moment><valoare>7101</valoare></nod4>
<nod5><moment>22-07-2014 11:20:06</moment><valoare>6920</valoare></nod5>
<nod6><moment>22-07-2014 11:10:16</moment><valoare>6989</valoare></nod6>
<nod7><moment>22-07-2014 11:00:26</moment><valoare>6925</valoare></nod7>
<nod8><moment>22-07-2014 10:50:36</moment><valoare>6942</valoare></nod8>
<nod9><moment>22-07-2014 10:40:46</moment><valoare>6990</valoare></nod9>
<nod10><moment>22-07-2014
10:30:56</moment><valoare>6922</valoare></nod10>
<nod11><moment>22-07-2014
10:21:06</moment><valoare>6927</valoare></nod11>
<nod12><moment>22-07-2014
10:11:16</moment><valoare>6891</valoare></nod12>
<nod13><moment>22-07-2014
10:01:26</moment><valoare>6900</valoare></nod13>
</dateconsum>

338 bytes

1007 bytes

Dei amndou pot fi scrise i editate de editoare text simple, modul de citire
pentru programe care folosesc datele este diferit. Din exemplul anterior, ca aflam
penultima cea mai ndeprtat valoare (adic informaia 6891) prin formatul
.csv trebuie parcus fiierul pn la nregistrarea dorit, dar prin .xml se poate
accesa direct <nodul12>.<valoare>. Acest lucru elibereaz procesorul i memoria
cache de procesul de citirea unor informaii inutile i de asemena cresc viteza de
procesare.
Informaiile din .csv sunt uor integrate n editoare tabelare (Excel) i uor lizibile,
pe cnd cele .xml pot fi integrare dar le trebuie aduse completri pentru a le face
uor lizibile cu fiiere .xsd (XML Schema Definition) sau .dtd (DOCTYPE
declaration) .
Asupra fiierelor .xml se poate aplica condiii de validare a datelor. n contextul n
care o aplicaie genereaz un .xml care trebuie s conin bine definit unele
informaii de tip ntreg (integer) altele de tip ir de caractere (string) , aplicaia care
citete datele va avea certitudinea formatrii corecte.
Condiiile de legalitate se aplic doar pentru formatul .xml. De exemplu
generatorului fiierului .xml din Romania poate descrie prin atribute conveniile
regionale de reprezentare a datei sau a formatului real (float) astfel n o aplicaie din
orice alt ar poate s interpreteze datele din fiierul genereat n Romania.

Alexandru Adoliu
Programator
DIP, CST
Formatul .xml accepta relaionri ntre date ce apar n mod recurent prin faptul
c .xml are o form ierhizat i auto descriptiv.

.csv sau .xml


Folosim .csv cnd control flux-ul de output i input. De exemplu n aplicaia de
monitorizare a Energiei Eoliene pentru a citi multiple valori din fiiere multiple (80
fiiere). Fiierele sunt citite complet, iar simplitatea avantajeaz integrarea n
aplicaie.
Folosim .csv pentru a furniza fiiere excel pentru uurina in care Excel-ul import
formatul tabelar
.xml este folosit pentru a transfera date ntre platforme diferite realizate de
dezvoltatori diferii, de exemplu Historical Information Server i platorma Pieei de
Echilibrare.

S-ar putea să vă placă și