Documente Academic
Documente Profesional
Documente Cultură
Editoare de texte care permit numai introducerea, editarea, salvarea i tiprirea textelor. Nu au facilitti
de tehnoredactare i nici de inserare elemente grafice i se utilizeaz pentru coresponden i scriere de
programe (de exemplu WordPad, NotePad, Write, Edit).
2.
3.
Caracterului este un element indivizibil care poate fi caracterizat prin simbolului reprezentat (liter,
cifr, operator matematic, simbol ortografic), culoarea elementului i a fundalului, corpului de liter
utilizat (fontului), mrimea i stilului (obinuit, ngroat, cursiv, umbrit etc.).
2.
3.
Paragrafului este o poriune de text care se termin prin apsarea tastei Enter. O linie fr nici un
caracter, obinut prin apsarea tastei Enter, este un paragraf vid. Aceast linie fr nici un caracter se
mai numete:
a) Linie Window este ultima linie a unui paragraf, care nu mai ncape pe pagina/coloana curent
i este trecut automat pe pagina/coloana urmtoare;
b) Linie Orphan este prima linie a unui paragraf care rmne singur la sfritului
paginii/coloanei curente.
4.
Seciunea - este un grup de paragrafe consecutive delimitate prin caracterului neprintabil sfrit de
seciune (Section Break). Aceast comand se introduce din bara de meniuri prin Insert / Break /
Section Break i se terge ca un caracter obinuit (tasta Delete sau Backspace).
5.
Pagin - este zona de editare realizat automat, n funcie de setrile fcute de utilizator referitoare
la: dimensiunile fizice ale hrtiei, marginile documentului, orientarea textului (Portrait / Landscape).
Extensia definete tipului de fiier (text, executabil, baza de date, graficetc). Datorita extensiilor
calculatorului identifica mai uor fiierele i le asociaz o aplicaie care le deschide.
Forma: Nume fiier.extensie (punctului face delimitarea)
Extensia fiierelor document este: .doc
Definiie
.DOC (abreviere de la document) este extensia numelui de fiier al documentelor produse de diverse
procesoare de text n baza formatului impus de Microsoft Word versiunile 1.0 - 2003. Este un tip de fiier
binar, care pe lng textului propriu-zis stocheaz i datele legate de formatarea acestuia, de asemenea i
elemente non-textuale precum imagini, grafic sau diagrame.
Dei este considerat nvechit i a fost nlocuit inclusiv de ctre creatorii si, rmne, pentru moment, unului
dintre cele mai utilizate formate pentru procesare de text.
ncepnd cu 2006, formatului DOC a nceput s aib concuren din ce n ce mai acerb din partea unor
formate deschise precum OpenDocument (extensie ODT), formatului standard al programului Open Office.
Fiierele document - .doc sunt, n general, deschise cu Microsoft Word, dar sunt i surse-deschise alternative,
cum este OpenOffice sau NeoOffice.
Definiie
Formatarea se refer la schimbrile care se pot face la aspectului caracterelor (litere, cifre, semne speciale),
aspectului marginilor paginii, aspectului paragrafelor .a.
Definiie
Fonturile sunt caractere tipografice cu o anumit form.
1. Clasificarea fonturilor se face in funcie de urmtoarele criterii:
dup dimensiunile acceptate
o cu dimensiuni fixe (nescalabile fonturi bit-mapped). Exemplu: numai dimensiunile 8, 12,
16, 24
o cu dimensiuni variabile (scalabile true type fonts) . Exemplu: pot avea dimensiuni
intermediare 5, 13, 15, 17.
dup form
o fr serif - Sans Serif (serif este un element grafic care apare ca adaos la captului anumitor
tipuri de litere picioru sau linie marcat). Exemplu: Arial, Tahoma, Verdana
o cu serif Serif. Exemplu: Times New Roman, Courier, Garamont
o caligrafice Script (Sans Serif modificat). Exemplu: Lucida Handwritting, Brush Script
dup lime
o cu lime fix Monospaced (neproporionale). Exemplu: Courier, Lucida
o cu lime variabil (proporionale). Exemplu: Arial, Haettenschweiler
2. Caracteristici font
a. Form reprezint alura i indic numele fontului. Se caracterizeaz prin:
Grosime (weight). Exemple: A - Times New Roman, A - Impact, A - Verdana, A - Arial Black
nclinare. Exemple: Clasa - Times New Roman, Clasa Bookman Old Style, Clasa - Courir
Proporia dintre nlimea i grosimea unei litere. Exemple: a - Times New Roman, a Impact, a - Tahoma
Dimensiunea codiei unei litere. Exemplu: f j -Times New Roman, f j-Impact, f j-Verdana
b. Dimensiune (Size). Se mai numete corp de liter i se msoar n puncte tipografice points. 1 point =
1/72 inch; 2 pica = 1 pica. Mrimea caracterelor depinde de font. Exemplu la dimensiunea 14:
INFORMATICA
Times New Roman
INFORMATICA
Tahoma
INFORMATICA
Comic Sans Serif
c. Stil (Style)
-
d. Efecte (Effects)
-
e. Culoare (Color)
3. Alte tipuri de formatare
Spaierea se obine prin opiunea Format-Font subopiunea Character Spacing. Sunt posibile urmtoarele
opiuni:
Programator Lowered by 5 pt
n foarte multe standarde i norme tehnice n vigoare, interne i internaionale, sunt enumerate o serie de date
tehnice i recomandri n sistemului de msur tipografic.
Sistemului de msur tipografic este un semn tolerat n ara noastr i se utilizeaz pentru determinarea
dimensiunilor. Acest sistem folosete msuri n care unitatea este mai mic dect cea din sistemului metric.
Unitatea de msur a lungimii, n tipografie, este "punctului tipografic".
5. Elemente tipografice
Punctului tipografic folosit la noi n ar a fost creat n prima jumtate a secolului al XVIII-lea i se
folosete de atunci n aproape toate rile din Europa, sub denumirea de didot, dup numele creatorului su.
Acest punct deriv din olului francez (27,1 mm) i reprezint a 72-a parte din acest ol. n STAS-ului
6302/1971 se arat c relaia dintre sistemului metric i sistemului de msur tipografic este urmtoarea: punct tipografic (p) este egal cu 0,376065 mm la 20 C; deci 1 m (mai precis 1000,333 mm) la 20 C = 2660
p.
Corpului de liter este mrimea literei (floarea literei plus spaiului deasupra i dedesubt, care creeaz
distana dintre rnduri), exprimat n puncte tipografice.
Floarea literei este imaginea literei care apare pe hrtie.
Coridoare de text nseamn poriuni albe n text formate pe mai multe rnduri consecutive prin spaiile
dintre cuvinte, att pe linie vertical, ct i pe linie oblic. Este un defect de culegere.
Evidenierea reprezint scoaterea n eviden (sublinierea) a textelor, prin diferite procedee.
Tietura literelor variante ale literelor, n cadrului aceluiai caracter de liter, diferenierea
constnd n saturaia literelor (grosime relativ a liniilor florii):
Capitlue - litere cu floarea avnd dimensiunile literelor minuscule dar cu forma grafic a literelor
majuscule.
ngropare n text element cules sau de ilustraie, nconjurat din dou, trei sau patru prti de text.
Format (de text, de coal etc.) - dimensiunile textului, colii etc.
Ptrior dimensiunea spaiului egal ca grosime cu corpului literei.
n alte ri se folosesc sisteme de msur tipografice diferite. Astfel, n SUA i n Anglia se folosete
punctului tipografic derivat din olului englez (1 ol=25,4 mm), din care cauz are mrimea de 0,352777
mm.
6. Clasificarea caracterelor
6.1. Familii de caractere
Familia de litere cunoscut sub denumirea de "medievale" cuprinde caracterele ce au piciorue de form
triunghiular, racordat, avnd un grad de contrast mediu.
ABCDEFG abcdefg 123456
A doua familie de caractere, cunoscut sub denumirea "anticva", cuprinde caracterele ce au piciorue de
forma unor linii drepte, subiri, perpendiculare pe liniile principale, avnd un grad de contrast ridicat.
ABCDEFG abcdefg 123456
O alt familie de caractere, cunoscut sub denumirea de "egiptene", cuprinde caracterele cu piciorue sub
form de dreptunghi (uneori apropiat de trapez) i un grad de contrast mic.
ABCDEFG abcdefg 123456
Familia de caractere cunoscut sub denumirea de "groteti", cuprinde caracterele ce nu au piciorue, fiind
lipsite de contrast (au aceeai grosime, att a liniilor principale, ct i a celor secundare).
ABCDEFG abcdefg 123456
A cincea familie, denumit a caracterelor "caligrafice", cuprinde caractere ce imit scrisului de mn.
ABCDEFG abcdefg 123456
A asea familie, denumit "maina de scris", cuprinde caractere ce imit literele de la aceast main: toate
literele au aceeai lime.
ABCDEFG abcdefg 123456
6.2. Clasificarea dup mrimea literei.
Mrimea literei se exprim prin corpului lor, care se msoar n puncte tipografice. Conform STAS-6302/71,
mrimea de corp a literei tipografice, exprimat n puncte tipografice i n milimetri, cu denumirile lor, sunt:
- corp 4 - 1,504 mm Diamant
- corp 5 - 1,880 mm Perl
- corp 6 - 2,256 mm Nonpareille
- corp 7 - 2,632 mm Colonel
- corp 8 - 3,009 mm Petit
- corp 9 - 3,384 mm Borgis
- corp 10 - 3,760 mm Garmond (Corpus)
- corp 12 - 4,512 mm Cicero
- corp 14 - 5,264 mm Mittel
- corp 16 - 6, 016 mm Teria
- corp 18 - 6,768 mm Parangon (1,5 cicero)
- corp 20 - 7,520 mm Text
- corp 24 - 9,024 mm Dublucicero
Corpurile de liter pn la 12 inclusiv se folosesc pentru culegerea textului de baz.
Corpurile 14 i mai mari se folosesc n mod special pentru culegerea titlurilor textului crilor pentru copii i
afie.
6.3. Clasificarea cifrelor
Cifrele sunt semne grafice ale numerelor. Ele se clasific n dou categorii:
cifre arabe caracterizate prin aceea c au grosimea ntotdeauna ct jumtatea corpului lor;
cifre romane care se culeg cu ajutorului literelor tipografice cu floare majuscul.
2. Formatarea paragrafelor
Se folosete meniului Format, opiunea Paragraph.
Aliniere:
Indentare ndeprteaz textului fa de marginea din stnga i/sau marginea din dreapta, a ntregului text
sau doar a primului rnd (First Line) sau ndeprteaz toate liniile paragrafului n afar de prima (Hanging).
Spaiere - ndeprteaz paragrafului fa de paragrafului sau obiectului care se afl nainte de prima linie a
lui (Before) i/sau dup ultima sa linie (After).
At least distana va avea cel puin valoarea din caseta At i va crete dac liniile conin majuscule
Multiple distana va fi egal cu nlimea celui mai mare caracter de pe un rnd nmulit cu
numrului introdus n caseta At.
Controlului liniilor unui paragraf se realizeaz cu Meniului Format, opiunea Paragraph, subobiunea
Line and Page Breaks, oferind urmtoarele setri:
Keep Lines Together tot textului setat cu acest atribut va fi pe aceeai pagin. Se folosete la tabele
care trebuie s ncap pe aceeai pagin sau paragrafe care nu trebuie s apar pe pagini diferite.
Keep With Next textului setat cu acest atribut se va plasa pe aceeai pagin cu paragrafului care
urmeaz. Se folosete pentru legarea obligatorie a titlurilor de capitole, subcapitole, paragrafe de
primului paragraf de text.
Page Break Before - foreaz un salt la pagin nou naintea paragrafului curent. Se folosete pentru
plasarea pe pagin nou a nceputului de capitol sau a altui text.
Pentru text se vor utiliza fonturi Serif iar pentru titluri fonturi Sans Serif.
Fonturie Serif sunt preferate n cri, ziare, scrisori iar fonturile Sans Serif n documente oficiale.
Fonturile trebuie folosite n funcie de context, destinatar. De exemplu, pentru SUA, fondului
standard este Arial; pentru Romnia este Time New Roman.
Nu se recomand mai mult de dou fonturi diferite pe pagin. Combinarea acestora trebuie s
realizeze un contrast agreabil. De exemplu, font luminos i rar cu un font ntunecos i des; font de
dimensiuni reduse cu unului de dimensiuni mai mari.
Nu se combin dou fonturi Sans Serif (de exemplu Arial cu Century Gothic) deorece au un contrast
slab ntre ele.
Fonturile cu nlimi mai mari dau senzaia de robustee i stabilitate (de exemplu Times New Roma
fa de Garamond).
studiaz
algoritmii
SVG (Scalable Vector Graphics) este un format de fiier care descrie bidimensional
vectorului grafic.
Dup tipului datelor din aceast structur bidimensional, imaginile prelucrate pot fi mprite n mai
multe categorii:
imagini scalare, n care fiecare component este un scalar (un numr unic); ca exemple de
astfel de imagini se pot da imaginile monocrome (n care punctele au doar doua valori
posibile, ce corespund unui coninut binar al imaginii, n general alb-negru) i imaginile cu
nivele de gri (de tipului imaginii de luminan de pe ecranele televizoarelor alb-negru).
Programele pentru desenare pot s lucreze n grafica de pixeli sau n grafica vectorial.
n grafica pe calculator, grafica vectorial este un procedeu prin care imaginile sunt construite
cu ajutorului descrierilor matematice prin care se determin poziia, lungimea i direcia liniilor
folosite n desen. Imaginile vectoriale sunt complementare imaginilor bitmap, din grafica raster, n
care imaginile sunt reprezentate ca un tablou de pixeli.
Grafica bitmap (bitmapped graphics): realizeaz o imagine din puncte (pixeli), care de fapt sunt
nite dreptunghiuri foarte mici. Pentru fiecare pixel al desenului se memoreaz codului de culoare.
Un avantaj al acestei grafici este c imaginea creat din puncte poate s conin foarte multe
detalii, ns cnd dimensiunea desenului se modific, el pierde din calitate.
Astfel, dac se mrete foarte mult, conturului desenului apare n trepte (efectului de dinti de
ferestru), iar dac se micoreaz foarte mult, punctele ajung s se suprapun unele peste altele.
Un alt dezavantaj al acestui tip de grafic este dimensiunea foarte mare a fiierului n care se
memoreaz desenului, deoarece cu ct desenului este mai mare cu att el conine mai multe puncte
pentru care trebuie s se memoreze codului de culoare, iar cu ct se folosesc mai multe culori n
realizarea desenului, cu att sunt necesari mai multi biti pentru memorarea culorii pentru fiecare
pixel.
Astfel, dac se folosete o paleta de 16 culori, pentru fiecare pixel din desen sunt necesari 4 biti
pentru culoare, iar dac se folosete o palet de 256 de culori, sunt necesari 8 biti de culoare. n
al doilea exemplu, din cauza mririi numrului de culori, necesarului de suport pentru memorarea
desenului se dubleaz.
n grafica vectorial (vector graphics) imaginile sunt formate din obiecte (grupuri de linii drepte
sau curbe) descrise prin formule matematice care stabilesc dimensiunea, poziia i orientarea lor.
Aceste desene pot fi redimensionate i rotite fr s-i piard din calitate, deoarece ele se
regenereaz la orice dimensiune i n orice poziie prin formulele matematice cu care au fost
descrise.
Principalului lor dezavantaj const n faptului c, fiind alctuite din obiecte descrise cu formule
matematice, att numrului acestor obiecte ct i complexitatea lor sunt limitate, depinznd de
biblioteca de formule matematice folosit de programului de desenare.
Definiie
Procesarea imaginilor este definit ca orice proces sau metod de prelucrare a informaiilor, ce are ca
intrare una sau mai multe imagini. Rezultatului prelucrrii poate fi una sau mai multe imagini, ns poate fi
reprezentat i de orice alt informaie (histogram, palet de culori, figuri geometrice, etc.).
Prelucrarea imaginilor este o particularizare a prelucrrii semnalelor (Signal processing).
Prelucrarea imaginilor i propune:
-
Metode de prelucrare:
Tipuri de transformri
Transformri geometrice afine
Scalarea (Scaling). Implic mrirea sau micorarea imaginilor iniiale. n general mrirea se face
fra pierderea informaiei, n timp ce micorarea duce la pierderea informaiei.
Rotirea (Rotation). Implic rotirea imaginii n plan. n general se pierde informaie, ns n cazului
rotirii cu unghiuri a cror msura este multipl de 90o, nu se pierde informaie.
Transformri specifice
Transformarea culorilor (Color balance). Implic modificarea paletei de culoare folosite. Spre
exemplu pentru a reproduce corect culorile neutre (alb, negru).
Combinarea. Implic un proces ce are ca intrare un set de imagini, iar ca ieire o imagine obinut
prin combinarea setului iniial.
Segmentarea (Segmentation). Este folosit pentru a putea partiiona o imagine n mai multe regiuni,
n scopului de a nlesni procesarea, sau pentru determina zonele ce prezint interes spre a fi analizate
mai amnunit.
Interpolarea i demozaicare (Demosaicing). Aceast metod este folosit pentru a obine o imagine
coerent folosind ca surs imaginile obinute de la senzorului de captur. n general se folosesc
imaginile obinute prin aplicarea celor trei filtre: rou, verde i albastru.
n genere n memorie imaginile sunt salvate sub form de raster (Raster graphics), iar pe un mediu extern ele
sunt salvate sub o form comprimat.
O imagine este caracterizat de:
Definiie
Adncimea culorii - reprezint numrului de biti care sunt folositi pentru a reprezenta culoarea unui singur
pixel.
BPP - Bits per pixel:
Focuserv ofer produsele software cele mai cunoscute de captur a informaiilor, ce proceseaz milioane de
forumulare critice afacerilor n fiecare zi, reducnd costurile cu livrarea i procesarea informaiei ctre
sistemele din ntreprindere.
Descrierea produsului
Soluia software a clientului nostru citete informaia coninut n documente, indiferent dac aceasta este
stocat pe hrtie, Internet, PC-uri sau PDA-uri apoi supune fiecare dat unei serii de verificri riguroase
nainte de a fi transferat ctre diferite aplicaii din ntreprindere. De asemenea, pstreaz o imagine a
documentului original mpreun cu datele extrase, pentru accesare rapid.
ImageSoftware a dezvoltat soluii software pentru recunoaterea inteligent a documentelor, proiectate
pentru a procesa diferite formulare, pentru a identifica numeroase tipuri de documente i pentru a extrage
informaiile i datele coninute n acestea.
Aspecte tehnice
La nceput am dezvoltat un proiect pilot care mrete funcionalitile bibliotecii de imagini cu posibilitatea
de a detecta linii i a le muta, detectarea marginilor, a inclinaiei i reabilitarea automat a documentelor albnegru nclinate. Alte funcionalitti se gsesc n nregistrarea abloanelor urmate de detectarea siglelor,
recunoaterea abloanelor i multe altele.
n acest moment desfurm un proiect de detectare de text cu funcionalitti complete, incluznd detectarea
paragrafelor i structurilor tabelare.
Provocarea
Proiectarea algoritmilor pentru procesarea imaginii, algoritmi ce se execut la viteze foarte ridicate, cu
rezultate de mare acuratee, pentru o gam larg de documente prelucrate.
Tehnologia
C/C++ i ATL/COM pe platforme Microsoft OS.
OBSERVAIE. Firma i serviciile oferte sunt fictive.
III. Glosar
Termen
Procesor de texte
Documentului
Tehnoredactarea
Caracterului
Cuvntului
Paragrafului
Seciunea
Pagin
Formatarea
Fonturile
Didot
Corpului de liter
Floarea literei
Coridoare de text
Evidenierea
Capitlue
Ptrior
Tipometrului
Indentare
Definiie
pachet de programe de prelucrare destinat introducerii textelor i
tehnoredactrii documentelor. Se mai numete program pentru
tehnoredactare asistat de calculator, tehnoredactare
computerizat sau tehnoredactare cu calculatorului
dovad scris sau tiprit, prin care se atest un fapt, se confer un
drept, se recunoate o obligaie i pe care sunt nscrise informaiile
ntr-un anume format. Documentului este o colecie de paragrafe i
obiecte
operaia de pregtire tehnic i grafic a unui manuscris destinat
imprimrii i cuprinde: stabilirea tipului de imprimare, a formatului
documentului, indicarea tipului de caracter adecvat textului,
titlurilor, subtitlurilor, paginaia, dimensionarea i amplasarea
imaginilor, tabelelor etc. utiliznd un procesor de text
element indivizibil care poate fi caracterizat prin simbolului
reprezentat, culoarea elementului i a fundalului, corpului de liter
utilizat, mrimea i stilului
unitatea fundamental de comunicare a unui neles i este un ir de
caractere cuprinse ntre dou caractere blank
o poriune de text care se termin prin apsarea tastei Enter
un grup de paragrafe consecutive delimitate prin caracterului
neprintabil sfrit de seciune
zona de editare realizat automat, n funcie de setrile fcute de
utilizator referitoare la: dimensiunile fizice ale hrtiei, marginile
documentului, orientarea textului
se refer la schimbrile care se pot face la aspectului caracterelor
(litere, cifre, semne speciale), aspectului marginilor paginii,
aspectului paragrafelor .a.
sunt caractere tipografice cu o anumit form
punct tipografic derivat ca unitate de msur din olului francez
mrimea literei (floarea literei plus spaiului deasupra i dedesubt,
care creeaz distana dintre rnduri), exprimat n puncte tipografice
imaginea literei care apare pe hrtie
poriuni albe n text formate pe mai multe rnduri consecutive prin
spaiile dintre cuvinte, att pe linie vertical, ct i pe linie oblic
scoaterea n eviden (sublinierea) a textelor, prin diferite procedee
litere cu floarea avnd dimensiunile literelor minuscule dar cu
forma grafic a literelor majuscule
dimensiunea spaiului egal ca grosime cu corpului literei
o linie gradat, att n sistemului de msur tipografic (punct,
cicero, cvadrat), ct i n sistemului metric (centimetru, milimetru)
ndeprteaz textului fa de marginea din stnga i/sau marginea
din dreapta, a ntregului text sau doar a primului rnd (First Line)
sau ndeprteaz toate liniile paragrafului n afar de prima
(Hanging)
Spaiere
Culoare
Conurile
Lumina monocromatic
Model de culoare
Imagine digital
Pixeli
Grafica vectorial
Grafica bitmap
(bitmapped graphics)
Procesarea imaginilor
Rezoluia
Adncimea culorii
Imaginile digitale pot fi create cu ajutorului unei game variate de dispozitive tehnice, aa cum ar fi
aparate de fotografiat digitale, aparate de filmat digitale, scanere de imagine, maini de msurat
coordonate, radare aeriene i multe altele. Imaginile digitale mai pot fi de asemenea obinute i/sau
sintetizate (create) din diferite date ne-imagistice, eventual "artificiale", aa cum ar fi funcii
matematice, modele bi- i tri-dimensionale, grafic computerizat, etc.
Documentului - reprezint o dovad scris sau tiprit, prin care se atest un fapt, se confer un
drept, se recunoate o obligaie i pe care sunt nscrise informaiile ntr-un anume format. Documentului este
o colecie de paragrafe i obiecte.
Definiie
Tehnoredactarea este operaia de pregtire tehnic i grafic a unui manuscris destinat imprimrii i
cuprinde: stabilirea tipului de imprimare, a formatului documentului, indicarea tipului de caracter adecvat
textului, titlurilor, subtitlurilor, paginaia, dimensionarea i amplasarea imaginilor, tabelelor etc. utiliznd un
procesor de text.
Scopului utilizrii procesoarelor de texte:
6.
7.
Editoare de texte care permit numai introducerea, editarea, salvarea i tiprirea textelor. Nu au facilitti
de tehnoredactare i nici de inserare elemente grafice i se utilizeaz pentru coresponden i scriere de
programe (de exemplu WordPad, NotePad, Write, Edit).
5.
6.
Caracterului este un element indivizibil care poate fi caracterizat prin simbolului reprezentat (liter,
cifr, operator matematic, simbol ortografic), culoarea elementului i a fundalului, corpului de liter
utilizat (fontului), mrimea i stilului (obinuit, ngroat, cursiv, umbrit etc.).
5.
6.
Paragrafului este o poriune de text care se termin prin apsarea tastei Enter. O linie fr nici un
caracter, obinut prin apsarea tastei Enter, este un paragraf vid. Aceast linie fr nici un caracter se
mai numete:
c) Linie Window este ultima linie a unui paragraf, care nu mai ncape pe pagina/coloana curent
i este trecut automat pe pagina/coloana urmtoare;
d) Linie Orphan este prima linie a unui paragraf care rmne singur la sfritului
paginii/coloanei curente.
6.
Seciunea - este un grup de paragrafe consecutive delimitate prin caracterului neprintabil sfrit de
seciune (Section Break). Aceast comand se introduce din bara de meniuri prin Insert / Break /
Section Break i se terge ca un caracter obinuit (tasta Delete sau Backspace).
7.
Pagin - este zona de editare realizat automat, n funcie de setrile fcute de utilizator referitoare
la: dimensiunile fizice ale hrtiei, marginile documentului, orientarea textului (Portrait / Landscape).
19
Extensia definete tipului de fiier (text, executabil, baza de date, graficetc). Datorita extensiilor
calculatorului identifica mai uor fiierele i le asociaz o aplicaie care le deschide.
Forma: Nume fiier.extensie (punctului face delimitarea)
Extensia fiierelor document este: .doc
Definiie
.DOC (abreviere de la document) este extensia numelui de fiier al documentelor produse de diverse
procesoare de text n baza formatului impus de Microsoft Word versiunile 1.0 - 2003. Este un tip de fiier
binar, care pe lng textului propriu-zis stocheaz i datele legate de formatarea acestuia, de asemenea i
elemente non-textuale precum imagini, grafic sau diagrame.
Dei este considerat nvechit i a fost nlocuit inclusiv de ctre creatorii si, rmne, pentru moment, unului
dintre cele mai utilizate formate pentru procesare de text.
ncepnd cu 2006, formatului DOC a nceput s aib concuren din ce n ce mai acerb din partea unor
formate deschise precum OpenDocument (extensie ODT), formatului standard al programului Open Office.
Fiierele document - .doc sunt, n general, deschise cu Microsoft Word, dar sunt i surse-deschise alternative,
cum este OpenOffice sau NeoOffice.
Definiie
Formatarea se refer la schimbrile care se pot face la aspectului caracterelor (litere, cifre, semne speciale),
aspectului marginilor paginii, aspectului paragrafelor .a.
Definiie
Fonturile sunt caractere tipografice cu o anumit form.
1. Clasificarea fonturilor se face in funcie de urmtoarele criterii:
dup dimensiunile acceptate
o cu dimensiuni fixe (nescalabile fonturi bit-mapped). Exemplu: numai dimensiunile 8, 12,
16, 24
o cu dimensiuni variabile (scalabile true type fonts) . Exemplu: pot avea dimensiuni
intermediare 5, 13, 15, 17.
dup form
o fr serif - Sans Serif (serif este un element grafic care apare ca adaos la captului anumitor
tipuri de litere picioru sau linie marcat). Exemplu: Arial, Tahoma, Verdana
o cu serif Serif. Exemplu: Times New Roman, Courier, Garamont
o caligrafice Script (Sans Serif modificat). Exemplu: Lucida Handwritting, Brush Script
dup lime
o cu lime fix Monospaced (neproporionale). Exemplu: Courier, Lucida
o cu lime variabil (proporionale). Exemplu: Arial, Haettenschweiler
2. Caracteristici font
a. Form reprezint alura i indic numele fontului. Se caracterizeaz prin:
Grosime (weight). Exemple: A - Times New Roman, A - Impact, A - Verdana, A - Arial Black
nclinare. Exemple: Clasa - Times New Roman, Clasa Bookman Old Style, Clasa - Courir
Proporia dintre nlimea i grosimea unei litere. Exemple: a - Times New Roman, a Impact, a - Tahoma
Dimensiunea codiei unei litere. Exemplu: f j -Times New Roman, f j-Impact, f j-Verdana
b. Dimensiune (Size). Se mai numete corp de liter i se msoar n puncte tipografice points. 1 point =
1/72 inch; 2 pica = 1 pica. Mrimea caracterelor depinde de font. Exemplu la dimensiunea 14:
INFORMATICA
Times New Roman
INFORMATICA
Tahoma
INFORMATICA
Comic Sans Serif
c. Stil (Style)
-
d. Efecte (Effects)
-
e. Culoare (Color)
3. Alte tipuri de formatare
Spaierea se obine prin opiunea Format-Font subopiunea Character Spacing. Sunt posibile urmtoarele
opiuni:
Programator Lowered by 5 pt
n foarte multe standarde i norme tehnice n vigoare, interne i internaionale, sunt enumerate o serie de date
tehnice i recomandri n sistemului de msur tipografic.
Sistemului de msur tipografic este un semn tolerat n ara noastr i se utilizeaz pentru determinarea
dimensiunilor. Acest sistem folosete msuri n care unitatea este mai mic dect cea din sistemului metric.
Unitatea de msur a lungimii, n tipografie, este "punctului tipografic".
5. Elemente tipografice
Punctului tipografic folosit la noi n ar a fost creat n prima jumtate a secolului al XVIII-lea i se
folosete de atunci n aproape toate rile din Europa, sub denumirea de didot, dup numele creatorului su.
Acest punct deriv din olului francez (27,1 mm) i reprezint a 72-a parte din acest ol. n STAS-ului
6302/1971 se arat c relaia dintre sistemului metric i sistemului de msur tipografic este urmtoarea: punct tipografic (p) este egal cu 0,376065 mm la 20 C; deci 1 m (mai precis 1000,333 mm) la 20 C = 2660
p.
Corpului de liter este mrimea literei (floarea literei plus spaiului deasupra i dedesubt, care creeaz
distana dintre rnduri), exprimat n puncte tipografice.
Floarea literei este imaginea literei care apare pe hrtie.
Coridoare de text nseamn poriuni albe n text formate pe mai multe rnduri consecutive prin spaiile
dintre cuvinte, att pe linie vertical, ct i pe linie oblic. Este un defect de culegere.
Evidenierea reprezint scoaterea n eviden (sublinierea) a textelor, prin diferite procedee.
Tietura literelor variante ale literelor, n cadrului aceluiai caracter de liter, diferenierea
constnd n saturaia literelor (grosime relativ a liniilor florii):
Capitlue - litere cu floarea avnd dimensiunile literelor minuscule dar cu forma grafic a literelor
majuscule.
ngropare n text element cules sau de ilustraie, nconjurat din dou, trei sau patru prti de text.
Format (de text, de coal etc.) - dimensiunile textului, colii etc.
Ptrior dimensiunea spaiului egal ca grosime cu corpului literei.
n alte ri se folosesc sisteme de msur tipografice diferite. Astfel, n SUA i n Anglia se folosete
punctului tipografic derivat din olului englez (1 ol=25,4 mm), din care cauz are mrimea de 0,352777
mm.
6. Clasificarea caracterelor
6.1. Familii de caractere
Familia de litere cunoscut sub denumirea de "medievale" cuprinde caracterele ce au piciorue de form
triunghiular, racordat, avnd un grad de contrast mediu.
ABCDEFG abcdefg 123456
A doua familie de caractere, cunoscut sub denumirea "anticva", cuprinde caracterele ce au piciorue de
forma unor linii drepte, subiri, perpendiculare pe liniile principale, avnd un grad de contrast ridicat.
ABCDEFG abcdefg 123456
O alt familie de caractere, cunoscut sub denumirea de "egiptene", cuprinde caracterele cu piciorue sub
form de dreptunghi (uneori apropiat de trapez) i un grad de contrast mic.
ABCDEFG abcdefg 123456
Familia de caractere cunoscut sub denumirea de "groteti", cuprinde caracterele ce nu au piciorue, fiind
lipsite de contrast (au aceeai grosime, att a liniilor principale, ct i a celor secundare).
ABCDEFG abcdefg 123456
A cincea familie, denumit a caracterelor "caligrafice", cuprinde caractere ce imit scrisului de mn.
ABCDEFG abcdefg 123456
A asea familie, denumit "maina de scris", cuprinde caractere ce imit literele de la aceast main: toate
literele au aceeai lime.
ABCDEFG abcdefg 123456
6.2. Clasificarea dup mrimea literei.
Mrimea literei se exprim prin corpului lor, care se msoar n puncte tipografice. Conform STAS-6302/71,
mrimea de corp a literei tipografice, exprimat n puncte tipografice i n milimetri, cu denumirile lor, sunt:
- corp 4 - 1,504 mm Diamant
- corp 5 - 1,880 mm Perl
- corp 6 - 2,256 mm Nonpareille
- corp 7 - 2,632 mm Colonel
- corp 8 - 3,009 mm Petit
- corp 9 - 3,384 mm Borgis
- corp 10 - 3,760 mm Garmond (Corpus)
- corp 12 - 4,512 mm Cicero
- corp 14 - 5,264 mm Mittel
- corp 16 - 6, 016 mm Teria
- corp 18 - 6,768 mm Parangon (1,5 cicero)
- corp 20 - 7,520 mm Text
- corp 24 - 9,024 mm Dublucicero
Corpurile de liter pn la 12 inclusiv se folosesc pentru culegerea textului de baz.
Corpurile 14 i mai mari se folosesc n mod special pentru culegerea titlurilor textului crilor pentru copii i
afie.
6.3. Clasificarea cifrelor
Cifrele sunt semne grafice ale numerelor. Ele se clasific n dou categorii:
cifre arabe caracterizate prin aceea c au grosimea ntotdeauna ct jumtatea corpului lor;
cifre romane care se culeg cu ajutorului literelor tipografice cu floare majuscul.
2. Formatarea paragrafelor
Se folosete meniului Format, opiunea Paragraph.
Aliniere:
Indentare ndeprteaz textului fa de marginea din stnga i/sau marginea din dreapta, a ntregului text
sau doar a primului rnd (First Line) sau ndeprteaz toate liniile paragrafului n afar de prima (Hanging).
Spaiere - ndeprteaz paragrafului fa de paragrafului sau obiectului care se afl nainte de prima linie a
lui (Before) i/sau dup ultima sa linie (After).
At least distana va avea cel puin valoarea din caseta At i va crete dac liniile conin majuscule
Multiple distana va fi egal cu nlimea celui mai mare caracter de pe un rnd nmulit cu
numrului introdus n caseta At.
Controlului liniilor unui paragraf se realizeaz cu Meniului Format, opiunea Paragraph, subobiunea
Line and Page Breaks, oferind urmtoarele setri:
Keep Lines Together tot textului setat cu acest atribut va fi pe aceeai pagin. Se folosete la tabele
care trebuie s ncap pe aceeai pagin sau paragrafe care nu trebuie s apar pe pagini diferite.
Keep With Next textului setat cu acest atribut se va plasa pe aceeai pagin cu paragrafului care
urmeaz. Se folosete pentru legarea obligatorie a titlurilor de capitole, subcapitole, paragrafe de
primului paragraf de text.
Page Break Before - foreaz un salt la pagin nou naintea paragrafului curent. Se folosete pentru
plasarea pe pagin nou a nceputului de capitol sau a altui text.
Pentru text se vor utiliza fonturi Serif iar pentru titluri fonturi Sans Serif.
Fonturie Serif sunt preferate n cri, ziare, scrisori iar fonturile Sans Serif n documente oficiale.
Fonturile trebuie folosite n funcie de context, destinatar. De exemplu, pentru SUA, fondului
standard este Arial; pentru Romnia este Time New Roman.
Nu se recomand mai mult de dou fonturi diferite pe pagin. Combinarea acestora trebuie s
realizeze un contrast agreabil. De exemplu, font luminos i rar cu un font ntunecos i des; font de
dimensiuni reduse cu unului de dimensiuni mai mari.
Nu se combin dou fonturi Sans Serif (de exemplu Arial cu Century Gothic) deorece au un contrast
slab ntre ele.
Fonturile cu nlimi mai mari dau senzaia de robustee i stabilitate (de exemplu Times New Roma
fa de Garamond).
studiaz
algoritmii
SVG (Scalable Vector Graphics) este un format de fiier care descrie bidimensional
vectorului grafic.
Dup tipului datelor din aceast structur bidimensional, imaginile prelucrate pot fi mprite n mai
multe categorii:
imagini scalare, n care fiecare component este un scalar (un numr unic); ca exemple de
astfel de imagini se pot da imaginile monocrome (n care punctele au doar doua valori
posibile, ce corespund unui coninut binar al imaginii, n general alb-negru) i imaginile cu
nivele de gri (de tipului imaginii de luminan de pe ecranele televizoarelor alb-negru).
Programele pentru desenare pot s lucreze n grafica de pixeli sau n grafica vectorial.
n grafica pe calculator, grafica vectorial este un procedeu prin care imaginile sunt construite
cu ajutorului descrierilor matematice prin care se determin poziia, lungimea i direcia liniilor
folosite n desen. Imaginile vectoriale sunt complementare imaginilor bitmap, din grafica raster, n
care imaginile sunt reprezentate ca un tablou de pixeli.
Grafica bitmap (bitmapped graphics): realizeaz o imagine din puncte (pixeli), care de fapt sunt
nite dreptunghiuri foarte mici. Pentru fiecare pixel al desenului se memoreaz codului de culoare.
Un avantaj al acestei grafici este c imaginea creat din puncte poate s conin foarte multe
detalii, ns cnd dimensiunea desenului se modific, el pierde din calitate.
Astfel, dac se mrete foarte mult, conturului desenului apare n trepte (efectului de dinti de
ferestru), iar dac se micoreaz foarte mult, punctele ajung s se suprapun unele peste altele.
Un alt dezavantaj al acestui tip de grafic este dimensiunea foarte mare a fiierului n care se
memoreaz desenului, deoarece cu ct desenului este mai mare cu att el conine mai multe puncte
pentru care trebuie s se memoreze codului de culoare, iar cu ct se folosesc mai multe culori n
realizarea desenului, cu att sunt necesari mai multi biti pentru memorarea culorii pentru fiecare
pixel.
Astfel, dac se folosete o paleta de 16 culori, pentru fiecare pixel din desen sunt necesari 4 biti
pentru culoare, iar dac se folosete o palet de 256 de culori, sunt necesari 8 biti de culoare. n
al doilea exemplu, din cauza mririi numrului de culori, necesarului de suport pentru memorarea
desenului se dubleaz.
n grafica vectorial (vector graphics) imaginile sunt formate din obiecte (grupuri de linii drepte
sau curbe) descrise prin formule matematice care stabilesc dimensiunea, poziia i orientarea lor.
Aceste desene pot fi redimensionate i rotite fr s-i piard din calitate, deoarece ele se
regenereaz la orice dimensiune i n orice poziie prin formulele matematice cu care au fost
descrise.
Principalului lor dezavantaj const n faptului c, fiind alctuite din obiecte descrise cu formule
matematice, att numrului acestor obiecte ct i complexitatea lor sunt limitate, depinznd de
biblioteca de formule matematice folosit de programului de desenare.
Definiie
Procesarea imaginilor este definit ca orice proces sau metod de prelucrare a informaiilor, ce are ca
intrare una sau mai multe imagini. Rezultatului prelucrrii poate fi una sau mai multe imagini, ns poate fi
reprezentat i de orice alt informaie (histogram, palet de culori, figuri geometrice, etc.).
Prelucrarea imaginilor este o particularizare a prelucrrii semnalelor (Signal processing).
Prelucrarea imaginilor i propune:
-
Metode de prelucrare:
Tipuri de transformri
Transformri geometrice afine
Scalarea (Scaling). Implic mrirea sau micorarea imaginilor iniiale. n general mrirea se face
fra pierderea informaiei, n timp ce micorarea duce la pierderea informaiei.
Rotirea (Rotation). Implic rotirea imaginii n plan. n general se pierde informaie, ns n cazului
rotirii cu unghiuri a cror msura este multipl de 90o, nu se pierde informaie.
Transformri specifice
Transformarea culorilor (Color balance). Implic modificarea paletei de culoare folosite. Spre
exemplu pentru a reproduce corect culorile neutre (alb, negru).
Combinarea. Implic un proces ce are ca intrare un set de imagini, iar ca ieire o imagine obinut
prin combinarea setului iniial.
Segmentarea (Segmentation). Este folosit pentru a putea partiiona o imagine n mai multe regiuni,
n scopului de a nlesni procesarea, sau pentru determina zonele ce prezint interes spre a fi analizate
mai amnunit.
Interpolarea i demozaicare (Demosaicing). Aceast metod este folosit pentru a obine o imagine
coerent folosind ca surs imaginile obinute de la senzorului de captur. n general se folosesc
imaginile obinute prin aplicarea celor trei filtre: rou, verde i albastru.
n genere n memorie imaginile sunt salvate sub form de raster (Raster graphics), iar pe un mediu extern ele
sunt salvate sub o form comprimat.
O imagine este caracterizat de:
Definiie
Adncimea culorii - reprezint numrului de biti care sunt folositi pentru a reprezenta culoarea unui singur
pixel.
BPP - Bits per pixel:
Focuserv ofer produsele software cele mai cunoscute de captur a informaiilor, ce proceseaz milioane de
forumulare critice afacerilor n fiecare zi, reducnd costurile cu livrarea i procesarea informaiei ctre
sistemele din ntreprindere.
Descrierea produsului
Soluia software a clientului nostru citete informaia coninut n documente, indiferent dac aceasta este
stocat pe hrtie, Internet, PC-uri sau PDA-uri apoi supune fiecare dat unei serii de verificri riguroase
nainte de a fi transferat ctre diferite aplicaii din ntreprindere. De asemenea, pstreaz o imagine a
documentului original mpreun cu datele extrase, pentru accesare rapid.
ImageSoftware a dezvoltat soluii software pentru recunoaterea inteligent a documentelor, proiectate
pentru a procesa diferite formulare, pentru a identifica numeroase tipuri de documente i pentru a extrage
informaiile i datele coninute n acestea.
Aspecte tehnice
La nceput am dezvoltat un proiect pilot care mrete funcionalitile bibliotecii de imagini cu posibilitatea
de a detecta linii i a le muta, detectarea marginilor, a inclinaiei i reabilitarea automat a documentelor albnegru nclinate. Alte funcionalitti se gsesc n nregistrarea abloanelor urmate de detectarea siglelor,
recunoaterea abloanelor i multe altele.
n acest moment desfurm un proiect de detectare de text cu funcionalitti complete, incluznd detectarea
paragrafelor i structurilor tabelare.
Provocarea
Proiectarea algoritmilor pentru procesarea imaginii, algoritmi ce se execut la viteze foarte ridicate, cu
rezultate de mare acuratee, pentru o gam larg de documente prelucrate.
Tehnologia
C/C++ i ATL/COM pe platforme Microsoft OS.
OBSERVAIE. Firma i serviciile oferte sunt fictive.
III. Glosar
Termen
Procesor de texte
Documentului
Tehnoredactarea
Caracterului
Cuvntului
Paragrafului
Seciunea
Pagin
Formatarea
Fonturile
Didot
Corpului de liter
Floarea literei
Coridoare de text
Evidenierea
Capitlue
Ptrior
Tipometrului
Indentare
Definiie
pachet de programe de prelucrare destinat introducerii textelor i
tehnoredactrii documentelor. Se mai numete program pentru
tehnoredactare asistat de calculator, tehnoredactare
computerizat sau tehnoredactare cu calculatorului
dovad scris sau tiprit, prin care se atest un fapt, se confer un
drept, se recunoate o obligaie i pe care sunt nscrise informaiile
ntr-un anume format. Documentului este o colecie de paragrafe i
obiecte
operaia de pregtire tehnic i grafic a unui manuscris destinat
imprimrii i cuprinde: stabilirea tipului de imprimare, a formatului
documentului, indicarea tipului de caracter adecvat textului,
titlurilor, subtitlurilor, paginaia, dimensionarea i amplasarea
imaginilor, tabelelor etc. utiliznd un procesor de text
element indivizibil care poate fi caracterizat prin simbolului
reprezentat, culoarea elementului i a fundalului, corpului de liter
utilizat, mrimea i stilului
unitatea fundamental de comunicare a unui neles i este un ir de
caractere cuprinse ntre dou caractere blank
o poriune de text care se termin prin apsarea tastei Enter
un grup de paragrafe consecutive delimitate prin caracterului
neprintabil sfrit de seciune
zona de editare realizat automat, n funcie de setrile fcute de
utilizator referitoare la: dimensiunile fizice ale hrtiei, marginile
documentului, orientarea textului
se refer la schimbrile care se pot face la aspectului caracterelor
(litere, cifre, semne speciale), aspectului marginilor paginii,
aspectului paragrafelor .a.
sunt caractere tipografice cu o anumit form
punct tipografic derivat ca unitate de msur din olului francez
mrimea literei (floarea literei plus spaiului deasupra i dedesubt,
care creeaz distana dintre rnduri), exprimat n puncte tipografice
imaginea literei care apare pe hrtie
poriuni albe n text formate pe mai multe rnduri consecutive prin
spaiile dintre cuvinte, att pe linie vertical, ct i pe linie oblic
scoaterea n eviden (sublinierea) a textelor, prin diferite procedee
litere cu floarea avnd dimensiunile literelor minuscule dar cu
forma grafic a literelor majuscule
dimensiunea spaiului egal ca grosime cu corpului literei
o linie gradat, att n sistemului de msur tipografic (punct,
cicero, cvadrat), ct i n sistemului metric (centimetru, milimetru)
ndeprteaz textului fa de marginea din stnga i/sau marginea
din dreapta, a ntregului text sau doar a primului rnd (First Line)
sau ndeprteaz toate liniile paragrafului n afar de prima
(Hanging)
Spaiere
Culoare
Conurile
Lumina monocromatic
Model de culoare
Imagine digital
Pixeli
Grafica vectorial
Grafica bitmap
(bitmapped graphics)
Procesarea imaginilor
Rezoluia
Adncimea culorii
Imaginile digitale pot fi create cu ajutorului unei game variate de dispozitive tehnice, aa cum ar fi
aparate de fotografiat digitale, aparate de filmat digitale, scanere de imagine, maini de msurat
coordonate, radare aeriene i multe altele. Imaginile digitale mai pot fi de asemenea obinute i/sau
sintetizate (create) din diferite date ne-imagistice, eventual "artificiale", aa cum ar fi funcii
matematice, modele bi- i tri-dimensionale, grafic computerizat, etc.
Documentului - reprezint o dovad scris sau tiprit, prin care se atest un fapt, se confer un
drept, se recunoate o obligaie i pe care sunt nscrise informaiile ntr-un anume format. Documentului este
o colecie de paragrafe i obiecte.
Definiie
Tehnoredactarea este operaia de pregtire tehnic i grafic a unui manuscris destinat imprimrii i
cuprinde: stabilirea tipului de imprimare, a formatului documentului, indicarea tipului de caracter adecvat
textului, titlurilor, subtitlurilor, paginaia, dimensionarea i amplasarea imaginilor, tabelelor etc. utiliznd un
procesor de text.
Scopului utilizrii procesoarelor de texte:
11. crearea documentelor: introducerea textului i inserarea unor imagini / desene / figuri.
12. editarea documentelor: corectarea greelilor de ortografie i modificarea coninutului documentelor
prin inserare / mutare / copiere / tergere / modificare a blocurilor de texte.
13. formatarea documentelor: modificarea formatului documentelor, din punct de vedere al caracterelor,
alinierii, spaierii, aranjrii n pagin, orientrii paginii, etc.
14. salvarea documentelor: pentru utilizri ulterioare.
15. tiprirea documentelor.
Tipuri de procesoare de texte:
7.
Editoare de texte care permit numai introducerea, editarea, salvarea i tiprirea textelor. Nu au facilitti
de tehnoredactare i nici de inserare elemente grafice i se utilizeaz pentru coresponden i scriere de
programe (de exemplu WordPad, NotePad, Write, Edit).
8.
9.
Caracterului este un element indivizibil care poate fi caracterizat prin simbolului reprezentat (liter,
cifr, operator matematic, simbol ortografic), culoarea elementului i a fundalului, corpului de liter
utilizat (fontului), mrimea i stilului (obinuit, ngroat, cursiv, umbrit etc.).
8.
9.
Paragrafului este o poriune de text care se termin prin apsarea tastei Enter. O linie fr nici un
caracter, obinut prin apsarea tastei Enter, este un paragraf vid. Aceast linie fr nici un caracter se
mai numete:
e) Linie Window este ultima linie a unui paragraf, care nu mai ncape pe pagina/coloana curent
i este trecut automat pe pagina/coloana urmtoare;
f) Linie Orphan este prima linie a unui paragraf care rmne singur la sfritului
paginii/coloanei curente.
8.
Seciunea - este un grup de paragrafe consecutive delimitate prin caracterului neprintabil sfrit de
seciune (Section Break). Aceast comand se introduce din bara de meniuri prin Insert / Break /
Section Break i se terge ca un caracter obinuit (tasta Delete sau Backspace).
9.
Pagin - este zona de editare realizat automat, n funcie de setrile fcute de utilizator referitoare
la: dimensiunile fizice ale hrtiei, marginile documentului, orientarea textului (Portrait / Landscape).
Extensia definete tipului de fiier (text, executabil, baza de date, graficetc). Datorita extensiilor
calculatorului identifica mai uor fiierele i le asociaz o aplicaie care le deschide.
Forma: Nume fiier.extensie (punctului face delimitarea)
Extensia fiierelor document este: .doc
Definiie
.DOC (abreviere de la document) este extensia numelui de fiier al documentelor produse de diverse
procesoare de text n baza formatului impus de Microsoft Word versiunile 1.0 - 2003. Este un tip de fiier
binar, care pe lng textului propriu-zis stocheaz i datele legate de formatarea acestuia, de asemenea i
elemente non-textuale precum imagini, grafic sau diagrame.
Dei este considerat nvechit i a fost nlocuit inclusiv de ctre creatorii si, rmne, pentru moment, unului
dintre cele mai utilizate formate pentru procesare de text.
ncepnd cu 2006, formatului DOC a nceput s aib concuren din ce n ce mai acerb din partea unor
formate deschise precum OpenDocument (extensie ODT), formatului standard al programului Open Office.
Fiierele document - .doc sunt, n general, deschise cu Microsoft Word, dar sunt i surse-deschise alternative,
cum este OpenOffice sau NeoOffice.
Definiie
Formatarea se refer la schimbrile care se pot face la aspectului caracterelor (litere, cifre, semne speciale),
aspectului marginilor paginii, aspectului paragrafelor .a.
Definiie
Fonturile sunt caractere tipografice cu o anumit form.
1. Clasificarea fonturilor se face in funcie de urmtoarele criterii:
dup dimensiunile acceptate
o cu dimensiuni fixe (nescalabile fonturi bit-mapped). Exemplu: numai dimensiunile 8, 12,
16, 24
o cu dimensiuni variabile (scalabile true type fonts) . Exemplu: pot avea dimensiuni
intermediare 5, 13, 15, 17.
dup form
o fr serif - Sans Serif (serif este un element grafic care apare ca adaos la captului anumitor
tipuri de litere picioru sau linie marcat). Exemplu: Arial, Tahoma, Verdana
o cu serif Serif. Exemplu: Times New Roman, Courier, Garamont
o caligrafice Script (Sans Serif modificat). Exemplu: Lucida Handwritting, Brush Script
dup lime
o cu lime fix Monospaced (neproporionale). Exemplu: Courier, Lucida
o cu lime variabil (proporionale). Exemplu: Arial, Haettenschweiler
2. Caracteristici font
a. Form reprezint alura i indic numele fontului. Se caracterizeaz prin:
Grosime (weight). Exemple: A - Times New Roman, A - Impact, A - Verdana, A - Arial Black
nclinare. Exemple: Clasa - Times New Roman, Clasa Bookman Old Style, Clasa - Courir
Proporia dintre nlimea i grosimea unei litere. Exemple: a - Times New Roman, a Impact, a - Tahoma
Dimensiunea codiei unei litere. Exemplu: f j -Times New Roman, f j-Impact, f j-Verdana
b. Dimensiune (Size). Se mai numete corp de liter i se msoar n puncte tipografice points. 1 point =
1/72 inch; 2 pica = 1 pica. Mrimea caracterelor depinde de font. Exemplu la dimensiunea 14:
INFORMATICA
Times New Roman
INFORMATICA
Tahoma
INFORMATICA
Comic Sans Serif
c. Stil (Style)
-
d. Efecte (Effects)
-
e. Culoare (Color)
3. Alte tipuri de formatare
Spaierea se obine prin opiunea Format-Font subopiunea Character Spacing. Sunt posibile urmtoarele
opiuni:
Programator Lowered by 5 pt
n foarte multe standarde i norme tehnice n vigoare, interne i internaionale, sunt enumerate o serie de date
tehnice i recomandri n sistemului de msur tipografic.
Sistemului de msur tipografic este un semn tolerat n ara noastr i se utilizeaz pentru determinarea
dimensiunilor. Acest sistem folosete msuri n care unitatea este mai mic dect cea din sistemului metric.
Unitatea de msur a lungimii, n tipografie, este "punctului tipografic".
5. Elemente tipografice
Punctului tipografic folosit la noi n ar a fost creat n prima jumtate a secolului al XVIII-lea i se
folosete de atunci n aproape toate rile din Europa, sub denumirea de didot, dup numele creatorului su.
Acest punct deriv din olului francez (27,1 mm) i reprezint a 72-a parte din acest ol. n STAS-ului
6302/1971 se arat c relaia dintre sistemului metric i sistemului de msur tipografic este urmtoarea: punct tipografic (p) este egal cu 0,376065 mm la 20 C; deci 1 m (mai precis 1000,333 mm) la 20 C = 2660
p.
Corpului de liter este mrimea literei (floarea literei plus spaiului deasupra i dedesubt, care creeaz
distana dintre rnduri), exprimat n puncte tipografice.
Floarea literei este imaginea literei care apare pe hrtie.
Coridoare de text nseamn poriuni albe n text formate pe mai multe rnduri consecutive prin spaiile
dintre cuvinte, att pe linie vertical, ct i pe linie oblic. Este un defect de culegere.
Evidenierea reprezint scoaterea n eviden (sublinierea) a textelor, prin diferite procedee.
Tietura literelor variante ale literelor, n cadrului aceluiai caracter de liter, diferenierea
constnd n saturaia literelor (grosime relativ a liniilor florii):
Capitlue - litere cu floarea avnd dimensiunile literelor minuscule dar cu forma grafic a literelor
majuscule.
ngropare n text element cules sau de ilustraie, nconjurat din dou, trei sau patru prti de text.
Format (de text, de coal etc.) - dimensiunile textului, colii etc.
Ptrior dimensiunea spaiului egal ca grosime cu corpului literei.
n alte ri se folosesc sisteme de msur tipografice diferite. Astfel, n SUA i n Anglia se folosete
punctului tipografic derivat din olului englez (1 ol=25,4 mm), din care cauz are mrimea de 0,352777
mm.
6. Clasificarea caracterelor
Cifrele sunt semne grafice ale numerelor. Ele se clasific n dou categorii:
-
cifre arabe caracterizate prin aceea c au grosimea ntotdeauna ct jumtatea corpului lor;
cifre romane care se culeg cu ajutorului literelor tipografice cu floare majuscul.
2. Formatarea paragrafelor
Se folosete meniului Format, opiunea Paragraph.
Aliniere:
Indentare ndeprteaz textului fa de marginea din stnga i/sau marginea din dreapta, a ntregului text
sau doar a primului rnd (First Line) sau ndeprteaz toate liniile paragrafului n afar de prima (Hanging).
Spaiere - ndeprteaz paragrafului fa de paragrafului sau obiectului care se afl nainte de prima linie a
lui (Before) i/sau dup ultima sa linie (After).
At least distana va avea cel puin valoarea din caseta At i va crete dac liniile conin majuscule
Multiple distana va fi egal cu nlimea celui mai mare caracter de pe un rnd nmulit cu
numrului introdus n caseta At.
Controlului liniilor unui paragraf se realizeaz cu Meniului Format, opiunea Paragraph, subobiunea
Line and Page Breaks, oferind urmtoarele setri:
Keep Lines Together tot textului setat cu acest atribut va fi pe aceeai pagin. Se folosete la tabele
care trebuie s ncap pe aceeai pagin sau paragrafe care nu trebuie s apar pe pagini diferite.
Keep With Next textului setat cu acest atribut se va plasa pe aceeai pagin cu paragrafului care
urmeaz. Se folosete pentru legarea obligatorie a titlurilor de capitole, subcapitole, paragrafe de
primului paragraf de text.
Page Break Before - foreaz un salt la pagin nou naintea paragrafului curent. Se folosete pentru
plasarea pe pagin nou a nceputului de capitol sau a altui text.
Pentru text se vor utiliza fonturi Serif iar pentru titluri fonturi Sans Serif.
Fonturie Serif sunt preferate n cri, ziare, scrisori iar fonturile Sans Serif n documente oficiale.
Fonturile trebuie folosite n funcie de context, destinatar. De exemplu, pentru SUA, fondului
standard este Arial; pentru Romnia este Time New Roman.
Nu se recomand mai mult de dou fonturi diferite pe pagin. Combinarea acestora trebuie s
realizeze un contrast agreabil. De exemplu, font luminos i rar cu un font ntunecos i des; font de
dimensiuni reduse cu unului de dimensiuni mai mari.
Nu se combin dou fonturi Sans Serif (de exemplu Arial cu Century Gothic) deorece au un contrast
slab ntre ele.
Fonturile cu nlimi mai mari dau senzaia de robustee i stabilitate (de exemplu Times New Roma
fa de Garamond).
studiaz
algoritmii
TIFF (Tagged Image File Format) este un format de fiier care stocheaz imagini i
fotografii.
SVG (Scalable Vector Graphics) este un format de fiier care descrie bidimensional
vectorului grafic.
Dup tipului datelor din aceast structur bidimensional, imaginile prelucrate pot fi mprite n mai
multe categorii:
imagini scalare, n care fiecare component este un scalar (un numr unic); ca exemple de
astfel de imagini se pot da imaginile monocrome (n care punctele au doar doua valori
posibile, ce corespund unui coninut binar al imaginii, n general alb-negru) i imaginile cu
nivele de gri (de tipului imaginii de luminan de pe ecranele televizoarelor alb-negru).
Programele pentru desenare pot s lucreze n grafica de pixeli sau n grafica vectorial.
n grafica pe calculator, grafica vectorial este un procedeu prin care imaginile sunt construite
cu ajutorului descrierilor matematice prin care se determin poziia, lungimea i direcia liniilor
folosite n desen. Imaginile vectoriale sunt complementare imaginilor bitmap, din grafica raster, n
care imaginile sunt reprezentate ca un tablou de pixeli.
Grafica bitmap (bitmapped graphics): realizeaz o imagine din puncte (pixeli), care de fapt sunt
nite dreptunghiuri foarte mici. Pentru fiecare pixel al desenului se memoreaz codului de culoare.
Un avantaj al acestei grafici este c imaginea creat din puncte poate s conin foarte multe
detalii, ns cnd dimensiunea desenului se modific, el pierde din calitate.
Astfel, dac se mrete foarte mult, conturului desenului apare n trepte (efectului de dinti de
ferestru), iar dac se micoreaz foarte mult, punctele ajung s se suprapun unele peste altele.
Un alt dezavantaj al acestui tip de grafic este dimensiunea foarte mare a fiierului n care se
memoreaz desenului, deoarece cu ct desenului este mai mare cu att el conine mai multe puncte
pentru care trebuie s se memoreze codului de culoare, iar cu ct se folosesc mai multe culori n
realizarea desenului, cu att sunt necesari mai multi biti pentru memorarea culorii pentru fiecare
pixel.
Astfel, dac se folosete o paleta de 16 culori, pentru fiecare pixel din desen sunt necesari 4 biti
pentru culoare, iar dac se folosete o palet de 256 de culori, sunt necesari 8 biti de culoare. n
al doilea exemplu, din cauza mririi numrului de culori, necesarului de suport pentru memorarea
desenului se dubleaz.
n grafica vectorial (vector graphics) imaginile sunt formate din obiecte (grupuri de linii drepte
sau curbe) descrise prin formule matematice care stabilesc dimensiunea, poziia i orientarea lor.
Aceste desene pot fi redimensionate i rotite fr s-i piard din calitate, deoarece ele se
regenereaz la orice dimensiune i n orice poziie prin formulele matematice cu care au fost
descrise.
Principalului lor dezavantaj const n faptului c, fiind alctuite din obiecte descrise cu formule
matematice, att numrului acestor obiecte ct i complexitatea lor sunt limitate, depinznd de
biblioteca de formule matematice folosit de programului de desenare.
Definiie
Procesarea imaginilor este definit ca orice proces sau metod de prelucrare a informaiilor, ce are ca
intrare una sau mai multe imagini. Rezultatului prelucrrii poate fi una sau mai multe imagini, ns poate fi
reprezentat i de orice alt informaie (histogram, palet de culori, figuri geometrice, etc.).
Prelucrarea imaginilor este o particularizare a prelucrrii semnalelor (Signal processing).
Prelucrarea imaginilor i propune:
-
Metode de prelucrare:
Tipuri de transformri
Transformri geometrice afine
Scalarea (Scaling). Implic mrirea sau micorarea imaginilor iniiale. n general mrirea se face
fra pierderea informaiei, n timp ce micorarea duce la pierderea informaiei.
Rotirea (Rotation). Implic rotirea imaginii n plan. n general se pierde informaie, ns n cazului
rotirii cu unghiuri a cror msura este multipl de 90o, nu se pierde informaie.
Transformri specifice
Transformarea culorilor (Color balance). Implic modificarea paletei de culoare folosite. Spre
exemplu pentru a reproduce corect culorile neutre (alb, negru).
Combinarea. Implic un proces ce are ca intrare un set de imagini, iar ca ieire o imagine obinut
prin combinarea setului iniial.
Segmentarea (Segmentation). Este folosit pentru a putea partiiona o imagine n mai multe regiuni,
n scopului de a nlesni procesarea, sau pentru determina zonele ce prezint interes spre a fi analizate
mai amnunit.
Interpolarea i demozaicare (Demosaicing). Aceast metod este folosit pentru a obine o imagine
coerent folosind ca surs imaginile obinute de la senzorului de captur. n general se folosesc
imaginile obinute prin aplicarea celor trei filtre: rou, verde i albastru.
Imaginea digital - este reprezentarea unei imagini bidimensionale sub forma unui set de valori ce
alctuiesc o matrice.
n genere n memorie imaginile sunt salvate sub form de raster (Raster graphics), iar pe un mediu extern ele
sunt salvate sub o form comprimat.
O imagine este caracterizat de:
Definiie
Adncimea culorii - reprezint numrului de biti care sunt folositi pentru a reprezenta culoarea unui singur
pixel.
BPP - Bits per pixel:
Focuserv este unului dintre primii 10 vnztori de software de captur de informaii n Romnia i face parte
din Grupului MACROS de peste 25 de companii de top din Statele Unite ale Americi i Europa, deinut de
Marian Corbu.
Focuserv ofer produsele software cele mai cunoscute de captur a informaiilor, ce proceseaz milioane de
forumulare critice afacerilor n fiecare zi, reducnd costurile cu livrarea i procesarea informaiei ctre
sistemele din ntreprindere.
Descrierea produsului
Soluia software a clientului nostru citete informaia coninut n documente, indiferent dac aceasta este
stocat pe hrtie, Internet, PC-uri sau PDA-uri apoi supune fiecare dat unei serii de verificri riguroase
nainte de a fi transferat ctre diferite aplicaii din ntreprindere. De asemenea, pstreaz o imagine a
documentului original mpreun cu datele extrase, pentru accesare rapid.
ImageSoftware a dezvoltat soluii software pentru recunoaterea inteligent a documentelor, proiectate
pentru a procesa diferite formulare, pentru a identifica numeroase tipuri de documente i pentru a extrage
informaiile i datele coninute n acestea.
Aspecte tehnice
La nceput am dezvoltat un proiect pilot care mrete funcionalitile bibliotecii de imagini cu posibilitatea
de a detecta linii i a le muta, detectarea marginilor, a inclinaiei i reabilitarea automat a documentelor albnegru nclinate. Alte funcionalitti se gsesc n nregistrarea abloanelor urmate de detectarea siglelor,
recunoaterea abloanelor i multe altele.
n acest moment desfurm un proiect de detectare de text cu funcionalitti complete, incluznd detectarea
paragrafelor i structurilor tabelare.
Provocarea
Proiectarea algoritmilor pentru procesarea imaginii, algoritmi ce se execut la viteze foarte ridicate, cu
rezultate de mare acuratee, pentru o gam larg de documente prelucrate.
Tehnologia
C/C++ i ATL/COM pe platforme Microsoft OS.
OBSERVAIE. Firma i serviciile oferte sunt fictive.
III. Glosar
Termen
Procesor de texte
Documentului
Tehnoredactarea
Caracterului
Cuvntului
Paragrafului
Seciunea
Pagin
Formatarea
Fonturile
Didot
Corpului de liter
Floarea literei
Coridoare de text
Evidenierea
Capitlue
Ptrior
Tipometrului
Indentare
Definiie
pachet de programe de prelucrare destinat introducerii textelor i
tehnoredactrii documentelor. Se mai numete program pentru
tehnoredactare asistat de calculator, tehnoredactare
computerizat sau tehnoredactare cu calculatorului
dovad scris sau tiprit, prin care se atest un fapt, se confer un
drept, se recunoate o obligaie i pe care sunt nscrise informaiile
ntr-un anume format. Documentului este o colecie de paragrafe i
obiecte
operaia de pregtire tehnic i grafic a unui manuscris destinat
imprimrii i cuprinde: stabilirea tipului de imprimare, a formatului
documentului, indicarea tipului de caracter adecvat textului,
titlurilor, subtitlurilor, paginaia, dimensionarea i amplasarea
imaginilor, tabelelor etc. utiliznd un procesor de text
element indivizibil care poate fi caracterizat prin simbolului
reprezentat, culoarea elementului i a fundalului, corpului de liter
utilizat, mrimea i stilului
unitatea fundamental de comunicare a unui neles i este un ir de
caractere cuprinse ntre dou caractere blank
o poriune de text care se termin prin apsarea tastei Enter
un grup de paragrafe consecutive delimitate prin caracterului
neprintabil sfrit de seciune
zona de editare realizat automat, n funcie de setrile fcute de
utilizator referitoare la: dimensiunile fizice ale hrtiei, marginile
documentului, orientarea textului
se refer la schimbrile care se pot face la aspectului caracterelor
(litere, cifre, semne speciale), aspectului marginilor paginii,
aspectului paragrafelor .a.
sunt caractere tipografice cu o anumit form
punct tipografic derivat ca unitate de msur din olului francez
mrimea literei (floarea literei plus spaiului deasupra i dedesubt,
care creeaz distana dintre rnduri), exprimat n puncte tipografice
imaginea literei care apare pe hrtie
poriuni albe n text formate pe mai multe rnduri consecutive prin
spaiile dintre cuvinte, att pe linie vertical, ct i pe linie oblic
scoaterea n eviden (sublinierea) a textelor, prin diferite procedee
litere cu floarea avnd dimensiunile literelor minuscule dar cu
forma grafic a literelor majuscule
dimensiunea spaiului egal ca grosime cu corpului literei
o linie gradat, att n sistemului de msur tipografic (punct,
cicero, cvadrat), ct i n sistemului metric (centimetru, milimetru)
ndeprteaz textului fa de marginea din stnga i/sau marginea
din dreapta, a ntregului text sau doar a primului rnd (First Line)
sau ndeprteaz toate liniile paragrafului n afar de prima
(Hanging)
Spaiere
Culoare
Conurile
Lumina monocromatic
Model de culoare
Imagine digital
Pixeli
Grafica vectorial
Grafica bitmap
(bitmapped graphics)
Procesarea imaginilor
Rezoluia
Adncimea culorii
Imaginiledigitalepotficreatecuajutoruluiuneigamevariatededispozitivetehnice,aacumarfia
paratedefotografiatdigitale,aparatedefilmatdigitale,scaneredeimagine,mainidemsuratcoordo
nate,radareaerieneimultealtele.Imaginiledigitalemaipotfideasemeneaobinutei/sausintetizat
e(create)dindiferitedateneimagistice,eventual"artificiale",aacumarfifunciimatematice,modelebi-itridimensionale,graficcomputerizat,etc.
Ex_4.2_a
Ex_4.2_b
Ex_4.2_e
Ex_4.2_d
Ex_4.2_c