Sunteți pe pagina 1din 16

1

Lecia 2
Oformarea crilor digitale: redactarea estetic a coninutului

Premiz: Orice carte, ca s predispun la lectur, trebuie s fie ngrijit, adic s aib aspect
plcut i structurat.

Elementele constitutive ale unei cri digitale:

1. Coninut omogen (a se vedea n continuare)


2. Coperta fronte i retro
3. Cuprins/Index navigabil (n leciile urmtoare)
4. Motor de cutare
5. Textualizare (OCR)

Principiile redactrii estetice a coninutului:

1. Separarea i salvarea coninutului util (informaia) de restul inutil (gunoiul)


2. Omogenizarea parametrilor (dimensiune, nclinaie, paginaie succesiv)
3. Redarea unui aspect clasic, conform cu cartea de origine (cea scanat)

Ce programe folosim:

Scan Kromsator 5.91 unealt impecabil i absolut gratuit. Editor grafic avansat de tip batch
(adaptat pentru prelucrarea concomitent a unui grup ntreg de imagini). Specializat n redactarea
crilor digitale obinute prin scanare (vezi Anexa 1).

Contrar impresiei iniiale pe care o d ntlnirea cu Scan Kromsator, acesta posed o intuitivitate
admirabil, nct o carte de 350 pagini scanat calitativ i salvat n format TIF G4Fax poate fi
prelucrat deplin n numai 10-15 min!

Experiment f ce vezi:

Pentru a face iniierea ct mai eficace, v propun s parcurgem rapid mpreun funciunile de baz
a lui Scan Kromsator simulnd un proces de lucru aa cum arat n realitate. Vi se cere doar s facei
ceea ce vedei pe slide-urile cluzitoare (Anexa 2).

Concluzii i observaii:

n experimentul nostru am lsat n umbr o mulime de opiuni, care n cele mai multe cazuri (ex.
2

scanare calitativ) ne vor interesa foarte puin. Este vorba de intuitivitatea lui Scan Kromsator,
graie creia o multitudine de parametri sunt reglai automat, cum ar fi:

corecia gradului de nclinaie a textului (normal vertical) = funcia deskew


calculul limii marginilor (sus-jos, dreapta-stnga) = funcia automargins
normalizarea dimensiunilor colii (lime-nlime) dup valoarea medie = funcia Page
width/height
paginaia (denumirea automat a seriei de imagini prelucrate n stil patru zerouri)
compresie, rezoluie i culori meninute ca i n fiierul de origine (TIF G4Fax).

Despre elementele care necesit un control vizual nemijlocit:

Procesul de prelucrare poate fi imaginat ca o serie de intervenii circulare, repetate pas-cu-pas


pentru fiecare pagin n parte:

Interveniile sunt semnificativ minimizate graie unei alte faculti intuitive ale lui Scan Kromsator
translarea automat a parametrilor precedeni (de la pagina vizualizat anterior). Astfel, toat
operaiunea se va rezuma la un soi de rsfoire rapid, cu 10-20 pagini consecutive parcurse fr
nici o modificare (dect numai verificare i salvare), ntrerupt din cnd n cnd de necesitatea
centrrii textului dup modelul structurii crii de origine (nceput sau sfrit de capitol etc). Merit
s ne oprim cte puin la fiecare din aceti pai, ca fiind cei mai importani i costisitori din tot
lucrul cu Scan Kromsator.

I. Deschiderea paginii:

Prin punctarea pe panoul cu arborele crii (atenie: fr bifarea csuei!), sau mai rapid
(pentru paginile urmtoare), cu tastele Q = napoi, W = nainte.
Observai cum sunt motenite toate setrile aplicate precedent (sau, acelai efect, la simpla
vizualizare a paginii anterioare inclusiv la distan una de alta).
3

Cum poate fi exploatat acest efect? Spre exemplu, cnd n scanate,


o pagin a cerut careva modificri, n timp ce urmtoarele sunt
identice cu cele anterioare ei n loc de a seta din nou parametrii e
suficient deschiderea uneia dintre cele precedente i revenirea la cea
de prelucrat pentru a regsi automat conformitatea parametrilor - altfel
alterat (de intervenia anterioar). Bunoar, dac n irul 1-10 pagina
5 este o imagine bipaginat, celelalte fiind de o singur pagin, dup
prelucrarea paginii 5 (scindarea n dou), redeschidem nti pagina 4 i
abia apoi trecem la a 6-a.

II. Activarea cuitelor:

Numrul cuitelor activate depinde de numrul de pagini coninute pe o imagine scanat:


imaginea poate conine o singur pagin de carte sau dou, n funcie de capacitile scanner-ului
folosit (adic de suprafaa geamului):

(a) imagine unipaginat (b) imagine bipaginat

n cazul scanatelor cu imagini unipaginate sunt activate 4 cuite (sus, jos, dreapta, stnga),
bifnd csuele corespunztoare din panoul activitii cuitelor:

Pentru scindarea n dou a scanatelor bipaginate, n afar de acestea 4, vor fi activate altele 2
mediane, bifnd csua rmas plus csua split din panoul cu opiuni Page:
4

Ce se ntmpl dac nu este activat split la o imagine bipaginat? Este tratat ca i cum ar fi
imagine unipaginat (la fel i tiat). Acest fapt se poate adeveri util atunci cnd din dou pagini ne
intereseaz n final numai una (ex., cnd cealalt este alb).

III. Aranjarea cuitelor:

Este cel mai responsabil pas din prelucrarea scanatelor. Rmne valabil principiul: de zece ori
msoar i o dat taie.

Atenie! Avei grij s plasai corect cuitele fiecare posed un spectru de aciune unic, precizat
prin sigla de pe jumper. Iat-le:

Cuitul stng Cuitul drept

Cuitul superior Cuitul inferior

Cuitul median-stng (plus septul) Cuitul median-drept (fr sept)

Pentru a nu face confuzie cnd le aranjai, mutai-le simetric nti cuitele din stnga i din
dreapta, apoi cele de sus i de jos, i eventual (scanate bipaginate) pe cele mediane. n figurile din
Anexa 3 am rezumat poziiile corecte pentru cele dou tipuri de scanate.

Atenie la amplasarea eficace a cuitelor:

1. Nici un cuit s nu taie din aria util


2. S fie ct mai puin gunoi n interiorul cmpului delimitat

Un moment care uureaz semnificativ intervenia, tot din rndul celor intuitive, este c nu
conteaz exactitatea cu care sunt poziionate lamele n raport cu textul, ntruct calcularea
marginilor este automat (funciunea automargins descris mai sus).

i pentru cuite este valabil principiul translrii automate a parametrilor precedeni (cu
aceleai implicaii).

IV. Centrarea textului pe orizontal i pe vertical:

Structurarea textului pe pagin va respecta dispunerea acestuia n pagina de origine a crii. Cele
mai comune situaii, mpreun cu setrile lor corespunztoare de aplicat n panoul cu opiuni
Page, sunt artate n figurile din Anexa 4.

Principiul translrii automate a parametrilor precedeni (cu acelai implicaii) este valabil i aici.

Not: n cazul scanatelor bipaginate, centrarea se va face n acelai fel, dar separat pentru cele
dou pri
5

V. Verificarea:

Are importan capital i va fi urmrit ntotdeauna nainte de salvarea modificrilor efectuate


(sau translate).

Atenia se va ndrepta la 3 momente:

(a) cruare text (b) centrare orizontal (c) centrare vertical

VI. Salvarea modificrilor:

Se face prin bifarea csuelor din panoul cu arborele crii.

Orice modificare ulterioar se va practica numai dup debifarea ei prealabil i se va salva neaprat
prin rebifare.

Not: modificrile n interiorul unui ir salvat pot fi aplicate i fr a se recurge la debifare, dac
modificarea se efectueaz activnd concomitent tasta CTRL. n acest caz, ns, modificrile se
rspndesc la tot irul de pagini.

Cu referire la salvare se cuvine s deschidem o parantez.

Exist dou modaliti de prelucrare a irului de scanate controlat (fiecare imagine prelucrat i
salvat succesiv, una cte una) i oarb (numai primele cteva imagini sunt prelucrate succesiv, iar
celelalte prin translare, conform principiului deja cunoscut, bifndu-le n grup pe toate la un loc).

(a) Metoda controlat ofer o calitate mai bun, dar este mai lent. Recomandabil.
(b) Metoda oarb lucreaz foarte bine n cazul scanatelor calitative (cnd scanarea a fost ngrijit
din punct de vedere topografic al localizrii omogene pe geamul scannerului), ns necesit o
verificare ulterioar a irului pagin cu pagin. Iat de ce, de obicei, ambele se folosesc n
combinaie.

Salvarea concomitent a unui grup consecutiv de pagini se face activnd butonul respectiv
din panoul opiunilor de prelucrare n grup, punndu-l n funcie numai dup ce ne-am poziionat
(1) de pe pagina cu parametrii ce urmeaz mprumutai (de la nceputul irului), (2) pe pagina
care va fi ultima din grupul de prelucrat (de la sfritul irului) vezi desenele (a, b).

Exist i posibilitatea salvrii unui grup altern de pagini, bifndu-le adic fiecare peste una,
calculnd de la ultima pagin de prelucrat (de la sfritul irului), n direcie retrograd, pn la prima
6

pagin altern prelucrat (de la nceputul irului). Se realizeaz prin activarea butonului
corespunztor din acelai panou vezi desenul (c):

(a) (b) (c)

Despre opiunile din Scan Kromsator angajate mai rar, dar tot utile:

Dup ce am trecut n revist funciile executate automat (vezi mai sus), precum i pe cele care
dimpotriv, solicit maximal atenia utilizatorului (vezi mai sus), se cuvine s le menionm i pe
cele de care ne vom servi doar episodic (vezi Anexa 5).

n sfrit, procesarea!

(a) dup finisarea modificrilor i salvarea lor (toate csuele bifate) se purcede la execuie
prin activarea funciei
(b) viteza de procesare depinde de formatul n care au fost salvate scanatele: formatul TIF
G4Fax este optimal (500 pagini = 5 minute)

Post-procesarea:

(a) la finisarea execuiei (avizat de o fereastr-rezumat) programul se deschide n regimul


de post-procesare, care nu este altceva dect un editor grafic n care imaginile prelucrate
pot fi verificate i reajustate dup caz (vezi Anexa 2, pasul VIII).
(b) verificarea va fi centrat pe urmtoarele momente:
- integritatea informaiei (atenie la amputri de orice fel, lizibilitate, claritate figuri i
desene etc)
- omogenitatea dispunerii textului pe coal: respectarea abzaelor, centrarea pe orizontal
i vertical, armonia ntre pagini etc
- gradul de nclinaie a textului pe coal (normal vertical)
- paginaie: succesivitatea corect; eventual omisiuni sau surplusuri (erori de scanare!)
- impuriti: gunoi (de nlturat manual)
(c) reajustrile, dac necesare, se vor face imediat; ele pot fi de dou feluri care necesit
7

reprocesare (ntoarcerea la regimul de prelucrare = reprocesarea), i altele care sunt


remediabile n regimul de post-procesare (de obicei nlturarea impuritilor). Acestea din
urm se vor salva prin preaviz, la ncercarea de a deschide pagina urmtoare sau la ieirea
din regimul de post-procesare.

Reprocesarea:

(a) corectarea erorilor de prelucrare constatate la etapa de post-procesare se va face n mod


ct mai selectiv posibil (cu respectarea maximal a restului paginilor)
(b) pentru aceasta, ntoarcerea la regimul de prelucrare n vederea corecturilor se va face
imediat ce s-a constatat defectul: trecerea de la un regimul la altul se realizeaz nchiznd
fereastra de post-procesare; imaginea regsit n cmpul de lucru va fi exact imaginea
interesat
(c) cele mai frecvente erori care necesit reprocesare sunt:
- amputri din zona util (vezi Anexa 6);
- erori de corecie a gradului de nclinaie a textului pe coal (vezi Anexa 7);
- erori de centrare pe orizontal sau pe vertical: de obicei, se ntmpl atunci cnd au fost
scpate impuriti evidente nuntrul lamelor, recunoscute ca text sau desen util (i deci
cruate). Se corecteaz prin plasarea lamei respective medial de impuriti.
(d) modificrile efectuate la reprocesare nu se vor salva prin debifare-rebifare, ci mai
simplu, prin execuie selectiv, prelucrnd doar imaginea-pagin curent, acceptnd
avertismentul eventual de overwrite (substituirea fiierului deja existent cu acelai nume):

n loc de ncheiere:

n lecia precedent am
menionat o funcie util a lui
STDU Viewer (convertarea
TIF G4Fax --> PDF) i am
anticipat ideea despre
folosirea sa n restaurarea
crilor PDF de proast
calitate. Pentru aceasta din
urm, bineneles, avem
nevoie nti i nti de
extragerea imaginilor fiecrei
pagini de carte.

Avantajul lui STDU Viewer (n afar de rapiditate i fidelitate) este posibilitatea configurrii
8

extraciei, ca diapazon pagini, formatul grafic, rezoluie, denumire (i numerotare automat):

Un fiier PDF grafic (coninnd imaginile unei cri scanate) neoformat poate fi n acest fel
reprelucrat n Scan Kromsator. n lecia urmtoare vom trata subiectul restaurrii imaginilor din
PDF ndeaproape. Deocamdat menionez c se folosesc soft-uri gratis, ca i n tot cursul prezent.
9

Anexa 1: Scan Kromsator 5.91 (napoi la text)

1 = panoul cu arborele crii


2 = cmpul de lucru (imaginea-pagin de modificat)
3 = panoul cu opiuni (Page, Book, Files etc)
4 = panoul activitii "cuitelor"
5 = opiuni prelucrare n grup
6 = butonul iniiere prelucrare
7 = informaii despre imaginea-fiierul curent
10

Anexa 2: Algoritmul de lucru pas-cu-pas (f ce vezi sau ntoarce-te la text)

I. Deschide fiierul TIF G4Fax


II. Deschide paginea numrul unu din arborele crii din panoul respectiv (fr a bifa csua!)
III. Activeaz cuitele (pe desen: 2,3,4)
IV. Poziioneaz toate cuitele respectnd zona util (pe desen: 5a,5b,6a,6b,7a,7b)
V. Centreaz textul pe pagin (pe desen: 8a,8b)
VI. Salveaz modificrile bifnd csua din faa numrului de ordine al paginii curente (pe desen: 9)
VII. D la execuie (pe desen: 10)
VIII. Verific rezultatul n regimul de post-procesare: vizualizeaz dou pagini odat (pe desen: 1),
folosete radiera (pe desen: 2)
IX. Caut mapa cu numele Out n acelai loc n care se afl fiierul TIF G4Fax de origine

Pas I

Pai II-VII
11

Pas VIII
12

Anexa 3: Aranjarea corect a cuitelor (napoi la text)


13

Anexa 4: Cele mai comune tipuri de centrare i parametrii de aplicat (napoi la text)

1. pagin plin:

2. pagin tip nceput de capitol:

3. pagin tip sfrit de capitol:

4. pagin tip prolog:


14

Anexa 5: Despre cteva opiuni mai rare, dar tot utile (napoi la text)

1. Despeckle = degranularea, adic nlturarea impuritilor tip nisip


dinuntrul textului; din cauza frecventelor rezultate fals-pozitive -
lund drept gunoi diacriticele i alte semne ortografice minuscule! -
recomand dezactivarea acestei funciuni (impuritile, de altfel, pot fi
nlturate i manual, la etapa de post-procesare n Scan Kromsator).
2. Rotate angle = rsturnarea la 90 sau 180 grade a imaginii (n cazul
c a fost scanat cu capul n jos sau lateral)

3. Specificarea parametrilor de grup panoul Book:


(a) H.Gap value/V. Gap value - limea marginilor colii, pe
orizontal (H) i vertical (V) n unitile de msur specificate la
Units
(b) vert.gap = hor.gap - aceiai lime la toate marginile
(c) Page width/Page height - limea, respectiv nlimea colii.
Auto - calcularea lor automat
(d) Use average width - calcularea automat n baza valorii medii
(e) Merge pages after split - n cazul imaginilor bipaginate,
comasarea automat a celor dou jumti dup prelucrarea fiecreia
(n locul salvrii lor independente, ca pagini succesive). Util uneori,
bunoar, n caz de hri sau grafice construite pe limea celor dou
pagini.

4. Specificarea parametrilor de grup panoul Files:


(a) Output prefix - un eventual acronim care s precead
denumirea fiecrui fiier-pagin
(b) Start from/step - ncepnd de la care pagin i cu ce pas se va
salva (ex., step=1 - fiecare pagin consecutiv; step=2 - fiecare
a doua pagin etc)
(c) Name length - din cte uniti va fi alctuit numrul de ordine
din numele fiierului (ex., pentru 4 - vom avea 0000, 0001, 0002
etc)
(d) Output format - tipul compresiei fiierului rezultat (optimal
TIF G4Fax)
(e) DPI - rezoluia final
(f) Color - culoarea imaginii rezultate; B/W=negru/alb
(g) Input DPI - ntotdeauna Auto
15

Anexa 6: Reprocesarea amputrilor de text (napoi la text)

Corecia erorilor de tiere se face modificnd opiunile automargins din panoul Page.
Fiecrui cuit i corespunde o csu, n mod normal bifat (regimul automat de tiere). La debifarea
uneia din ele cuitul corespunztor trece n regimul de tiere manual, linia de tiere fiind
determinat de poziia exact a lamei.

Atenie la corespondena cuitelor acionate!

Iat-le:

Mai jos avei un exemplu de situaie (amputare lateral stng), cu parametrii pentru corectare,
precum i cu aspectul din fereastra principal (a se nota schimbarea culorii lamei dezactivate din
albastru n roz):
16

Anexa 7: Erori de corecie a gradului de nclinaie a textului pe coal (napoi la text)

De obicei, corecia automat (funciunea deskew din panoul cu opiuni Page) se isprvete
foarte bine n nclinaiile minore (sub 15 grade). Uneori, ns eroarea trebuie corectat manual,
activnd funciunea special... din panoul cu opiuni Page. Opiunea interesat este fixed
deskew angle:

Erorile de nclinaie pot fi de dou feluri, n dependen de diferena fa de perpendicular:


negative
pozitive

Mai jos sunt prezentate cele dou situaii, mpreun cu parametrii pentru corecie: