Sunteți pe pagina 1din 15

1

1 Din PDF în DJVU (şmecherii „Open Source”) ilustrat şi explicat

Din PDF în DJVU

(şmecherii „Open Source”)

ilustrat şi explicat

2

P r e a m b u l

2 P r e a m b u l 1. NICIODATĂ nu încercaţi să convertaţi în

1. NICIODATĂ nu încercaţi să convertaţi în "djvu" un fişier "pdf" de tip textual ("searchable", cu provenienţă din "doc", spre exemplu). Daca nu ştiţi de ce - încercaţi şi veţi înţelege. :-))))

2. Dacă sunteţi adept al codificărilor directe şi nu aveţi răbdare şi nici încredere în metodele mai sofisticate – puteţi arunca acest ghid la coşul cu gunoi (împreună cu calculatorul Dvs. :-))))

3

Sumar

3 Sumar Resurse 4 PDF ---> TIF (multipage) 5 Redactarea fişierului „TIF” 8 Modificări

Resurse

4

PDF ---> TIF (multipage)

5

Redactarea fişierului „TIF”

8

Modificări avansate

10

Codificarea DJVU

13

Adăugarea cuprinsului

14

4

RESURSE *

-------------------------------------------

* toate Open Source sau Freeware

----------------------------------------------------

---------------------------------------------------- 1. GSview & Ghostscript (gsview32.exe, version 4.7):

1. GSview & Ghostscript (gsview32.exe, version 4.7): http://www.cs.wisc.edu/~ghost/

2. IrfanView (version 4.10): http://www.irfanview.net/

4. (opţional) Djvu Bookmark Tool: http://windjview.sourceforge.net/bookmarks.html

GSview & Ghostscript – ceva mai mult decât un printer virtual. Îl vom folosi la convertarea fişierului PDF în TIF (multipage).

IrfanView – ceva mai mult decât un vizualizator grafic. Îl vom folosi la etapa de prelucrare a fişierului TIF (multipage).

Djvu Small – codificator DJVU. Varianta semplificată din Djvu Solo (LizardTech Inc.). Îl vom folosi în ultima etapă.

Djvu Bookmark Tool – program care permite adăugirea unui Tabel de Conţinut (TOC) în documentele DJVU, făcându-le foarte comode în utilizare.

5

5 PDF ---> TIF (multipage) Scopul ultim este păstrarea calităţii originale. Întrucât suntem limitaţi de

PDF ---> TIF (multipage)

Scopul ultim este păstrarea calităţii originale. Întrucât suntem limitaţi de calitatea PDF-ului (care şi el este un produs al unei convertări), tot ce putem face e să avem un DJVU de calitate comparabilă (dar cu grad mai mare de compresie – de 5-10 ori).

Pachetul Ghostscript & GSview permite o transformare aproape „loossless” într-un format (TIF) acceptabil pentru soft-urile de codificare DJVU *

* există şi convertoare directe PDF-DJVU, dar nu am reuşit să obţin nici calitatea, nici compresia satisfăcătoare cu ele.

Procedeu:

1. Deschidem GSview. File--->Open--->(documentul PDF dorit):

nici compresia satisfăcătoare cu ele. Procedeu: 1. Deschidem GSview . File--->Open--->(documentul PDF dorit):

6

6 2. În meniul „File” alegem opţiunea „Convert” şi setăm ca în desen: Notă: A se

2. În meniul „File” alegem opţiunea „Convert” şi setăm ca în desen:

Notă: A se fixa diapazonul de pagini la un total de cel mult 180, întrucît aceasta pare a fi limita acceptată de IrfanView la etapa următoare.

a fi limita acceptată de IrfanView la etapa următoare. 3. Selectăm „Ok”. Apare pagina de definire

3. Selectăm „Ok”. Apare pagina de definire a numelui fisierului rezultat.

Notă: (a) Insist să se dea un nume care să conţină diapazonul de pagini ales anterior – moment esenţial la etapele următoare atunci când avem documente cu peste 180 pagini. Pentru urmatorul bloc de 180 pagini, să se schimbe doar cifrele, încât să se păstreze continuitatea logică a documentului (ex: der_1- 180, der_181-360, der_361- 540 etc). (b) A se rezerva spaţiu suficient pe HDD, după socoteala: 1 pagină = 10 Mb

180, der_181-360, der_361- 540 etc). (b) A se rezerva spaţiu suficient pe HDD, după socoteala: 1

7

7 4. Selectăm „Ok”. Aştepăm până ce procesul se desfăşoară (5-10 min). Între timp apare pagina

4. Selectăm „Ok”. Aştepăm până ce procesul se desfăşoară (5-10 min). Între timp apare pagina

cu progresul activităţii:

Notă: Fişierul rezultat de regulă apare ca format „necunoscut” de sistemul de operare. Nu este o problemă, întrucât IrfanView îl va recunoaşte automat la deschidere (ca TIF).

de sistemul de operare. Nu este o problemă, întrucât IrfanView îl va recunoaşte automat la deschidere

8

8 REDACTAREA FIŞIERULUI „TIF” Fişierul TIF obţinut este de tip „multipage” cu rezoluţie mare (cca 2000

REDACTAREA FIŞIERULUI „TIF”

Fişierul TIF obţinut este de tip „multipage” cu rezoluţie mare (cca 2000 x 2000). Rezoluţia mare este garantul unei codificări DJVU de calitate (tocmai de aceea fişierele grafice necomprimate – de tip TIF sau PNG – sunt cele mai preferabile).

Înainte de a fi prelucra imaginile obţinute, fragmentăm fişierul TIF unic („monolitic”) pe fişiere-pagini. În felul acesta vom avea un mai mare control la etapele succesive şi se vor preîntâmpina erori de codificare eventuale.

Procedeu:

1. Deschidem fişierul TIF-multipage în editorul IrfanView, care îl recunoaşte imediat şi ne propune să-i atribuim extensia potrivită:

imediat şi ne propune să-i atribuim extensia potrivită: 2. Creăm o mapă cu acelaşi nume ca

2. Creăm o mapă cu acelaşi nume ca şi fişierul TIF iniţial (ex: der_1-180).

3. În meniul „Options” selectăm opţiunea

ca şi fişierul TIF iniţial (ex: der_1-180). 3. În meniul „Options” selectăm opţiunea „Extract all frames

„Extract all frames

”:

9

9 4. Ne asigurăm că formatul pentru extras este la fel TIF (care este şi „default”).

4. Ne asigurăm că formatul pentru extras este la fel TIF (care este şi „default”). Indicăm parcursul

(mapa creată la p. 2, în cazul nostru – „der_1-180”).

creată la p. 2, în cazul nostru – „der_1-180”). 5. Aşteptăm până se încheie procesul (5-10

5. Aşteptăm până se încheie procesul (5-10 min)

Fişierele-pagini

rezultate sunt numerotate automat, în procesul extragerii. Este unul din avantajele exclusive ale lui IrfanView.

Notă:

rezultate sunt numerotate automat, în procesul extragerii. Este unul din avantajele exclusive ale lui IrfanView .

10

MODIFICĂRI

AVANSATE

10 MODIFICĂRI AVANSATE Unii parametri, aşa ca cîmpul vizibil („crop”), dimensiunile efective („resize”),

Unii parametri, aşa ca cîmpul vizibil („crop”), dimensiunile efective („resize”), trecerea la negru- alb etc. - pot fi şi ei modificaţi (opţional) în IrfanView.

Notă: (a) Toate aceste modificări se aplică automat la întreg blocul de pagini alese („batch”). Din nou, un avantaj unic al lui IrfanView şi, în acelaşi timp, o cauză a multor erori şi confuzii. (b) Nu este recomandabilă modificarea altor parametri decât cei specificaţi mai sus, întrucât pot diminua gradul de compresie DJVU la etapa finală, plus consecinţe neprevăzute.

Procedeu:

1. (opţional) Meniul cu setări se accesează prin: „File”--->”Batch Convertion/Rename”. În pagina apărută se selectează butonul „Advanced” în drept cu paragraful „Output Format”:

„Advanced” în drept cu paragraful „Output Format”: Notă: (a) A nu se uita ajustarea setărilor din

Notă: (a) A nu se uita ajustarea setărilor din celelalte câmpuri, după caz („Output directory”, „Add all” etc)! (b) Se va avea grijă din timp să se creeze mapa „output” pentru fişierele redactate, cu acelaşi nume ca şi cea dinainte plus un semn distinctiv (bunăoară, o literă „b” -

der_1-180_b)

11

11 2. (opţional) Aplicarea noilor parametri: (a) „CROP”: tăierea câmpurilor externe după coordonatele

2. (opţional) Aplicarea noilor parametri:

11 2. (opţional) Aplicarea noilor parametri: (a) „CROP”: tăierea câmpurilor externe după coordonatele

(a) „CROP”: tăierea câmpurilor externe după coordonatele specificate. Notă:

-- multă precauţie la tăiere, întrucât acelaşi şablon de tăiere va fi aplicat automat la toate paginile din document! -- coordonatele (X şi Y), ca şi lăţimea („width”) şi înălţimea („height”) se pot culege tot în IrfanView, în pagina principală, pentru o careva pagină (pagină „reprezentativă”) a documentului actual, selectând un chenar prin procedeul obişnuit de „drag-and-drop” care să cuprindă aria dorită (adică cea care va rămâne vizibilă după „crop”); -- datele căutate se pot culege în bara de titlu a programului, reactualizîndu-se pe măsură ce chenarul se modifică. Coordonata „X” se citeşte prima între paranteze, „Y” corespunzând celei de-a doua. (în cazul nostru 401 şi 577, respectiv – vezi desenul). „Lăţimea” se citeşte prima în perechea următoare de paranteze, a doua fiind valoarea „înălţimii” (în cazul nostru 362 şi 573, respectiv). Informaţia găsită se înscrie în câmpurile potrivite (având grijă ca căsuţa „Left top” să fie bifată).

12

12 (b) „RESIZE”: redimensionarea paginilor după înălţime şi/sau lăţime. Notă: -- a nu se uita să

(b) „RESIZE”: redimensionarea paginilor după înălţime şi/sau lăţime.

Notă:

-- a nu se uita să se bifeze căsuţa „Preserve aspect ratio”! -- celelalte căsuţe („Use resample function” şi „Don't enlarge smaller images”) e bine să fie şi ele bifate. -- e suficient să se indice o singură dimensiune (de regulă, doar lăţimea). În felul acesta întregul document va avea un aspect omogen şi plăcut.

(c) „Convert to greyscale”: trecerea în regim negru-alb. După preferinţă.

3. (opţional) Clik pe butonul „Start batch”. Aşteptăm pînă la încheierea procesului (5-10 min)

Notă:

(a) Întotdeauna se va verifica corectitudinea parcursului indicat (localizarea mapei

„output”)

(b) După încheierea procesului, verificăm rezultatul, după care se pot şterge fişierele şi

mapele de la etapele precedente (fişierul „TIF”-monolitic şi mapa unde s-au extras fişierele- pagini din el; în cazul nostru acestea erau fişierul „der_1-180.tif” şi mapa „der_1-180” cu

toate fişierele). Rămâne doar mapa „der_1-180_b” în care au fost salvate fişierele redactate.

13

CODIFICAREA

DJVU

13 CODIFICAREA DJVU Este etapa decisivă. Este şi cea mai durabilă (10-30 min). Notă : (a)

Este etapa decisivă. Este şi cea mai durabilă (10-30 min).

Notă:

(a) Înainte de a purcede la codificarea întregului document e bine să

se exerseze pe un set mai mic (ex., 10 pagini) din acelaşi document.

În felul acesta se poate găsi regimul optim de compresie (care este practic strict individual).

(b) Orientativ, calitatea cea mai bună se obţine de regulă în regimul

„Clean”. Cu cât se alege o rezoluţie mai mică, cu atît calitatea

produsului va fi mai apropiată de original, iar dimensiunile fişierului mai mari.

(c) În prealabil, se vor amplasa la un loc toate fişierele-pagini, într-o

singură mapă (o cerinţă a Djvu Small).

Procedeu:

1. Deschidem mapa cu fişiere în programul Djvu Small.

2. Alegem regimul cel mai potrivit de compresie.

3. Indicăm parcursul unde fişierul rezultat va fi salvat.

Notă: Fişierul DJVU rezultat va fi denumit automat ca „Djvu encoded”. Nu uitaţi să-l re-denumiţi (există riscul să fie şters FĂRĂ AVERTISMENT la o execuţie următoare!)

encoded”. Nu uitaţi să-l re-denumiţi (există riscul să fie şters FĂRĂ AVERTISMENT la o execuţie următoare!)

14

14 ADĂUGAREA CUPRINSULUI Un moment important în lecturarea cărţilor digitale este organizarea conţinutului într-o

ADĂUGAREA CUPRINSULUI

Un moment important în lecturarea cărţilor digitale este organizarea conţinutului într-o formă uşor accesibilă, aşa cum este binecunoscutul Table of Contents (TOC = „Tabelul de Conţinut”) din formatul PDF. Vestea bună e că această comoditate poate fi aplicată şi documentelor DJVU.

Notă:

Programul Djvu Bookmark Tool ataşează „Conţinutul” citindu-l dintr-un fişier tip „htm” sau „html” pe care îl creăm în mod manual, după procedeul obişnuit al limbajului HTML (dar fără „tag”-uri). Pe pagina oficială este arătat următorul exemplu de conţinut al fişierului (a) şi rezultatul final după integrarea în DJVU (b):

(a) Codul HTML (contents.htm)

<html> <body> <ul> <li><a href="#1">Link to page 1</a></li> <li><a href="#2">Link to page 2</a></li> <li><a href="#3">Chapter 1</a> <ul> <li><a href="#4">Link to page 4</a></li> <li><a href="#5">Link to page 5</a></li> </ul> </li> <li><a href="">Chapter 2, no link here</a> <ul> <li><a href="#6">Subsection</a> <ul> <li><a href="#7">Link to page 7</a></li> <li><a href="#8">Link to page 8</a></li> </ul> </li> <li><a href="#9">Link to page 9</a></li> </ul> </li> <li><a href="book.djvu#10">Link to page 10 in book.djvu</a></li> <li><a href="http://windjview.sourceforge.net">Web link</a></li> </ul> </body> </html>

(b)

DJVU

</ul> </body> </html> (b) DJVU Puteţi copia acest cod în Notepad şi salva în format

Puteţi copia acest cod în Notepad şi salva în format „htm”. După un pic de exerciţiu veţi găsi varianta potrivită pentru Dvs. şi o veţi aplica cărţii dorite.

15

15 Procedeu:
15 Procedeu:
15 Procedeu:

Procedeu:

1. Deschidem Djvu Bookmark Tool:

15 Procedeu: 1. Deschidem Djvu Bookmark Tool: 2. În câmpul „DjVu File” accesăm prin butonul „

2. În câmpul „DjVu File” accesăm prin butonul „

fişierul Djvu dorit.

3. În câmpul „Bookmarks” localizăm fişierul „Contents.htm” creat anterior.

4. Dăm la execuţie tastînd butonul „Save as

”,

urmînd instrucţiunile.