Sunteți pe pagina 1din 121

MECHERII

pentru DOWNLOADAREA
ORICROR FIIERE
SCRIBD
NOTA
Un salut calduros tuturor userilor care posteaza carti corectate.
De asemeni, si celor care scaneaza si apoi restrictioneaza downloadul
lasand pe cei mai neinstruiti sa saliveze degeaba.
Oricum, cei care scaneaza ne ofera
astfel (vezi mai jos)
materia bruta, pe care o vom perfectiona noi, astilaltii.
Daca pdf-ul/documentul a fost postat integral, TOTUL se poate lua de pe scribd,
inclusiv fisierele carora nu le este permis downloadul.
Iata cum se face in MOZILLA:

1. Pentru pdf-urile din imagini scanate,


a. Trageti de cursorul din dreapta paginii scribd, si parcurgeti documentul
pana jos, imagine cu imagine,
lasand-i astfel timp pdf-ului sa isi incarce imaginile jpg in folderul temporar.
O faceti cu rabdare, ne-sarind peste vreo pagina, si nici peste vreun grup de
pagini.
Cand ajungeti jos la ultima pagina mergeti sus in meniu MOZILLA si apasati TOOLS- PAGE INFO - MEDIA - in aceasta fereastra aveti foarte multe fisiere
(componente ale HTML, ale paginii web scribd) dintre care multe sunt inutile pt
dv.
Le alegeti pe cele DENUMITE ca mai jos:
(am colorat secventele ''sablon'',ce se vor repeta in celelalte sute de pagini
ale cartii, si pe care le veti regasi in josul ferestrei MEDIA, tragand de cursor)

http://htmlimg2.scribdassets.com/2tm4dthyv425apiw/images/1-798bdba627.jpg
vezi fig de mai jos

tragand de cursorul ferestrei MEDIA,


acest ''sablon'' se repeta si pentru restul sutelor de pagini ale cartii.
http://htmlimg4.scribdassets.com/2tm4dthyv425apiw/images/2-e47052906c.jpg
http://htmlimg3.scribdassets.com/2tm4dthyv425apiw/images/3-55a539a868.jpg
vezi fig de mai jos

Intrucat nu am incarcat cartea CORECT, vedeti ca de la imaginea / 9-61c67etc


numaratoarea sare la imag.17 apoi de la 24 la 45, etc.
Dv veti avea grija sa o faceti corect.
----------Pentru download propriuzis,
selectati grupuri de cate 30 - 50 pagini jpg si din fereastra MEDIA - din dreapta
jos - apasati butonul SAVE AS, iar fisierele se vor downloada in computer.
Functie de procesor si RAM, puteti lua si cate o suta o data, dar uneori vi se
poate bloca computerul, mai ales daca e tip mai vechi
La urma, verificati FOLDERUL in care ati downloadat paginile cartii,
asigurandu-va ca aveti TOATE fisierele componente ale cartii,
urmarind NUMARUL fisierului,
mai precis,
ultima parte a denumirii fisierului
care ESTE de fapt
NUMARUL de ordine al paginii cartii.
Aducandu-le in computer, paginile se vor redenumi - renumerotandu-le,

mai precis, in fata denumirii


se adauga doi de ZERO, pt fisierele de ordinul UNITATILOR - de la 1-9,
si se adauga un ZERO pt fisierele de ordinul zecilor, de la 10 - 99.
Eventualele fisiere lipsa, se iau manual, unul cate unul, ori din fereastra MEDIA,
ori chiar direct din SCRIBD din cartea NE-DOWNLOADABILA, mergand
direct la pagina lipsa
si dand click dreapta pe PAGINA CARTII, SAVE AS jpg.
Salvati intotdeauna ca jpg.
Paginile sunt de mici dimensiuni, 400-600 pixeliuneori insuficiente pentru un
OCR bun, dar solutia este sa
instalati un program ACDSEE 7, si dati RESIZE acestor pagini, aprox la 40005000 pixeli verticala.
iar apoi, dupa RESIZE, o prelucrare cu Scan tailor poate reda rezolutia buna
paginilor
si poate elimina anumite fonduri gri, cetzoase, neuniforme,
sau poate indrepta anumite deformari ale paginii (de forma trapezoidala, sau de
forma unui paralelogram).
(Amanunte in OCR de la A la Z)
https://www.scribd.com/doc/251762475/OCR-de-La-a-La-Z-Simplificat-Mart2012
Intre timp, SCRIBD si-a luat masuri suplimentare de protectie:
---- Un caz particular aparut in ultima vreme la anumite carti ne ofera surpriza
neplacuta ca denumirea TUTUROR pozelor componente al cartii - (vezi mai jos,
cu ALBASTRU) sa fie 000.jpg, pt TOATE componentele
http://htmlimg4.scribdassets.com/2tm4dthyv425apiw/images/2-e47052906c/000.jpg
http://htmlimg3.scribdassets.com/2tm4dthyv425apiw/images/3-55a539a868/000.jpg

IN ACEST CAZ NU avem alta solutie decat sa downloadam pe rand, doar


cate o singura poza o data, si sa le redenumiti dv, in ordinea FIREASCA.
2. Instructiuni copiere de pe scribd
a fisierelor DOC word, pe care nu le puteti downloada,
in speta
- a celor al caror download este conditionat de uploadarea
vreunui document de catre dv
- a fisierelor INCOMPLET AFISATE, pentru reclama, care au pagini care
nu se afiseaza.
(in memoria cache exista sansa de a descoperi CONTINUTUL INTEGRAL
al documentelor puse PARTIAL la vedere, in scop de reclama - din care

vedeti afisate in numar de 20 - 30 de pagini, dar al caror continut integral


exista pe serverul scribd)
Prima metoda este prin verificarea
CACHE-ULUI GOOGLE, unde verificam daca putem gasi o copie txt neformatata a
documentului cu pricina.
Aceasta metoda NU se poate aplica fisierelor doc COMPLET RESTRICTIONATE la
download. (dar... exista alte doua metode, la pct 3 si 4, mai jos, un pic mai migaloase, dar
perfect posibile).
Ca exemplu, iata o carte afisata partial in 2012, in scop de reclama...
http://www.scribd.com/doc/97071993/Producatorii-de-Gresie
Luati linkul in COPY-PASTE,
Deschideti google, dati Paste in caseta de cautare pt linkul cu pricina:
si apasati ENTER
In fereastra urmatoare (GOOGLE) avem rezultatul dorit:
apoi - vezi figura urmatoare:

1. Apasam cu mouseul simbolul triunghi


si alegem optiunea IN CACHE

2. Ulterior, in fereastra ce se deschide,


vi se afiseaza continutul text neformatat si fara ilustratii al fisierului dorit.
Cu CTRL+A .... CTRL+C .... CTRL+V, i-ati dat paste in WORD.
Pozele le luati cu click dreapta pe fiecare in parte - SAVE AS,
iar pentru formatare bold-italic si NOTE DE SUBSOL se foloseste ca model, ORIGINALUL
SCRIBD.

3. Instructiuni copiere de pe scribd


a fisierelor DOC, interzise la download
Paginile jpg (- poze, coperti) se iau simplu, click pe fiecare pagina/poza si dati SAVE AS.
Paginile text (dactilografiate):
- sunt codificate/criptate prin substitutie (de catre programatorii angajati la escrocii
proprietari ai scribd-ului - care incearca sa vanda papagalilor documentele postate tot de catre
NOI - cu cate 3-5 dolari)
- se pot lua NUMAI cu copy paste sau PrintScreen, PrtSc - (vezi procedeul la pct. 4 mai jos),
-a. cu copy-paste se pot transfera - asa cum sunt, in forma ''criptata'' - intr-un document word
blank doar in numar de CATE PATRU PAGINI O DATA.
- b. cu Prt Sc se pot lua numai UNA cate UNA.
.... pct. a
Selectarea celor 4 pagini se face astfel:
Puneti mouse-ul cu click stanga la inceputul paginii 1 de copiat,
(INAINTE DE PRIMUL CARACTER al paginii 1)
apoi tineti tasta SHIFT apasat, si
coboriti CU RABDARE cursorul PAGINII WEB (din lateral dreapta), numarand paginile
pana la sfarsitul paginii 4 - DUPA ultimul caracter,
unde puneti mouse-ul si apasati click stanga.
In acest moment ati selectat cele PATRU PAGINI (se inalbastreste textul scribd).
Dati click dreapta pe portiunea selectata si alegeti COPY, apoi mergeti in documentul word
blank si dati PASTE.
In documentul cules brut, textul scribd luat cu copy paste
este transpus cu font de 121, deci foarte mare.
Il formatati dv la font de 12-14.
Apoi, dupa adunarea si lipirea cu copy-paste a tuturor GRUPURILOR de cate patru pagini
criptate,
accesati originalul scribd,
identificati fiecare caracter din ORIGINAL in paralel cu corespondentul din COPIA DOC
criptata.
- faceti un tabel separat cu corespondentele respective, pe baza caruia
- cu search find and replace in word, inlocuiti in copia doc criptata
fiecare din caracterele criptate cu corespondentul lor IN CLAR ...
Initial, documentul se formateaza INTEGRAL cu font BLACK,

apoi, dupa fiecare inlocuire, caracterele inlocuite deja de catre dv le veti colora>
se selecteaza toate literele DE INLOCUIT (pe rand, succesiv, pe masura ce le inlocuiti) si
se formateaza cu FONT ROSU (pentru a le exclude pe viitor din cautare-inlocuire).
Ulterior, Cautarea in vederea INLOCUIRII se va da NUMAI si MUSAI pe font BLACK, iar
Replace-ul se face cu font rosu, ca sa nu intrati in contradictie cu
simbolurile DECRIPTATE DEJA - intrucat criptarea scribd s-a facut in proportie de aprox 70
la suta substituind simbolurile alfabetului LATIN (obisnuit).
Iata un exemplu de inlocuire pt simbolul F - (litera majuscula F) ce initial exista scrisa cu font
black, Litera care trebuie inlocuita cu L majuscul de font rosu:

Model, tabelul de mai jos, valabil pt documentul


http://www.scribd.com/doc/116918654/Fluturele-Alb
Deoarece la oricare alt document criptat Scribd a modificat formula de criptare,
aceste operatii nu se pot automatiza, astfel ca identificarea simbolurilor trebuie sa o faceti dv
de fiecare data separat pt orice alt document.
SIMBOL din Textul scribd luat in copy-paste
O

A
D

SE SUBSTITUIE CU:
A

B
C

M
E
B
@
C
L

I
H
F
K
G
J
^
_
Q
T

U
R
P
S
\
Y
o

a
d
m
e
b
`
c
l

i
h
f
k
g
j
~
q
t

D
E
F
G
H
I

J
K
L
M
N
O
P
Q
R
S

U
V
W
X
Y
Z
a

b
c
d
e
f
g
h
i

j
k
l
m
n
o
p
q
r
s


u
r
p
s
|
y
'
&
8
9
/
:

,
#
>
?

1
4
=
5
2
0
3
<

u
v
w
x
y
z
.
,
;
:
!
?
^p-dialog

)
(
0
1
2
3
4
5
6
7
8
9

En Dash

La final, documentul se corecteaza dupa originalul scribd, nedownloadabil.

4. O alta metoda - mai simpla decat pct. 3,


implica
- sa luati cu PRINT SCREEN fiecare pagina de carte, pe rand,
indiferent de format - doc sau pdf,

- sa dati PASTE in PAINT, pe rand, fiecarei pagini de carte si sa o salvati


NUMEROTAND-O, ca fisier BMP in PAINT-ul din Windows,
- ulterior faceti OCR cu ABBYY, pentru toate pozele cu scris/ilustratii carte,
culese astfel.
Tasta PrtSc
se afla langa tastele functionale F11, F12, aproape de tasta INSERT.
In acelasi scop puteti folosi orice program de SCREENSHOT, fiind indicata
salvarea ca JPG color.
In PAINT salvarea o faceti ca BMP, altfel se pot pierde
anumite caracteristici de culoare si claritate ale imaginii, ce vor face imposibil
OCR-ul,
apoi se va da Resize tuturor pozelor BMP
(redimensionare--marire la 4000 de pixeli verticala),
dupa care, cu ACDSEE, se face conversie in JPG...
iar la final OCR.
Cam atat...
Nu disperati, in orice meserie
primii 20 de ani sunt mai dificili, dar trec repede!
Mai jos sunt 120 de pagini blank, pentru ca acest document sa apara la cautari
scribd SI la CATEGORIA DOC PESTE 100 DE PAGINI, PENTRU A PUTEA
FI GASIT DE CAT MAI MULTI USERI interesati.

S-ar putea să vă placă și