Sunteți pe pagina 1din 130

ŞMECHERII

pentru DOWNLOADAREA
ORICĂROR FIŞIERE
SCRIBD
NOTA
Un salut calduros tuturor userilor care posteaza carti corectate.
De asemeni, si celor care scaneaza si apoi restrictioneaza downloadul
lasand pe cei mai neinstruiti sa saliveze degeaba.
Oricum, cei care scaneaza ne ofera
astfel (vezi mai jos)
materia bruta, pe care o vom perfectiona noi, astilaltii.

Daca pdf-ul/documentul a fost postat integral, TOTUL se poate lua de pe scribd,


inclusiv
fisierele carora nu le este permis downloadul.
Iata cum:

1. Pentru pdf-urile din imagini scanate,


Trageti de cursorul din dreapta paginii scribd, si parcurgeti documentul
pana jos, imagine cu imagine,
lasand-i astfel timp pdf-ului sa isi incarce imaginile jpg in
folderul temporar.
O faceti cu rabdare, ne-sarind peste vreo pagina, si nici peste vreun grup de pagini.

Cand ajungeti jos, dati click dreapta in afara cartii, in campul paginii WEB scribd,
de ex. jos - spre dreapta, in apropiere de cursorul din lateralul paginii
(nu pe cursor) si, din drop-down list, alegeti VIEW PAGE INFO.

Daca nu va apare aceasta optiune, insistati, schimband locul unde dati click dreapta.
SIGUR va aparea.
In fereastra urmatoare, apasati butonul MEDIA, care apare in stg sus, alaturi de
butonul GENERAL
cu oarecare intarziere.
Nu disperati, uneori se incarca mai greu, dar apare.

In aceasta fereastra veti vedea ca aveti foarte multe fisiere


(componente ale HTML, ale paginii web scribd)
dintre care multe sunt inutile pt dv.

Le alegeti pe cele DENUMITE ca mai jos:


(am colorat secventele ''sablon'',ce se vor repeta in celelalte sute de pagini
ale cartii, si pe care le veti regasi in josul ferestrei MEDIA, tragand de cursor)

http://htmlimg2.scribdassets.com/2tm4dthyv425apiw/images/1-798bdba627.jpg
vezi fig de mai jos
tragand de cursorul ferestrei MEDIA,
acest ''sablon'' se repeta si pentru restul sutelor de pagini ale cartii.

http://htmlimg4.scribdassets.com/2tm4dthyv425apiw/images/2-e47052906c.jpg
http://htmlimg3.scribdassets.com/2tm4dthyv425apiw/images/3-55a539a868.jpg

vezi fig de mai jos

Intrucat nu am incarcat cartea CORECT, vedeti ca de la imaginea / 9-61c67etc


numaratoarea sare la imag.17… apoi de la 24 … la 45, etc.
Dv veti avea grija sa o faceti corect.

-----------
Pentru download propriuzis,
selectati grupuri de cate 30 - 50 pagini jpg si din fereastra MEDIA - din dreapta jos
- apasati butonul SAVE AS, iar fisierele se vor downloada in computer.
Functie de procesor si RAM, puteti lua si cate o suta o data, dar uneori vi se poate
bloca computerul, mai ales daca e tip mai vechi…
La urma, verificati FOLDERUL in care ati downloadat paginile cartii,
asigurandu-va ca aveti TOATE fisierele componente ale cartii,
urmarind NUMARUL fisierului,
mai precis,
ultima parte a denumirii fisierului
care ESTE de fapt
NUMARUL de ordine al paginii cartii.

Aducandu-le in computer, paginile se vor redenumi - renumerotandu-le,


mai precis, in fata denumirii
se adauga doi de ZERO, pt fisierele de ordinul UNITATILOR - de la 1-9,
si se adauga un ZERO pt fisierele de ordinul zecilor, de la 10 - 99.

Eventualele fisiere lipsa, se iau manual, unul cate unul, ori din fereastra MEDIA,
ori chiar direct din SCRIBD din cartea NE-DOWNLOADABILA, mergand direct
la pagina lipsa
si dand click dreapta pe PAGINA CARTII, SAVE AS… jpg.

Salvati intotdeauna ca jpg.


Paginile sunt de mici dimensiuni, 400-600 pixeli…uneori insuficiente pentru un
OCR bun, dar solutia este sa
instalati un program ACDSEE 7, sau 9,
si dati RESIZE acestor pagini, aprox la 4000-5000 pixeli verticala.
iar apoi, dupa RESIZE, o prelucrare cu Scan tailor poate reda rezolutia buna
paginilor
si poate elimina anumite fonduri gri, cetzoase, neuniforme,
sau poate indrepta anumite deformari ale paginii (de forma trapezoidala, sau de
forma unui paralelogram).
(Amanunte in OCR de la A la Z)
http://www.scribd.com/doc/119186134/OCR-de-La-A-la-Z-Simplificat-Mart-2012

2. Instructiuni copiere de pe scribd


a fisierelor DOC word, pe care nu le puteti downloada,
in speta
- a celor al caror download este conditionat de uploadarea
vreunui document de catre dv
- a fisierelor INCOMPLET AFISATE, pentru reclama, care au pagini care nu
se afiseaza.
(in memoria cache exista sansa de a descoperi CONTINUTUL INTEGRAL al
documentelor
puse PARTIAL la vedere, in scop de reclama...)

Prima metoda este prin verificarea


CACHEULUI GOOGLE, unde verificam daca putem gasi o copie txt neformatata a
documentului cu pricina.
Aceasta metoda NU se poate aplica fisierelor doc COMPLET RESTRICTIONATE la download.
(dar... exista alte doua metode, la pct 3 si 4, mai jos, un pic mai migaloase, dar perfect posibile).

Ca exemplu, iata o carte afisata partial, in scop de reclama...


http://www.scribd.com/doc/97071993/Producatorii-de-Gresie

Deschideti google, si dati Paste in caseta de cautare pt linkul cu pricina:


si apasati ENTER

In fereastra urmatoare (GOOGLE) avem rezultatul dorit:


apoi - vezi figura:
1. Punem mouseul deasupra simbolului DUBLA SAGEATA »
2. Apare fereastra ce ne ofera o imagine grafica micsorata a paginii cautate
3. In dreapta sus, identificam si apasam butonul IN CACHE
4. Ulterior, in fereastra ce se deschide,
vi se afiseaza continutul text neformatat si fara ilustratii al fisierului dorit.
Cu
CTRL+A .... CTRL+C .... CTRL+V, i-ati dat paste in WORD.

Pozele le luati cu click dreapta pe fiecare in parte - SAVE AS,


iar pentru formatare bold-italic si NOTE DE SUBSOL se foloseste ca model, ORIGINALUL
SCRIBD.
»

3. Instructiuni copiere de pe scribd


a fisierelor DOC, interzise la download

Paginile jpg (- poze, coperti) se iau simplu, click pe fiecare pagina/poza si dati SAVE AS.

Paginile text (dactilografiate):

- sunt codificate/criptate prin substitutie


(de catre programatorii angajati la escrocii
proprietari ai scribd-ului - care incearca sa vanda papagalilor
documentele postate tot de catre NOI - cu cate 3-5 dolari)

- se pot lua NUMAI cu copy paste sau


PrintScreen, PrtSc - (vezi procedeul la pct. 4),

-a. cu copy-paste se pot transfera - asa cum sunt, in forma ''criptata'' - intr-un document word
blank doar in numar de CATE PATRU PAGINI O DATA.

- b. cu Prt Sc se pot lua numai UNA cate UNA.

.... pct. a
Selectarea celor 4 pagini se face astfel:

Puneti mouse-ul cu click stanga la inceputul paginii 1 de copiat,


(INAINTE DE PRIMUL CARACTER al paginii 1)
apoi tineti tasta SHIFT apasat, si
coboriti CU RABDARE cursorul PAGINII WEB (din lateral dreapta), numarand paginile
pana la sfarsitul paginii 4 - DUPA ultimul caracter,
unde puneti mouse-ul si apasati click stanga.

In acest moment ati selectat cele PATRU PAGINI (se inalbastreste textul scribd).
Dati click dreapta pe portiunea selectata si alegeti COPY, apoi mergeti in documentul word
blank si dati PASTE.

In documentul cules brut, textul scribd luat cu copy paste


este transpus cu font de 121, deci foarte mare.
Il formatati dv la font de 12-14.

Apoi, dupa adunarea si lipirea cu copy-paste a tuturor GRUPURILOR de cate patru pagini
criptate,
accesati originalul scribd,
identificati fiecare caracter din ORIGINAL in paralel cu corespondentul din COPIA DOC
criptatata.
- faceti un tabel separat cu corespondentele respective, pe baza caruia
- cu search find and replace in word, inlocuiti in copia doc criptata
fiecare din caracterele criptate cu corespondentul lor IN CLAR ...

Initial, documentul se formateaza INTEGRAL cu font BLACK,


si, dupa fiecare inlocuire, caracterele inlocuite deja de catre dv
se selecteaza toate literele DE INLOCUIT (pe rand, succesiv, pe masura ce le inlocuiti) si
se formateaza cu FONT ROSU (pentru a le exclude pe viitor din cautare-inlocuire).

Ulterior, Cautarea in vederea INLOCUIRII se va da NUMAI si MUSAI pe font BLACK, iar


Replace-ul se face cu font rosu, ca sa nu intrati in contradictie cu
simbolurile DECRIPTATE DEJA - intrucat criptarea scribd s-a facut in proportie de aprox 70
la suta substituind simbolurile alfabetului LATIN (obisnuit).

Iata un exemplu de inlocuire pt simbolul F - (litera majuscula F) ce initial exista scrisa cu font
black, Litera care trebuie inlocuita cu L majuscul de font rosu:
Model, tabelul de mai jos, valabil pt documentul
http://www.scribd.com/doc/116918654/Fluturele-Alb

Deoarece la oricare alt document criptat Scribd a modificat formula de criptare,


aceste operatii nu se pot automatiza, astfel ca identificarea simbolurilor trebuie sa o faceti dv
de fiecare data separat pt orice alt document.

SIMBOL din Textul scribd luat in copy-paste SE SUBSTITUIE CU:


O A
ā Ă
 Â
A B
D C
M D
E E
B F
@ G
C H
L I
Ç Î
I J
H K
F L
K M
G N
J O
^ P
_ Q
Q R
T S
ŗ Ş
] T
š Ţ
U U
R V
P W
S X
\ Y
Y Z
o a
Ą ă
á â
a b
d c
m d
e e
b f
` g
c h
l i
ç î
i j
h k
f l
k m
g n
j o
~ p
q
q r
t s
Ś ş
} t
Ť ţ
u u
r v
p w
s x
| y
y z
' .
& ,
8 ;
9 :
/ !
: ?
— ^p-dialog
+ -
‗ “
‛ ”
, )
# (
> 0
? 1
1 2
4 3
= 4
5 5
2 6
0 7
3 8
< 9
¨ «
¸ »
• …
î à
ж м
з о
х х
— En Dash
¬ ©

La final, documentul se corecteaza dupa originalul scribd, nedownloadabil.

4. O alta metoda - mai simpla decat pct. 3,


implica
- sa luati cu PRINT SCREEN fiecare pagina de carte, pe rand,
indiferent de format - doc sau pdf,

- sa dati PASTE in PAINT, pe rand, fiecarei pagini de carte si sa o salvati


NUMEROTAND-O, ca fisier BMP in PAINT-ul din Windows,

- ulterior faceti OCR cu ABBYY, pentru toate pozele cu scris/ilustratii carte, culese
astfel.

Tasta PrtSc
se afla langa tastele functionale F11, F12, aproape de tasta INSERT.
In acelasi scop puteti folosi orice program de SCREENSHOT, fiind indicata
salvarea ca JPG color.

In PAINT salvarea o faceti ca BMP, altfel se pot pierde


anumite caracteristici de culoare si claritate ale imaginii, ce vor face imposibil
OCR-ul,
apoi se va da Resize tuturor pozelor BMP
(redimensionare--marire la 4000 de pixeli verticala),
apoi, cu ACDSEE, se face conversie in JPG...
iar la final OCR.

Cam atat...
Nu disperati, in orice meserie
primii 20 de ani sunt mai dificili, dar trec repede!

Mai jos sunt 120 de pagini blank, pentru ca acest document sa apara la cautari
scribd
SI la CATEGORIA
DOC PESTE 100 DE PAGINI, PENTRU A PUTEA FI GASIT DE CAT MAI
MULTI USERI interesati.

S-ar putea să vă placă și