Documente Academic
Documente Profesional
Documente Cultură
Zipf's Law
Zipf's Law
Teoretic,,Principesa
Tema:Legea
Conferinta laZipf
Natalia
Dadiani
matematica
Elaborat:Zmuncila Alexandru
Elev al clasei X ,,A
Coordonator:Izman Nina,professor de matematica
Cuprins:
1.Introducere
2.Scurt istoric
3.Legaturi cu alte legi matematice
3.1 Legea lui Pareto
3.2 Principiul putinului efort
3.3 Procese preferentiale de atasare
4.Distributia lui Gauss
5.Legea lui Zipf in aceasta conferinta
6.Incheiere
7.Bibliografie
3
7
8
8
10
13
15
17
18
19
1.Introducere
6 procente din tot limbajul zilnic al englezilor este cuvntul ,,the" care se folosete
1 data la fiecare 16 cuvinte. Dac vom ncerca s crem un tabel grafic al
popularitii folosirii cuvintelor, vom vedea c graficul a luat o form care seamn
cu acesta.
Dup cum vedem, a aprut o consecutivitate. Al doilea cuvnt este folosit de doua
ori mai rar dect primul, al treilea de 3 ori mai rar, etc. Numrul de ori un cuvnt
este folosit este proporional cu 1 asupra ordinii cuvntului. Frecvena cuvntului i
ordinea pe un grafic logaritmic este o linie dreapt. Acest fenomen este numit legea
Dup cum vedem, aceast lege se aplic la toate limbele cunoscute, i chiar la cele
necunoscute, cum ar fi cele antice care nu au putut fi translate.
Din acest motiv, legea lui Zipf adesea este numita misterul lui Zipf. nimeni nc nu
a aflat motivul acestui fenomen. Este uimitor cum un lucru aa de complex i
creativ ca limba se comport intr-o modalitate aa de previzibil.
Lumea este haotica,lucrurile sunt distribuite in cai nenumarate , nu doar dupa legi
de tip putere.Si limba este ceva personal,intenionat,total deosebit pentru fiecare.De
aici vine intrebarea, care este motivul pe baza carui noi influentam lumea
complexa din imprejurul nostru sa urmareasca asa o regula banala?Peste un secol
de cercetare nu a putut da o explicatie al acestui fenomen.Dar,legea lui Zipf nu este
legata doar de folosirea cuvintelor,este deasemenea gasit la populatia
oraselor,frecventa exploziilor solare,secventa proteinelor si receptorilor
imunitari,numarul de vizualizari al unui website,puterea cutremurilor de
pamint,numarul de ori cind o lucrare stiintifica este citata,numele de
familie,ingredientele folosite in culinary,numarul de convorbiri
telefonice,diametrul craterelor de pe luna,popularitatea inceperilor in sah si chiar
rata la care noi uitam .
2.Scurt Istoric
George Kingsley Zipf(n.1902 d.1950) a fost un lingvist American care a
studiat intilnirile statistice in limbi diferite. El si-a cistigat bacalaureatul,masteratul
si doctoratul la Universitatea Harvard, invatind deasemenea la Universitatea Bonn
si cea din Berlin. El a fost in Departamentul German in Harvard ,ce insemna ca el
putea preda orice obiect care dorea. El lucre cu limba chineza si statistica
demografica, si mult effort depus de el poate explica proprietatile
internetului,impartirea avutului intre natie si multe alte colectii de date.
Desi descoperirea acestei proprietati nu a fost realizata de el,faptul ca Zipf
a popularizat-o si a incercat sa o explice ia atribuit legii numele lui. Pentru prima
data aceasta lege a fost observata de Felix Auerbach in 1913, cind el revizuia date
despre populatia oraselor.
Principiul Pareto este present peste tot. El permite concentrarea asupra 20%
din greseli pentru a rezolva 80% din problemele aparute. O varietate de factori
nelegati determina ca acest lucru sa fie adevarat pentru cazuri diferite,dar daca noi
vom determina cauza acestui fenomen noi vom putea gasi mecanismul raspunzator
de legea lui Zipf in limba.
10
12
13
Acest lucru se intimpla fiindca cu cit mai lung este lantul,cu atit este mai
mare probabilitatea ca el va fi luat la intimplare,si va deveni mai lung.Bogatii
devin mai bogati,ce este mare devine si mai mare.Acest lucru este pura
matematica.
14
15
ox.
Aceasta lege prezinta cea mai raspindita distributie din natura. Un numar
enorm de relatii statistice devin clare cind noi asumam distributia normala.
16
Nimic in viata reala nu se aliniaza perfect cu aceasta lege, dar este uimitor
cite repartitii au procentul de eroare extreme de mic. Acest lucru se intimpla
datorita teoremei limite central, care spune ca daca calculam media la destule
lucruri nerelatate , noi obtinem distributia normala. Asemenea mecanicii clasice in
fizica, aceasta lege in statistica este o increngatura speciala care este usoara de
inteles si calculele sunt simple si usor de interpretat.
Exemplu de problema:
Profesorul are 184 de student in colegiul de matematica. Nota la teze este
distribuita dupa legea lui Gauss cu =72.3 si o derivatie standarta de =8.9. Citi
student din clasa se pot astepta sa primeasca un scor de la 82 pina la 90? Folositi
graficul propus.
Solutia:
+o derivare standarta=81.2
+2 derivari standarte=90.1
Derivarea de 1-2 este considerata acceptabila.Dupa cum vedem in
grafic,derivarea dintre 1 si 2 deasupra este de 13.6%.
Raspuns:13.6% din 184 studenti=25 studenti
17
18
6.Incheiere
Din perspectiva matematicii, noi niciodata nu vom putea afla de lumea
imprejurul nostru se conduce dupa asa o modalitate banala. Cu ajutorul acestei
conferinte am descoperit cum o lege matematica poate influenta populatia
orasului,economia si chiar limba noastra. Am putut raspunde la intrebarile care ne
framintau la inceput ,cum ar fi: de ce exista asa o imbalasare dintre bogati si saraci,
care factori variaza populatia orasului,de ce atit de multe cuvinte in vocabularul
nostru se repeat s.a.m.d. .
Cunoasterea matematicii este un lucru fundamental pentru oricine, ea fiind
mama tuturor stiintelor, si cu ajutorul acestei conferinte am putut demonstra
importanta ei in toate domeniile, chiar si in studierea limbilor, absolut tot in aceasta
lume actionind in concordanta cu legile algebrei.
Eu consider ca intelegerea acestor principia la nivelul expus mai sus va ajuta
la cunoasterea mai aprofundata a lumii din imprejurul nostru, oamenii primind un
interes mai mare in studierea algebrei, oamenii avind posibilitatea sa studieze limbi
straine nu memorind vocabularul intreg, dar doar 20% din el pentru a folosi 80%
din potentialul ei, si posibil, intr-o zi un matematician v-a putea descifra misterul
dat, astfel gasind calea de a intelege cum lucreaza orice domeniu .Noi deja stim
dup ace principia lucreaza lumea. Acum trebuie sa aflam cum lucreaza aceste
principii pentru a decodifica misterele universului.
19
7.Bibliografie
http://www.wordcount.org/
www.wikipedia.org
http://www.uow.edu.au/~dlee/corpora.htm
http://www.wordfrequency.info
http://www.anc.org/data/
http://www.titania.bham.ac.uk/docs/
http://www.kilgarriff.co.uk/
http://corpus.byu.edu/
http://colala.bcs.rochester.edu/.
http://www.ling.upenn.edu/~ycharles/
http://arxiv.org/pdf/cond-mat/
http://www-personal.umich.edu/
Cartea ,,Principiul 80/20 de Richard Koch
20