Documente Academic
Documente Profesional
Documente Cultură
Tema1 PDF
Tema1 PDF
Pentru antrenament, folositi setul de date mnist. Acesta poate fi gasit, intr-un format usor de incarcat de
python la urmatoarea adresa : http://deeplearning.net/data/mnist/mnist.pkl.gz
Aceasta este impartita in 3 alte baze de date: training_set, validation_set, test_set. Fiecare din cele 3
baze de date are doi vectori de lungime egala.
1. Un set de cifre scrise sub forma unui vector de lungime 784. Cifrele reprezentate in baza mnist
au dimensiunea 28x28 pixeli si sunt reprezentate sub forma unui vector. (cele 28 de linii din
matrice sunt scrise una dupa alta, formand un vector de lungime 28x28=784). Fiecare pixel din
matrice are o valoare intre 0 si 1, unde 0 reprezinta alb, 1 negru, iar o valoare intre reprezinta o
nuanta de gri.
2. Un label pentru fiecare element din primul set, mai exact o cifra de la 0 la 9
Baza de date a fost salvata cu ajutorul modulului de python cPickle (un modul foarte folosit pentru a
serializa datele).
Algoritmul de clasificare trebuie sa fie bazat pe 10 perceptroni. Fiecare din cei 10 perceptroni va fi
antrenat sa deosebeasca elementele specifice unei cifre, fata de elementele din restul bazei de date. (De
exemplu, perceptronul 0 va fi antrenat sa deosebeasca cifra 0 fata de cifrele 1,2,3,4,5,6,7,8,9).
Cand se doreste clasificarea unei cifre din baza de date de test, se va testa outputul dat de fiecare
perceptron, iar clasificarea va fi dat de numarul perceptronului cu output-ul cel mai mare. Hint: Cand testati
puteti sa nu mai treceti outputul prin functia de activare, ci sa-l folositi direct. (asta va creste acuratetea cu aprox 7%).
Perceptron for number 0
Input
784
pixels