Documente Academic
Documente Profesional
Documente Cultură
1. INTRODUCERE 7
1.1. Motivatie 7
1.2. Objective 8
1.3. Publicatii 9
1.4. Structura tezei de doctorat 10
2. CADRU TEORETIC 11
2.1. Tehnologia DNA microroarray 11
2.2. Metode actuale de recunoa5tere a formelor in analiza genetica 14
2.2.1. Similaritate 5i di-similaritate 18
2.2.1.1. Distanta euclidian5 19
2.2.1.2. Distanta Manhattan 19
2.2.1.3. Distanta Minkowski 21
2.2.1.4. Distanta Chebyshev 21
2.2.1.5. Distanta Canberra 21
2.2.1.6. Coeficientul de corelatie 22
2.2.1.7. Impactul masurilor similarieatii 5i di-similarit6tii 22
2.2.2. Tehnici de grupare 27
2.2.2.1. Gruparea ierarhic5 27
2.2.2.2. Gruparea k-means 36
2.2.2.3. Gruparea Fuzzy k-means 37
2.2.2.4. Gruparea k-medoid 37
2.2.2.5. Gruparea CLARA 38
2.2.3. Tehnici de clasificare 39
2.2.3.1. Clasificatorul Nave Bayes 40
2.2.3.2. Clasificatorul k-Nearest Neighbor (kNN) 47
2.2.3.3. Clasificatorul liniar 53
2.2.3.4. Ma5ini de suport vectorial (SVM) 57
2.2.3.5. Selectarea atributelor 61
2.2.4. Evaluarea performantei clasificatorilor 63
2.2.4.1. Teorema No Free Lunch 63
2.2.4.2. M5suri cantitative ale performantei clasificatorilor 64
2.2.4.3. Bias 5i Varian t5 67
2.2.4.4. Evaluarea 5i compararea performantei clasificatorilor 68
2.2.4.4.1. Metoda Hold-out 68
2.2.4.4.2. Metoda "leave-one-out" de validare incrucipt5 69
2.2.4.4.3. Metoda k-fold de validare incrucipt6 69
2.3. Concluzii 69
3. METODA PROPUSA PENTRU SELECTAREA UNUI NUMAR RESTRANS DE ATRIBUTE,
INTERPRETABILE DIN PUNCT DE VEDERE BIOLOGIC 72
3.1. Algoritmii genetici 72
3.1.1. Initializarea AG 74
3.1.2. Recombinarea 74
3.1.2.1. Recombinarea Intr-un punct 74
3.1.2.2. Recombinarea in doug puncte 75
3.1.2.3. Recombinarea uniforma 75
3.1.3. Mutatia 76
6 Cuorins
3.1.4. Selectia 76
3.1.4.1. Metoda turnirului 77
3.1.4.1. Metoda ruletei 77
3.1.4.1. Elitism 77
3.2. Metod5 propus5 pentru selectarea unui num5r restrans de atribute 78
3.3. Dominanta incomplet5 81
3.3.1. Dominanta incomplet5 in biologie 81
3.3.2. Dominanta incomplet6 in algorimii genetici 83
3.4. Atribuirea aleatorie a cromozomilor 85
3.4.1. Atribuirea aleatorie a cromozomilor in meioz5 85
3.4.2. Atribuirea aleatorie a cromozomilor in AG 87
3.5. Operatori pentru mutatii 90
3.5.1. Mutatia fare" sens in biologie 91
3.5.2. Mutatia thra" sens in algoritmii genetici 92
3.5.3. Mutatia Cu deplasare in biologie 93
3.5.4. Mutatia Cu deplasare in algoritmii genetici 93
3.5.5. Stergerea unui segment in biologie 93
3.5.6. Stergerea unui segment in algoritmii genetici 93
3.5.7. Stergerea unui cromozom in biologie 94
3.5.8. Stergerea unui cromozom in algoritmii genetici 94
3.5.9. Transpozonii in biologie 95
3.5.10. Transpozoni in algoritmii genetici 95
3.6. Concluzii 95
4. PACHETUL R dGAselID 97
4.1. R si Bioconductor 97
4.2. Pachetul software dGAselID 98
4.3. Concluzii 107
5. EXPERIMENTE 108
5.1. Setul de date Acute Lymphoblastic Leukemia 108
5.2. Evaluarea dominantei incomplete 112
5.3. Evaluarea dominantei incomplete versiunea 2 115
5.4. Evaluarea operatorului pentru atribuirea aleatorie a cromozomilor 120
5.5. Evaluarea operatorului pentru mutatia far5 sens 126
5.6. Evaluarea operatorului pentru mutatia cu deplasare 129
5.7. Evaluarea operatorului pentru mutatia cu stergerea unui segment 130
5.8. Evaluarea operatorului pentru mutatia cu stergerea unui cromozom 132
5.9. Evaluarea operatorului pentru transpozoni 134
5.10. Evaluarea efectelor cumulate ale DI2 si AAC 135
5.11. Concluzie 138
6. CONCLUZII 140
6.1. Observatii finale 140
6.2. Contributii personale 141
6.3. Perspectiv5 de dezvoltare 142
BIBLIOGRAFIE 143