Sunteți pe pagina 1din 9

STRUCTURI TOLERANTE LA DEFECTE

CURS 1

Stiinta calculatoarelor arta si stiinta de a transforma cerintele de utilizator pe care nu le intelegem in


hardware si software pe care nu il putem analiza precis, intr-un mod in care societatea nu are nici un
motiv sa ne suspecteze de ignoranta.

Failure- diferenta neacceptabila intre ceea ce asteptam si ceea ce observam (cum se comporta de fapt).

Redundanta- folosita pentru motive de siguranta (putem parti de rezerva, mai multi piloni la pod).

CURS 2

Un sistem=entitate ce comunica cu alte entitati ce fac


mediul inconjurator.

Sistemele de calcul= indici de performanta (ce tine de


functionalitate, Securitate etc).

System function- functionality, performance

System behavior- ce face ca sa implementeze


functionalitatea descrisa de stari.

System structure= set de componente.

Starea Totala= setul de stari externe ale componentelor


atomice

Service= comportamentul observabil.

Un utilizator poate fi si un alt sistem

Service failure- un serviciu este oferit dar modul in care


este oferit este defectos (se incarca pagina dar nu imi da
datele)

Service outage- ma astept la un serviciu correct, el este


livrat fie incorrect fie nu este livrat, si dureaza o perioada
de timp pana este oferit (da eroare)

Service restoration- serviciu trece de la stadiul de serviciu


incorrect in stadiul de serviciu correct. (nu merge si apoi
isi revine

Cauzele erorilor sunt faults.

Faults- interne,externe (unul intern poate duce la vulnerabilizarea unuia extern)

External faults nu se manifesta imediat.


Eroare poate duce la un serviciu defectuos (activa, subtila(nu cauzeaza imediat o defectiune))

Partial failure- performanta scazuta, serviciu lent, serviciu limitat.

Dependabilitatea- abilitatea de a livra servicii de incredere in mod justificat.

Securitatea are atributele: Availablity,


confidentiality, integrity.

Pentru a obtine DEP si SEP:

*fault prevention – testez componentele inainte


de folosire

*fault tolerance- cum sa mearga sistemul chiar


daca apar erori?

*fault removal

*fault forecasting- estimam cat de probabil e sa


apara un defect.

Ciclu de viata: dezvoltare, folosinta (service delivery period, service outage period, service shutdown).

Mentenanta- repararea sistemului sau modificarea lui.

Poate fi corectiva, preventiva etc.

1- Apar development faults sau operational


2- Interne saau externe

8- permanente sau nu.

Service Failure

Timing rau continut bun sau invers sau ambele.

Defecte Bizantine- unii oameni cred ca e


defectuos altii nu.

Modelul celor 3 universuri


Fiabilitatea- probabilitatea ca un sistem sa functioneze corect daca initial mergea corect.

Z(t) este functia de hazard si descrie cel mai bine defectarile

F(t) unreliability

Λ=failure rate, rata in care se defecteaza (nr defectate/nr total dispozitive)

Availability- timpul de functionare a unui sistem.

Fail safe- atunci cand sistemul se defecteaza ajunge intr-o stare cunoscuta

CURS 3

Bathtub curve

Infant mortality phase- testarea nu este exhaustiva inainte sa iasa pe piata, asa ca apar unele
defecte si produsul se intoarce pe garantie si se calculeaza rata. Defectele se manifesta in perioada
de inceput a produsului.

Wear-out phase- Componentele imbatranesc accelerat dupa o perioada de timp

Parallel systems
Ca sistemul sa mearga este sufficient ca unul din elemente sa mearga. Probabilitatea ca sistemul sa
fie defect este probabilitatea ca unul din elemente sa fie defect.

Coverage factor- probabil ca situatia unui defect sa fie inteleasa.

M out of N systems

Se bazeaza pe vot majoritar (numar impar de module de voteaza iesirea corecta)

Voter-ul preia iesire de la cele 3 module, le analizeaza si scoate la iesire cee ace au votat in mod
majoritar cele 3 module. Cele 3 module trebuie sa ruleze acelasi algoritm pentru a scoate aceleasi
rezultate la iesire. Fiabilitatea sistemului ia in calcul functionarea tuturo, si defectarea pe rand a unui
modul.

Voter-ul este considerat cu fiabilitate 1 pentru ca


este un comparator binar care este pur
combinational si este cel mai rezistanet la defecte

Desi noi consideram ca modulele sunt separate exista posibilitatea ca acestea sa fie si corelata (de
exemlu aceeasi sursa de alimentare). Voterul este SPF pentru ca daca el se strica se strica tot.

Daca presupunem ca avem aceeasi fiabilitate la toate TREI modulele atunci avem un TMR

Daca Rv este considerat 1 avem k out of n system. Unde avem o formula combinatorica.

Sistemele in care conteaza si ordinea de functionare se numesc consecutive k out of n systems.

NMR este N Modular Redundancy

Din formula TMR pentru ca fiabilitatea sistemului sa fie mai mare decat un sistem format dintr-un singur
modul trebuie ca R al unui modul sa fie mai mare de 0.5!!!! Daca R<0.5 atunci sistemul bazat pe vot
majoritar nu adduce nici un beneficiu, din contra, are o fiabilitate mai scazuta.

Despre votere
De regula voterele primesc niste intrari si genereaza iesirea majoritara dar asta se intampla fie care
intrarile sunt pe un singur bit, fie ca sunt pe mai multi biti dar comparatiile se fac bit cu bit. Dar s-ar
putea ca iesirile moduleleor sa nu fie exact la fel ci sa fie appropriate daca sunt pe mai multi biti. Cum

stabilim iesirea Voterului? Definim o noua relatie: practice identice

Cum sa nu mai facem ca Voterul sa fie SPF? Punem mai multe votere ca sa nu mai fie critice.

Redundanta Dinamica – avem o resursa active si n care sunt de rezerva. Resursele ce nu functioneaza
nici nu se uzeaza. Pentru a implementa asta este nevoie de o unitate care in cazul in care resursa active
se defecteaza isi da seama si o inlocuiese cu una de rezerva.

Redundanta Statica – interconexiunile dintre module nu se schimba, am module de rezerva.

Hybrid redundancy

Combinatie intre redundanta statica bazata pe vot majoritar si cea dinamica. Se bazeaza pe resurse de
rezerva (k resurse) si n resurse ce participa la procesul de votare. Avem unitate de reconfigurare si una
de comparare. Principiu: in orice moment iesirea majoritatii care iese de la voter este comparata cu
fiecare iesire a modulelor active in momentul descoperiri unei necorelari se semnalizeaza acest lucru
catre u de reconfig care va deconecta modulele defecte si va active si conecta modulele de rezerva.

Sift-out modular redundancy – elimina resursele de rezerva

Avem comparator care va scoate niste vectori care vor spune daca doua iesiri sunt de accord sau nu.
Eij=1 iesirile nu se potrivesc. Detectorul pe baza unei logici va semnala care este modulul defect si va
instiinta collectorul care va inlatura modulul defect.

Duplex Systems

2 module si se compara mereu iesirile lor. Trebuie sa luam decizia la nivel mai ridicat care din rezultate
este correct.
CURS 4

Detectia si localizarea erorii este strans legata de corectia ei.

Intr-un cod toate cuvintele au aceeasi lungime.

O eroare este de fapt o modificare in cod.

Numarul mai mic de erori este cel mai probabil. Eroarea singulara este cea mai des intalnita.

Distanta Hamming – numarul de diferente dintre 2 coduri

Un cod C poate detecta s erori daca d(C)>=s+1

Un cod C poate corecta t erori daca d(C)>=2*t+1

SED (single error detecting)

SEC (single error correcting)

(n,M,d) q-ary code

N caractere,

D distanta hamming

M cuvinte

Q caractere in alphabet

Redundant bits k=n-t

Code rate creeaza o coresp intre numarul de biti utili si numarul total de biti pe care ii transmitem.

Code Rate=t/n

G(x) este de grad k!!!!

Convolutional- bazate pe inmultire, bitii sunt nugrupati

Division- structurată.

Caracteristici G(x)
D(x)=C(x)+E(x)

CURS 5

Permanent faults- nu se modifica, se intind pe toata viata sistemului, usor de rezolvat si studiat

Non-permanent faults- dipar dupa un timp (intermitente- cu cause ce nu tin de mediul inconjurator
dificil de debugguit; tranzitorii- apar din cauza mediului si sunt imposibil de modelat).

Single Event Upsets: zgomot datorat ionizarii electron-gol.

Particule capable sa genereze nucleoni si fragmente nucleare (particule alfa, izotopi radiocativi, raze
cosmice).

Memoriile sunt foarte sensibile la tipurile acestea de erori iar logica combinationala este rezistenta.

SER (Soft Error Rate) depinde de dezvoltarea tehnologiei (nr de memorii etc).

Izotopii Radioactivi

Cosmic Ray Influence perturbatiile electromagnetice afecteaza sistemele.

Dispozitivele semiconductoare se bazeaza pe schimburi de sarcini si la perturbatii electron-gol nu se


recombina deci sarcina in loc sa fie colectata se scurge pe alte cai.

Fluxul de particule este afectat de:

 Altitudine
 Regiunea geomagnetica (la ecuator campul em este cel mai mare, iar la poli minim)
 Ciclul solar de 11 ani

Dupa ciocniri successive a particulelor primare venite din spatiu cu cele de pe pamant rezulta un flux
cascada. Fluxul final este reprezentat de hadroni, leptoni si fotoni.

In punctul Pfotzer aflat la 15 km altitudine fail rate-ul dispozitivelor electrice este de 100 ori mai mare
decat la altitudini terestre.

Leptonii particole care nu interactioneaza prin forta nucleara puternica (ex electroni, muoni, particule
tau etc)

Hadronii interactioneaza dupa forta nucleara puternica (Mesons, Baryoni (protoni, neutroni))

Un pion pozitiv in nucleul unu element transforma in altceva plus un protos (forteaza extractia unu
proton). Cel negativ la fel si forteaza extractia unui neutrol. Fiecare captura de pion negativ duce la
un soft fail.

Muonii au durata de viata mai mare ca pionii.

Filogenetice-primul nivel de organizare a sistemelor vii. Reproducerea are loc pe baza unor
evenimente nondeterministe cu o rata de eroare mica.

Ontogenetice- dezvoltarea individului de la celula la moartea acestuia. Proces deterministic.


Epigenetice- sunt sisteme capabile de invatare (sistemul nervos, endocrin, imunitar).

Ce invatam?

Ne folosim de filogenie la algoritmii genetici, strategii de evolutie, programe evolutioniste sau


programare genetica. Hardware reconfigurabil FPGA e exemplu.

Ne folosim de ontogeneza pentru evolutia celulara si diviziunea celulara : embrionics.

Ne folosim de epigeneza prin retele neuronale, malware, anti-malware (folosing sistemul imunitar),
comportamentul roiurilor (endocrin)

EMBRIONICS

Ce se poate transfera din biologie in lumea digitala?

Genotip=memoria

Ribotip=procesorul

Un organism este un sistem de calcul implementat ca un array de procesoare (celule). Fiecare celula
executa un program (gena). Toate celulele opereaza in paralel si impreuna toate celulele realizeaza
aplicatia.

Fiecare celula are tot programul genetic la dispozitie. Fiecare celula are o copie a celorlalte celule
integrat. Celula are access la gena fiecarei celule deci poate sa ii ia si locul daca este nevoie.Astfel ia
nastere un mecanism de autoreparare cand una din celule se defecteaza si avem si celule de
rezerva.

Celula este impartita in molecule construite pe baza unui fpga.

Un space devider este configurabil si poate fixa numarul si pozitia coloanelor de rezerva.

Memoria este circulara.

Embrionics si celulele stem

Celulele stem si celulele zigot se poat reface si divide de un numar infinit de ori.

S-ar putea să vă placă și