Documente Academic
Documente Profesional
Documente Cultură
Rezumat Teza Mihail Iulian ANDREI
Rezumat Teza Mihail Iulian ANDREI
DEPARTAMENTUL DE ELECTROTEHNICA
BUCURESTI
2012
Cuprins
Introducere
1.1 Importanta si actualitatea temei . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Structura lucrarii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
2
3
3
4
5
6
7
8
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 11
. 13
14
. 14
. 15
. 22
. 23
.
.
.
.
24
25
30
32
34
35
Bibliografie
38
CAPITOLUL 1
Introducere
1.1
Deoarece costurile pentru fabricarea componentelor de circuit integrat sunt ridicate atat
din punct de vedere financiar, necesitand masini si instrumente de masura costisitoare, cat
si din punct de vedere al timpului de fabricatie, procesul de fabricatie durand ntre 6 si 8
saptamani, se alege ca solutie alternativa modelarea. Fata de fabricarea prototipului, pentru
verificarea unui proiect, simularea are un cost mai scazut fiind necesare doar un sistem de
calcul (hardware) si un program de modelare si simulare a componentelor de circuit integrat
(software). Modelarea si simularea circuitelor integrate a devenit o tehnica obligatorie n
proiectarea elctronica. Ea este baza unei tehnologii de proiectare automata a circuitelor
integrate micro- si nano-electronice numita EDA (Electronic Design Automation).
Tranzitia de la microelectronica la nanoelectronica a deschis drumul spre noi descoperiri. Evolutia circuitelor integrate sta la baza dezvoltarii multor domenii complementare
(industrie, medicina, securitate, telecomunicatii, etc.), deoarece perfomantele circuitelor
integrate se reflecta n toata instrumentatia folosita n aceste domenii.
Un aspect important al proiectarii eficiente a componentelor de circuit integrat, se refera la efectele campului electromagnetic. Proiectarea acestor componente, tinand cont de
efectele campului electromagnetic, conduce la modele ce pot contine milioane de grade de
libertate. Din acest motiv, se impune aplicarea unor tehnici de reducere a ordinului modelelelor extrase, care transforma modelul initial ntr-unul echivalent din punct de vederea al
comportarii pe la terminale, dar de ordin redus.
Pentru a avea timpi rezonabili de obtinere a modelelor, tehnicile de reducere a ordinului
modelelor trebuie completate cu folosirea supercalculatoarelor si a tehnicilor de calcul de
nalta performanta .
Din punct de vedere al compatibilitatii, programul de modelare, trebuie sa genereze
modelul ntr-un format standard, compatibil cu alte programe. Majoritatea proiectantilor
de componente de circuit integrat prefera ca format standard modelul SPICE.
Teza de doctorat, Modelarea electromagnetica a inductoarelor integrate pe sisteme de calcul multiprocesor, are ca principal obiectiv folosirea acestor instrumente de
calcul paralel, pentru mbunatatirea tehnologiei de modelare electromagnetica a componentelor pasive de circuit integrat, urmarind atat scaderea timpului si a efortului de calcul,
1
1. Introducere
cat si obtinerea unei precizii acceptabile pentru modelele obtinute. Tema tezei este de actualitate si prezinta o importanta ridicata datorita faptului ca pe de o parte tot mai multe
circuite integrate contin inductoare sau au efecte inductive relevante, iar, pe de alta parte,
foarte multe probleme de complexitate industriala nu pot fi abordate cu tehnicile clasice
secventiale, din cauza timpului foarte mare de executie.
1.2
Structura lucrarii
Teza este alcatuita din sase capitole. Primul capitol reprezinta o intoducere n care sunt
prezentate importanta si actualitatea temei de cercetare, structura tezei de doctorat.
Capitolul doi prezinta stadiul actual al modelarii inductoarelor integrate. Sunt tratate
atat modelelele cu parametri concentrati, cat si modelele cu parmetri distribuiti, care presupun rezolvarea numerica ecuatiilor campului electromagnetic n regimuri dinamice.
Capitolul trei prezinta descrierea si analiza procesului de modelare al inductoarelor
integrate, ales pentru a fi studiat n vederea paralelizarii. Sunt prezentate toate etapele
procesului de modelare: modelarea fizica, modelarea matematica, modelarea numerica si
metoda de reducerea ordinului modelului.
Capitolul patru prezinta avantajele folosirii sistemelor multiprocesor, n modelarea inductoarelor spiralate. In prima parte a acestui capitol, sunt introduse arhitecturile calculatoarelor paralele folosite, atat din punct de vedere hardware, cat si software. In a doua
parte, sunt prezentate metodele de rezolvare directa si iterativa a sistemelor liniare rezultate folosind tehnici de calcul paralel. In finalul acestui capitol, sunt propuse doua abordari
paralele ale algoritmului de reducere a ordinului modelului, pentru care sunt prezentate si
rezultatele obtinute pe probleme de test.
Capitoul cinci prezinta un studiu de caz pe trei probleme reale, n care se prezinta procesul de modelare electromagnetica si perfomantele abordarilor paralele propuse n capitolul
anterior.
Ultimul capitol, face o sinteza a concluziilor ntregii lucrari, pune n evidenta principalele contributii originale ale tezei si se ncheie cu lista de lucrari publicate de autor.
CAPITOLUL 2
2.1
Circuitele care contin un numar finit de elemente ideale simple, caracterizate de parametrii lor rezistivi, capacitivi sau inductivi, sunt numite circuite cu parametri concentrati.
Elementele pot fi pasive (rezistoare, inductoare, condensatoare) sau active (surse, generatoare). Modelul pentru un inductor spiralat contine o serie de paramtetri, ce sunt ntr-o
stransa legatura cu proprietatile geometrice ale spirei.
Teoria circuitelor electrice cu parametrii concentrati se elaboreaza prin particularizarea
teoriei campului electromagnetic, n anumite ipoteze simplificatoare [1]. Practic, modelarea se rezuma la gasirea unui circuit echivalent, care pentru a avea o acuratete ridicata
trebuie sa modeleze principalele efecte parazite, ntr-o gama de frecvente cat mai extinsa.
Principalul neajuns al modelelor cu parametri concentrati este acela ca sunt valabile numai
pentru frecvente de maxim 25GHz.
Prin urmare, teoria cu parametri concetrati nu poate raspunde cerintelor circuitelor integrate de nalta frecventa , astfel ncat, n acest context, o noua teorie trebuie abordata, teorie
care sa ia n calcul toate efectele campului electromagnetic sau sa fie mai putin restrictiva
decat teoria cu parametri concentrati.
3
2.2
Modelul cu parametri distribuiti ofera o acuratete mai mare decat modelul cu parametri
concentrati, nsa complexitatea modelului este mult mai mare. Acuratetea modelului provine din faptul ca se ia n considerare interactiunea reciproca a efectelor campului electromagnetic, iar complexitatea provine din faptul ca modelul este descris de ecuatii cu derivate
partiale. Modelul cu parametri distribuiti, descris de ecuatiile lui Maxwell, completat cu
relatiile consitutive de material si cu conditiile pe frontiera, este un model continuu, infinit dimensional. Pentru a obtine un model discret, cu o dimensiune finita, se foloseste o
metoda numerica pentru a discretiza ecuatiile lui Maxwell, dintre care cele mai importante
sunt: FEM (metoda elementului finit), FDM (metoda diferentelor finite) si BEM (metoda
elmentelor de frontiera), numita si MoM (metoda momentelor).
Ca si concluzie generala, indiferent de metoda numerica folosita pentru discretizarea
ecuatiilor lui Maxwell (MoM, FDTD, FEM, FIT), problema se va reduce, tot timpul, la
rezolvarea unui sistem liniar. De aceea, tipul matricei sistemului (rara, plina, simetrica,
nesimetrica, complexa, reala, pozitiv definita, diagonal dominanta, etc), rezultata n urma
aplicarii metodei numerice, este foarte important n alegerea unei metode adecvate de
rezolvare, directa sau iterativa.
Modelarea efectelor inductive reprezinta un aspect important al obtinerii modelului
de ordin redus, sub forma unui circuit cu parametri concentrati, pentru un dispozitiv de
circuit integrat. Istoric, prima metoda de modelare inductiva a fost propusa de Ruehli, care
a introdus prin metoda PEEC, conceptul de inductivitate partiala pentru modelarea 3D a
dispozitivelor din circuitele integrate. FastHenry este o tehnica de accelerare a extragerii matricei inductantelor partiale din PEEC, bazata pe dezvoltarea n multipoli, care s-a
dovedit foarte eficienta n cazurile practice. In lucrarea este introdus modelul K, model
caracterizat de matricea K a reluctantelor magnetice (numita gresit si a susceptantelor),
definita ca inversa matrice inductivitatilor partiale H = L1 . Initial metoda VPEC este
propusa n lucrarea pentru a doua conductoare, nsa Hao Yu preia acest subiect si propune
o metoda VPEC, metoda care are la baza tot varianta K a metodei PEEC, pentru N conductoare.
Metoda circuitelor echivalente Magneto-Electrice (MEEC) reprezinta o alternativa
ce evita dezavantajele metodelor PEEC si VPEC. Aceasta metoda foloseste conceptul de
element electromagnetic de circuit si tehnica de descompunere n subdomenii.
De cele mai multe ori, metodele de discretizare numerica si de modelare prezentate mai
sus se gasesc n programe comerciale sau open-source, care contin la randul lor metode de
rezolvare corespunzatoare sistemelor liniare de rezolvat, generate n urma dicretizarii. A
fost realizat un studiu al celor mai importante programe de modelare pentru inductoarele
integrate (ANSYS HFSS, Momentum 3D Planar EM Simulator), SONNET, ASITIC,
COMSOL Multiphysics), evidentiind folosirea sistemelor multiprocesor pentru accelerarea obtinerii rezultatelor.
Chamy este un program de modelare electromagnetica a componentelor pasive din
circuitele integrate de nalta frecventa si extragerea modelelor parametrice de ordin redus
corespunzatoare. El este dezvoltat n cadrul Laboratorului de Metode numerice din UPB, n
cadrul mai multor programe europene. Pentru sistemele cu unul sau mai multe procesoare,
metoda de rezolvare UMFPack foloseste procesarea paralela apeland operatii de algebra
4
2.3. Concluzii
2.3
Concluzii
Acest capitol a prezentat stadiul actual atat al metodelor de modelare, cat si celor mai
importante programe de modelare existente. Prima parte a acestui capitol a prezentat metoda de modelare cu parametri concentrati, concluzionan ca ipotezele simplificatoare ale
acestei teorii sunt prea restrictive pentru modelarea componentelor din circuitele integrate
de nalta frecventa , implicit si a inductoarelor spiralate. S-a stabilit ca pentru inductoarele
spiralate, cea mai buna metoda de modelare, este metoda ce foloseste modele cu parametri
distribuiti. In acest sens au fost prezentate principalele metode de discretizare a ecuatiilor
lui Maxwell.
Partea finala a acestui capitol a prezentat cateva din programele de modelare electromagnetica, programe ce urmaresc fluxul de proiectare EDA (design flow EDA). Asa cum
s-a putut observa majoritatea programelor existente folosesc tehnici de calul paralel si distribuit pe diferite sisteme multiprocesor. Majoritatea programelor prezentate, au raportat
un timp de 6 ori mai mic la rularea pe un cluster cu 8 noduri, decat la rularea pe un singur
nod.
Prin prezentarea caracteristicilor de multiprocesare a programelor de modelare electromagnetica, se demonstreaza nca o data ca tema acestei teze este de actualitate si prezinta
un interes ridicat din partea cercetatorilor.
CAPITOLUL 3
3.1
Modelarea fizica
Problemele ce vor fi analizate constau din unul sau doua inductoare spiralate, plasate
ntr-un circuit integrat cu substrat de siliciu (tehnologia BiCMOS). Deci, fiecare problema
va avea trei subdomenii rectangulare: Si, SiO2 si Aer, conductoarele din Al, aflandu-se
n stratul de oxid (Figura 3.1). Ele vor fi analizate n gama de frecvente 1-60GHz, deci
alegerea regimului de functionare, trebuie sa tina cont de frecventa , astfel ncat modelul sa
contina toate efectele relevante ale campului electromagnetic atat la frecvente joase, cat si
la frecvente nalte. Pentru a descrie toate efectele campului electromagnetic din substratul
de siliciu, la frecvente de 60GHz, trebuie considerat regimul FW. Tot regim FW trebuie
folosit si n modelarea starului de oxid SiO2 , nsa, pentru modelarea conductoarelor, cel
mai potrivit model este MQS, deoarece, n Al, curentii de deplasare au densitatea (JD =
E) mult mai mica decat cei de conductie Jc = E. De exemplu, la 60 GHz, (
103 ) ( 107 ). In consecinta , se neglijeaza curentii de deplasare, ceeea ce nseamna
regim MQS.
Procedand astfel, vor fi modelate urmatoarele efecte ale campului de nalta si joasa
frecventa (Figura 3.2).
Pentru a extrage modelul inductorului, care sa considere toate efectele campului electromagnetic de frecventa nalta, trebuie rezolvata o problema de camp electromagnetic,
bine formulata si cuplata cu o problema de circuit electric exterior. Orice problema de
camp are ca date cunoscute: domeniul de calcul, proprietatile de material si sursele de
camp, care satisfac conditiile de unicitate.
Necunoscutele problemei sunt componentele campului electromagnetic, descris de
ecuatiile lui Maxwell n regim general variabil (FW), respectiv: E, D, B, H, J, . Pentru
proiectantul de circuite integrate, componetele campului electromagnetic si modul cum variaza ele n spatiu sau timp, nu are o prea mare relevanta . Ce prezinta interes, este modul n
care o componeta interactioneaza cu exteriorul. Mai exact, care sunt relatiile constitutive
ntre curentii si tensiunile componentei respective.
Se vor considera primele m terminale, din cele n terminale ale dispozitivului, alimentate n tensiune, iar restul de (n m 1) alimentate n curent, astfel ca se pot defini
7
(3.1)
(3.2)
SK
si semnalele de iesire
Z
ik (t) =
Hdr, k = 1, m
(3.3)
Edr, k = m + 1, n 1 .
(3.4)
SK
Z
vk (t) =
CK D
Vectorul intrarilor si vectorul iesirilor sistemului modelat (Figura ??) vor avea componentele:
v1
i1
..
..
.
.
vm
im
u=
,y =
.
im+1
vm+1
.
.
..
..
in1
vn1
3.2
Modelarea matematica
(3.5)
(3.6)
(3.7)
(3.8)
3.3
Modelarea numerica are ca scop discretizarea problemei de camp formulata n subcapitolele anterioare. Cuplajul dispozitivului cu un circuit exterior se face prin terminalele
aflate pe suprafata frontierei domeniului elementului electromagnetic de circuit, n interiror
comportamentul fiind descris de ecuatiile lui Maxwell n regim general variabil. Aceasta
9
Edr = B
dA
Cv = d
rotE = B
t
t
dt
v
divB = 0
H BdA =s0
D0 = 0
(J + D
rotH = J + D
)dA
=
=
(3.9)
C0 u = i + d
t
t
dt
v Hdr = t
divD =
DdA
dv
D = q
s =
t
=> divJ = dt
=> JdA =
dv
=> Di = dq
dt
dt
si relatiile consitutive, care sunt descrise cu ajutorul operatorilor Hodge:
B = H
= M u = M1
v u
= M v
D = E =
J = E
i = M v
(3.10)
(3.11)
(3.12)
(3.13)
dx
+ Gx = 0 .
dt
(3.14)
3.4. Reducerea ordinului modelului prin esantionarea adaptiva a frecventelor cu procedura Vector Fitting
+ Gx = y
C dx
dt
z = Dx,
(3.15)
n care
Ce 0
0 Gm
0
,
S
0
C=
C
0
0
0
0
Ge B0
B
0
0
0
G = SG
,
S0E
0
0 SM
SE
0
SJ ,
D=0
0 SM
(3.16)
0
0
0
v
0
v
0
.
y = j , z = i , x =
u
e0
w
f
In domeniu frecventa , sistemul de stare (3.15) devine un sistem liniar complex
3.4
(sC + G)x = Bu
.
y = Lx + Du
(3.17)
Reducerea ordinului modelului prin esantionarea adaptiva a frecventelor cu procedura Vector Fitting
a0 + a1 s + + aN sN
b0 + b1 s + + bN s N
11
(3.18)
astfel ncat f (s) sa aproximeze functia g(s) n sensul celor mai mici patrate. Functia f (s)
poate fi rescrisa sub forma:
f (s) =
N
X
n=1
cn
+ d + sh
s an
(3.19)
3.5. Concluzii
(3.20)
Deci, pentru a calcula matricea de transfer, trebuie rezolvat un sistem liniar de ecuatii
de tipul Ax = b, avand A = G + jC matricea sistemului, iar b = B termenii liberi,
pentru fiecare frecventa .
Analizand algoritmul AFS-VF, se constata ca pasi critici, din punct de vedere al timpului de calcul, pasii n cadrul carora se rezolva sistemele de ecuatii liniare, sunt paralelizati.
Abordari paralele ale acestor pasi vor fi prezentate n capitolul urmator. De asemenea, la
primul pas al algoritmului, se cunosc atat frecventele de esantionare S, cat si frecventele
de test S 0 .
3.5
Concluzii
In cadrul acestui capitol, a fost prezentat ntreg procesul dezvoltat de echipa de cercetare LMN din UPB pentru modelarea componentelor pasive ale circuitelor integrate de
nalta frecventa . Prima etapa a procesului de modelare furnizeaza sistemul matriceal de
stare. Acest sistem matriceal este considerat data de intrare pentru a doua etapa a procesului de modelare, etapa ce consta n extragerea modelului de ordin redus cu ajutorul algortimului AFS-VF. Rezultatul final al ntregului proces de modelare este un model rational
pe baza caruia este sintetizat un model echivalent SPICE cu parametri concentrati ce poate
fi conectat ntr-un circuit exterior si simulate mpreuna folosind un program de simulare a
circuitelor.
Acest proces de modelare a fost studiat, de autor, n vederea paralelizarii. Procedura de
extragere a modelului de ordin redus, pentru componente pasive de circuit integrat, a fost
identificata ca fiind partea cea mai costisitoare din punct de vedere al timpului de executie.
Tocmai de aceea n capitolul urmator vor fi prezentate noi abordari ale acestui algoritm,
abordari care au rolul de a reduce timpul de obtinere al modelului de ordin redus.
13
CAPITOLUL 4
Prima parte a acestui capitol contine o scurta prezentare a arhitecturii sistemelor multiprocesor si a tehnicilor de programare paralela, corespunzatoare lor. In a doua parte se
prezinta metode de rezolvare, directe si iterative, a sistemelor liniare mari generate pe parcursul procesului de modelare electromagnetica, folosind calculul paralel. Ultima parte
prezinta abordarile paralele, propuse de autor, pentru algoritmul de extragerea modelului
de ordin redus (AFS-VF).
4.1
In 1972, Michael Flynn a introdus o clasificare generala a sistemelor de calcul din punct
de vedere al fluxurilor de instructiuni si de date, numita Taxonomia lui Flynn. Aceasta
clasificare identifica patru clase de sisteme de calcul:
4.2
Rezolvarea directa
Majoritatea metodelor directe de rezolvare ale unui sistem liniar, executa factorizarea
LU a matricei A si ncearca reducerea costurilor, memorie si timp de calcul, minimizand
umplerea cu elemente nenule a factorilor triunghiulari L si U , n procesul de eliminare.
Pentru simulari, a fost folosita o metoda directa, ce respecta tiparul de mai sus, si anume
solverul UMFPack [13] dezvoltat de Tim Davis. Implementarea din MATLAB a acestui
solver poate fi considerata o implementare paralela, deoarece, prin intermediul bibliotecii
LAPACK, solverul are acces la operatii BLAS paralele, ce se folosesc de faptul ca procesorul sistemului de calcul are doua sau mai multe core-uri. Se va executa, ca test, rezolvarea
unor sisteme liniare de mai multe dimensiuni, generate cu FIT, folosind de la 1 la 8 core-uri.
Nr. DoFs Tip nod
6317
17069
42269
56927
INTEL
AMD
INTEL
AMD
INTEL
AMD
INTEL
AMD
1
0.4
0.87
3.3
6.21
26.61
49.19
53.61
93.38
Nr. core-uri
2
3
4
5
0.33
0.33 0.28 0.27
0.7
0.62 0.61 0.58
2.25
2.24 1.61 1.61
4.21
3.67 3.28 3.11
16.57 16.54 10.22 10.23
30.3 23.92 20.02 18.87
30.29 30.95 18.83 19.24
55.02 43.3 35.65 32.19
6
7
8
0.27 0.27 0.28
0.6
0.62 0.53
1.47 1.45 1.32
2.95 3.25 2.85
8.37
8.6
7.56
17.18 18.58 15.6
15.39 15.44 14.37
30.24 30.62 26.73
3
37x37x37
283907
430.80
22280
mem. err.
4
38x38x38
308111
494.31
22365
mem. err.
5
39x39x39
333653
3108
swap
mem. err.
unde matricele MC si MA sunt mai rare decat n alte forme ale sistemului de stare oferite
de Comsol. Astfel, folosind sistemul de stare rezultat, ca data de intrare pentru algoritmul
AFS-VF, se poate obtine modelul SPICE (modelul de ordin redus) pentru problema modelata. In prima varianta, modelul contine efectele campului electromagnetic modelate cu
metoda FIT, n schimb, acest model va contine efectele modelate cu metoda FEM.
Au fost executate teste, pe doua tipuri de platforma de calcul:
CPU - folosind nodul Psi, avand configuratia 2 x Intel Xeon i7 CPUs, 2.66 GHz cu 8
MB memorie cache, un total de 8 cores per nod, si 24 GB memorie RAM;
GPU - folosind NVIDIA Tesla C1060, 240 cores, 1.296 GHz per core, 4GB memorie
RAM.
Testul a constat n rezolvarea unui sistem complex A x = b, folosind solverul GMRES
,
cu restart, pentru care a fost calculat norma reziduului rezultatului final, R = norm(bAx)
norm(b)
TCP U
si accelerarea, S = TGP U . Pentru GPU, testul a fost rezolvat pentru doua valori de restart
50 (GPU1 ), respectiv 5000 (GPU2 ), iar pentru CPU valoarea de restart a fost setata la 50.
Problema
No. of DoFs
Results
CPU
GMRES
GPU1
GPU2
Speedup1
Speedup2
FEM1
7196
Timp [s]
R
5086
7.6e-2
62
9.1e-2
3165
7.3e-6
82
1.6
FEM2
11568
Timp [s]
R
11860
7.4e-2
161
4.0e-2
476
2.98e-5
73
24
FEM3
19486
Timp [s]
R
26766
2.8e-2
452
3.8e-2
15875 3.73e-6
59
1.7
(4.2)
indica cat de aproape este solutia de la iteratia k, de solutia reala x. Metodele de preconditionare
folosesc o matrice M ce aproximeaza inversa matricei A, cu ajutorul careia se obtine un
sistem a carui rezolvare necesita mai putine iteratii:
M A x = M b.
(4.3)
Matricea noului sistem A1 = M A, are proprietati mai bune decat matricea A, n cazul
matricelor FIT, un numar de conditionare mai mic.
Dupa mai multe teste, ca metoda de preconditionare, a fost folosita factorizarea incompleta ilu, iar pentru rezolvare metoda reziduului minimal generalizat (Generalized Minimum Residual - GMRES):
GMRES cu preconditionare ilu, apelate din MATLAB (iluM AT );
GMRES cu preconditionare ilu, apelate din toolbox-ul pentru MATLAB, ILUPACK
(iluP ACK ).
Pentru testele executate n cadrul acestei etape, au fost utilizate matricele FIT pentru
problema Ucoupled .In Tabelul 4.4, se gasesc rezultatele, pentru rezolvarea unui sistem liniar,
obtinute pentru cele doua metode iterative cu preconditionare: iluP ACK si iluM AT .
Grid
10x10x10
DoFs
4631
mem. [GB]
0.32
iluP ACK
Timp [s]
2.82
R
3.8e-12
mem. [GB]
0.4
iluM AT
Timp [s]
2.1
R
7.68e-13
15x15x15
17069
1.3
37.15
2.1e-11
2
44.5
3.15e-12
20x20x20 25x25x25
42269
84719
8
14
427.25
7638
6.4e-12
4.2e-12
mem err
-
30x30x30
148895
mem err
-
(a) Memorie
(b) Timp
nf req T1
Ts
=
,
Tp
Tp
(4.4)
unde Ts reprezinta timpul serial, T1 timpul de rezolvare al unui sistem pentru o frecventa ,
nf rec numarul de frecvente, iar Tp timpul paralel.
Pentru un singur sistem cu 56927 grade de libertate, timpul de rezolvare obtinut este
T1 = 13.41. Timpii paraleli (Tabelul 4.5) au fost obtinuti ruland cele doua versiuni pe 4 noduri din cluster-ul Atlas, rezultand 32 workersi pentru versiunea cu un nivel de granularitate
si 4 workersi pentru versiunea cu doua nivele de granularitate.
nf rec
Ts
Timp [s]
Speedup
Tp 1LvlGr
Tp 2LvlGr
S1LvlGr
S2LvlGr
10
134.1
67.57
40.57
1.98
3.31
20
30
40
268.2 402.3 536.4
67.87 69.33 122.13
68.30 105.73 132.18
3.95
5.80
4.39
3.93
3.80
4.06
59
791.19
123.02
196.20
6.43
4.03
In acest caz timpul paralel pentru 2LvlGr este mai mic decat timpul paralel pentru
1LvlGr (se verifica, vezi Tabelul 4.5).
Un alt lucru foarte important, pentru decizia utilizarii uneia dintre versiunile propuse,
este acela ca pentru versiunea 1LvlGr (1 worker = 1 core), 1 worker va avea la dispozitie
= 3GB
doar 18 din memoria totala a nodului respectiv, adica, n cazul nodurilor INTEL, 24
8
memorie RAM. Aceasta limitare reprezinta un important dezavantaj, deoarece folosind
aceasta versiune, se vor putea rezolva doar sisteme care necesita o cantitate de maxim 3 GB
memorie (aproximativ 85000 grade de libertate), ceea ce nseamna ca gridul de discretizare
nu poate fi foarte dens, rezultand simulari cu erori mai mari.
4.3
Asa cum a fost prezentat n Capitolul 3, pasul critic al algoritmului AFS-VF, implica
rezolvarea unui sistem liniar de ecuatii, de tip A x = b, pentru o serie de frecvente. Acest
lucru se ntampla, din cauza sistemelor de rezolvat, care au o dimensiune foarte mare (pot
depasi 106 grade de libertate), ceea ce implica timpi de rezolvare foarte mari.
Folosind tehnici de calcul paralel si distribuit, autorul propune doua versiuni paralele
ale algoritmului AFS-VF, obiectivul folosirii lor, fiind acela de a reduce la minimum timpul de modelare. Diferenta dintre cele doua versiuni constau n abordarea hardware-ului si
software-ului sistemului de calcul, din punct de vedere al granularitatii. Nivelul de granularitate are o mare influenta asupra performantelor algoritmului paralel, deoarece un nivel
de granularitate prea mare ar ncetini executia programului (din cauza timpilor de comunicare), iar un nivel de granularitate prea mic, nu ar exploata la maxim resursele de calcul.
4.4. Concluzii
AF S
V F
Nr. pct.
1e-3
1e-5
1e-3
1e-5
Convergenta
iteratie 1
2
0
S
3
6
0
S+S
7 13
iteratie 1
S0
7
S + S 0 15
U coupled
Grid
20 20 20
DoFs
42269
Nr. in/out
2
Nr. pct.
Timp [s]
Ts
141.8
4
Tp 1LvlGr
90.39
Tp 2LvlGr
60.27
Ts
157.64
8
Tp 1LvlGr
47.76
Tp 2LvlGr
59.27
4.4
Concluzii
In introducerea acestui articol au introduse cateva notiuni legate de sistemele multiprocesor actuale, dar si tehnici de programare paralela a acestor sisteme. Studiu referitor
la metodele de rezolvare a oferit informatii pretioase legate de tipul solverului ce trebuie
ales pentru o rezolvare cu acuratete ridicata a sistemelor cu matrice rare generate cu ajutorul
Chamy. In finalul acestui capitol au fost propuse doa implementari paralele ale algoritmului
AFS-VF, cu un nivle de granularitate, respectiv cu doua nivele de granularitate, prezentand
atat avantajele cat si dezavantajele folosirii lor. De asemenea, a fost prezentat si o metoda de calcul a eficientei acestor implementari. Despre eficienta folosirii implementarilor
paralele, se va vorbi si n capitolul urmator pentru fiecare strutura de test modelata.
23
CAPITOLUL 5
5.1. Inductorul spiralat patrat
- CDST-SP-MIDDLE
5.1
Problema CDST-SP-MIDDLE se refera la un inductor spiralat patrat ce are amble terminale excitate n tensiune, iar substratul de Si conectat la GND. Geometria 2D, n coordonate xOz, a dispozitivului provine din fisierul .gds (Figura 5.1a - vedere din Layouteditor).
Coordonata pe axa Oy provine din fisierul de tehnologie, obtinandu-se astfel geometria 3D
(Figura 5.1b - vedere din COMSOL) a dispozitivului de modelat.
(a) Layout
(b) Vedere 3D
Caracteristicile materialelor folosite pentru clasa de probleme CODESTAR sunt prezentate n Tabelul 5.1.
Material
Tip
r
alum1
Al-conductor
1
alum2
Al-conductor
1
tun1
W-conductor
1
SUB1 (Si) semi-conductor 1
SUB5 (Si) semi-conductor 1
Oxide1
izolator
1
Oxide2
izolator
1
Nitride
izolator
1
r
1
1
1
11.7
11.7
3.9
4.1
7.5
[S/m]
6.60 107
1.25 107
3.33 106
5
3.33 103
0
0
0
Modelarea aproximativa
Pentru obtinerea solutiei analitice se va folosi modelul Pi cu parametri concentrati (Figura 5.2).
l
= 1.42, Ls =
Parametri concentrati ai modelului sunt definiti astfel: Rs = wt
+2dout )t
= 6.8 103 S/m2 . Cu aceste valori CSi = 3.58f F si RSi = 7.353k. Probabil ca n
tSi
realitate valorile acestor doi parametri sunt cuprinse ntre aceste limite.
(5.1)
Pentru obtinerea caracteristicii n frecventa din SPICE, circuitul trebuie simulat de doua ori
astfel:
1. cu V2 = 0 se obtine I1 = Y11 V1 si I2 = Y21 V1 , adica Y11 si Y21 ;
2. cu V1 = 0 se obtine I1 = Y12 V1 si I2 = Y22 V1 , adica Y12 si Y22 .
A fost facut un studiu, rezultatul final fiind un model cu parametri concentrati pentru
care obtine eroarea relativa globala n norma euclidiana fata de masuratori de 2% (simularea
8).
26
5.1. Inductorul spiralat patrat
- CDST-SP-MIDDLE
Modelarea numerica
Modelarea numerica este urmatoarea etapa n procesul de modelare electromagnetica
a inductorului CDST-SP-MIDDLE, care va fi facuta cu ajutorul programului Chamy, bazat
pe metoda FIT. Aceasta etapa presupune obtinerea modelului discretizat pentru campul
electrodinamic din domeniului de calcul de tip EMCE, domeniu care contine inductorul si
are dimensiunile de 400 microni dupa axele Ox, Oz, si 10+2725 microni dupa axa Oy.
Figura 5.5: Caracteristicile de frecventa Y11 si Y12 : masurate, simulate ale modelului cu
parametri concentrati si distribuiti
28
5.1. Inductorul spiralat patrat
- CDST-SP-MIDDLE
V F
1e-4
Nr. pct.
4
Convergenta
iteratie 1 2
ordin 3 6
S0
3 6
S + S 0 7 13
3
7
4
17
5.2
(a) Layout
(b) Vedere 3D
r
1
1
1
11.7
11.7
[S/m]
3.23 107
2.15 107
5.21 106
2.38 106
3.33 103
Modelarea aproximativa
Modelarea aproximativa se va face folosind acelasi model propus in subcapitolul anterior. Valorile parametrilor concentrati ai modelului sunt: Rs = 2.55, Ls = 1.754nH,
Cs = 3.066f F , COx = 63.11f F , CSi = 3.093f F , RSi = 8.5k.
Rezultatele acestei simulari au fost comparate cu rezultatele Chamy (Figura 5.7).
30
Modelarea numerica
Pentru discretizarea problemei CHRF217 au fost folosite strategiile dezvoltate n subcapitolul anterior, n final fiind folosita o retea adaptata cu 47 21 39 noduri.
(a) Real
(b) Imaginar
V F
1e-5
Nr. pct.
4
Convergenta
iteratie 1 2
ordin 3 6
S0
3 6
S + S 0 7 13
3
10
10
23
belul 5.4) pentru a obtine modelul final, care are ordinul q = 10. Implementarea seriala a
obtinut modelul de ordin redus n 4554s. Implementarea cu un singur nivel de granularitate
nu a putut rezolva aceasta problema din cauza limitarii memoriei. Implementarea paralela
cu doua nivele de granularitate a avut nevoie doar de 1386s, obtinandu-se o accelerare de
3.3. La fel ca n cazul precedent, pentru executia implementarii paralele au fost folosite 4
noduri din clusterul Atlas. Accelerarea obtinuta se apropie de accelerarea maxima teoretica, deci, se poate spune ca implementarea paralela exploateaza si de aceasta data eficient
resursele de calcul.
5.3
Problema CHRF201 contine doua inductoare spiralate patrate cuplate aflate la distanta
de 14m. Fiecare inductor are un terminal excitat n tensiune iar celalalt conectat la masa,
rezultand un element diport de circuit electric. Geometria dispozitiviului este reprezentata
n Figurile 5.8a) si 5.8b.
(a) Layout
(b) Vedere 3D
Modelarea aproximativa
Pentru modelarea aproximativa a problemei CHRF201 se vor folosi doua modele cu
parametri concentrati de tip Pi, pentru fiecare inductor, la care se adauga doua elemente:
un condensator C12 , care modeleaza efectele capacitive aparute ntre cele doua inductoare,
si o inductivitate mutuala, care modeleaza cuplajul ntre cele doua inductoare. In cazul
campului electric uniform, capacitatea condensatorului este egala cu C12 = OxhS , unde
A = t dout aria comuna spirelor si h distanta dintre spire. Inductivitatea
mutuala calculata
dintre cele doua nfasurari M = 1.02125nH satisface relatia M = k Ls1 Ls2 .
Circuitul echivalent SPICE al inductoarelor cuplate este prezentat n Figura 5.9, iar
parametri lui se calculeaza folosind formulele adoptate n subcapitolul anterior: Rs = 9,
32
Modelarea numerica
Pentru discretizarea problemei CHRF201 a fost folosita o retea adaptata cu 622238
noduri. Rezultatele simularilor, prezentate n Figura 5.10, arata clar superioritatea modelului Chamy, mai ales la frecvente nalte, unde surprinde comportarea specifica a caracteristicii de frecventa a dispozitivului. Modelul cu parametri concentrati nu reuseste sa faca
acest lucru, nici macar din punct de vedere calitativ. Eroarea medie patratica globala pentru
modelul SPICE este de 20%, pe cand modelul Chamy are o eroare de 14%. Concluzia este
33
ca, n acest caz, numai, un model cu parametri distribuiti poate modela cu acuratete efectele
de nalta frecventa .
Folosind metoda Fredho, se observa ca aceeasi retea de discretizare adaptiva, ce genereaza un sistem linear cu acelasi numar de grade de libertate, reduce eroarea medie patratica
globala de la 14% la 10%. Cel mai probabil, rezultatele mai pot fi mbunatatite ndesind
gridul n planul xOz, nsa aceasta tehnica este limitata de memoria RAM avuta la dispozitie
n sistemul de calcul pe care se face modelarea.
V F
Nr. pct.
1e-2
1e-4
Convergenta
iteratie 1 2 3
4
ordin 3 6 12 15
S0
3 6 12 4
S + S 0 7 13 25 29
5.4
Concluzii
CAPITOLUL 6
Issue Selected papers from the 3rd International Conference of Modern Power Systems (MPS 2010), Vol. 51, No. 5, pp. 9-14, Mediamira Science Publisher, ClujNapoca, Romania, 2010, ISSN 1841-3323.
2. I. Andrei, E. Caciulan and D. Dan, Parallel and Distributed Computations Applied
to the Deterministic Optimization of the Loneys Solenoid, Proceedings of the 11th
International Workshop on Optimization and Inverse Problems in Electromagnetism
(OIPE 2010), pp:90-91, September 14-18, 2010, Sofia, Bulgaria, ISBN 978-954438-855-3.
3. G. Ciuprina, D. Ioan, I.A. Lazar, M.I. Andrei, Adaptive Frequency Sampling for the
Effective Extraction of Reduced Models for HF-ICs Passive Components, Proceedings of National Symposium of Theoretical Electrical Engineering (SNET 2010),
Bucharest, 2010, ISSN 2067-4147.
4. I.A. Lazar, M.I. Andrei, E. Caciulan, G. Ciuprina and D. Ioan, Parallel algorithms
for the efficient extraction of fitting based reduced order models, Proceedings of the
7th International Symposium on Advanced Topics in Electrical Engineering (ATEE
2011), pp:1-6, 12-14 May, Bucharest, 2011, ISSN: 2068-7966
5. D. Ioan, G. Ciuprina, C.B. Dita and M.I. Andrei, Electromagnetic Models of Integrated Circuits with Coupled Magnetic Circuits, Proceedings of the International
Conference on Electromagnetics in Advanced Applications (ICEAA 2012), September 2-7, 2012, Cape Town, South Africa.
6. G. Ciuprina, D. Ioan, C.B. Dita and M.I. Andrei, Frequency Dependent Models for
Planar On-Chip Inductors, Book of Abstracts, Scientific Computing in Electrical
Engineering (SCEE 2012), 11-14 September, 2012, Zurich, Switzerland.
7. G. Ciuprina, D. Ioan, C.B. Dita and M.I. Andrei, Optimal terminals identification
for domain partitioning of electro-magnetic circuit elements, Proceedings of 12th
International Workshop on Optimization and Inverse Problems in Electromagnetism
(OIPE 2012), 19-21 September, 2012, Ghent, Belgium.
Lucrari trimise pentru publicare:
1. G. Ciuprina, C.B. Dita , M.I. Andrei and D. Ioan, Hierarchical Sparse Circuits for
the Modeling of Homogeneous Domains in High Frequency ICs, n curs de publicare la Editura Politehnica Press
2. M.I. Andrei and C.B. Dita , Using Multiprocessors Systems for Electromagnetic
Modelling of Spiral Inductors, lucrare trimisa pentru Buletinul UPB, ID 1698.
Lucrari n pregatire:
1. Parallel extraction of reduced order models for integrated inductors by AFS-VF
2. Parallel iterative electromagnetic modeling of spiral inductors
37
Bibliografie
38