Sunteți pe pagina 1din 40

UNIVERSITATEA POLITEHNICA din BUCURES TI

FACULTATEA DE INGINERIE ELECTRIC

A
DEPARTAMENTUL DE ELECTROTEHNIC

A
Nr. Decizie Senat 219 din 28.09.2012
REZUMATUL TEZEI DE DOCTORAT
MODELAREA ELECTROMAGNETIC

A A INDUCTOARELOR
INTEGRATE PE SISTEME MULTIPROCESOR
ELECTROMAGNETIC MODELLING OF INTEGRATED
INDUCTORS USING MULTIPROCESSOR SYSTEMS
Autor: Ing. Mihail-Iulian ANDREI
Conduc ator de doctorat: Prof. dr. ing. Daniel IOAN
BUCURES TI
2012
Cuprins
1 Introducere 1
1.1 Important a si actualitatea temei . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Structura lucr arii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Stadiul actual al model arii inductoarelor spiralate integrate 3
2.1 Modele cu parametri concentrat i . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Modele cu parametri distribuit i . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3 Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Modelarea inductoarelor spiralate integrate 6
3.1 Modelarea zic a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2 Modelarea matematic a . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.3 Modelarea numeric a (FIT) . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.4 Reducerea ordinului modelului prin esantionarea adaptiv a a frecvent elor cu
procedura Vector Fitting . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.5 Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4 Folosirea sistemelor multiprocesor n modelarea inductoarelor spiralate 14
4.1 Arhitectura hardware si software a sistemelor multiprocesor . . . . . . . . 14
4.2 Rezolvarea direct a si iterativ a, n paralel, a sistemelor linare mari . . . . . . 15
4.3 Paralelizarea Esation arii Adaptive a Frecvent elor cu Vector Fitting(AFS-
VF paralel) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.4 Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
5 Studii de caz - rezultate numerice si validarea lor experimental a 24
5.1 Inductorul spiralat p atrat - CDST-SP-MIDDLE . . . . . . . . . . . . . . . 25
5.2 Inductorul spiralat hexagonal - CHRF217 . . . . . . . . . . . . . . . . . . 30
5.3 Inductoare spiralate cuplate - CHRF201 . . . . . . . . . . . . . . . . . . . 32
5.4 Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
6 Concluzii nale si contributii originale 35
Bibliograe 38
i
CAPITOLUL 1
Introducere
1.1 Importanta si actualitatea temei
Deoarece costurile pentru fabricarea componentelor de circuit integrat sunt ridicate at at
din punct de vedere nanciar, necesit and masini si instrumente de m asur a costisitoare, c at
si din punct de vedere al timpului de fabricat ie, procesul de fabricat ie dur and ntre 6 si 8
s apt am ani, se alege ca solut ie alternativ a modelarea. Fat a de fabricarea prototipului, pentru
vericarea unui proiect, simularea are un cost mai sc azut ind necesare doar un sistem de
calcul (hardware) si un programde modelare si simulare a componentelor de circuit integrat
(software). Modelarea si simularea circuitelor integrate a devenit o tehnic a obligatorie n
proiectarea elctronic a. Ea este baza unei tehnologii de proiectare automat a a circuitelor
integrate micro- si nano-electronice numit a EDA (Electronic Design Automation).
Tranzit ia de la microelectronic a la nanoelectronic a a deschis drumul spre noi descope-
riri. Evolut ia circuitelor integrate st a la baza dezvolt arii multor domenii complementare
(industrie, medicin a, securitate, telecomunicat ii, etc.), deoarece perfomant ele circuitelor
integrate se reect a n toat a instrumentat ia folosit a n aceste domenii.
Un aspect important al proiect arii eciente a componentelor de circuit integrat, se re-
fer a la efectele c ampului electromagnetic. Proiectarea acestor componente, t in and cont de
efectele c ampului electromagnetic, conduce la modele ce pot cont ine milioane de grade de
libertate. Din acest motiv, se impune aplicarea unor tehnici de reducere a ordinului mode-
lelelor extrase, care transform a modelul init ial ntr-unul echivalent din punct de vederea al
comport arii pe la terminale, dar de ordin redus.
Pentru a avea timpi rezonabili de obt inere a modelelor, tehnicile de reducere a ordinului
modelelor trebuie completate cu folosirea supercalculatoarelor si a tehnicilor de calcul de
nalt a performant a.
Din punct de vedere al compatibilit at ii, programul de modelare, trebuie s a genereze
modelul ntr-un format standard, compatibil cu alte programe. Majoritatea proiectant ilor
de componente de circuit integrat prefer a ca format standard modelul SPICE.
Teza de doctorat, Modelarea electromagnetic a a inductoarelor integrate pe sis-
teme de calcul multiprocesor, are ca principal obiectiv folosirea acestor instrumente de
calcul paralel, pentru mbun at at irea tehnologiei de modelare electromagnetic a a compo-
nentelor pasive de circuit integrat, urm arind at at sc aderea timpului si a efortului de calcul,
1
1. Introducere
c at si obt inerea unei precizii acceptabile pentru modelele obt inute. Tema tezei este de ac-
tualitate si prezint a o important a ridicat a datorit a faptului c a pe de o parte tot mai multe
circuite integrate cont in inductoare sau au efecte inductive relevante, iar, pe de alta parte,
foarte multe probleme de complexitate industrial a nu pot abordate cu tehnicile clasice
secvent iale, din cauza timpului foarte mare de execut ie.
1.2 Structura lucr arii
Teza este alc atuit a din sase capitole. Primul capitol reprezint a o intoducere n care sunt
prezentate important a si actualitatea temei de cercetare, structura tezei de doctorat.
Capitolul doi prezint a stadiul actual al model arii inductoarelor integrate. Sunt tratate
at at modelelele cu parametri concentrat i, c at si modelele cu parmetri distribuit i, care pre-
supun rezolvarea numeric a ecuat iilor c ampului electromagnetic n regimuri dinamice.
Capitolul trei prezint a descrierea si analiza procesului de modelare al inductoarelor
integrate, ales pentru a studiat n vederea paraleliz arii. Sunt prezentate toate etapele
procesului de modelare: modelarea zic a, modelarea matematic a, modelarea numeric a si
metoda de reducerea ordinului modelului.
Capitolul patru prezint a avantajele folosirii sistemelor multiprocesor, n modelarea in-
ductoarelor spiralate. In prima parte a acestui capitol, sunt introduse arhitecturile calcu-
latoarelor paralele folosite, at at din punct de vedere hardware, c at si software.

In a doua
parte, sunt prezentate metodele de rezolvare direct a si iterativ a a sistemelor liniare rezul-
tate folosind tehnici de calcul paralel.

In nalul acestui capitol, sunt propuse dou a abord ari
paralele ale algoritmului de reducere a ordinului modelului, pentru care sunt prezentate si
rezultatele obt inute pe probleme de test.
Capitoul cinci prezint a un studiu de caz pe trei probleme reale, n care se prezint a proce-
sul de modelare electromagnetic a si perfomant ele abord arilor paralele propuse n capitolul
anterior.
Ultimul capitol, face o sinteza a concluziilor ntregii lucr ari, pune n evident a principa-
lele contribut ii originale ale tezei si se ncheie cu lista de lucr ari publicate de autor.
2
CAPITOLUL 2
Stadiul actual al model arii inductoarelor spiralate
integrate
De-a lungul anilor tehnologiile de fabricat ie a inductoarelor spiralate au evoluat, ns a
din cauza costului ridicat al realiz arii de prototipuri, s-au dezvoltat diferite tehnici de mo-
delare a acestor inductoare. Tehnicile de modelare au rolul de a extrage, modele ce permit
studierea comportamentului componentei modelate n diferite situat ii (conectarea ntr-un
circuit), nainte ca aceasta s a e realizat a practic.

In prezent, se evident iz a dou a tehnici de
a inductoarelor:
1. modelul de circuit cu parametri concentrat i;
2. modelul de circuit cu parametri distribuit i.
2.1 Modele cu parametri concentrati
Circuitele care cont in un num ar nit de elemente ideale simple, caracterizate de para-
metrii lor rezistivi, capacitivi sau inductivi, sunt numite circuite cu parametri concentrat i.
Elementele pot pasive (rezistoare, inductoare, condensatoare) sau active (surse, genera-
toare). Modelul pentru un inductor spiralat cont ine o serie de paramtetri, ce sunt ntr-o
str ans a leg atur a cu propriet at ile geometrice ale spirei.
Teoria circuitelor electrice cu parametrii concentrat i se elaboreaz a prin particularizarea
teoriei c ampului electromagnetic, n anumite ipoteze simplicatoare [1]. Practic, mode-
larea se rezum a la g asirea unui circuit echivalent, care pentru a avea o acuratet e ridicat a
trebuie s a modeleze principalele efecte parazite, ntr-o gam a de frecvent e c at mai extins a.
Principalul neajuns al modelelor cu parametri concentrat i este acela c a sunt valabile numai
pentru frecvent e de maxim 25GHz.
Prin urmare, teoria cu parametri concetrat i nu poate r aspunde cerint elor circuitelor inte-
grate de nalt a frecvent a, astfel nc at, n acest context, o nou a teorie trebuie abordat a, teorie
care s a ia n calcul toate efectele c ampului electromagnetic sau s a e mai put in restrictiv a
dec at teoria cu parametri concentrat i.
3
2. Stadiul actual al model arii inductoarelor spiralate integrate
2.2 Modele cu parametri distribuiti
Modelul cu parametri distribuit i ofer a o acuratet e mai mare dec at modelul cu parametri
concentrat i, ns a complexitatea modelului este mult mai mare. Acuratet ea modelului pro-
vine din faptul c a se ia n considerare interact iunea reciproc a a efectelor c ampului electro-
magnetic, iar complexitatea provine din faptul c a modelul este descris de ecuat ii cu derivate
part iale. Modelul cu parametri distribuit i, descris de ecuat iile lui Maxwell, completat cu
relat iile consitutive de material si cu condit iile pe frontier a, este un model continuu, in-
nit dimensional. Pentru a obt ine un model discret, cu o dimensiune nit a, se foloseste o
metod a numeric a pentru a discretiza ecuat iile lui Maxwell, dintre care cele mai importante
sunt: FEM (metoda elementului nit), FDM (metoda diferent elor nite) si BEM (metoda
elmentelor de frontier a), numit a si MoM (metoda momentelor).
Ca si concluzie general a, indiferent de metoda numeric a folosit a pentru discretizarea
ecuat iilor lui Maxwell (MoM, FDTD, FEM, FIT), problema se va reduce, tot timpul, la
rezolvarea unui sistem liniar. De aceea, tipul matricei sistemului (rar a, plin a, simetric a,
nesimetric a, complex a, real a, pozitiv denit a, diagonal dominant a, etc), rezultat a n urma
aplic arii metodei numerice, este foarte important n alegerea unei metode adecvate de
rezolvare, direct a sau iterativ a.
Modelarea efectelor inductive reprezint a un aspect important al obt inerii modelului
de ordin redus, sub forma unui circuit cu parametri concentrat i, pentru un dispozitiv de
circuit integrat. Istoric, prima metoda de modelare inductiv a a fost propusa de Ruehli, care
a introdus prin metoda PEEC, conceptul de inductivitate part ial a pentru modelarea 3D a
dispozitivelor din circuitele integrate. FastHenry este o tehnic a de accelerare a extrage-
rii matricei inductant elor part iale din PEEC, bazat a pe dezvoltarea n multipoli, care s-a
dovedit foarte ecient a n cazurile practice.

In lucrarea este introdus modelul K, model
caracterizat de matricea K a reluctantelor magnetice (numit a gresit si a susceptant elor),
denit a ca inversa matrice inductivit at ilor part iale H = L
1
. Init ial metoda VPEC este
propus a n lucrarea pentru a dou a conductoare, ns a Hao Yu preia acest subiect si propune
o metod a VPEC, metod a care are la baz a tot varianta K a metodei PEEC, pentru N con-
ductoare.
Metoda circuitelor echivalente Magneto-Electrice (MEEC) reprezint a o alternativ a
ce evit a dezavantajele metodelor PEEC si VPEC. Aceast a metod a foloseste conceptul de
element electromagnetic de circuit si tehnica de descompunere n subdomenii.
De cele mai multe ori, metodele de discretizare numeric a si de modelare prezentate mai
sus se g asesc n programe comerciale sau open-source, care cont in la r andul lor metode de
rezolvare corespunz atoare sistemelor liniare de rezolvat, generate n urma dicretiz arii. A
fost realizat un studiu al celor mai importante programe de modelare pentru inductoarele
integrate (ANSYS HFSS, Momentum 3D Planar EM Simulator), SONNET, ASITIC,
COMSOL Multiphysics), evident iind folosirea sistemelor multiprocesor pentru accelera-
rea obt inerii rezultatelor.
Chamy este un program de modelare electromagnetic a a componentelor pasive din
circuitele integrate de nalt a frecvent a si extragerea modelelor parametrice de ordin redus
corespunz atoare. El este dezvoltat n cadrul Laboratorului de Metode numerice din UPB, n
cadrul mai multor programe europene. Pentru sistemele cu unul sau mai multe procesoare,
metoda de rezolvare UMFPack foloseste procesarea paralel a apel and operat ii de algebr a
4
2.3. Concluzii
liniar a paralele, din biblioteca LAPACK.
Implementarea unui mod de rezolvare, ce foloseste procesarea paralel a si distribuit a si
exploateaz a ecient un sistem multiprocesor tip cluster a fost una din sarcinile autorului si
reprezint a subiectul central al acestei teze de doctorat.
2.3 Concluzii
Acest capitol a prezentat stadiul actual at at al metodelor de modelare, c at si celor mai
importante programe de modelare existente. Prima parte a acestui capitol a prezentat me-
toda de modelare cu parametri concentrat i, concluzion an c a ipotezele simplicatoare ale
acestei teorii sunt prea restrictive pentru modelarea componentelor din circuitele integrate
de nalt a frecvent a, implicit si a inductoarelor spiralate. S-a stabilit c a pentru inductoarele
spiralate, cea mai bun a metod a de modelare, este metoda ce foloseste modele cu parametri
distribuit i.

In acest sens au fost prezentate principalele metode de discretizare a ecuat iilor
lui Maxwell.
Partea nal a a acestui capitol a prezentat c ateva din programele de modelare electro-
magnetic a, programe ce urm aresc uxul de proiectare EDA (design ow EDA). Asa cum
s-a putut observa majoritatea programelor existente folosesc tehnici de calul paralel si dis-
tribuit pe diferite sisteme multiprocesor. Majoritatea programelor prezentate, au raportat
un timp de 6 ori mai mic la rularea pe un cluster cu 8 noduri, dec at la rularea pe un singur
nod.
Prin prezentarea caracteristicilor de multiprocesare a programelor de modelare electro-
magnetic a, se demonstreaz a nc a o dat a c a tema acestei teze este de actualitate si prezint a
un interes ridicat din partea cercet atorilor.
5
CAPITOLUL 3
Modelarea inductoarelor spiralate integrate
Modelarea electromagnetic a a componentelor pasive din circuitele integrate de nalt a
frecvent a, presupune extragerea unui circuit electric liniar cu parametri concentrat i (alc atuit
din elementele ideale R, L, C, surse comandate liniar, cu parametri independent i de frecvent a),
care s a aib a o comportare pe la borne c at mai apropiat a de comportamentul componentei
reale. Pentru a realiza acest lucru, este necesar a modelarea aproximativ a a tuturor efectelor
c ampului electromagnetic de nalt a frecvent a, cum sunt: efectul pelicular, curent ii turbio-
nari, ntarzierea prin propagare, etc. Acest lucru necesit a rezolvarea numeric a ecuat iilor
lui Maxwell care descriu toate aceste efecte ale c ampului elctromagnetic. Prin modelare
nu se urm areste doar obt inerea solut iei numerice, ci extragerea modelului de ordin redus.

In cazul de fat a nu are relevant a variat ia sptial a a solut iei, ci doar comportarea sistemului
pe la bornele sale. Pentru a atinge acest obiectiv, sunt parcurse mai multe etape ale mo-
del arii electromagnetice [2]: modelarea zic a, matematic a, analitc a, numeric a, iar n nal
reducerea ordinului.
Figura 3.1: Geometria tipic a a unui inductor spiralat integrat
6
3.1. Modelarea zic a
3.1 Modelarea zic a
Problemele ce vor analizate constau din unul sau dou a inductoare spiralate, plasate
ntr-un circuit integrat cu substrat de siliciu (tehnologia BiCMOS). Deci, ecare problem a
va avea trei subdomenii rectangulare: Si, SiO
2
si Aer, conductoarele din Al, a andu-se
n stratul de oxid (Figura 3.1). Ele vor analizate n gama de frecvent e 1-60GHz, deci
alegerea regimului de funct ionare, trebuie s a tin a cont de frecvent a, astfel nc at modelul s a
cont in a toate efectele relevante ale c ampului electromagnetic at at la frecvent e joase, c at si
la frecvent e nalte. Pentru a descrie toate efectele c ampului electromagnetic din substratul
de siliciu, la frecvent e de 60GHz, trebuie considerat regimul FW. Tot regim FW trebuie
folosit si n modelarea starului de oxid SiO
2
, ns a, pentru modelarea conductoarelor, cel
mai potrivit model este MQS, deoarece, n Al, curent ii de deplasare au densitatea (J
D
=
E) mult mai mic a dec at cei de conduct ie J
c
= E. De exemplu, la 60 GHz, (
10
3
) ( 10
7
).

In consecint a, se neglijeaz a curent ii de deplasare, ceeea ce nseamn a
regim MQS.
Proced and astfel, vor modelate urm atoarele efecte ale c ampului de nalta si joas a
frecvent a (Figura 3.2).
Figura 3.2: Efectele c ampului electromagnetic
Pentru a extrage modelul inductorului, care s a considere toate efectele c ampului elec-
tromagnetic de frecvent a nalt a, trebuie rezolvat a o problem a de c amp electromagnetic,
bine formulat a si cuplat a cu o problem a de circuit electric exterior. Orice problem a de
c amp are ca date cunoscute: domeniul de calcul, propriet at ile de material si sursele de
c amp, care satisfac condit iile de unicitate.
Necunoscutele problemei sunt componentele c ampului electromagnetic, descris de
ecuat iile lui Maxwell n regim general variabil (FW), respectiv: E, D, B, H, J, . Pentru
proiectantul de circuite integrate, componetele c ampului electromagnetic si modul cum va-
riaz a ele n spat iu sau timp, nu are o prea mare relevant a. Ce prezint a interes, este modul n
care o componet a interactioneaz a cu exteriorul. Mai exact, care sunt relat iile constitutive
ntre curent ii si tensiunile componentei respective.
Se vor considera primele m terminale, din cele n terminale ale dispozitivului, alimen-
tate n tensiune, iar restul de (n m 1) alimentate n curent, astfel c a se pot deni
7
3. Modelarea inductoarelor spiralate integrate
semnalele de intrare, acestea reprezent and si sursele de c amp, ca ind:
v
k
(t) =
_
C
K
D

Edr, k = 1, m (3.1)
i
k
(t) =
_
S
K
Hdr, k = m+ 1, n 1 , (3.2)
si semnalele de iesire
i
k
(t) =
_
S
K
Hdr, k = 1, m (3.3)
v
k
(t) =
_
C
K
D

Edr, k = m+ 1, n 1 . (3.4)
Vectorul intr arilor si vectorul iesirilor sistemului modelat (Figura ??) vor avea componen-
tele:
u =
_

_
v
1
.
.
.
v
m
i
m+1
.
.
.
i
n1
_

_
, y =
_

_
i
1
.
.
.
i
m
v
m+1
.
.
.
v
n1
_

_
.
3.2 Modelarea matematic a
Modelul dispozitivului (inductorului), obt inut n urma procesului de modelare, trebuie
s a e compatibil cu alte componente de circuite. Acest lucru se realizeaz a prin condit ii
de frontier a care trebuie s a asigure, n mod consistent, cuplajul dintre problema intern a de
c amp si problema extern a de circuit electric. Aceste condit ii de frontier a sunt introduse
prin Elementul Electromagnetic de Circuit.
Al. Timotin a introdus conceptul de Elementul Electromagnetic de Circuit n [3], ca
o generalizare a elementului multipolar de circuit. Acest concept a fost readus n atent ia
cercet atorilor si folosit pentru a simula cuplajele electromagnetice n [4].
Denitia 1 Elementul electromagnetic de circuit (EMCE - Figura 3.3) este un domeniu
simplu conex m arginit de o suprafat a alc atuit a din n

p art i disjuncte S

1
, S

2
, . . . , S

n
numite terminale electrice, si n

p art i disjuncte S

1
, S

2
, . . . , S

n
numite terminale magnetice
pe care sunt ndeplinite urm atoarele condit ii de frontier a:
n rotE(P, t) = 0, pentru P S

k
, (3.5)
n rotH(P, t) = 0, pentru P S

k
, (3.6)
n E(P, t) = 0, pentru P S

k
, (3.7)
n H(P, t) = 0, pentru P S

k
, (3.8)
unde n este vectorul normal la suprafat a n punctul P.
8
3.3. Modelarea numeric a (FIT)
Figura 3.3: Elementul Electromagnetic de Circuit
Teorema lui Timotin completeaz a formularea corect a a problemei de c amp electro-
magnetic cu condit ii de frontier a adecvate.

In concluzie, problema de c amp asociat a unui
element electromagnetic de circuit descris de ecuat iile lui Maxwell, condit ii pe frontier a,
condit ii init iale nule, cu terminalele excitate n tensiune si curent sau ux are solut ie unic a.

In concluzie, semnalele de iesire ale terminalelor sunt univoc determinate de evolut ia n


timp a semnalelor de intrare. Fiind o problem a liniar a, operatorii de impedant a, admitant a
si hibrizi, care leag a semnalele de intrare de cele de iesire, vor operatori liniari. Dac a
elemenul funct ioneaz a n regim armonic, atunci acesti operatori se reprezint a n complex,
ca matrice de impedant e sau admitant e complexe, dependente de frecvent a.
Obiectivul nal al model arii inductoarelor nu const a n rezolvarea problemei de c amp,
formulat a anterior, ci n extragerea din solut ia ei a unui model compact de ordin redus.
Pentru a obt ine modelul compact de ordin redus, se aplica tehnici de reducerea ordinului
modelelor (Figura 3.4).

In procesul de modelare, descris anterior, primul pas de reducere
a ordinului modelelor, trece de la modelul innit continuu, la un model nit discret, dar
de dimensiune foarte mare, prin discretizarea ecuat iilor lui Maxwell folosind o metoda
numeric a. Se impune, deci, aplicarea unei noi metode de reducerea ordinului modelelor,
care are ca rezultat, modelul compact, care are un ordin foarte mic n comparat ie cu ordinul
modelului discret.
Practic, problema obt inerii modelului de ordin redus, are ca date de intrare geometria
dispozitivului de modelat, iar ca date de iesire modelul compact.
3.3 Modelarea numeric a (FIT)
Modelarea numeric a are ca scop discretizarea problemei de c amp formulat a n subca-
pitolele anterioare. Cuplajul dispozitivului cu un circuit exterior se face prin terminalele
aate pe suprafat a frontierei domeniului elementului electromagnetic de circuit, n interiror
comportamentul ind descris de ecuat iile lui Maxwell n regim general variabil. Aceast a
9
3. Modelarea inductoarelor spiralate integrate
Figura 3.4: Modelul continuu, modelul discret si modelul compact
problem a conduce la un model continuu ce are un num ar innit de grade de libertate, astfel
nc at se impune aplicarea unei metode numerice n scopul obt inerii unui model discret cu
num ar nit de grade de libertate.
Obiectivul folosirii metodei FIT este acela de a obt ine sistemul de ecuat ii de stare al
dispozitivului, pentru ca apoi acest sistem s a poat a folosit pentru extragerea modelului de
ordin redus. Pentru obt inerea ecuat iilor lui Maxwell, n form a discret a, se aplic a forma glo-
bal a a legilor generale ale c ampului electromagnetic pe elementele ret elei de discretizare,
fet e, respectiv frontiere ale acestora, iar, legile uxului pe celulele elementare:
_

_
rotE =
B
t
divB = 0
rotH = J +
D
t
divD =
=> divJ =

dt
=
_

_
_
Edr =

B
t
dA

BdA = 0
_
Hdr =

(J +
D
t
)dA

DdA =

dv
=>

JdA =


dt
dv
=
_

_
Cv =
d
dt
D

= 0
C

u = i +
d
dt
D = q
=> Di =
dq
dt
(3.9)
si relat iile consitutive, care sunt descrise cu ajutorul operatorilor Hodge:
_
_
_
B = H
D = E
J = E
=
_
_
_
= M

u = M
1
v
u
= M

v
i = M

v
(3.10)
Generarea sistemului matriceal de stare. Pentru a evita confuzia dintre operatorul
discret C si matricea capacit at ilor, acesta se va nota cu B. Elementele operatorilor Hodge
M

, M
v
, M

reprezint a conductant a electric a, reluctant a magnetic a si capacitatea elec-


tric a. Not andu-le G
e
, R
m
= G
1
m
, C
e
, relat iile constitutive se vor scrie sub forma:
= G
m
u, (3.11)
= C
e
v, (3.12)
i = G
e
v, (3.13)
n nal obt in andu-se forma compact a
C
dx
dt
+Gx = 0 . (3.14)
La acest moment, sistemul de ecuat ii algebrice diferent iale nu este complet, deoarece
num arul de ecuat ii nu este egal cu num arul de necunoscute. Ecuat iile adit ionale, care
completeaz a sistemul, provin din forma discret a a condit iilor de frontier a.
10
3.4. Reducerea ordinului modelului prin esantionarea adaptiv a a frecvent elor cu procedura Vector Fitting
Efectul conditiilor de frontier a asupra ecuatiilor de stare. Condit iile de frontier a
sunt cele care completeaz a formularea corect a a problemei de c amp.

In subcapitolul pre-
cendent, s-a ar atat faptul c a elementul electromagnetic de circuit asigur a compatibilitatea
ntre problema de c amp si cea de circuit. Tot elelementul electromagnetic de circuit este cel
care impune condit iile de frontier a, dar n acelasi timp completeaz a si sistemul de ecuat ii.
Prin urmare, ecuat iile de stare n acest caz devin
_
C
dx
dt
+Gx = y
z = Dx,
(3.15)
n care
C =
_

_
C
e
0
0 G
m
S

C
0
0 0
0 0
_

_
, G =
_

_
G
e
B

B 0
S

G
0
S

E
0
0 S
M
_

_
, D =
_
_
S
E
0
0 S
J
0 S
M

_
_
, (3.16)
y =
_

_
0
0
j

f
_

_
, z =
_
_
v

w
_
_
, x =
_
v
u
_
.

In domeniu frecvent a, sistemul de stare (3.15) devine un sistem liniar complex


_
(sC+G)x = Bu
y = Lx +Du
. (3.17)
3.4 Reducerea ordinului modelului prin esantionarea adap-
tiv a a frecventelor cu procedura Vector Fitting
Algoritmul care va folosit n tez a pentru reducerea ordinului modelului se numeste
Esantionarea Adaptiv a a Frecvent elor cu Vector Fitting (AFS-VF) [5], algoritm ce si pro-
pune s a extrag a modelul de ordin redus, pentru componente pasive ale unui circuit integrat,
cu un efort minim de calcul. Cele dou a p art i importante ale algoritmului sunt: procedura
Vector Fitting (VF) si procedura de Esantionare Adaptiv a a Frecvent elor (AFS).
Procedura Vector Fitting. Init ial, procedura VF a fost propus a n lucrarea [6], ca
o metod a de interpolare a r aspunsurilor n frecvent a prin mbun at at irea iterativ a a unei
aproximat ii rat ionale.
Pornind de la o funct ie g(s) complex a, de variabil a complex a s, se caut a aproximarea
rational a:
f(s) =
a
0
+a
1
s + +a
N
s
N
b
0
+b
1
s + +b
N
s
N
(3.18)
11
3. Modelarea inductoarelor spiralate integrate
astfel nc at f(s) s a aproximeze funct ia g(s) n sensul celor mai mici p atrate. Funct ia f(s)
poate rescris a sub forma:
f(s) =
N

n=1
c
n
s a
n
+d +sh (3.19)
unde a
n
polii, c
n
reziduurile si iar termenii d si h sunt numere reale.
Lucrarea [7] prezint a o metod a mbunat at it a de relocare a polilor pentru o convergent a
mai rapid a a procedurii. Lucrarea [8] prezint a o implementare mai ecient a a procedurii
VF, implementare ce exploatez a raritatea sistemului de ecuat ii rezultat n urma aplic arii
metodei celor mai mici p atrate, prin aplicarea direct a a decompunerii QR. A treia versiune
a procedurii VF cont ine o funct ie care fort eaz a pasivitatea modelului obt inut, pasivitate
ce asigur a stabilitatea modelelului rat ional.

In [9], [10], [11] si [12] sunt propuse astfel
de metode care s a fort eze pasivitatea modelului rat ional, dar care s a si accelereze execut ia
procedurii VF.
Figura 3.5: Algoritm AFS-VF - schema logica
Algoritmul cu AFS-VF (Figura 3.5) propus n [5] si propune s a obt in a caracteristica
n frecvent a cu efort minim de calcul. Practic, algoritmul AFS-VF const a n alegerea unui
12
3.5. Concluzii
num ar optim de esantioane pe baza c arora se va extrage o aproximare rat ional a a formei
semnalului prin Vector Fitting.
Pornind de la sistemul de stare, se obt ine relat ia dintre reprezent arile complexe ale
semnalelor de intrare/iesire, numit a matrice de transfer
Y() = H
FIT
() = L(G+jC)
1
B . (3.20)
Deci, pentru a calcula matricea de transfer, trebuie rezolvat un sistem liniar de ecuat ii
de tipul Ax = b, av and A = G + jC matricea sistemului, iar b = B termenii liberi,
pentru ecare frecvent a.
Analiz and algoritmul AFS-VF, se constat a ca pasi critici, din punct de vedere al timpu-
lui de calcul, pasii n cadrul c arora se rezolv a sistemele de ecuat ii liniare, sunt paralelizat i.
Abord ari paralele ale acestor pasi vor prezentate n capitolul urm ator. De asemenea, la
primul pas al algoritmului, se cunosc at at frecvent ele de esantionare S, c at si frecvent ele
de test S

.
3.5 Concluzii

In cadrul acestui capitol, a fost prezentat ntreg procesul dezvoltat de echipa de cer-
cetare LMN din UPB pentru modelarea componentelor pasive ale circuitelor integrate de
nalta frecvent a. Prima etap a a procesului de modelare furnizeaz a sistemul matriceal de
stare. Acest sistem matriceal este considerat dat a de intrare pentru a doua etap a a procesu-
lui de modelare, etap a ce const a n extragerea modelului de ordin redus cu ajutorul algor-
timului AFS-VF. Rezultatul nal al ntregului proces de modelare este un model rat ional
pe baza c aruia este sintetizat un model echivalent SPICE cu parametri concentrat i ce poate
conectat ntr-un circuit exterior si simulate mpreun a folosind un program de simulare a
circuitelor.
Acest proces de modelare a fost studiat, de autor, n vederea paraleliz arii. Procedura de
extragere a modelului de ordin redus, pentru componente pasive de circuit integrat, a fost
identicat a ca ind partea cea mai costisitoare din punct de vedere al timpului de execut ie.
Tocmai de aceea n capitolul urm ator vor prezentate noi abord ari ale acestui algoritm,
abord ari care au rolul de a reduce timpul de obt inere al modelului de ordin redus.
13
CAPITOLUL 4
Folosirea sistemelor multiprocesor n modelarea
inductoarelor spiralate
Prima parte a acestui capitol cont ine o scurt a prezentare a arhitecturii sistemelor mul-
tiprocesor si a tehnicilor de programare paralel a, corespunz atoare lor.

In a doua parte se
prezint a metode de rezolvare, directe si iterative, a sistemelor liniare mari generate pe par-
cursul procesului de modelare electromagnetic a, folosind calculul paralel. Ultima parte
prezint a abord arile paralele, propuse de autor, pentru algoritmul de extragerea modelului
de ordin redus (AFS-VF).
4.1 Arhitectura hardware si software a sistemelor multi-
procesor

In 1972, Michael Flynn a introdus o clasicare general a a sistemelor de calcul din punct
de vedere al uxurilor de instruct iuni si de date, numit a Taxonomia lui Flynn. Aceast a
clasicare identic a patru clase de sisteme de calcul:
(a) Memorie comun a (b) Memorie distribuit a
Figura 4.1: Calculatoare MIMD

In prezent, sistemul MIMD este cel mai des ntalnit pentru calculul paralel.

In funct ie
de arhitectura memoriei se pot distinge dou a tipuri de sisteme MIMD (Figura 4.1):memorie
comun a (shared memory - Figura 4.1a) si memorie distribuit a (distributed memory - Figura
4.1b). Combinat ia celor dou a concepte, ment ionate anterior, se numeste memorie comun a
distribuit a (distributed shared memory).
14
4.2. Rezolvarea direct a si iterativ a, n paralel, a sistemelor linare mari
Datorit a evolut iei arhitecturii sistemelor de calcul paralelismul s-a dezvoltat si n partea
de programe. Marea majoritatea a programelor pot mbun at at ite cu ajutorul unei forme
de paralelism, diviz andu-l, p an a la un anumit nivel, n p art i independente ce pot rulate
simultan.

In urma procesului de divizare, numit descompunere, se identic a dou a tipuri
de paralelism: descompunerea domeniului, n literatura de specialitate ind cunoscut ca
paralelismul datelor (data parallelism) si descompunerea funct ional a, n literatura de spe-
cialitate ind cunoscut ca paralelismul sarcinilor (task parallelism). Folosirea combinat a, a
celor dou a tipuri de paralelism, poate duce la o mai buna exploatare a resurselor hardware,
rezult and programe cu mai multe nivele de paralelism numite si nivele de granularitate.
Sistemul de calcul multiprocesor ATLAS
Laboratorul de Modelare Numeric a (LMN din cadrul UPB) dispune de un astfel de sis-
tem de calcul multiprocesor, clusterul ATLAS. Din punct de vedere al resurselor hardware,
clusterul ATLAS este alc atuit din 14 noduri, dintre care 6 cu c ate dou a procesoare INTEL
si 8 cu c ate dou a procesoare AMD, conectate printr-o ret ea de mare transfer InniBand.

In totalitate, clusterul ATLAS dispune de:


112 core-uri CPU, 2.3GHz(AMD) si 2.66GHz(INTEL) frecvent a de lucru, 272GB
memorie RAM;
240 core-uri GPU, 1.296 GHz frecvent a de lucru a ec arui core si 4GB memorie
RAM.
10TB memorie HDD.
4.2 Rezolvarea direct a si iterativ a, n paralel, a sistemelor
linare mari

In capitolul precedent, partea de rezolvare a sistemelor de ecuat ii, a fost identicat a


ca parte critic a a algoritmul de modelare magnetic a.

In acest subcapitol, se va prezenta
un studiu referitor la metodele de rezolvare pentru sistemele de ecuat ii liniare cu matrice
rare de mari dimensiuni, generate prin discretizarea ecuat iilor c ampului elctromagnetic.
Deoarece n partea critic a trebuie rezolvate mai multe sisteme A
i
x = b
i
, provenite din
sistemul de stare pentru o list a de frecvent e S =

n
i=1
f
i
, se vor studia n prim a faz a
posibilit at ile de a rezolva mai multe sisteme n paralel.
Pentru testele efectuate n cadul acestui subcapitol, s-a considerat o problem a de test
cu dou a inductoare simple plasate ntr-un domeniu alc atuit din 3 straturi (Aer, SiO
2
, Si -
Figura 4.2a). Problem a considerat a se va numi U
coupled
, si are dou a conductoare n form a
U (Figura 4.2b) plasate n stratul de SiO
2
.
Exist a dou a moduri de rezolvarea a unui sistem liniar Ax = b: cu metode directe sau
cu metode iterative. Alegerea uneia sau a alteia difer a de tipul matricei sistemului A care
poate : real a sau complex a, simetric a sau nesimetric a, p atrat a sau dreptunghiular a, rar a
sau dens a, pozitiv denit a sau nu, structurat a sau nu.
15
4. Folosirea sistemelor multiprocesor n modelarea inductoarelor spiralate
(a) Domeniu problem a (b) Bobine n form a U
Figura 4.2: Problem a de test U
coupled
Rezolvarea direct a
Majoritatea metodelor directe de rezolvare ale unui sistem liniar, execut a factorizarea
LU a matricei A si ncearc a reducerea costurilor, memorie si timp de calcul, minimiz and
umplerea cu elemente nenule a factorilor triunghiulari L si U, n procesul de eliminare.
Pentru simul ari, a fost folosit a o metod a direct a, ce respect a tiparul de mai sus, si anume
solverul UMFPack [13] dezvoltat de Tim Davis. Implementarea din MATLAB a acestui
solver poate considerat a o implementare paralel a, deoarece, prin intermediul bibliotecii
LAPACK, solverul are acces la operat ii BLAS paralele, ce se folosesc de faptul c a proceso-
rul sistemului de calcul are dou a sau mai multe core-uri. Se va executa, ca test, rezolvarea
unor sisteme liniare de mai multe dimensiuni, generate cu FIT, folosind de la 1 la 8 core-uri.
Nr. DoFs Tip nod
Nr. core-uri
1 2 3 4 5 6 7 8
6317
INTEL 0.4 0.33 0.33 0.28 0.27 0.27 0.27 0.28
AMD 0.87 0.7 0.62 0.61 0.58 0.6 0.62 0.53
17069
INTEL 3.3 2.25 2.24 1.61 1.61 1.47 1.45 1.32
AMD 6.21 4.21 3.67 3.28 3.11 2.95 3.25 2.85
42269
INTEL 26.61 16.57 16.54 10.22 10.23 8.37 8.6 7.56
AMD 49.19 30.3 23.92 20.02 18.87 17.18 18.58 15.6
56927
INTEL 53.61 30.29 30.95 18.83 19.24 15.39 15.44 14.37
AMD 93.38 55.02 43.3 35.65 32.19 30.24 30.62 26.73
Tabelul 4.1: Timpii de rezolvare pentru num ar diferit de core-uri

In Tabelul 4.1 se g asesc timpii corespunz atori rezolv arii unui singur sistem, pentru
num ar diferit de core-uri. Se poate conclude, c a num arul optim de threads-uri pentru rezol-
varea unui sistem este 8, si c a timpul de rezolvare pentru un core este de aproximativ 4 ori
16
4.2. Rezolvarea direct a si iterativ a, n paralel, a sistemelor linare mari
mai mic dec at timpul de rezolvare pentru 8 core-uri, T
8 core
= 4 T
1 core
Urm atorul test, care va consta tot n rezolvarea unui sistem liniar, ns a, de aceast a dat a
se va urm ari performant ele solverului, din punct de vedere al timpului de execut ie si al
consumului de memorie.
Test 1 2 3 4 5
Grid 15x15x15 25x25x25 37x37x37 38x38x38 39x39x39
Nr. DoFs 6317 84719 283907 308111 333653
INTEL
Timp [s] 0.26 31.68 430.80 494.31 3108
Mem. [MB] 24 3414 22280 22365 swap
AMD
Timp [s] 0.48 63.16 - - -
Mem. [MB] 23 3442 mem. err. mem. err. mem. err.
Tabelul 4.2: Timpii de rezolvare pentru diferite ret ele de discretizare
(a)

Inainte de factorizare (b) Umplerea dup a factorizare
Figura 4.3: Matricea FIT nainte si dup a factorizarea LU.
Privind rezultatele numerice (Tabelul 4.2) pentru problema U
coupled
, se poate observa,
c a pe congurat ia cu procesor AMD, nu au putut rezolvate sistemele mari, cu mai mult de
283907 grade de libertate, din cauza necesarului mare de memorie, care a dep asit memoria
zic a instalat a (congurat ia AMD dispune de 16GB memorie RAM). Din cauza structurii
matricei si a umplerilor cu elemente nenule a factorilor L si U (Figura 4.3), de pe parcurs,
solverul UMFPack necesit a o cantiate mare de memorie pentru rezolvare.
Rezolvarea iterativ a paralel a
Principalul motiv pentru care s-a decis investigarea metodelor iterative, a fost acela c a
ele au nevoie, n principiu datorit a absent ei umplerilor, de o cantitate mai mic a de memo-
rie dec at metodele directe, pentru rezolvarea unui sistem de ecuat ii liniare, lucru care ar
permite rezolvarea unor sisteme cu mai multe grade de libertate si, implicit, folosirea unor
griduri de discretizare mai dense.
17
4. Folosirea sistemelor multiprocesor n modelarea inductoarelor spiralate
Analiz and algoritmii celor dou a metode, GMRES si BiCGSTAB, se observ a faptul c a
la ecare iterat ie, se folosesc operat ii de algebr a liniar a: operat ii vector-vector (BLAS 1) si
operat ii matrice-vector (BLAS 2), operat ii ce se g asesc, ca instrumente de programare, n
biblioteca Basic Linear Algebra Subprograms (BLAS).
Pentru testele realizate n aceast a lucrare, s-au folosit implement arile GMRES si Bi-
CGSTAB din MATLAB, respectiv din biblioteca CUSP. Pentru a putea accesa metodele
iterative din biblioteca CUSP, paralelizate cu tehnologia da calcul paralel GPU, au fost
scrise programe, ce asigur a rezolv area unui sistem, dar si etapele premerg atoare rezolv arii:
transferul si compatibilitatea datelor, ntre MATLAB si formatul acceptat pentru procesarea
GPU.
Mai exact, contribut ia autorului este realizarea sierelor ce cont in funct ii mex si funct ii
MATLAB, ce fac posibil a apelarea metodelor iterative din biblioteca CUSP. Aceste siere
au fost organizate ntr-o suit a de programe. Cu ajutorul acestor programe, se pot rezolva
at at sisteme liniare reale rare, c at si sisteme liniare complexe rare.
Rezultatele obt inute cu metodele iterative paralele GMRES si BiCGSTAB, n cazul sis-
temului generat cu metoda FIT pentru problema U
coupled
, sunt inexacte, principala cauz a -
ind condit ion area slab a a sistemului. De aceea, n subcapitolul urm ator se vor testa metode
iterative cu precondit ionare. Totusi, pentru a ilustra utilitatea metodelor iterative paralele,
ele au fost aplicate rezolv arii unor sisteme de ecuat ii liniare generate de programul profe-
sional COMSOL, care foloseste metoda elementelor nite, deci, n funct ie de complexitatea
modelului, poate genera matrice rare, simetrice, pozitiv denite, diagonal dominante.
Figura 4.4: Problema Ushape
Pentru problem a de test (Problema Ushape - Figura 4.4), a fost considerat un domeniu,
similar cu cel denit pentru celelalte probleme, respectiv trei straturi Aer, SiO
2
, Si, si o
bobin a n form a U, aat a n stratul de SiO
2
. Matricele rezultate din acest model sunt
rare, p atrate si diagonal dominante. Pentru a putea aduce sistemul matriceal n mediul
MATLAB, a fost folosit toolbox-ul COMSOL Live Link for MATLAB. Contribut ia auto-
rului, const a n scrierea unei funct ii, care s a exporte sistemul de stare din mediul COMSOL
n mediul MATLAB.
A fost aleas a forma sistemului de stare, n care matricele sunt rare:
_
M
C
dx(t)
dt
= M
A
x(t) +M
B
u(t)
y(t) = Cx +Du(t)
, (4.1)
18
4.2. Rezolvarea direct a si iterativ a, n paralel, a sistemelor linare mari
unde matricele M
C
si M
A
sunt mai rare dec at n alte forme ale sistemului de stare oferite
de Comsol. Astfel, folosind sistemul de stare rezultat, ca dat a de intrare pentru algoritmul
AFS-VF, se poate obt ine modelul SPICE (modelul de ordin redus) pentru problema mo-
delat a.

In prima variant a, modelul cont ine efectele c ampului electromagnetic modelate cu
metoda FIT, n schimb, acest model va cont ine efectele modelate cu metoda FEM.
Au fost executate teste, pe dou a tipuri de platform a de calcul:
CPU - folosind nodul Psi, av and congurat ia 2 x Intel Xeon i7 CPUs, 2.66 GHz cu 8
MB memorie cache, un total de 8 cores per nod, si 24 GB memorie RAM;
GPU - folosind NVIDIA Tesla C1060, 240 cores, 1.296 GHz per core, 4GB memorie
RAM.
Testul a constat n rezolvarea unui sistem complex A x = b, folosind solverul GMRES
cu restart, pentru care a fost calculat norma reziduului rezultatului nal, R =
norm(bAx)
norm(b)
,
si accelerarea, S =
T
CPU
T
GPU
. Pentru GPU, testul a fost rezolvat pentru dou a valori de restart
50 (GPU
1
), respectiv 5000 (GPU
2
), iar pentru CPU valoarea de restart a fost setat a la 50.
Problem a FEM1 FEM2 FEM3
No. of DoFs 7196 11568 19486
GMRES
Results Timp [s] R Timp [s] R Timp [s] R
CPU 5086 7.6e-2 11860 7.4e-2 26766 2.8e-2
GPU
1
62 9.1e-2 161 4.0e-2 452 3.8e-2
GPU
2
3165 7.3e-6 476 2.98e-5 15875 3.73e-6
Speedup
1
82 73 59
Speedup
2
1.6 24 1.7
Tabelul 4.3: Rezultatele testelor pentru diferite griduri de discretizare
Rezultatele obt inute pentru CPU si GPU
1
arat a o accelerare foarte bun a, n condit iile
n care acuratet ea este aproximativ aceeasi.

In mod normal, n aceleasi condit ii de rulare,
rezultatele ar trebuit s a e identice, nsu a, din cauza implement arii algoritmului GMRES,
pot ap area mici diferent e. Testul GPU
2
arat a c a se pot obt ine rezultate cu o acuratet e mai
bun a, ns a, dup a cum se poate vedea si n Tabelul 4.3, costurile, din punct de vedere al
timpului de execut ie, sunt destul de ridicate.

In concluzie, s-a demonstrat c a solverele GPUsunt mai performante din punct de vedere
al timpului de execut ie dec at solverele seriale CPU. Pe parcursul cercet arilor s-a observat c a
perfomant ele si acuratet ea solverelor GPU depind puternic de: tolerant a impus a, num arul
maxim de iterat ii si valorea de restart a metodei iterative. De asemenea, s-a observat c a sol-
verele GPU nu reusesc s a obt in a rezultate exacte pentru sistemele generate cu metoda FIT,
una din principalele cauze ind condit ionarea slab a a matricei sistemului. Urm atorul pas
n investigarea metodelor iterative reprezint a investigarea metodelor de precondit ionare.
Rezolvarea iterativ a cu preconditionare
Spre deosebire de metodele directe, metodele iterative nu aduc modic ari matricei A,
ci ele caut a succesiv cea mai bun a aproximare a solut iei x. Vectorul reziduurilor
r
k
= b A x
k
, (4.2)
19
4. Folosirea sistemelor multiprocesor n modelarea inductoarelor spiralate
indic a c at de aproape este solut ia de la iterat ia k, de solut ia real a x. Metodele de precondit ionare
folosesc o matrice M ce aproximeaz a inversa matricei A, cu ajutorul c areia se obt ine un
sistem a c arui rezolvare necesit a mai put ine iterat ii:
M A x = M b. (4.3)
Matricea noului sistem A
1
= M A, are propriet at i mai bune dec at matricea A, n cazul
matricelor FIT, un num ar de condit ionare mai mic.
Dup a mai multe teste, ca metod a de precondit ionare, a fost folosit a factorizarea incom-
plet a ilu, iar pentru rezolvare metoda reziduului minimal generalizat (Generalized Mini-
mum Residual - GMRES):
GMRES cu precondit ionare ilu, apelate din MATLAB (ilu
MAT
);
GMRES cu precondit ionare ilu, apelate din toolbox-ul pentru MATLAB, ILUPACK
(ilu
PACK
).
Pentru testele executate n cadrul acestei etape, au fost utilizate matricele FIT pentru
problema U
coupled
.

In Tabelul 4.4, se g asesc rezultatele, pentru rezolvarea unui sistem liniar,


obt inute pentru cele dou a metode iterative cu precondit ionare: ilu
PACK
si ilu
MAT
.
Grid 10x10x10 15x15x15 20x20x20 25x25x25 30x30x30
DoFs 4631 17069 42269 84719 148895
ilu
PACK
mem. [GB] 0.32 1.3 8 14 mem err
Timp [s] 2.82 37.15 427.25 7638 -
R 3.8e-12 2.1e-11 6.4e-12 4.2e-12 -
ilu
MAT
mem. [GB] 0.4 2 mem err - -
Timp [s] 2.1 44.5 - - -
R 7.68e-13 3.15e-12 - - -
Tabelul 4.4: Rezulte numerice obt inute cu metode iterative cu precondit ionare
Consumul mare de memorie n cazul metodelor iterative cu precondit ionare, se dato-
reaz a condit iilor impuse metodei de precondit ionare, anume factorizarea incomplet a.

In Figura 4.5 sunt centralizate performant ele metodelor de rezolvare prezentate n acest
subcapitol. Concluzia acestui subcapitol este c a metoda direct a (solverul UMFPack), obt ine
cele mai bune rezultate, pentru matricele generate folosind metoda FIT. G asirea unei tehnici
competitive de precondit ionare, pentru aceste matrice, necesit a studii suplimentare, aceast a
problem a r am an nd deschis a. Drept urmare, acest solver va folosit pentru simul arile din
subcapitolele ce urmeaz a.
Rezolvarea, n paralel, a mai multor sisteme liniare
Rezolvarea, n paralel, a mai multor sisteme liniare reprezint a etapa premerg atoare
paraleliz arii algoritmului AFS-VF. Pentru aceast a sect iune, se consider a ca test rezolvarea
sistemului pentru problema U
coupled
pentru o list a de frecvent e. Din problema U
coupled
discretizat a cu un grid 22 22 22, rezult a un sistem cu 56927 grade de libertate. Acest
20
4.2. Rezolvarea direct a si iterativ a, n paralel, a sistemelor linare mari
(a) Memorie (b) Timp
Figura 4.5: Performant e metode de rezolvare directe vs iterative
sistem trebuie rezolvat pentru un num ar de frecvent e n
frec
, din banda 1 60GHz. Pentru
rezolvarea unui sistem, a fost nevoie de 1.7GB memorie, ns a, deoarece congurat ia cu
procesoare INTEL s-a dovedit a mai rapid a, testul urm ator, va executat folosind numai
nodurile cu acest tip de procesor.
Speedup-ul (accelererea) este calculat dup a formula:
S =
T
s
T
p
=
n
freq
T
1
T
p
, (4.4)
unde T
s
reprezint a timpul serial, T
1
timpul de rezolvare al unui sistem pentru o frecvent a,
n
frec
num arul de frecvent e, iar T
p
timpul paralel.
Pentru un singur sistem cu 56927 grade de libertate, timpul de rezolvare obt inut este
T
1
= 13.41. Timpii paraleli (Tabelul 4.5) au fost obt inut i rul and cele dou a versiuni pe 4 no-
duri din cluster-ul Atlas, rezult and 32 workersi pentru versiunea cu un nivel de granularitate
si 4 workersi pentru versiunea cu dou a nivele de granularitate.
n
frec
10 20 30 40 59
Timp [s]
T
s
134.1 268.2 402.3 536.4 791.19
T
p 1LvlGr
67.57 67.87 69.33 122.13 123.02
T
p 2LvlGr
40.57 68.30 105.73 132.18 196.20
Speedup
S
1LvlGr
1.98 3.95 5.80 4.39 6.43
S
2LvlGr
3.31 3.93 3.80 4.06 4.03
Tabelul 4.5: Rezultatele numerice pentru cele dou a versiuni
Din punct de vedere al speedup-ului (Tabelul 4.5), se poate spune c a abordarea cu un
singur nivel de granularitate (1LvlGr) obt ine performant e mai bune fat a de abordarea cu
dou a nivele de granularitate (2LvlGr), doar atunci c and avem un num ar mic de sisteme de
rezolvat (sub 10).
Pentru a avea o imagine mai clar a asupra perfomant elor celor dou a versiuni, vom face
o analiz a a ecient iei acestora.
21
4. Folosirea sistemelor multiprocesor n modelarea inductoarelor spiralate

In acest caz timpul paralel pentru 2LvlGr este mai mic dec at timpul paralel pentru
1LvlGr (se veric a, vezi Tabelul 4.5).
Un alt lucru foarte important, pentru decizia utiliz arii uneia dintre versiunile propuse,
este acela c a pentru versiunea 1LvlGr (1 worker = 1 core), 1 worker va avea la dispozit ie
doar
1
8
din memoria total a a nodului respectiv, adic a, n cazul nodurilor INTEL,
24
8
= 3GB
memorie RAM. Aceast a limitare reprezint a un important dezavantaj, deoarece folosind
aceast a versiune, se vor putea rezolva doar sisteme care necesit a o cantitate de maxim 3 GB
memorie (aproximativ 85000 grade de libertate), ceea ce nseamn a c a gridul de discretizare
nu poate foarte dens, rezult and simul ari cu erori mai mari.
4.3 Paralelizarea Esation arii Adaptive a Frecventelor cu
Vector Fitting(AFS-VF paralel)
Asa cum a fost prezentat n Capitolul 3, pasul critic al algoritmului AFS-VF, implic a
rezolvarea unui sistem liniar de ecuat ii, de tip A x = b, pentru o serie de frecvent e. Acest
lucru se nt ampl a, din cauza sistemelor de rezolvat, care au o dimensiune foarte mare (pot
dep asi 10
6
grade de libertate), ceea ce implic a timpi de rezolvare foarte mari.
Folosind tehnici de calcul paralel si distribuit, autorul propune dou a versiuni paralele
ale algoritmului AFS-VF, obiectivul folosirii lor, ind acela de a reduce la minimum tim-
pul de modelare. Diferent a dintre cele dou a versiuni const au n abordarea hardware-ului si
software-ului sistemului de calcul, din punct de vedere al granularit at ii. Nivelul de granu-
laritate are o mare inuent a asupra performant elor algoritmului paralel, deoarece un nivel
de granularitate prea mare ar ncetini execut ia programului (din cauza timpilor de comuni-
care), iar un nivel de granularitate prea mic, nu ar exploata la maxim resursele de calcul.
(a) Un nivel de granularitate (b) Dou a nivele de granularitate
Figura 4.6: Abord ari paralele ale AFS-VF

In Tabelul 4.6 este prezentat a convergent a algoritmului AFS-VF3 pentru problema Uco-
upled, cu grid 20 20 20, 56927 grade de libertate, si parametri diferit i (
AFS
,
V F
,
22
4.4. Concluzii

AFS

V F
Nr. pct. Convergent a
1e-3 1e-5 4
iterat ie 1 2
S

3 6
S +S

7 13
1e-3 1e-5 8
iterat ie 1
S

7
S +S

15
Tabelul 4.6: Convergent a algoritmului AFS-VF3 pentru problema Ucoupled
num arul punctelor de start). Se poate observa, c a num arul de sisteme S

, care trebuie re-


zolvat pentru ecare iterat ie, este mai mic de 10 pentru primul caz, cu 4 puncte de start, si
mai mare 10 pentru al doilea caz, cu 8 puncte de start.
U coupled
Grid 20 20 20
DoFs 42269
Nr. in/out 2
Nr. pct. Timp [s]
4
T
s
141.8
T
p 1LvlGr
90.39
T
p 2LvlGr
60.27
8
T
s
157.64
T
p 1LvlGr
47.76
T
p 2LvlGr
59.27
Tabelul 4.7: Timpii de execut ie ai algortimului AFS-VF pentru problema Ucoupled

In Tabelul 4.7 sunt prezentat i timpii de execut ie, n cazul mai sus ment ionat, ai algorit-
mului AFS-VF pentru problema Ucoupled. Se poate observa, c a aproxim arile f acute, sunt
adev arate, implementarea cu dou a nivele de granularitate obt in and timpi mai mici n cazul
cu 4 pucte de start (unde avem sub 10 puncte per iterat ie) si timpi mai mari n cazul cu 8
puncte de start (unde avem peste 10 puncte per iterat ie).
4.4 Concluzii

In introducerea acestui articol au introduse c ateva not iuni legate de sistemele multi-
procesor actuale, dar si tehnici de programare paralel a a acestor sisteme. Studiu referitor
la metodele de rezolvare a oferit informat ii pret ioase legate de tipul solverului ce trebuie
ales pentru o rezolvare cu acuratet e ridicat a a sistemelor cu matrice rare generate cu ajutorul
Chamy.

In nalul acestui capitol au fost propuse do a implement ari paralele ale algoritmului
AFS-VF, cu un nivle de granularitate, respectiv cu dou a nivele de granularitate, prezent and
at at avantajele c at si dezavantajele folosirii lor. De asemenea, a fost prezentat si o me-
tod a de calcul a ecient ei acestor implement ari. Despre ecient a folosirii implement arilor
paralele, se va vorbi si n capitolul urm ator pentru ecare strutur a de test modelat a.
23
CAPITOLUL 5
Studii de caz - rezultate numerice si validarea lor
experimental a
Pentru validarea perfomant elor implement arilor paralele ale AFS-VF au fost analizate
trei structuri de test: CDST-SP-MIDDLE, CHRF217 si CHRF201. Acestea au fost con-
cepute si realizate n tehnologia CMOS, de parteneri industriali ai CHAMELEON RF si
CODESTAR, si caracterizate experimental de acestia.
Prima etap a a procesului de modelare electromagnetic a const a n modelarea geome-
tric a. Geometria dispozitivelor se extrage din sierele .gds, care descriu prin coordonate
din planul orizontal xOy m astile prin care se realizeaz a acele dispozitive. Coordonatele pe
axa y se obt in din sierul de tehnologie, sier ce cont ine dimensiunea si dispunerea stratu-
rilor n dispozitiv. Aceste date sunt asamblate n sierul de geometrie folosit n Chamy.
Urm atoarea etap a const a n modelarea zic a, prezentat a n Capitolul 3, n care au fost
identicate principalele fenomene zice care apar n funct ionarea dispozitivului si sursele
c ampului electromagnetic, n regimul cel mai potrivit pentru analiza dispozitivului. Tot
n acelasi capitol a fost prezentat a si modelarea matematic a, n care au fost prezentate
ecuat iile ce descriu fenomenele zice, condit iile de frontier a, si a fost formulat a corect
problema ce va rezolvat a, identic andu-se datele si rezultatele ei.
Modelarea aproximativ a este cea de-a treia etap a procesului de modelare electromag-
netic a si ea const a n rezolvarea analitic a a problemei, pentru a extrage modelul cu para-
metri concentrat i al dispozitivului analizat. Modelarea numeric a presupune rezolvarea
problemei de c amp electromagnetic folosind modelul discretizat. Validarea se face prin
compararea celor dou a solut ii (analitic a si numeric a), dar vericarea cea mai puternic a se
realizeaz a prin comparat ia cu rezultatele experimentale.
Modelarea numeric a va f acut a cu ajutorul programului Chamy, bazat pe tehnica in-
tegr arilor nite (FIT), prezentat a anterior. Chamy genereaz a n mod automat o ret ea de
discretizare minimal a, ns a pentru a obt ine rezultate c at mai exacte, va folosit a o ret ea de
discretizare adaptat a. Datele de iesiere ale acestui program, n care a fost ncorporat a pro-
cedura paralel a AFS-VF, constau n: modelul de ordin redus sub forma unui circuit SPICE
si caracteristica n frecvent a a dispozitivului modelat. Scopul acestui capitol este de a va-
lida si evalua cantitativ versiunea Chamy+AFS-VF paralel prin comparat ie cu versiunea
secvent ial a a programului Chamy-VF.
24
5.1. Inductorul spiralat p atrat - CDST-SP-MIDDLE
5.1 Inductorul spiralat p atrat - CDST-SP-MIDDLE
Problema CDST-SP-MIDDLE se refer a la un inductor spiralat p atrat ce are amble ter-
minale excitate n tensiune, iar substratul de Si conectat la GND. Geometria 2D, n coordo-
nate xOz, a dispozitivului provine din sierul .gds (Figura 5.1a - vedere din Layouteditor).
Coordonata pe axa Oy provine din sierul de tehnologie, obtin andu-se astfel geometria 3D
(Figura 5.1b - vedere din COMSOL) a dispozitivului de modelat.
(a) Layout (b) Vedere 3D
Figura 5.1: Problema CDST-SP-MIDLLE
Caracteristicile materialelor folosite pentru clasa de probleme CODESTAR sunt pre-
zentate n Tabelul 5.1.
Material Tip
r

r
[S/m]
alum1 Al-conductor 1 1 6.60 10
7
alum2 Al-conductor 1 1 1.25 10
7
tun1 W-conductor 1 1 3.33 10
6
SUB1 (Si) semi-conductor 1 11.7 5
SUB5 (Si) semi-conductor 1 11.7 3.33 10
3
Oxide1 izolator 1 3.9 0
Oxide2 izolator 1 4.1 0
Nitride izolator 1 7.5 0
Tabelul 5.1: Materialele problemelor CODESTAR
Dimensiunile inductorului spiralat sunt: s = 3m, w = 20m, d
out
= 200m,
d
in
= 114m, p
1
= 69.80m si p
2
= 112.8m. Inductorul se a a n stratul met4 iar
conductoarele de aduct ie n stratul met3.
25
5. Studii de caz - rezultate numerice si validarea lor experimental a
Modelarea aproximativ a
Pentru obt inerea solut iei analitice se va folosi modelul Pi cu parametri concentrat i (Fi-
gura 5.2).
Parametri concentrat i ai modelului sunt denit i astfel: R
s
=
l
wt
= 1.42, L
s
=
1.053nH [14], C
s
= (N1) w
2


Ox
t
Ox M3 M4
= 13.81fF, C
s
= (N1)

Ox
(d
out
+2d
out
)t
4s
=
5.35fF, C
Ox
=
1
2
l w

Ox
t
Ox
= 91.13fF C
Ox
=
1
2
d
2
out


Ox
t
Ox
= 139.60fF, C
Si
=
1
2
d
2
out
C
Sub
= 690.40fF, R
Si
=
2
d
2
out
G
Sub
= 45.05m. Dac a se neglijeaz a efectul struc-
turilor V din stratul nwell (Figura 5.1a), atunci C
sub
=

t
Si
= 178.820nF/m
2
, Gsub =

t
Si
= 6.8 10
3
S/m
2
. Cu aceste valori C
Si
= 3.58fF si R
Si
= 7.353k. Probabil c a n
realitate valorile acestor doi parametri sunt cuprinse ntre aceste limite.
Figura 5.2: Circuitul echivalent pentru inductorul integrat (LTSpice)
Pasul urm ator reprezint a simularea circuitului din Figura (5.2) n SPICE . Ecuat iile ce
caracterizeaz a circuitul liniar sunt:
I
1
= Y
11
V
1
+Y
12
V
2
I
2
= Y
21
V
1
+Y
22
V
2
.
(5.1)
Pentru obt inerea caracteristicii n frecvent a din SPICE, circuitul trebuie simulat de dou a ori
astfel:
1. cu V
2
= 0 se obt ine I
1
= Y
11
V
1
si I
2
= Y
21
V
1
, adic a Y
11
si Y
21
;
2. cu V
1
= 0 se obt ine I
1
= Y
12
V
1
si I
2
= Y
22
V
1
, adic a Y
12
si Y
22
.
A fost f acut un studiu, rezultatul nal ind un model cu parametri concentrat i pentru
care obt ine eroarea relativa globala n norm a euclidian a fat a de m asur atori de 2%(simularea
8).
26
5.1. Inductorul spiralat p atrat - CDST-SP-MIDDLE
(a) Y
11
Real (b) Y
11
Imaginar
Figura 5.3: Simularea 1 si 7 - Y
11
Concluzia general a a acestui studiu este c a valorile parametrilor R
s
, R
Si
si C
Si
sunt
esent iale pentru modelarea corect a a inductorului. Rezistent a R
s
este dependent a de frecvent a
si puternic afectat a de efectele c ampului electromagnetic la frecvent e nalte, deci valoarea
ei inuent eaz a caracteristica n toata gama de frecvent e. Din simul arile efectuate s-a putut
observa c a rezistet a R
Si
si capacitatea C
Si
substratului inuent eaz a comportamentul dispo-
zitivului la frecvent e nalte.

In consecint a, modelul cu parametri concentrat i independent i
de frecvent a nu poate da rezultate foarte precise pe o gam a larg a de frecvent e.
Modelarea numeric a
Modelarea numeric a este urm atoarea etap a n procesul de modelare electromagnetic a
a inductorului CDST-SP-MIDDLE, care va f acut a cu ajutorul programului Chamy, bazat
pe metoda FIT. Aceast a etap a presupune obt inerea modelului discretizat pentru c ampul
electrodinamic din domeniului de calcul de tip EMCE, domeniu care cont ine inductorul si
are dimensiunile de 400 microni dupa axele Ox, Oz, si 10+2725 microni dupa axa Oy.
(a) Adaptat a n planul xOy (b) Adapta a n planul xOz
Figura 5.4: Ret ea de discretizare
27
5. Studii de caz - rezultate numerice si validarea lor experimental a

In funct ie de elementele cont inute de dispozitivul modelat, respectiv conductoare si


straturi, programul genereaz a n mod automat o ret ea de discretizare minimal a, care trebuie
ndesit a, n limita resurselor hardware, pentru a obt ine rezultate c at mai exacte. Se impune,
deci, dezvoltarea unei strategii de alegere a ret elei de discretizare (ret ea adaptat a - Figura
5.4).

In Figura 5.5 sunt prezentate comparativ caracteristicile de frecvent a rezultate n urma


m asur atorilor si cele rezultate n urma simul arilor modelului cu parametri distribuit i (Chamy
nr. 8) si concentrat i (SPICE nr. 8). Eroarea medie p atratic a relativ a, calculat a folosind
norma Frobenius
rmsY
i simulat
Y
i masurat

maxY
i..n masurat

, este de circa 2% pentru ambele simul ari, SPICE


si Chamy, ns a se poate observa c a modelul cu parametri distribuit i are o comportare mai
apropiat a de m asur atori dec at modelul cu parametri concentrat i, mai ales n pozit ia mini-
mului/maximului p art ilor imaginare Y
11
si Y
12
.
(a) Partea real a Y
11
(b) Partea imaginar a Y
11
(c) Partea real a Y
12
(d) Partea imaginar a Y
12
Figura 5.5: Caracteristicile de frecvent a Y
11
si Y
12
: m asurate, simulate ale modelului cu
parametri concentrat i si distribuit i
28
5.1. Inductorul spiralat p atrat - CDST-SP-MIDDLE
Studiul prezentat n acest capitol valideaz a procedura de modelare cu parametri distribuit i
propus a de autor n aceast a tez a de doctorat. Rezulatele simul arii modelului extras se abat
doar cu 2% fat a de rezulatatele experimentale, ceea ce este pe deplin satisf ac ator, conform
cerint elor industriale si preciziei solicitate de proiectant ii de circuite integrate. Progresele
se datoreaz a at at evolut iei performant elor componentelor hardware ale sistemeleor de cal-
cul (vitez a si memorie), dar si dezvolt arii unor noi metode de modelare si a algoritmilor,
precum si programelor (paralele si distribuite) asociate.
Chiar dac a modelul cu parametri concentrat i propus de autor are un ordin de m arime
al erorii tot de 2%, totusi procedura de extract ie a sa este mai put in robust a. Dup a cum s-a
v azut, si fundamentarea sa teoretic a nu este la fel de solid a ca a modelului cu parametri
distribuit i.
Performantele procedurii de extractie a modelului
Pe l ang a acuratet e, un alt aspect important al model arii numerice l reprezint a timpul
de calcul consumat pentru extract ia modelului si necesarul de memorie.

In cazul de test
CDST-SP-MIDDLE, ret eaua adaptat a cu 232922 noduri a dus la obt inerea unui model
discretizat cu 78363 grade de libertate (DoFs). Timpul de rezolvare pentru un singur sistem
liniar cu aceste necunoscute complexe a fost este de 34s pe un nod din clusterul ATLAS,
iar cantitatea de memorie necesar a a fost de 3.3GB.

AFS

V F
Nr. pct. Convergent a
1e-2 1e-4 4
iterat ie 1 2 3
ordin 3 6 7
S

3 6 4
S +S

7 13 17
Tabelul 5.2: Convergent a algoritmului AFS-VF
Algoritmul de rezolvare AFS-VF a avut nevoie de 3 iterat ii (Tabelul 5.2) pentru a obt ine
modelul nal, care are ordinul q = 7. Implementarea serial a a obt inut modelul de ordin
redus n 580s, pe c and implementarea paralel a cu dou a nivele de granularitate a avut nevoie
doar de 194s, adic a s-a obt inut cu o accelerare de 3. Implementarea cu un nivel de granu-
laritate nu a putut executa acest test deoarece necesarul de memorie (3.3 8 = 26.4GB)
dep aseste memoria zic instalat a (24GB). Pentru execut ia implement arii paralele au fost
folosite 4 noduri din clusterul Atlas, ceea ce nseamn a c a ideal se poate obt ine o accelerare
maxim a de valoare 4. Av and n vedere accelerarea obt inut a, se poate spune c a implemen-
tarea paralel a exploateaz a ecient resursele de calcul. Desigur, accelerarea depinde foarte
mult de convergent a algoritmului respectiv num arul de iterat ii si num arul de sisteme de
rezolvat la ecare iterat ie.
Concluzia acestei analize este c a paralelizarea calculului reduce timpul de execut ie si
permite n consecint a extragerea unor modele mai precise. Dac a timpul de extract ie necesar
pentru procedura paralel a AFS-VF este comparat cu cel init ial solicitat de algoritmul VF
secvential (f ar a AFS) se constat a o sc adere a acestui timp de circa 16 ori, atunci c and se
foloseste un cluster alc atuit din patru noduri interconectate. Aceast a observat ie evident iaz a
cresterea performant elor procedurii de modelare electromagnetic a.
29
5. Studii de caz - rezultate numerice si validarea lor experimental a
5.2 Inductorul spiralat hexagonal - CHRF217
Problema CHRF217 cont ine un inductor spiralat hexagonal ce are un terminal excitat n
tensiune, iar cel alat conectat la mas a. Geometria 2D, n coordonate xOz, a dispozitivului
care provine din sierul .GDS este prezentat a n Figura 5.6. Dispunerea straturilor pe
axa Oy provine din sierul de tehnologie. Pentru clasa de probleme CHRF sunt folosite
(a) Layout (b) Vedere 3D
Figura 5.6: Problema CHRF217 - Inductor spiralat hexagonal
aproape aceleasi materiale ca n cazul problemelor CODESTAR, n Tabelul 5.3 se g asesc
materialele ale c aror propriet at i sunt diferite. Dimensiunile inductorului spiralat sunt: s =
2m, w = 13m, d
out
= 186m, d
in
= 100m, p
1
= 50m si p
2
= 69m. Inductorul se
a a n stratul met4.
Material Tip
r

r
[S/m]
alum1 Al-conductor 1 1 3.23 10
7
alum2 Al-conductor 1 1 2.15 10
7
tun1 W-conductor 1 1 5.21 10
6
SUB2 (Si) semi-conductor 1 11.7 2.38 10
6
SUB5 (Si) semi-conductor 1 11.7 3.33 10
3
Tabelul 5.3: Materialele problemelor CHAMELEON
Modelarea aproximativ a
Modelarea aproximativ a se va face folosind acelasi model propus in subcapitolul an-
terior. Valorile parametrilor concentrat i ai modelului sunt: R
s
= 2.55, L
s
= 1.754nH,
C
s
= 3.066fF, C
Ox
= 63.11fF, C
Si
= 3.093fF, R
Si
= 8.5k.
Rezultatele acestei simul ari au fost comparate cu rezultatele Chamy (Figura 5.7).
30
5.2. Inductorul spiralat hexagonal - CHRF217
Modelarea numeric a
Pentru discretizarea problemei CHRF217 au fost folosite strategiile dezvoltate n sub-
capitolul anterior, n nal ind folosit a o ret ea adaptat a cu 47 21 39 noduri.
(a) Real (b) Imaginar
Figura 5.7: Simularea SPICE si Chamy - Y
11

In Figura 5.7 sunt prezentate comparativ caracteristicile de frecvent a rezultate n urma


simul arilor modelului cu parametri distribuit i (Chamy) si concentrat i (SPICE). Se constat a,
asa cum era de asteptat, c a modelul Chamy obt ine rezultate mai bune dec at modelul SPICE.
Concluzia nal a a acestui studiu este c a modelul cu parametri concentrat i nu poate modela
cu acuratet e efectele de nalt a frecvent a, una din principalele cauze ind faptul c a nu se
t ine cont de stratul de nwell care apare n substrat. Eroarea medie p artatic a global a este de
15% la modelul cu parametri concentrat i si 22% la modelul cu parametri distribuit i, dar n
scar a logaritmic a erorile simul arilor Chamy sunt mult mai mici, iar modelul cu parametri
distribuit i mai poate mbun at at it, ndesind ret eaua de discretizare.
Performantele procedurii de extractie a modelului
Modelul discretizat cu ret eaua adaptat a cu 47 21 39 noduri, a generat un sistem cu
209346 grade de libertate. Timpul de rezolvare pentru un astfel de sistem liniar cu necu-
noscute complexe a fost de 198s pe un nod din clusterul ATLAS, iar cantitatea de memorie
necesar a a fost de 12GB. Algoritmul de rezolvare AFS-VF a avut nevoie de 3 iterat ii (Ta-

AFS

V F
Nr. pct. Convergent a
1e-3 1e-5 4
iterat ie 1 2 3
ordin 3 6 10
S

3 6 10
S +S

7 13 23
Tabelul 5.4: Convergent a algoritmului AFS-VF
31
5. Studii de caz - rezultate numerice si validarea lor experimental a
belul 5.4) pentru a obt ine modelul nal, care are ordinul q = 10. Implementarea serial a a
obt inut modelul de ordin redus n 4554s. Implement area cu un singur nivel de granularitate
nu a putut rezolva aceast a problem a din cauza limit arii memoriei. Implementarea paralel a
cu dou a nivele de granularitate a avut nevoie doar de 1386s, obt in andu-se o accelerare de
3.3. La fel ca n cazul precedent, pentru execut ia implement arii paralele au fost folosite 4
noduri din clusterul Atlas. Accelerarea obt inut a se apropie de accelerarea maxim a teore-
tic a, deci, se poate spune c a implementarea paralel a exploateaz a si de aceast a dat a ecient
resursele de calcul.
5.3 Inductoare spiralate cuplate - CHRF201
Problema CHRF201 cont ine dou a inductoare spiralate p atrate cuplate aate la distant a
de 14m. Fiecare inductor are un terminal excitat n tensiune iar cel alalt conectat la mas a,
rezult and un element diport de circuit electric. Geometria dispozitiviului este reprezentat a
n Figurile 5.8a) si 5.8b.
(a) Layout (b) Vedere 3D
Figura 5.8: Problema CHRF201 - Inductoare spiralate cuplate
Straturile de material ale dispozitivului sunt dispuse n mod similar cu cele ale induc-
torului hexagonal CHRF217. Cele dou a inductoare sunt identice, cu c ate cinci spire, si
dimensiunile: s = 3m, w = 5m, d
out
= 300m, d
in
= 226m, p
1
= 51m si
p
2
= 91m, grosimea t = 3.1m, iar distant a dintre inductoare este de h = 14m. Induc-
toarele se a a n stratul met4, iar conductoarele de aduct ie n stratul met3.
Modelarea aproximativ a
Pentru modelarea aproximativ a a problemei CHRF201 se vor folosi dou a modele cu
parametri concentrat i de tip Pi, pentru ecare inductor, la care se adaug a dou a elemente:
un condensator C
12
, care modeleaz a efectele capacitive ap arute ntre cele dou a inductoare,
si o inductivitate mutual a, care modeleaz a cuplajul ntre cele dou a inductoare.

In cazul
c ampului electric uniform, capacitatea condensatorului este egal a cu C
12
=

Ox
S
h
, unde
A = t d
out
aria comun a spirelor si h distant a dintre spire. Inductivitatea mutual a calculat a
dintre cele dou a nf asur ari M = 1.02125nH satisface relat ia M = k

L
s1
L
s2
.
Circuitul echivalent SPICE al inductoarelor cuplate este prezentat n Figura 5.9, iar
parametri lui se calculeaz a folosind formulele adoptate n subcapitolul anterior: R
s
= 9,
32
5.3. Inductoare spiralate cuplate - CHRF201
Figura 5.9: Circuitul echivalent pentru inductoare integrate cuplate (LTSpice)
L
s
= 13.94nH, k = 0.0732, C
s
= 0.907fF, C
Ox
= 93.941fF, C
Si
= 8.047fF, R
Si
=
3.268k, C
12
= 2.410fF. Rezultatele simul arii SPICE au fost comparate cu rezultatele
obt inute cu Chamy (Figure 5.10).
(a) Y
11
Real (b) Y
11
Imaginar
Figura 5.10: Rezultate Chamy si SPICE - Y
11
- pentru CHRF201
Modelarea numeric a
Pentru discretizarea problemei CHRF201 a fost folosit a o ret ea adaptat a cu 622238
noduri. Rezultatele simul arilor, prezentate n Figura 5.10, arat a clar superioritatea mode-
lului Chamy, mai ales la frecvent e nalte, unde surprinde comportarea specic a a caracte-
risticii de frecvent a a dispozitivului. Modelul cu parametri concentrat i nu reuseste s a faca
acest lucru, nici m acar din punct de vedere calitativ. Eroarea medie p atratic a global a pentru
modelul SPICE este de 20%, pe c and modelul Chamy are o eroare de 14%. Concluzia este
33
5. Studii de caz - rezultate numerice si validarea lor experimental a
c a, n acest caz, numai, un model cu parametri distribuit i poate modela cu acuratet e efectele
de nalt a frecvent a.
Folosind metoda Fredho, se observ a c a aceeasi ret ea de discretizare adaptiv a, ce gene-
reaz a un sistem linear cu acelasi num ar de grade de libertate, reduce eroarea medie p atratic a
global a de la 14% la 10%. Cel mai probabil, rezultatele mai pot mbun at at ite ndesind
gridul n planul xOz, ns a aceast a tehnic a este limitat a de memoria RAM avut a la dispozit ie
n sistemul de calcul pe care se face modelarea.
Performantele procedurii de extractie a modelului
Folosind ret eaua adaptat a cu 622238 noduri, a fost obt inut modelul discretizat, un
sistem cu 283733 grade de libertate. Timpul de rezolvare pentru un astfel de sistem liniar
cu necunoscute complexe a fost de 324s pe un nod din clusterul ATLAS, iar cantitatea de
memorie necesar a a fost de 16GB.

AFS

V F
Nr. pct. Convergent a
1e-2 1e-4 4
iterat ie 1 2 3 4
ordin 3 6 12 15
S

3 6 12 4
S +S

7 13 25 29
Tabelul 5.5: Convergent a algoritmului AFS-VF
Algoritmul de rezolvare AFS-VF a avut nevoie de 4 iterat ii (Tabelul 5.5) pentru a obt ine
modelul nal, care are ordinul q = 15. Implementarea serial a a obt inut modelul de ordin
redus n 9399s. Implementarea paralel a cu dou a nivele de granularitate a avut nevoie doar
de 2598s, obt in andu-se o accelerare de 3.61. Pentru acest test au fost folosite 4 noduri din
clusterul Atlas. Accelerarea obt inut a se apropie de accelerarea maxim a teoretic a, deci, se
poate spune c a implementarea paralel a exploateaz a si de aceast a dat a ecient resursele de
calcul.
5.4 Concluzii
Studiul celor trei probleme de test reprezint a validarea experimental a a procedurii de
modelare cu parametri distribuit i prezentat a n tez a, dar, n acelasi timp, demonstreaz a
ecient a folosirii implement arilor paralele propuse de autor.

In ceea ce priveste modelarea
cu parametri concentrat i, au fost propuse mbun at at iri pentru un model al inductoarelor
integrate existent n literatura de specialitate. El a fost validat pentru inductoare p atrate
si hexagonale. Totusi acest model cu parametri concentrat i nu reuseste s a modeleze cu
acuratet e efectele de nalt a frecvent a, asa cum s-a v azut mai ales la ultima structur a de test.

In schimb, procedura de modelare electromagnetic a bazat a pe rezolvarea ecuat iilor lui


Maxwell cu FIT permite extragerea n mod robust a unor modele de ordin redus, care au o
acuratet e acceptabil a din punct de vedere industrial, t in and cont si de abaterile geoemetriei
si parametrilor de material, inerente n tehnologiile micro- si nano- electronice si care au
ordine de m arime de circa 10%.
34
CAPITOLUL 6
Concluzii nale si contributii originale
Modelarea electromagnetic a a componentelor pasive din circuitele integrate de nalt a
frecvent a (p an a la 60GHz), folosind metode numerice, se reduce n nal la rezolvarea unor
sisteme de ecuat ii algebrice liniare de foarte mari dimensiuni.

In bibliotecile matematice
disponibile, comercial sau n domeniul public, exist a sute chiar si mii de rutine pentru
rezolvarea unor astfel de sisteme. Acestea au fost dezvoltate de persoane sau colective cu
cele mai avansate competente n domeniul matematic si/sau al calculatoarelor. Fiecare din
aceste rutine este potrivit a pentru o anumit a clas a de matrice.
Dac a toate acestea au fost stabilite anterior, atunci trebuie, n principiu, identicate din
bibliotecile matematice, acele rutine potrivite pentru propriet at ile concrete.

In perspectiv a
invers a, dac a se alege o metoda direct a sau iterativa si de precondit ionare recunoscut a ca
ind foarte ecient a, ar trebui ca atunci c and se formuleaz a problema de c amp si se de-
cide metoda de discretizare, s a se urmareasc a obt inerea propriet at ilor cerute de metoda de
rezolvare aleas a. Aceast a corelat ie ntre formularea problemei de c amp electromagnetic
si tehnica de rezolvare numeric a de rezolvare a ei, n paralel, presupune cunostint e de in-
ginerie electric a ce nu sunt la ndemana matematicienilor sau a informaticienilor, care au
dezvoltat rutinele de rezolvare. Pe de alt a parte inginerul, care se ocup a de modelarea elec-
tromagnetic a, trebuie s a nteleag a nu doar aspectele zice si ingineresti, s a poat a identica
ipotezele simplicatoare acceptabil, ci s a aib a cunostint ele de matematic a si informatic a,
necesare ntelegerii modului de funct ionare si utilizare a acestor rutine de rezolvare.
Tehnologia de modelare electromagnetic a a bobineleor spiralate din circuitele integrate
de nalt a frecvent a, prezentat a n tez a, a fost pus a la punct si validat a experimental folosind
rezultatele m asur atorilor puse la dispozit ie de partenerii nostri industriali, pentru structuri
de test proiectate si realizate de acestia. Dintre toate alternativele evaluate, n nal, s-a
dovedit a cea mai ecient a si precis a, tehnologia care se bazeaz a pe rezolvarea numeric a
a ecuat iilor lui Maxwell, cu condit ii de frontier a de tip EMCE, folosind metoda FIT n
domeniul frecvent ei si extrag and modelul de ordin redus cu tehnica Esantion arii Adaptive a
Frecvent ei AFS-VF. Ea a fost impelementat a pe sistemul hibrid ATLAS, folosind tehnicile
de paralelizare cele mai potrivite pentru etapele acestei tehnologii.
Procedurile de modelare electromagnetic a dezvoltate n LMN si prezentate n tez a au
condus la accelerarea procesului de 5-10 si chiar de 100 ori, fat a de situat ia existent a nainte
de a ncepe aceste cercet ari.

In concluzie, putem arma f ar a dubiu, c a obiectivele tezei au
35
6. Concluzii nale si contribut ii originale
fost pe deplin realizate.
Principalele contribut ii originale aduse prin teza de doctorat:
1. Realizarea unui studiu critic asupra metodelor de modelare elctromagnetic a a induc-
toarelor din circuitelele integrate de nalt a frecvent a.
2. Modelarea folosind un program dezvoltat n cadrul LMN (Chamy) si un program
comercial (COMSOL) a unui set de structuri inductive de test, virtuale si reale, n
vederea identicarii celei mai eciente tehnologii TCAD de modelare electromagne-
tic a. Pe nivelul inferior, cele dou a programe au fost folosite doar pentru generarea
matricelor sistemului liniar, care au fost rezolvate apoi cu diverse metode, pe sisteme
de calcul multiprocesor. Pe nivelul cel mai nalt, frecvent ele, pentru care se reali-
zeaz a simularea, au fost generate de un algoritm adaptiv distribuit implementat de
autor.
3. S-a studiat ecient a diferitelor metode directe si iterative cu si f ar a preconditionare,
pentru rezolvarea n paralel (pe sisteme cu arhitecturi ierarhice hibride: cluster, CPU,
GPU) a sistemelor de mari dimensiuni, cu matrice rare generate prin discretizarea
ecuat iilor c ampului elctromagnetic si s-au identicat solut
.
iile cele mai eciente pen-
tru tehnologia de modelare propus a. Acestea au fost incluse n programul TCAD
numit Chamy, dezvoltat n cadrul LMN. Testele efectuate pe sistemul de calcul mul-
tiprocesor ATLAS au dovedit o o accelerare substant iala a procesului de modelare.
4. A fost dezvoltat, n MATLAB, un program distribuit de extragerea a modelului de
ordin redus. Metoda cea mai ecient a s-a dovedit a AFS-VF - Esantionarea Adap-
tiv a a Frecvent elor cu Vector Fitting - AFS-VF. Acestea au fost incluse n programul
TCAD Chamy, dezvoltat de echipa LMN. Metoda AFS-VF a reusit s a reduc a numa-
rul variabilelor de stare la 5-20, ceea ce evidentaz a ecient a sa extraordinar a.
5. A fost modelat a structura de test CDST-SP-MIDDLE, const and dintr-o bobin a spira-
lat a cu spire p atrate, realizat a n tehnologia CMOS. Rezultatele au fost validate prin
comparat ie cu rezultatele m asur atorilor efectuate de partenerii nostri industriali. Fat a
de rularea secvent ial a, folosind 4 noduri din cluster, s-a obt inut o accelerare de 3.
6. A fost modelat a structura de test CHRF217, const and dintr-o bobin a spiralat a cu
spire hexagonale realizat a n tehnologia CMOS. Rezultatele au fost validate prin
comparat ie cu rezultatele m asur atorilor efectuate de partenerii nostri industriali.
7. A fost modelat a structura de test CHRF201, const and dintr-o pereche de bobine cu-
plate, realizate n tehnologia CMOS. Rezultatele au fost validate prin comparat ie cu
rezultatele m asur atorilor efectuate de partenerii nostri industriali. Rezultatele nume-
rice au acuratet e mai mare dec at cele obtinut e init ial, n cadrul proiecteleor, si sunt
obt inute mult mai rapid.
Contributiile orginale aduse de autor au fost comunicate n lucr ari publicate mpreun a
cu alt i membri ai echipei de cercetare LMN.
1. I. Andrei, E. C aciulan, D. Dan, G. Ciuprina and D. Ioan, Matlab Based Parallel
Deterministic Optimization of the Loneys Solenoid, Acta Electrotehnica Special
36
Issue Selected papers from the 3
rd
International Conference of Modern Power Sys-
tems (MPS 2010), Vol. 51, No. 5, pp. 9-14, Mediamira Science Publisher, Cluj-
Napoca, Romania, 2010, ISSN 1841-3323.
2. I. Andrei, E. C aciulan and D. Dan, Parallel and Distributed Computations Applied
to the Deterministic Optimization of the Loneys Solenoid, Proceedings of the 11
th
International Workshop on Optimization and Inverse Problems in Electromagnetism
(OIPE 2010), pp:90-91, September 14-18, 2010, Soa, Bulgaria, ISBN 978-954-
438-855-3.
3. G. Ciuprina, D. Ioan, I.A. Laz ar, M.I. Andrei, Adaptive Frequency Sampling for the
Effective Extraction of Reduced Models for HF-ICs Passive Components, Procee-
dings of National Symposium of Theoretical Electrical Engineering (SNET 2010),
Bucharest, 2010, ISSN 2067-4147.
4. I.A. Laz ar, M.I. Andrei, E. C aciulan, G. Ciuprina and D. Ioan, Parallel algorithms
for the efcient extraction of tting based reduced order models, Proceedings of the
7
th
International Symposium on Advanced Topics in Electrical Engineering (ATEE
2011), pp:1-6, 12-14 May, Bucharest, 2011, ISSN: 2068-7966
5. D. Ioan, G. Ciuprina, C.B. Dit a and M.I. Andrei, Electromagnetic Models of In-
tegrated Circuits with Coupled Magnetic Circuits, Proceedings of the International
Conference on Electromagnetics in Advanced Applications (ICEAA 2012), Septem-
ber 2-7, 2012, Cape Town, South Africa.
6. G. Ciuprina, D. Ioan, C.B. Dit a and M.I. Andrei, Frequency Dependent Models for
Planar On-Chip Inductors, Book of Abstracts, Scientic Computing in Electrical
Engineering (SCEE 2012), 11-14 September, 2012, Zurich, Switzerland.
7. G. Ciuprina, D. Ioan, C.B. Dit a and M.I. Andrei, Optimal terminals identication
for domain partitioning of electro-magnetic circuit elements, Proceedings of 12
th
International Workshop on Optimization and Inverse Problems in Electromagnetism
(OIPE 2012), 19-21 September, 2012, Ghent, Belgium.
Lucr ari trimise pentru publicare:
1. G. Ciuprina, C.B. Dit a, M.I. Andrei and D. Ioan, Hierarchical Sparse Circuits for
the Modeling of Homogeneous Domains in High Frequency ICs, n curs de publi-
care la Editura Politehnica Press
2. M.I. Andrei and C.B. Dit a, Using Multiprocessors Systems for Electromagnetic
Modelling of Spiral Inductors, lucrare trimis a pentru Buletinul UPB, ID 1698.
Lucr ari n preg atire:
1. Parallel extraction of reduced order models for integrated inductors by AFS-VF
2. Parallel iterative electromagnetic modeling of spiral inductors
37
Bibliograe
[1] C. Mocanu, Teoria Circuitelor Electrice. Editura Didactica si Pedagogica, 1979.
[2] D. Ioan, Modelarea dispozitivelor electromagnetice.
[3] A. Timotin, Elementul electromagnetic pasiv de circuit, Revue Roumaine des sciences tech-
niques, vol. 21, no. 2, 1971.
[4] D. Ioan and I. Munteanu, Missing link rediscovered: The electromagnetic circuit element
concept, JSAEM Studies in Applied Electromagnetics and Mechanics, vol. 8, Oct. 1999.
[5] I. A. Lazar, G. Ciuprina, and D. Ioan, Effective extraction of accurate reduced order models
for hf-ic using multi-CPU arhitectures, Inverse Problems in Science and Engineering, vol. 20,
no. 1, 2010.
[6] B. Gustavsen and A. Semlyen, Rational approximation of frequency domain responses by
vector tting, IEEE Transactions on Power Delivery, vol. 14, July 1999.
[7] B. Gustavsen, Improving the pole relocating properties of vector tting, IEEE Transactions
on Power Delivery, vol. 21, July 2006.
[8] D. Deschrijver, M. Mrozowski, T. Dhaene, and D. D. Zutter, Macromodeling of multiport
systems using a fast implementation of the vector tting method, IEEE Microwave and Wire-
less Components Letters, vol. 18, June 2008.
[9] A. Semlyen and B. Gustavsen, Ahalf-size singularity test matrix for fast and reliable passivity
assessment of rational models, IEEE Transactions on Power Delivery, vol. 24, Jan 2009.
[10] B. Gustavsen, Fast passivity enforcement for pole-residue models by perturbation of residue
matrix eigenvalues, IEEE Transactions on Power Delivery, vol. 23, Oct. 2008.
[11] B. Gustavsen and A. Semlyen, Fast passivity assessment for s-parameter rational models via
a half-size test matrix, IEEE Transactions on Microwave Theory And Techniques, vol. 56,
Dec. 2008.
[12] B. Gustavsen, Fast passivity enforcement for s-parameter models by perturbation of residue
matrix eigenvalues, IEEE Transactions on Advanced Packaging, vol. 39, May 2003.
[13] T. A. Davis, Algorithm832: UMFPACK, an unsymmetric-pattern multifrontal method, ACM
Transactions on Mathematical Software, vol. 30, no. 2, pp. 196199, 2004.
[14] S. S. Mohan, M. del Mar Hershenson, S. P. Boyd, and T. H. Lee, Simple Accurate Expressions
for Planar Spiral Inductances, IEEE Journal of Solid-State Circuits, vol. 34, no. 10, 1999.
http://smirc.stanford.edu/papers/JSSC99OCT-mohan.pdf.
38

S-ar putea să vă placă și