Sunteți pe pagina 1din 6

De la o problema cu matrice la transformari

elementare
Marian TETIVA1
1. Introducere. Problema la care ne referim n titlu este urmatoarea:
Sa se arate ca nu exista matrice patratice X, Y Mn (C) astfel nct XYY X = In ,
In fiind matricea unitate de ordinul n.
Este o problema cunoscuta, care poate fi ntlnita n mai multe manuale sau
culegeri, care s-a dat la concursuri etc. si nu este tocmai simpla: un elev mediu este
ntotdeauna descurajat de enunturi de tipul "sa se arate ca exista /nu exista. . . ".
Mai mult, n aceasta situatie nu prea avem alta cale de abordare n afara celei care
utilizeaza notiunea de urma a unei matrice si proprietatile sale. Istoria problemei
este cam asa: prin anii 70 ai secolului trecut ea era propusa la olimpiada, prin anii
80 a patruns n manuale pentru ca n anii 90 sa ajunga a fi parte din diverse teste
de bacalaureat sau admitere la facultate; aceasta spune ceva despre felul n care au
evoluat programele nvatamntului matematic elementar n Romnia. Noi credem
ca elevul mediu din ziua de azi se afla n acelasi impas ca si cel de acum douazeci sau
treizeci de ani (sau poate chiar mai rau) atunci cnd este confruntat cu asemenea
probleme. De aceea aceasta nota i se adreseaza, dar numai daca este cu adevarat
interesat de matematica.
Amintim ca urma matricei A = (aij )1i, jn Mn (C) este, prin definitie,
numarul Tr (A) = a11 + a22 + + ann (suma elementelor situate pe "diagonala
principala" a matricei). Sunt cunoscute urmatoarele proprietati ale urmei:
1 Tr (A + B) = Tr (A) + Tr (B), A, B Mn (C),
2 Tr (A) = Tr (A), C, A Mn (C),
3 Tr (AB) = Tr (BA), A, B Mn (C).
Primele doua egalitati se mai pot scrie condensat n forma Tr (A + B) =
= Tr (A) + Tr (B), oricare ar fi , C si A, B Mn (C) si exprima linia-
ritatea urmei: Tr : Mn (C) C este aplicatie liniara (sau morfism de C - spatii
vectoriale). De aici deducem Tr (XY Y X) = Tr (XY ) Tr (Y X) = 0 pentru orice
X, Y Mn (C) si aceasta explica de ce egalitatea din enunt nu poate avea loc pentru
nici o pereche de matrice X, Y : matricea XY Y X are urma nula, deci nu poate fi
egala cu In , a carei urma este n.
Remarcam ca matricea In din enunt poate fi nlocuita cu orice matrice de ordinul
n avnd urma nenula, enuntul si rezolvarea ramnnd valabile; problema poate fi
usor reformulata astfel:
Daca pentru o matrice A Mn (C) exista X, Y Mn (C) astfel nct A =
XY Y X, atunci Tr (A) = 0.
Atunci se naste n mod natural ntrebarea daca reciproca acestei afirmatii este
adevarata, adica se pune problema valabilitatii urmatorului enunt:
Fie A o matrice patratica de ordin n cu elemente numere complexe. Daca urma
matricei A este nula, atunci exista X, Y Mn (C) astfel nct A = XY Y X.
1 Profesor, Colegiul National "Gh. Rosca Codreanu", Brlad

10
n cele ce urmeaza ne propunem sa rezolvam aceasta problema; mai precis, sa
aratam ca raspunsul la ntrebare este afirmativ.
Ideea rezolvarii este sa cautam niste matrice Y, Z Mn (C) astfel nct A sa poata
fi scrisa n forma A = Z Y ZY 1 (Y fiind inversabila, desigur);
atunci
problema
va
fi rezolvata: e suficient sa alegem X = ZY 1 si avem A = ZY 1 Y Y ZY 1 =
= XY Y X.
Aici cititorul poate avea o nemultumire: de unde si pna unde aceste matrice Y, Z
n locul lui Xsi Y din enunt?
Sa remarcam ca din proprietatea 3 rezulta ca avem si
4 Tr(A) =Tr CAC 1 , C Mn (C), C inversabila (se dovedeste imediat, caci
A = AC 1 C). Matricele de forma A si CAC 1 sunt asemenea, iar proprietetea
4 spune ca acestea au aceeasi urma.
Desigur, problemele abia ncep. Sunt necesare cteva pregatiri.
2. Matrice asemenea si transformari elementare. Fie K un corp comutativ;
cititorul mai putin familiarizat cu aceasta notiune abstracta poate considera K o
notatie pentru unul dintre corpurile numerice uzuale Q, R sau C.
Doua matrice X, Y Mn (K) se numesc matrice asemenea ( sau similare) daca
exista U Mn (K) cu det U 6= 0 astfel nct Y = U XU 1 (vom nota X Y ).
Cititorul poate verifica usor faptul ca relatia de asemanare (similaritate) este o relatie
de echivalenta pe multimea Mn (K).
Transformarile elementare care se fac asupra unei matrice sunt, n principiu,
cele mai simple modificari care nu i afecteaza rangul, adica interschimbarea a doua
linii (sau coloane), adunarea unei linii (coloane) nmultite cu un numar (n general:
element al corpului K) la alta linie (respectiv coloana), sau chiar nmultirea unei
linii (coloane) cu un numar nenul. Una din cele mai simple aplicatii ale lor este
calculul rangului unei matrice; de asemenea, se pot folosi aceste transformari pentru
rezolvarea sistemelor de ecuatii liniare.
Sa ncepem prezentarea transformarilor elementare cu asa numitele matrice ele-
mentare; legatura va aparea curnd. Vom nota cu Eij matricea patratica de ordin
n peste corpul K ale carei elemente sunt toate nule, cu exceptia elementului de pe
linia i si coloana j care este egal cu 1. Se verifica usor ca matricele Eij , 1 i n,
1 j n formeaza o baza a spatiului vectorial Mn (K) peste K, precum si relatiile
Eij Ekl = 0n , j 6= k si Eij Ejl = Eil .
Se numesc matrice elementare urmatoarele tipuri de matrice patratice de ordinul
n, cu elemente din K:
1) Matricele Tij (a) = In +aEij ; aici a K si i, j {1, 2, . . . n} sunt indici diferiti.
Matricea Tij (a) se obtine din matricea unitate facndu-i o singura modificare: ele-
mentul de pe linia i si coloana j devine a. Se constata imediat ca (vezi proprietatile
matricelor Eij )
Tij (0) = In , Tij (a) Tij (b) = Tij (a + b) ,
1
Tij (a) GLn (K) , Tij (a) = Tij (a) , a, b K,
unde GLn (K) = {U Mn (K) | det U 6= 0} - grupul general liniar de ordin n peste
corpul K. Deci {Tij (a) | a K} formeaza, pentru i 6= j fixate, un grup izomorf cu
grupul (K, +). Sa vedem ce efect are nmultirea unei matrice oarecare cu o matrice
11
Tij (a). Fie A = (akl )1k,ln o matrice din Mn (K), care mai poate fi scrisa si
Xn
A= akl Ekl . Atunci
k,l=1
X
n n
X n
X
Tij (a) A = (In + aEij ) akl Ekl = akl Ekl + aakl Eij Ekl =
k,l=1 k,l=1 k,l=1
n
X Xn
= akl Ekl + aajl Eil .
k,l=1 l=1

Ce nseamna asta? nseamna ca elementele matricei Tij (a) A ramn aceleasi ca


ale matricei A, cu exceptia celor de pe linia i: aici, n locul elementului ail apare
acum ail + aajl , adica matricea Tij (a) A se obtine din A prin adunarea la linia i
a liniei j nmultite cu a, cu alte cuvinte nmultirea la stnga cu o matrice Tij (a)
realizeaza o transformare elementara a matricei A. De asemenea, se poate verifica n
acelasi fel ca matricea ATij (a) se obtine din A prin adunare la coloana j a coloanei
i nmultite cu a.
2) Matricele Qij = Tij (1) Tji (1) Tij (1) (i, j {1, 2, . . . , n} , i 6= j) intra si ele
n categoria matricelor elementare. Avem
Qij = Tij (1) Tji (1) Tij (1) = (In Eij ) (In + Eji ) (In Eij ) =
= (In + Eji Eij Eii ) (In Eij ) = In + Eji Eij Eii Eij Ejj + Eij =
= In Eii Ejj Eij + Eji ,
deci Qij este matricea care se obtine din matricea unitate prin schimbarea a patru
elemente: elementele de pe diagonala principala, de pe linia i, coloana i si de pe linia
j, coloana j se nlocuiesc cu zerouri; n locul elementului de pe linia i si coloana j
avem 1, iar n locul celui de pe linia j si coloana i se gaseste 1. La fel ca mai sus,
sa calculam
X n
Qij A = (In Eii Ejj Eij + Eji ) akl Ekl =
k,l=1
n
X n
X n
X n
X n
X
= akl Ekl akl Eii Ekl akl Ejj Ekl akl Eij Ekl + akl Eji Ekl =
k,l=1 k,l=1 k,l=1 k,l=1 k,l=1
n
X n
X n
X X n n
X
= akl Ekl ail Eil ajl Ejl ajl Eil + ail Eil ;
k,l=1 l=1 l=1 l=1 l=1
asadar, matricea Qij A se obtine din A prin nlocuirea liniei i, respectiv j, cu linia j
nmultita cu 1, respectiv cu linia i. Asemanator, se poate observa ca schimbarile pe
care le produc asupra lui A nmultirea cu matricea Qij la dreapta sunt urmatoarele:
coloana i se nlocuieste cu coloana j, iar coloana j se nlocuieste cu coloana i nmultita
cu 1. Sa mai spunem ca, fiind produs de matrice inversabile, Qij este, de asemenea,
matrice inversabila; avem
1 1 1
Q1
ij = Tij (1) Tji (1) Tij (1) = Tij (1) Tji (1) Tij (1)
si, deci, Q1
ij = Qij .
12
3) Un alt tip de matrice elementare sunt matricele Di (d) = In + (d 1) Eii ,
1 i n, d K fiind nenul; o astfel de matrice se obtine din matricea unitate
modificndu-i un singur element: n locul lui 1 de pe linia i si coloana i punem d. Nu
e greu de vazut ca nmultirea unei matrice A oarecare cu Di (d) la stnga (respectiv
la dreapta) i modifica doar linia (respectiv coloana) i, anume o nlocuieste pe aceasta
cu linia (respectiv coloana) i nmultit
a cu d. De asemenea, Di (d) este inversabila si
1 1
are inversa Di (d) = Di d .
4) Vom folosi matricele Pij pe care le definim prin
Pij = Di (1) Qij = Qij Dj (1) = In Eii Ejj + Eij + Eji .
Verificati aceste egalitati! Observati forma matricei Pij si efectul sau la nmultire:
matricea APij (respectiv Pij A) se obtine din A prin interschimbarea liniilor (respectiv
coloanelor) i si j. Si nu n ultimul rnd, aratati ca Pij este inversabila si Pij1 = Pij .
3. Rezolvarea problemei. Sa demonstram asadar urmatoarea
Propozitie. Fie K un corp comutativ infinit si A Mn (K) o matrice a carei
urma este zero. Atunci exista matricele X, Y Mn (K) astfel nct A = XY Y X.
Demonstratie. Pentru nceput vom presupune ca nu exista nici o submultime
a multimii {a11 , a22 , . . . , ann } a elementelor de pe diagonala principala a matricei A
pentru care suma elementelor sa fie nula, desigur, cu exceptia ntregii multimi (vom
vedea imediat la ce ne foloseste aceasta presupunere, iar la sfrsit ne vom da seama ca
nu este prea restrictiva). Deoarece, conform ipotezei, avem a11 + a22 + + ann = 0,
se pot determina elementele a1 , a2 , . . . , an K astfel nct
a11 = a1 a2 , a22 = a2 a3 , . . . , an1,n1 = an1 an , ann = an a1 .
E clar ca, datorita ipotezei suplimentare pe care am facut-o, oricare doua dintre
elementele a1 , a2 , . . . , an sunt distincte; vom folosi acest lucru mai departe.
Putem scrie pe A n forma A = B C, unde

a1 0 ... 0 0 a2 a12 . . . a1,n1 a1n
a21 a2 ... 0 0 0 a3 . . . a2,n1 a2n


B = ... ... ... ...
. . . , C = . . . . . . . . . ... ...
.
an1,1 an1,2 . . . an1 0 0 0 ... an an1,n
an1 an2 . . . an,n1 an 0 0 ... 0 a1
Asa cum am aratat la nceput, pentru rezolvarea problemei ar fi suficient sa
aratam ca matricele B si C sunt asemenea. n acest scop, vom arata ca B B 0 ,
C C 0 , unde

a1 0 ... 0 a2 0 ... 0
0 a2 . . . 0 0 a3 . . . 0
B0 = 0
. . . . . . . . . . . . , C = . . . . . . . . . . . .
0 0 . . . an 0 0 . . . a1
si B 0 C 0 . Folosind faptul ca asemanarea matricelor este o relatie de echivalenta,
obtinem ca B C.
Sa le luam pe rnd. Ne amintim ca nmultirea unei matrice cu matricea Pij la
stnga (respectiv la dreapta) schimba ntre ele liniile (respectiv coloanele) i si j ale
acelei matrice. De aceea, pentru M Mn (K), matricea Pij M Pij1 = Pij M Pij

13
are schimbate ntre ele elementele de pe diagonala principala situate pe liniile (si
coloanele) i si j; de asemenea, mai sunt afectate si celelalte elemente de pe liniile si
coloanele i si j. Aceasta nu are nsa importanta n cazul unor matrice precum B 0
sau C 0 , la care toate elementele din afara diagonalei principale sunt zerouri; astfel
Pij B 0 Pij1 = Pij B 0 Pij este o matrice care difera de B 0 doar prin aceea ca si-au
schimbat ntre ele locurile doua elemente de pe diagonala principala, anume ai si
aj . Cum orice permutare e produs de transpozitii, e clar ca dupa un numar finit
de asemenea transformari o putem aduce pe B 0 la orice forma n care pe diagonala
principala apar elementele a1 , a2 , . . . , an permutate cumva (si n rest, zerouri). n
particular, B 0 este asemenea cu C 0 .
Sa aratam acum ca B B 0 (si nu vom mai face demonstratia pentru C C 0 , ea
fiind ntru totul asemanatoare). ncepem prin a observa urmatorul calcul:

1 0 0 1 0 0 0
= = ,
a 1 1 a ( ) + 0
daca a este ales convenabil, adica daca a = / ( ); desigur, asta se poate face
numai n cazul n care 6= .
Un calcul asemanator se poate face si pentru matrice de ordin n. Daca vom
considera Tij (a) BTij (a)1 = Tij (a) BTij (a), unde i > j, elementul aij din pozitia
(i, j) se nlocuieste cu a (aj ai ) + aij si a poate fi ales astfel nct acest element sa
devina nul (caci am presupus ca ai 6= aj ). Mai sunt afectate si celelalte elemente ale
liniei i (la care se aduna linia j nmultita cu a) si ale coloanei j (la care se aduna
coloana i nmultita cu a). Remarcam ca aceste transformari oricum nu pot modifica
zerourile de deasupra diagonalei principale, care ramn intacte, si nici elementele de
pe diagonala principala.
1
Acum e clar ce avem de facut: mai nti calculam T21 (a) BT21 (a) care, pentru
un a bine ales reprezinta o matrice B1 asemenea cu B care are n pozitia (2, 1) pe
zero (asta daca nu era dinainte; de altfel se poate vedea usor ca, daca a21 = 0,
atunci a care ne trebuie este a = 0 deci T21 (a) = T21 (0) este, de fapt, matricea
identica). Apoi, pentru aceasta matrice calculam T31 (a) B1 T31 (a)1 , care pentru un
anumit a este o matrice asemenea cu B1 (deci si cu B) si are 0 n pozitia (3, 1); se
poate vedea ca elementul 0 obtinut la pasul anterior nu va fi afectat. Continuam
astfel, lucrnd cu matrice de forma Ti1 (a) pna cnd toate elementele de pe prima
coloana "de sub" a1 devin zerouri, apoi trecem si facem zerouri pe coloana a doua,
"sub" a2 , folosind transformari de tip T32 (a) , . . . , Tn2 (a) (adica nmultim cu acestea
la stnga si cu inversele lor la dreapta; la fiecare pas similaritatea matricelor se
pastreaza), n ordine, alegnd, desigur, de fiecare data valoare care trebuie pentru a.
Elementele nule obtinute pe prima coloana nu vor fi afectate, la fel cele de pe sau de
deasupra diagonalei principale, Tot asa vom proceda pna cnd, la urma, ajungem
la o matrice care are partea de deasupra diagonalei principale neschimbata, la fel
diagonala principala, iar sub diagonala principala are numai zerouri, adica ajungem
la B 0 si la concluzia dorita ca aceasta este asemenea cu B.
n concluzie, am aratat ca matricele B si C sunt asemenea, deci am ajuns acolo
unde ne-am propus: exista V GLn (K) astfel nct C = V BV 1 ; atunci A =
= B C = B V BV 1 si notnd X = BV 1 , Y = V avem A = XY Y X.
Demonstratia ar fi ncheiata, daca n-ar mai fi un mic amanunt de lamurit: ce
14
facem cu ipoteza suplimentara pe care am impus-o (si de care, s-a dovedit pe parcurs,
avem mare nevoie, caci daca elementele de pe diagonala nu sunt distincte, nu-l putem
alege pe a astfel nct Tij (a) sa produca un zero n locul lui aij )? Raspunsul nu e att
de greu si arata, cum spuneam, ca restrictia data de aceasta ipoteza nu este chiar att
de ... restrictiva. E suficient sa mpartim multimea elementelor de pe diagonala n
submultimi disjuncte doua cte doua, fiecare dintre acestea avnd suma elementelor
0 si fiecare nemaiavnd alta submultime (stricta) pentru care suma elementelor este
0. Sa numim b1 , . . . , bk elementele unei asemenea submultimi (a caror suma este,
asadar, zero); pentru acestea putem determina c1 , c2 , . . . , ck astfel nct b1 = c1 c2 ,
b2 = c2 c3 , . . . , bk1 = ck1 ck , bk = ck c1 . Mai mult, oricare doua dintre
c1 , c2 , . . . , ck sunt distincte doua cte doua si proprietatile lor se pastreaza daca le
nlocuim cu c1 + t, c2 + t, . . . , ck + t, t K. Gasim cte o grupare de asemenea c-uri
distincte doua cte doua pentru fiecare submultime de b-uri a multimii elementelor
de pe diagonala principala, iar apoi alegem cte un t pentru fiecare astfel de grupare
nct toate c-urile sa fie distincte doua cte doua (ceea ce sigur se poate face n cazul
n care corpul K este infinit; gnditi-va de ce!). Mai departe totul decurge la fel,
deoarece putem scrie matricea noastra ca diferenta a doua matrice, una inferior, alta
superior triunghiulara, fiecare dintre aceste elemente sunt distincte doua cte doua.
Propozitia este complet demonstrata.

Noi ne-am propus sa rezolvam problema n cazul corpurilor uzuale de numere:


Q, R, C, de aceea ipoteza pe care am facut-o asupra infinitatii corpului K nu ne
deranjeaza foarte mult; totusi, se prea poate ca aceasta presupunere sa fie strict
legata de rezolvarea pe care am dat-o aici si sa nu fie esentiala. Asadar, ramne
ntrebarea daca este valabil enuntul propozitiei demonstrate si n cazul unui corp
finit.
n ncheiere, sa mai spunem ca nu exista nici o pretentie de originalitate n elabo-
rarea acestei note; este foarte posibil ca aceasta solutie sa fie cunoscuta, atta doar ca
autorul nu are nici un fel de referinta pentru problema discutata, pe care o cunoaste
doar din folclor (n urma cu ctiva ani aceasta problema mi-a fost comunicata "prin
viu grai" de catre un elev, actualmente student stralucit al Facultatii de Matematica
din Bucuresti; asa ca i multumesc pe aceasta cale lui Dragos Deliu, care m-a facut
sa caut sa rezolv aceasta problema, cautari din care s-a nascut si aceasta nota).

Recreaii matematice

1. Sa se ndeparteze patru segmente din figura alaturata


(alcatuita din sase patrate) astfel nct noua figura sa fie for-
mata din trei patrate.

Nota. Solutia problemei se poate gasi la pagina 39.

15

S-ar putea să vă placă și