Sylvester-Gleichung

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Die Sylvester-Gleichung ist in der Mathematik und der Kontrolltheorie eine Matrix-Gleichung der Form

A X + X B = C , {\displaystyle AX+XB=C,} {\displaystyle AX+XB=C,}

dabei sind A , B , C {\displaystyle A,B,C} {\displaystyle A,B,C} drei vorgegebene n × n {\displaystyle n\times n} {\displaystyle n\times n}-Matrizen. Die n × n {\displaystyle n\times n} {\displaystyle n\times n}-Matrix X {\displaystyle X} {\displaystyle X} ist die gesuchte Lösung der Gleichung.

Allgemeiner kann C {\displaystyle C} {\displaystyle C} sogar eine m × n {\displaystyle m\times n} {\displaystyle m\times n}-Matrix sein; dann ist A {\displaystyle A} {\displaystyle A} eine m × m {\displaystyle m\times m} {\displaystyle m\times m}-Matrix, B {\displaystyle B} {\displaystyle B} eine n × n {\displaystyle n\times n} {\displaystyle n\times n}-Matrix und X {\displaystyle X} {\displaystyle X} wie C {\displaystyle C} {\displaystyle C} eine m × n {\displaystyle m\times n} {\displaystyle m\times n}-Matrix.

Sie ist nach James Joseph Sylvester benannt, der darüber 1884 veröffentlichte.

Der für Anwendungen wichtige Spezialfall, in dem B = A {\displaystyle B=A^{*}} {\displaystyle B=A^{*}} die zu A {\displaystyle A} {\displaystyle A} adjungierte Matrix ist, wird auch Ljapunow-Gleichung genannt (nach Alexander Michailowitsch Ljapunow).

Existenz und Eindeutigkeit der Lösung

[Bearbeiten | Quelltext bearbeiten ]

Wegen der Nichtkommutativität des Matrizenprodukts kann die Gleichung nicht direkt aufgelöst werden. Trotzdem ist sie einfach eine lineare Gleichung, die mit den n 2 {\displaystyle n^{2}} {\displaystyle n^{2}} unbekannten, in vektorisierter Form geschriebenen Matrixelementen X i j {\displaystyle X_{ij}} {\displaystyle X_{ij}} ein lineares Gleichungssystem bildet.

In kompakter Form kann es mit dem Kroneckerprodukt und dem Vektorisierungsoperator vec {\displaystyle \operatorname {vec} } {\displaystyle \operatorname {vec} } wie folgt geschrieben werden:

( I n A + B T I m ) vec X = vec C , {\displaystyle (I_{n}\otimes A+B^{T}\otimes I_{m})\operatorname {vec} X=\operatorname {vec} C,} {\displaystyle (I_{n}\otimes A+B^{T}\otimes I_{m})\operatorname {vec} X=\operatorname {vec} C,}

Dabei bezeichnet I k {\displaystyle I_{k}} {\displaystyle I_{k}} die k × k {\displaystyle k\times k} {\displaystyle k\times k} Einheitsmatrix.

Die direkte Lösung dieses Gleichungssystems ist aufwendig ( n 4 {\displaystyle n^{4}} {\displaystyle n^{4}} Elemente in einer dünnbesetzten Matrix, n 2 {\displaystyle n^{2}} {\displaystyle n^{2}} Unbekannte und O ( n 6 ) {\displaystyle {\mathcal {O}}(n^{6})} {\displaystyle {\mathcal {O}}(n^{6})} FLOPs) und darüber hinaus numerisch instabil.

Es existiert eine eindeutige Lösung für alle C {\displaystyle C} {\displaystyle C} genau dann, wenn A {\displaystyle A} {\displaystyle A} und B {\displaystyle -B} {\displaystyle -B} keine gemeinsamen Eigenwerte haben.

Numerische Auflösung

[Bearbeiten | Quelltext bearbeiten ]

Klassisch wird die Lösung stabil und robust mit dem Bartels-Stewart-Algorithmus berechnet. Dabei werden A {\displaystyle A} {\displaystyle A} und B {\displaystyle B} {\displaystyle B} durch Ähnlichkeitstransformationen in die schursche Normalform gebracht und dabei die Sylvestergleichung in eine einfachere und durch Rückwärtseinsetzen lösbare Dreiecksgestalt transformiert. Die Ähnlichkeitstransformationen erfolgen mit dem aus dem QR-Algorithmus abgeleiteten Francis-Algorithmus.

A = P 1 R P {\displaystyle A=P^{-1}RP} {\displaystyle A=P^{-1}RP}; B = Q 1 S Q {\displaystyle B=Q^{-1}SQ} {\displaystyle B=Q^{-1}SQ}; R {\displaystyle R} {\displaystyle R} und S {\displaystyle S} {\displaystyle S} sind geeignete Dreiecksmatrizen (Im reellen dürfen sie isolierte Subdiagonalelemente enthalten).

A X + X B = P 1 R P X + X Q 1 S Q = C {\displaystyle AX+XB=P^{-1}RPX+XQ^{-1}SQ=C} {\displaystyle AX+XB=P^{-1}RPX+XQ^{-1}SQ=C}
R P X Q 1 + P X Q 1 S = P C Q 1 {\displaystyle RPXQ^{-1}+PXQ^{-1}S=PCQ^{-1}} {\displaystyle RPXQ^{-1}+PXQ^{-1}S=PCQ^{-1}}
R Y + Y S = D {\displaystyle RY+YS=D} {\displaystyle RY+YS=D}

Dabei sind Y = P X Q 1 {\displaystyle Y=PXQ^{-1}} {\displaystyle Y=PXQ^{-1}} und D = P C Q 1 {\displaystyle D=PCQ^{-1}} {\displaystyle D=PCQ^{-1}}.

In der einfacheren Dreiecksgestalt kann Y {\displaystyle Y} {\displaystyle Y} jetzt direkt und X {\displaystyle X} {\displaystyle X} aus X = P 1 Y Q {\displaystyle X=P^{-1}YQ} {\displaystyle X=P^{-1}YQ} bestimmt werden. Die Rechenzeit liegt in der Größenordnung der schurschen Normalform ( O ( n 3 ) {\displaystyle {\mathcal {O}}(n^{3})} {\displaystyle {\mathcal {O}}(n^{3})} FLOPs).

Neuere Algorithmen kommen mit einer Schur-Transformation (z. B. für B {\displaystyle B} {\displaystyle B}) aus und bilden mit der anderen Matrix (z. B. A {\displaystyle A} {\displaystyle A}) nur eine Hessenbergmatrix.

Auch mit den iterativen Solvern für lineare Systeme kann die Lösung berechnet werden.

  • J. Sylvester: Sur l’equations en matrices p x = x q {\displaystyle px=xq} {\displaystyle px=xq}. In: C. R. Acad. Sc. Paris . Band 99, 1884, S. 67–71, 115–116. 
  • R. H. Bartels, G. W. Stewart: Solution of the matrix equation A X + X B = C {\displaystyle AX+XB=C} {\displaystyle AX+XB=C}. In: Communications of the ACM. Band 15, Nr. 9, 1972, S. 820–826, doi:10.1145/361573.361582 . 
  • R. Bhatia, P. Rosenthal: How and Why to Solve the Operator Equation A X X B = Y {\displaystyle AX-XB=Y} {\displaystyle AX-XB=Y}. In: Bulletin of the London Mathematical Society. Band 29, Nr. 1, 1997, S. 1–21, doi:10.1112/S0024609396001828 . 
  • Sang-Gu Lee, Quoc-Phong Vu: Simultaneous solutions of Sylvester equations and idempotent matrices separating the joint spectrum. In: Linear Algebra and its Applications. Band 435, Nr. 9, November 2011, S. 2097–2109, doi:10.1016/j.laa.2010年09月03日4 . 
  • Jituan Zhou Ruirui Wang and Qiang Niu: A Preconditioned Iteration Method for Solving Sylvester Equations. 2012 (hindawi.com). 
Abgerufen von „https://de.wikipedia.org/w/index.php?title=Sylvester-Gleichung&oldid=211546711"