Matrizenmultiplikation
Die Matrizenmultiplikation oder Matrixmultiplikation ist in der Mathematik eine multiplikative Verknüpfung von Matrizen. Um zwei Matrizen miteinander multiplizieren zu können, muss die Spaltenzahl der ersten Matrix mit der Zeilenzahl der zweiten Matrix übereinstimmen. Das Ergebnis einer Matrizenmultiplikation wird dann Matrizenprodukt, Matrixprodukt oder Produktmatrix genannt. Das Matrizenprodukt ist wieder eine Matrix, deren Einträge durch komponentenweise Multiplikation und Summation der Einträge der entsprechenden Zeile der ersten Matrix mit der entsprechenden Spalte der zweiten Matrix ermittelt werden.
Die Matrizenmultiplikation ist assoziativ und mit der Matrizenaddition distributiv. Sie ist jedoch nicht kommutativ, das heißt, die Reihenfolge der Matrizen darf bei der Produktbildung im Allgemeinen nicht vertauscht werden. Die Menge der quadratischen Matrizen mit Elementen aus einem Ring bildet zusammen mit der Matrizenaddition und der Matrizenmultiplikation den Ring der quadratischen Matrizen. Weiter bildet die Menge der regulären Matrizen über einem unitären Ring mit der Matrizenmultiplikation die allgemeine lineare Gruppe. Matrizen, die durch spezielle Multiplikationen mit regulären Matrizen ineinander überführt werden können, bilden darin Äquivalenzklassen.
Der Standardalgorithmus zur Multiplikation zweier quadratischer Matrizen weist eine kubische Laufzeit auf. Zwar lässt sich der asymptotische Aufwand mit Hilfe spezieller Algorithmen verringern, die Ermittlung optimaler oberer und unterer Komplexitätsschranken für die Matrizenmultiplikation ist jedoch noch Gegenstand aktueller Forschung.
Die Matrizenmultiplikation wird häufig in der linearen Algebra verwendet. So wird beispielsweise die Faktorisierung einer Matrix als Produkt von Matrizen mit speziellen Eigenschaften bei der numerischen Lösung linearer Gleichungssysteme oder Eigenwertprobleme eingesetzt. Weiterhin ist die Abbildungsmatrix der Hintereinanderausführung zweier linearer Abbildungen gerade das Matrizenprodukt der Abbildungsmatrizen dieser Abbildungen. Anwendungen der Matrizenmultiplikation finden sich unter anderem in der Informatik, der Physik und der Ökonomie.
Die Matrizenmultiplikation wurde erstmals von dem französischen Mathematiker Jacques Philippe Marie Binet im Jahr 1812 beschrieben.[1]
Definition
[Bearbeiten | Quelltext bearbeiten ]Die Matrizenmultiplikation ist eine binäre Verknüpfung auf der Menge der Matrizen über einem Ring {\displaystyle R} (oft der Körper der reellen Zahlen), also eine Abbildung
- {\displaystyle \cdot ~\colon R^{m\times n}\times R^{n\times p}\to R^{m\times p},\quad (A,B)\mapsto C=A\cdot B},
die zwei Matrizen {\displaystyle A=(a_{ij})} und {\displaystyle B=(b_{jk})} eine weitere Matrix {\displaystyle C=(c_{ik})} zuordnet. Die Matrizenmultiplikation ist dabei nur für den Fall definiert, dass die Spaltenzahl {\displaystyle n} der Matrix {\displaystyle A} mit der Zeilenzahl der Matrix {\displaystyle B} übereinstimmt. Die Zeilenzahl {\displaystyle m} der Ergebnismatrix {\displaystyle C} entspricht dann derjenigen der Matrix {\displaystyle A} und ihre Spaltenzahl {\displaystyle p} derjenigen der Matrix {\displaystyle B}. Jeder Eintrag {\displaystyle c_{ik}} des Matrizenprodukts berechnet sich dabei über
- {\displaystyle c_{ik}=\sum _{j=1}^{n}a_{ij}\cdot b_{jk}},
also durch komponentenweise Multiplikation der Einträge der {\displaystyle i}-ten Zeile von {\displaystyle A} mit der {\displaystyle k}-ten Spalte von {\displaystyle B} und durch Summation all dieser Produkte. Häufig wird bei der Notation einer Matrizenmultiplikation der Malpunkt weggelassen und man schreibt kurz {\displaystyle AB} statt {\displaystyle A\cdot B}. Soll die Reihenfolge der Faktoren betont werden, spricht man „A wird von links mit B multipliziert" für das Produkt {\displaystyle B\cdot A} und „A wird von rechts mit B multipliziert" für das Produkt {\displaystyle A\cdot B}.
Beispiel
[Bearbeiten | Quelltext bearbeiten ]Gegeben seien die beiden reellen Matrizen
- {\displaystyle A={\begin{pmatrix}3&2&1\1円&0&2\end{pmatrix}}\in \mathbb {R} ^{2\times 3}} und {\displaystyle B={\begin{pmatrix}1&2\0円&1\4円&0\end{pmatrix}}\in \mathbb {R} ^{3\times 2}}.
Da die Matrix {\displaystyle A} ebenso viele Spalten wie die Matrix {\displaystyle B} Zeilen besitzt, ist die Matrizenmultiplikation {\displaystyle A\cdot B} durchführbar. Nachdem {\displaystyle A} zwei Zeilen und {\displaystyle B} zwei Spalten hat, wird das Matrizenprodukt ebenfalls zwei Zeilen und Spalten aufweisen. Zur Berechnung des ersten Matrixelements der Ergebnismatrix werden die Produkte der entsprechenden Einträge der ersten Zeile von {\displaystyle A} und der ersten Spalte von {\displaystyle B} aufsummiert (die Sternchen stehen für noch nicht berechnete Elemente):
- {\displaystyle {\begin{pmatrix}\color {OliveGreen}3&\color {OliveGreen}2&\color {OliveGreen}1\1円&0&2\end{pmatrix}}\cdot {\begin{pmatrix}\color {BrickRed}1&2\\\color {BrickRed}0&1\\\color {BrickRed}4&0\end{pmatrix}}={\begin{pmatrix}{\color {OliveGreen}3}\cdot {\color {BrickRed}1}+{\color {OliveGreen}2}\cdot {\color {BrickRed}0}+{\color {OliveGreen}1}\cdot {\color {BrickRed}4}&\ast \\\ast &\ast \end{pmatrix}}={\begin{pmatrix}{\color {Blue}7}&\ast \\\ast &\ast \end{pmatrix}}}
Für das nächste Element der Ergebnismatrix in der ersten Zeile und zweiten Spalte wird entsprechend die erste Zeile von {\displaystyle A} und die zweite Spalte von {\displaystyle B} verwendet:
- {\displaystyle {\begin{pmatrix}\color {OliveGreen}3&\color {OliveGreen}2&\color {OliveGreen}1\1円&0&2\end{pmatrix}}\cdot {\begin{pmatrix}1&\color {BrickRed}2\0円&\color {BrickRed}1\4円&\color {BrickRed}0\end{pmatrix}}={\begin{pmatrix}7&{\color {OliveGreen}3}\cdot {\color {BrickRed}2}+{\color {OliveGreen}2}\cdot {\color {BrickRed}1}+{\color {OliveGreen}1}\cdot {\color {BrickRed}0}\\\ast &\ast \end{pmatrix}}={\begin{pmatrix}7&{\color {Blue}8}\\\ast &\ast \end{pmatrix}}}
Dieses Rechenschema setzt sich nun in der zweiten Zeile und ersten Spalte fort:
- {\displaystyle {\begin{pmatrix}3&2&1\\\color {OliveGreen}1&\color {OliveGreen}0&\color {OliveGreen}2\end{pmatrix}}\cdot {\begin{pmatrix}\color {BrickRed}1&2\\\color {BrickRed}0&1\\\color {BrickRed}4&0\end{pmatrix}}={\begin{pmatrix}7&8\\{\color {OliveGreen}1}\cdot {\color {BrickRed}1}+{\color {OliveGreen}0}\cdot {\color {BrickRed}0}+{\color {OliveGreen}2}\cdot {\color {BrickRed}4}&\ast \end{pmatrix}}={\begin{pmatrix}7&8\\{\color {Blue}9}&\ast \end{pmatrix}}}
Es wiederholt sich bei dem letzten Element in der zweiten Zeile und zweiten Spalte:
- {\displaystyle {\begin{pmatrix}3&2&1\\\color {OliveGreen}1&\color {OliveGreen}0&\color {OliveGreen}2\end{pmatrix}}\cdot {\begin{pmatrix}1&\color {BrickRed}2\0円&\color {BrickRed}1\4円&\color {BrickRed}0\end{pmatrix}}={\begin{pmatrix}7&8\9円&{\color {OliveGreen}1}\cdot {\color {BrickRed}2}+{\color {OliveGreen}0}\cdot {\color {BrickRed}1}+{\color {OliveGreen}2}\cdot {\color {BrickRed}0}\end{pmatrix}}={\begin{pmatrix}7&8\9円&{\color {Blue}2}\end{pmatrix}}}
Das Ergebnis ist das Matrizenprodukt {\displaystyle A\cdot B}. Eine optische Hilfestellung und Unterstützung zur Berechnung des Matrizenprodukts bietet das falksche Schema.[2]
Spezialfälle
[Bearbeiten | Quelltext bearbeiten ]Zeilenvektor mal Spaltenvektor
[Bearbeiten | Quelltext bearbeiten ]Besteht die erste Matrix aus nur einer Zeile und die zweite Matrix aus nur einer Spalte, so ergibt das Matrizenprodukt eine {\displaystyle (1\times 1)}-Matrix. Interpretiert man eine einzeilige Matrix als Zeilenvektor {\displaystyle x^{\mathrm {T} }} und eine einspaltige Matrix als Spaltenvektor {\displaystyle y}, so erhält man im Fall reeller Vektoren das Standardskalarprodukt
- {\displaystyle \langle x,y\rangle =x^{\mathrm {T} }\cdot y}
zweier Vektoren, wobei {\displaystyle x^{\mathrm {T} }} den zu {\displaystyle x} transponierten Vektor darstellt, beide Vektoren gleich lang sein müssen und das Ergebnis dann eine reelle Zahl ist. Jeder Eintrag eines Matrizenprodukts {\displaystyle A\cdot B} kann somit als Skalarprodukt eines Zeilenvektors der Matrix {\displaystyle A} mit einem Spaltenvektor der Matrix {\displaystyle B} angesehen werden.
Spaltenvektor mal Zeilenvektor
[Bearbeiten | Quelltext bearbeiten ]Besteht umgekehrt die erste Matrix aus nur einer Spalte der Länge {\displaystyle m} und die zweite Matrix aus nur einer Zeile der Länge {\displaystyle n}, so ergibt das Matrizenprodukt eine {\displaystyle (m\times n)}-Matrix. Wird wieder eine einspaltige Matrix als Spaltenvektor {\displaystyle x} und eine einzeilige Matrix als Zeilenvektor {\displaystyle y^{\mathrm {T} }} interpretiert, so wird das entstehende Produkt von Vektoren als dyadisches Produkt
- {\displaystyle x\otimes y=x\cdot y^{\mathrm {T} }}
bezeichnet. Jeder Eintrag {\displaystyle c_{ij}} der resultierenden Matrix ist dabei das Produkt eines Elements {\displaystyle x_{i}} des ersten Vektors mit einem Element {\displaystyle y_{j}} des zweiten Vektors. Das Matrizenprodukt {\displaystyle A\cdot B} kann so als Summe dyadischer Produkte der Spaltenvektoren von {\displaystyle A} mit den jeweiligen Zeilenvektoren von {\displaystyle B} geschrieben werden.
Matrix mal Vektor
[Bearbeiten | Quelltext bearbeiten ]Ein wichtiger Spezialfall einer Matrizenmultiplikation entsteht, wenn die zweite Matrix aus nur einer Spalte besteht. Das Ergebnis der Matrizenmultiplikation ist dann ebenfalls eine einspaltige Matrix. Wird wieder eine einspaltige Matrix als Spaltenvektor interpretiert, so erhält man das Matrix-Vektor-Produkt
- {\displaystyle A\cdot x=y},
wobei {\displaystyle A\in R^{m\times n}}, {\displaystyle x\in R^{n}} und {\displaystyle y\in R^{m}} sind. Das Matrix-Vektor-Produkt wird beispielsweise in der Matrixschreibweise linearer Gleichungssysteme verwendet.
Eine alternative Darstellung der Matrixmultiplikation ergibt sich durch Umschreiben der Definition. Wir schreiben {\textstyle A=(a_{1}|\dots |a_{n})\in R^{m\times n}} sodass die {\textstyle a_{j}} die Spalten der Matrix {\displaystyle A} darstellen (unten verdeutlicht durch {\displaystyle {\vec {a}}_{j}}). Ist nun {\textstyle x\in R^{n}} dann kann man das Matrix-Vektor-Produkt auch wie folgt lesen:
{\displaystyle A\cdot x=({\vec {a}}_{1}|\dots |{\vec {a}}_{n})\cdot {\vec {x}}=\sum _{j=1}^{n}{\vec {a}}_{j}\cdot x_{j}={\vec {a}}_{1}\cdot x_{1}+\dots +{\vec {a}}_{n}\cdot x_{n}}
Das Matrix-Vektor-Produkt ist also eine Linearkombination der Spalten von {\displaystyle A}. Diese Beobachtung lässt sich auch auf ein allgemeines Matrix-Matrix-Produkt übertragen. Ist man am Bild der von der Matrix induzierten linearen Abbildung interessiert, ist diese Darstellung meist intuitiver für weitere Argumentation.
Vektor mal Matrix
[Bearbeiten | Quelltext bearbeiten ]Besteht umgekehrt die erste Matrix aus nur einer Zeile, so ergibt das Vektor-Matrix-Produkt
- {\displaystyle x^{\mathrm {T} }\cdot A=y^{\mathrm {T} }}
aus einem Zeilenvektor {\displaystyle x^{\mathrm {T} }\in R^{m}} und einer Matrix {\displaystyle A\in R^{m\times n}} wieder einen Zeilenvektor {\displaystyle y^{\mathrm {T} }\in R^{n}}. Dieses lässt sich als eine Linearkombination der Zeilen von {\displaystyle A} interpretieren.
Quadrat einer Matrix
[Bearbeiten | Quelltext bearbeiten ]Durch Multiplikation einer quadratischen Matrix {\displaystyle A\in R^{n\times n}} mit sich selbst ergibt sich wieder eine Matrix gleicher Größe, die als das Quadrat der Matrix bezeichnet wird, das heißt:
- {\displaystyle A^{2}=A\cdot A}
Entsprechend dazu wird mit {\displaystyle A^{n}} die Matrixpotenz, also das {\displaystyle n}-fache Produkt einer Matrix mit sich selbst, bezeichnet. Matrixpotenzen werden beispielsweise zur Definition des Matrixexponentials und des Matrixlogarithmus verwendet. Umgekehrt heißt eine quadratische Matrix {\displaystyle A^{1/2}}, für die
- {\displaystyle A=A^{1/2}\cdot A^{1/2}}
gilt, Quadratwurzel der Matrix {\displaystyle A}. Eine Matrix kann mehrere, sogar unendlich viele, Quadratwurzeln besitzen. Analog wird eine Matrix, deren {\displaystyle n}-te Potenz die Matrix {\displaystyle A} ergibt, als {\displaystyle n}-te Wurzel {\displaystyle A^{1/n}} dieser Matrix bezeichnet.
Blockmatrizen
[Bearbeiten | Quelltext bearbeiten ]Weisen die beiden Matrizen {\displaystyle A} und {\displaystyle B} eine Blockstruktur auf, wobei die Blockbreiten der ersten Matrix mit den Blockhöhen der zweiten Matrix übereinstimmen müssen, so lässt sich auch das Matrizenprodukt {\displaystyle A\cdot B} blockweise notieren. Die Ergebnismatrix besitzt dann die Blockhöhen der ersten und die Blockbreiten der zweiten Matrix. Im Fall zweier Matrizen mit je zwei mal zwei Blöcken ergibt sich beispielsweise
- {\displaystyle {\begin{pmatrix}A_{11}&A_{12}\\A_{21}&A_{22}\end{pmatrix}}\cdot {\begin{pmatrix}B_{11}&B_{12}\\B_{21}&B_{22}\end{pmatrix}}={\begin{pmatrix}A_{11}B_{11}+A_{12}B_{21}&A_{11}B_{12}+A_{12}B_{22}\\A_{21}B_{11}+A_{22}B_{21}&A_{21}B_{12}+A_{22}B_{22}\end{pmatrix}}},
womit die Ergebnismatrix auch zwei mal zwei Blöcke besitzt.
Eigenschaften
[Bearbeiten | Quelltext bearbeiten ]Assoziativität
[Bearbeiten | Quelltext bearbeiten ]Die Matrizenmultiplikation ist assoziativ, das heißt, für Matrizen {\displaystyle A\in R^{m\times n}}, {\displaystyle B\in R^{n\times p}} und {\displaystyle C\in R^{p\times q}} gilt:
- {\displaystyle A\cdot (B\cdot C)=(A\cdot B)\cdot C}
Bei der Multiplikation mehrerer Matrizen ist es also unerheblich, in welcher Reihenfolge die Teilprodukte gebildet werden, solange die Gesamtreihung nicht verändert wird. Für den Eintrag an der Stelle {\displaystyle (i,l)} des resultierenden Matrizenprodukts gilt nämlich:
- {\displaystyle \sum _{j=1}^{n}a_{ij}\cdot \left(\sum _{k=1}^{p}b_{jk}\cdot c_{kl}\right)=\sum _{j=1}^{n}\sum _{k=1}^{p}a_{ij}\cdot b_{jk}\cdot c_{kl}=\sum _{k=1}^{p}\sum _{j=1}^{n}a_{ij}\cdot b_{jk}\cdot c_{kl}=\sum _{k=1}^{p}\left(\sum _{j=1}^{n}a_{ij}\cdot b_{jk}\right)\cdot c_{kl}}
Die Matrizenmultiplikation ist auch verträglich mit der Multiplikation mit Skalaren {\displaystyle a\in R}, das heißt:
- {\displaystyle a,円(B\cdot C)=(a,円B)\cdot C=B\cdot (a,円C)}
Distributivität
[Bearbeiten | Quelltext bearbeiten ]Betrachtet man neben der Matrizenmultiplikation auch noch die komponentenweise Matrizenaddition {\displaystyle A+B} zweier Matrizen {\displaystyle A,B\in R^{l\times m}}, dann sind auch die Distributivgesetze erfüllt. Das heißt, für alle Matrizen {\displaystyle C\in R^{m\times n}} gilt
- {\displaystyle (A+B)\cdot C=A\cdot C+B\cdot C}
und für alle Matrizen {\displaystyle C\in R^{n\times l}} entsprechend
- {\displaystyle C\cdot (A+B)=C\cdot A+C\cdot B}.
Die Distributivgesetze folgen direkt aus der Distributivität der Addition mit der Multiplikation im Ring {\displaystyle R} über
- {\displaystyle \sum _{j=1}^{m}\left(a_{ij}+b_{ij}\right)\cdot c_{jk}=\sum _{j=1}^{m}\left(a_{ij}\cdot c_{jk}+b_{ij}\cdot c_{jk}\right)=\sum _{j=1}^{m}a_{ij}\cdot c_{jk}+\sum _{j=1}^{m}b_{ij}\cdot c_{jk}}
für das erste Distributivgesetz und über eine analoge Umformung auch für das zweite Distributivgesetz.
Nichtkommutativität
[Bearbeiten | Quelltext bearbeiten ]Das Kommutativgesetz hingegen gilt für die Matrizenmultiplikation nicht, das heißt, für {\displaystyle A\in R^{m\times n}} und {\displaystyle B\in R^{n\times m}} ist im Allgemeinen
- {\displaystyle A\cdot B\neq B\cdot A}.
Für die beiden Matrizenprodukte gilt nämlich {\displaystyle A\cdot B\in R^{m\times m}} und {\displaystyle B\cdot A\in R^{n\times n}}, womit sie für {\displaystyle m\neq n} schon von den Dimensionen her nicht übereinstimmen können. Aber selbst, wenn {\displaystyle A} und {\displaystyle B} quadratisch sind, müssen die beiden Matrizenprodukte nicht gleich sein, wie das Gegenbeispiel
- {\displaystyle {\begin{pmatrix}0&2\0円&0\end{pmatrix}}\cdot {\begin{pmatrix}0&0\2円&0\end{pmatrix}}={\begin{pmatrix}4&0\0円&0\end{pmatrix}}\neq {\begin{pmatrix}0&0\0円&4\end{pmatrix}}={\begin{pmatrix}0&0\2円&0\end{pmatrix}}\cdot {\begin{pmatrix}0&2\0円&0\end{pmatrix}}}
zeigt. Die Nichtkommutativität der Matrizenmultiplikation gilt demnach sogar, wenn die Multiplikation im Ring {\displaystyle R} kommutativ sein sollte, wie es beispielsweise bei Zahlen der Fall ist. Für spezielle Matrizen kann die Matrizenmultiplikation dennoch kommutativ sein, siehe die nachfolgenden Abschnitte.
Weitere Rechenregeln
[Bearbeiten | Quelltext bearbeiten ]Für die Transponierte eines Matrizenprodukts gilt:
- {\displaystyle (A\cdot B)^{\mathrm {T} }=B^{\mathrm {T} }\cdot A^{\mathrm {T} }}.
Die Reihenfolge bei der Multiplikation wird durch die Transposition also vertauscht. Für die Adjungierte des Produkts komplexer Matrizen gilt entsprechend
- {\displaystyle (A\cdot B)^{H}=B^{H}\cdot A^{H}}.
Die Spur des Produkts zweier Matrizen {\displaystyle A\in R^{m\times n}} und {\displaystyle B\in R^{n\times m}} ist hingegen unabhängig von der Reihenfolge:
- {\displaystyle \operatorname {spur} (A\cdot B)=\operatorname {spur} (B\cdot A)}
Mit dem Determinantenproduktsatz gilt auch für die Determinante des Produkts zweier quadratischer Matrizen über einem kommutativen Ring:
- {\displaystyle \operatorname {det} (A\cdot B)=\operatorname {det} (A)\cdot \operatorname {det} (B)=\operatorname {det} (B)\cdot \operatorname {det} (A)=\operatorname {det} (B\cdot A)}
Die Determinante des Produkts zweier nicht notwendigerweise quadratischer Matrizen kann mit dem Satz von Binet-Cauchy berechnet werden.
Algebraische Strukturen
[Bearbeiten | Quelltext bearbeiten ]Ring der quadratischen Matrizen
[Bearbeiten | Quelltext bearbeiten ]Die Menge der quadratischen Matrizen fester Größe bildet zusammen mit der Matrizenaddition und der Matrizenmultiplikation einen nichtkommutativen Ring, den Matrizenring {\displaystyle (R^{n\times n},+,\cdot )}. Das Nullelement dieses Rings ist die Nullmatrix {\displaystyle 0\in R^{n\times n}}. Ist {\displaystyle R} ein unitärer Ring, dann ist auch der zugehörige Matrizenring unitär mit der Einheitsmatrix {\displaystyle I\in R^{n\times n}} als Einselement, wobei für alle Matrizen {\displaystyle A\in R^{n\times n}}
- {\displaystyle A\cdot I=I\cdot A=A}
gilt. Die Nullmatrix fungiert im Matrizenring in diesem Fall als absorbierendes Element, das heißt, für alle Matrizen {\displaystyle A\in R^{n\times n}} gilt dann:
- {\displaystyle A\cdot 0=0\cdot A=0}
Der Ring der quadratischen Matrizen ist jedoch nicht nullteilerfrei; aus {\displaystyle A\cdot B=0} folgt nicht notwendigerweise {\displaystyle A=0} oder {\displaystyle B=0}. Ein Beispiel wären zwei quadratische Matrizen {\displaystyle A,B} mit je genau einem Eintrag ungleich Null an der gleichen Diagonalaußenstelle. Entsprechend darf bei Matrixgleichungen auch nicht gekürzt werden, denn aus {\displaystyle A\cdot B=A\cdot C} folgt nicht notwendigerweise {\displaystyle B=C}. Die Menge der quadratischen Matrizen über einem Körper bildet mit der Matrizenaddition, der Skalarmultiplikation und der Matrizenmultiplikation eine assoziative Algebra.
Gruppe der regulären Matrizen
[Bearbeiten | Quelltext bearbeiten ]Die Menge der regulären Matrizen {\displaystyle A\in R^{n\times n}} über einem unitären Ring {\displaystyle R} bildet mit der Matrizenmultiplikation die allgemeine lineare Gruppe {\displaystyle \operatorname {GL} (n,R)}. Die zur Matrix {\displaystyle A} inverse Matrix ist dann eindeutig über
- {\displaystyle A\cdot A^{-1}=A^{-1}\cdot A=I}
definiert. Für die Inverse des Produkts zweier regulärer Matrizen gilt dann:
- {\displaystyle (A\cdot B)^{-1}=B^{-1}\cdot A^{-1}}
Durch die Invertierung wird die Reihenfolge bei der Multiplikation demnach ebenfalls vertauscht. Ist {\displaystyle A} regulär, dann gilt auch die Kürzungsregel, das heißt aus {\displaystyle A\cdot B=A\cdot C} oder {\displaystyle B\cdot A=C\cdot A} folgt dann {\displaystyle B=C}.
Gruppen der orthogonalen und unitären Matrizen
[Bearbeiten | Quelltext bearbeiten ]Eine reelle quadratische Matrix {\displaystyle A\in \mathbb {R} ^{n\times n}} heißt orthogonal, wenn
- {\displaystyle A\cdot A^{\mathrm {T} }=A^{\mathrm {T} }\cdot A=I}
gilt. Die orthogonalen Matrizen bilden mit der Matrizenmultiplikation die orthogonale Gruppe {\displaystyle \operatorname {O} (n)}, eine Untergruppe der allgemeinen linearen Gruppe {\displaystyle \operatorname {GL} (n,\mathbb {R} )}. Entsprechend dazu heißt eine komplexe quadratische Matrix {\displaystyle A\in \mathbb {C} ^{n\times n}} unitär, wenn
- {\displaystyle A\cdot A^{H}=A^{H}\cdot A=I}
gilt. Die unitären Matrizen bilden mit der Matrizenmultiplikation die unitäre Gruppe {\displaystyle \operatorname {U} (n)}, eine Untergruppe der allgemeinen linearen Gruppe {\displaystyle \operatorname {GL} (n,\mathbb {C} )}.
Äquivalenzklassen von Matrizen
[Bearbeiten | Quelltext bearbeiten ]Mit Hilfe der Matrizenmultiplikation werden Äquivalenzrelationen zwischen Matrizen über einem Körper definiert. Wichtige Äquivalenzrelationen sind:
- Äquivalenz: Zwei Matrizen {\displaystyle A} und {\displaystyle B} heißen äquivalent, wenn es zwei reguläre Matrizen {\displaystyle C} und {\displaystyle D} gibt, sodass {\displaystyle B=C^{-1}\cdot A\cdot D} gilt.
- Ähnlichkeit: Zwei quadratische Matrizen {\displaystyle A} und {\displaystyle B} heißen ähnlich, wenn es eine reguläre Matrix {\displaystyle C} gibt, sodass {\displaystyle B=C^{-1}\cdot A\cdot C} gilt.
- Kongruenz: Zwei quadratische Matrizen {\displaystyle A} und {\displaystyle B} heißen kongruent, wenn es eine reguläre Matrix {\displaystyle C} gibt, sodass {\displaystyle B=C^{\mathrm {T} }\cdot A\cdot C} gilt.
Matrizen, die durch solche Multiplikationen mit regulären Matrizen ineinander überführt werden können, bilden demnach Äquivalenzklassen.
Algorithmen
[Bearbeiten | Quelltext bearbeiten ]Standardalgorithmus
[Bearbeiten | Quelltext bearbeiten ]In Pseudocode kann die Matrizenmultiplikation wie folgt implementiert werden:
functionmatmult(A,B,l,m,n) C=zeroes(l,n)//ErgebnismatrixCmitNulleninitialisieren fori=1tol//SchleifeüberdieZeilenvonC fork=1ton//SchleifeüberdieSpaltenvonC forj=1tom//SchleifeüberdieSpaltenvonA/ZeilenvonB C(i,k)=C(i,k)+A(i,j)*B(j,k)//BildungderProduktsumme end end end returnC
Die Reihenfolge der drei For-Schleifen kann dabei beliebig vertauscht werden, ohne das Ergebnis der Berechnung zu verändern. Da die drei Schleifen unabhängig voneinander sind, ist die Anzahl der benötigten Operationen von der Ordnung
- {\displaystyle {\mathcal {O}}(l\cdot m\cdot n)}.
Die Zeitkomplexität des Algorithmus ist demnach für quadratische Matrizen {\displaystyle (l=m=n)} kubisch, also von der Ordnung
- {\displaystyle {\mathcal {O}}(n^{3})}.
Bei der Matrix-Kettenmultiplikation, also der Multiplikation von drei oder mehr nichtquadratischen Matrizen, kann durch eine geschickte Wahl der Reihenfolge die Gesamtzahl arithmetischer Operationen minimiert werden.
Algorithmen mit besserer Komplexität
[Bearbeiten | Quelltext bearbeiten ]Asymptotisch effizienter lassen sich zwei quadratische Matrizen mit dem Strassen-Algorithmus multiplizieren. Hierbei wird die Anzahl der Multiplikationen, die zur Multiplikation zweier {\displaystyle (2\times 2)}-Matrizen benötigt werden, durch geschicktes Zusammenfassen von acht auf sieben reduziert, was auf Kosten zusätzlicher Additionen geschieht. Wendet man dieses Verfahren rekursiv an, ergibt sich eine Komplexitätsordnung von
- {\displaystyle {\mathcal {O}}\left(n^{\log _{2}7}\right)\approx {\mathcal {O}}\left(n^{2{,}807}\right)}.
Allerdings lohnt sich der Strassen-Algorithmus aufgrund der in der Landau-Notation versteckten Konstanten nur für sehr große Matrizen.[3] Der Algorithmus mit der derzeit besten Komplexität ist eine Verbesserung des Coppersmith–Winograd-Algorithmus mit einer Laufzeit der näherungsweisen Ordnung[4]
- {\displaystyle {\mathcal {O}}\left(n^{2{,}3727}\right)}.
Für den praktischen Einsatz ist dieser Algorithmus jedoch nicht geeignet. Eine untere Schranke für die Komplexität der Matrizenmultiplikation ist
- {\displaystyle \Omega \left(n^{2}\right)},
da jedes der {\displaystyle n^{2}} Elemente der Ausgabematrix erzeugt werden muss. Die Ermittlung optimaler unterer und oberer Komplexitätsschranken für die Matrizenmultiplikation ist Gegenstand aktueller Forschung.
Ist eine der beiden Matrizen konstant, so kann lineare Berechnungscodierung verwendet werden.[5] Ihre asymptotische Komplexität ist
- {\displaystyle {\mathcal {O}}\left(n^{3}/\log n\right)},
jedoch sind die versteckten Konstanten relativ klein, so dass bereits für Matrizen mit mehr als 20 bis 30 Zeilen oder Spalten eine Verbesserung gegenüber dem Standardverfahren erreicht werden kann.
Programmierung
[Bearbeiten | Quelltext bearbeiten ]Das Matrizenprodukt ist in Programmiersystemen auf unterschiedliche Weise integriert, wobei insbesondere Verwechselungsgefahr mit dem komponentenweisen Hadamard-Produkt besteht. In den numerischen Softwarepaketen MATLAB und GNU Octave wird die Matrizenmultiplikation durch den Sternchen-Operator *
realisiert, sodass A * B
das Matrizenprodukt ergibt.[6] In anderen Programmierumgebungen, wie Fortran, Mathematica, R oder SciPy, wird jedoch durch A * B
das Hadamard-Produkt berechnet. Die Matrixmultiplikation wird dann durch Funktionsaufrufe, wie matmul(A,B)
in Fortran oder dot(A,B)
in SciPy, oder durch eigene Operatoren für die Matrixmultiplikation, wie .
in Mathematica oder %*%
in R, umgesetzt.[7]
Die objektorientierte Modellierung ermöglicht es in C++ die arithmetischen und funktionalen Standardoperatoren auch für Matrizenoperationen zu überladen und durch entsprechende Klassenmethoden ihre typische Verwendung auf Tensoren und Matrizen höherer Stufe zu übertragen.[8]
Verwendung
[Bearbeiten | Quelltext bearbeiten ]Faktorisierungen
[Bearbeiten | Quelltext bearbeiten ]In gewisser Weise ist die Umkehrung der Matrizenmultiplikation die Faktorisierung einer gegebenen Matrix {\displaystyle A} als Produkt zweier Matrizen {\displaystyle B} und {\displaystyle C}, das heißt die Ermittlung einer Darstellung der Form
- {\displaystyle A=B\cdot C}.
Eine solche Faktorisierung ist nicht eindeutig, daher werden an die Matrizen {\displaystyle B} und {\displaystyle C} zusätzliche Anforderungen gestellt, wie Orthogonalität, Symmetrie oder eine bestimmte Besetzungsstruktur. Wichtige Zerlegungen reeller oder komplexer Matrizen dieser Art sind:
- die LR-Zerlegung einer quadratischen Matrix in eine untere und eine obere Dreiecksmatrix
- die Cholesky-Zerlegung, eine spezielle LR-Zerlegung einer symmetrisch positiv definiten Matrix
- die ILU-Zerlegung, eine Art unvollständige LR-Zerlegung speziell für dünnbesetzte Matrizen
- die QR-Zerlegung einer Matrix in eine orthogonale Matrix und eine obere Dreiecksmatrix
- die Schur-Zerlegung einer quadratischen Matrix in drei Matrizen: eine unitäre Matrix, eine obere Dreiecksmatrix und die Inverse der ersten Matrix
- die Singulärwertzerlegung einer Matrix in drei Matrizen: eine unitäre Matrix, eine Diagonalmatrix bestehend aus den Singulärwerten und die Adjungierte einer unitären Matrix
Solche Zerlegungen von Matrizen werden häufig in der numerischen linearen Algebra etwa zur Lösung linearer Gleichungssysteme oder Eigenwertprobleme eingesetzt. So lassen sich beispielsweise die Zeilen- und Spaltenumformungen im gaußschen Eliminationsverfahren als Produkt von Elementarmatrizen angeben.
Lineare Abbildungen
[Bearbeiten | Quelltext bearbeiten ]Sind allgemein {\displaystyle V} und {\displaystyle W} zwei endlichdimensionale Vektorräume über dem gleichen Körper, dann kann jede lineare Abbildung {\displaystyle f\colon V\to W} nach Wahl je einer Basis in den beiden Vektorräumen über ihre Abbildungsmatrix {\displaystyle M_{f}} dargestellt werden. Das Bild {\displaystyle y} eines Vektors {\displaystyle x} unter der Abbildung {\displaystyle f} in den jeweiligen Basen kann dann über das Matrix-Vektor-Produkt
- {\displaystyle y=M_{f}\cdot x}
ermittelt werden. In der Geometrie lässt sich beispielsweise auf diese Weise jede Drehung um den Ursprung und jede Spiegelung an einer Ursprungsebene durch ein solches Matrix-Vektor-Produkt ausführen. Ist nun {\displaystyle U} ein weiterer Vektorraum und {\displaystyle g\colon W\to U} eine weitere lineare Abbildung, dann gilt für die Abbildungsmatrix der Hintereinanderausführung {\displaystyle g\circ f} dieser beiden Abbildungen:
- {\displaystyle M_{g\circ f}=M_{g}\cdot M_{f}}
Die Abbildungsmatrix einer Hintereinanderausführung zweier linearer Abbildungen ist also das Matrizenprodukt der beiden zugehörigen Abbildungsmatrizen. Auf diese Weise lässt sich beispielsweise jede Drehspiegelung als Produkt einer Drehmatrix und einer Spiegelungsmatrix darstellen. Alternativ kann eine lineare Abbildung auch durch Vektor-Matrix-Multiplikation eines Zeilenvektors mit der transponierten Abbildungsmatrix durchgeführt werden. Die Hintereinanderausführung von Abbildungen entspricht dann einer Matrizenmultiplikation von rechts statt von links.
Anwendungen
[Bearbeiten | Quelltext bearbeiten ]Anwendungen der Matrizenmultiplikation finden sich unter anderem:
- in der Analysis bei der Komposition differenzierbarer Funktionen mehrerer Variablen nach der mehrdimensionalen Kettenregel,
- in der Computergrafik bei der Durchführung von Koordinatentransformationen in einer Grafikpipeline,
- in der Optik bei der Berechnung von Lichtstrahlen durch optische Bauelemente mittels der Matrizenoptik,
- in der Ökonomie bei der Input-Output-Analyse einer Produktion sowie bei der innerbetrieblichen Materialverflechtung,[9]
- in der Robotik bei der Beschreibung kinematischer Ketten mittels der Denavit-Hartenberg-Transformation,
- in der Elektrotechnik bei der Zweitortheorie elektrischer Netzwerke,
- in der Quantenmechanik im Rahmen der Matrizenmechanik, hier auch für „unendlich große" Matrizen.
- als Benchmark (Leistungstest), insbesondere für Multiprozessorsysteme
Verallgemeinerungen
[Bearbeiten | Quelltext bearbeiten ]Matrizen über Halbringen
[Bearbeiten | Quelltext bearbeiten ]Allgemeiner können Matrizen über einem Halbring {\displaystyle R} betrachtet werden, wobei die wichtigsten Eigenschaften der Matrizenmultiplikation, wie Assoziativität und Distributivität, erhalten bleiben. Entsprechend bildet dann {\displaystyle (R^{n\times n},+,\cdot )} den Halbring der quadratischen Matrizen über {\displaystyle R}. Die Nullmatrix ist im Matrizenhalbring wieder das Nullelement und auch absorbierend, wenn das Nullelement im zugrunde liegenden Halbring absorbierend ist. Ist der zugrunde liegende Halbring unitär, dann bildet auch die Einheitsmatrix wieder das Einselement im Matrizenhalbring.
Wichtige Beispiele für Halbringe sind distributive Verbände, wie beispielsweise boolesche Algebren. Fasst man die Elemente eines solchen Verbands als Wahrheitswerte auf, so sind Matrizen über einem Verband zweistellige Relationen. Die Matrizenmultiplikation entspricht in diesem Fall der Komposition von Relationen.
Matrizenkategorien
[Bearbeiten | Quelltext bearbeiten ]Algebraische Strukturen wie Ringe und Gruppen, deren Elemente Matrizen sind, sind auf quadratische Matrizen fester Größe beschränkt. Die Matrizenmultiplikation ist dagegen nicht derartig eingeschränkt. Eine Möglichkeit, diese Einschränkung aufzuheben, ist es, stattdessen Kategorien von Matrizen, jeweils über einem festen unitären Ring oder Halbring, zu betrachten. Die Objekte sind natürliche Zahlen, und ein Pfeil {\displaystyle n\to m} ist eine {\displaystyle (n\times m)}-Matrix. Die Komposition von Pfeilen ist durch die Matrizenmultiplikation gegeben. Sollen Matrizen auch addiert werden können, handelt es sich um eine präadditive Kategorie. Wenn Matrizen aller endlichen Größen vorkommen, erhält man eine abelsche Kategorie. Wenn nur invertierbare Matrizen vorkommen, handelt es sich um ein Gruppoid. In diesem Fall kann es interessant sein, anstelle der natürlichen Zahlen beliebige endliche Mengen als Objekte zuzulassen.
Verwandte Produkte
[Bearbeiten | Quelltext bearbeiten ]Neben dem Matrizenprodukt existieren noch eine Reihe weiterer Produkte von Matrizen:
- Das Hadamard-Produkt zweier Matrizen ergibt eine Matrix, deren Einträge einfach durch komponentenweise Multiplikation der Einträge der Ausgangsmatrizen ermittelt werden. Im Vergleich zum Matrizenprodukt ist es jedoch weit weniger bedeutend.
- Das Kronecker-Produkt zweier Matrizen ergibt eine große Matrix, die durch Betrachtung aller möglichen Produkte von Einträgen der beiden Ausgangsmatrizen entsteht.
- Das Frobenius-Skalarprodukt zweier reeller oder komplexer Matrizen ergibt eine Zahl, die sich durch komponentenweise Multiplikation der Einträge der Ausgangsmatrizen und nachfolgende Summation all dieser Produkte berechnet. Im komplexen Fall wird dabei immer ein Eintrag komplex konjugiert.
Literatur
[Bearbeiten | Quelltext bearbeiten ]- Tilo Arens, Frank Hettlich, Christian Karpfinger, Ulrich Kockelkorn, Klaus Lichtenegger, Hellmuth Stachel: Mathematik. 2. Auflage. Spektrum Akademischer Verlag, 2011, ISBN 3-8274-2347-3.
- Michael Artin: Algebra. Springer, 1998, ISBN 3-7643-5938-2.
- Gene Golub, Charles van Loan: Matrix Computations. JHU Press, 2012, ISBN 1-4214-0794-9.
- Charles Leiserson, Ronald L. Rivest, Clifford Stein: Algorithmen – eine Einführung. Oldenbourg, 2010, ISBN 3-486-59002-2.
Weblinks
[Bearbeiten | Quelltext bearbeiten ]- Eric W. Weisstein: Matrix Multiplication. In: MathWorld (englisch).
- djao: Matrix operations. In: PlanetMath. (englisch)
- Matrixmultiplikation Online Rechner
Einzelnachweise
[Bearbeiten | Quelltext bearbeiten ]- ↑ John J. O’Connor, Edmund F. Robertson: Jacques Philippe Marie Binet. In: MacTutor History of Mathematics archive (englisch).
- ↑ Horst Stöcker: Taschenbuch mathematischer Formeln und moderner Verfahren. Verlag Harri Deutsch, Frankfurt am Main 2007, ISBN 978-3-8171-1811-3, S. 371.
- ↑ Paolo D’Alberto, Alexandru Nicolau: Using recursion to boost ATLAS’s performance. In: High-Performance Computing (= Lecture Notes in Computer Science). Volume 4759. Springer, 2010, S. 142–151, doi:10.1007/978-3-540-77704-5_12 .
- ↑ Virginia Vassilevska Williams: Multiplying matrices faster than coppersmith-winograd. In: STOC ’12 Proceedings of the 44th symposium on Theory of Computing. ACM, 2012, S. 887–898, doi:10.1145/2213977.2214056 .
- ↑ Ralf R. Müller, Bernhard Gäde, Ali Bereyhi: Linear computation coding. 2021, arxiv:2102.00398 (PDF [abgerufen am 16. Dezember 2021]).
- ↑ Christoph W. Überhuber, Stefan Katzenbeisser, Dirk Praetorius: MATLAB 7: Eine Einführung. Springer, 2007, S. 81.
- ↑ NumPy for Matlab Users. SciPy.org, 22. Februar 2014, abgerufen am 3. Januar 2015.
- ↑ Udo F. Meißner: Tensorkalkül mit objektorientierten Matrizen für Numerische Methoden in Mechanik und Ingenieurwissenschaften - Eine Grundlage für Tensor-/Matrix-Algorithmen der Finite-Elemente-Methode. Springer Vieweg, 2022, doi:10.1007/978-3-658-39881-1 .
- ↑ Christoph Mayer,David Francas,Carsten Weber: Lineare Algebra für Wirtschaftswissenschaftler. 3. Auflage. GBV Fachverlage, Wiesbaden 2007, ISBN 978-3-8349-9529-2, S. 75 f.