Verlustfunktion (Statistik)
Eine Verlustfunktion (engl. loss function) ist eine spezielle Funktion in der mathematischen Statistik und Teil eines statistischen Entscheidungsproblemes. Sie ordnet jeder Entscheidung in Form einer Punktschätzung, einer Bereichsschätzung oder eines Tests den Schaden zu, der durch eine vom wahren Parameter abweichende Entscheidung entsteht. Gemeinsam mit der Entscheidungsfunktion wird die Verlustfunktion zur Risikofunktion kombiniert, die den potentiellen Schaden bei Verwendung einer Entscheidungsfunktion angibt.
Definition
[Bearbeiten | Quelltext bearbeiten ]Gegeben sei ein statistisches Modell {\displaystyle (X,{\mathcal {A}},(P_{\vartheta })_{\vartheta \in \Theta })} und ein Entscheidungsraum {\displaystyle (\Omega ,\Sigma )}. Dann heißt eine Funktion {\displaystyle L:\Theta \times \Omega \to [0,+\infty ]} eine Verlustfunktion, wenn für jedes fixierte {\displaystyle \vartheta \in \Theta } die Funktion {\displaystyle L(\vartheta ,\cdot )} {\displaystyle \Sigma -{\mathcal {B}}([0,+\infty ])}-messbar ist. Das L steht dabei für loss, englisch für Verlust.
Die Verlustfunktion gibt den Verlust bei Vorliegen des Parameters {\displaystyle \vartheta } an, wenn man sich für {\displaystyle \omega \in \Omega } entscheidet.
Klassische Verlustfunktionen
[Bearbeiten | Quelltext bearbeiten ]Gegeben sei die Parameterfunktion {\displaystyle g} von der Parametermenge {\displaystyle \Theta } in die Entscheidungsmenge {\displaystyle \Omega }, also {\displaystyle g:\Theta \to \Omega } und eine Norm {\displaystyle \Vert \cdot \Vert } auf der Entscheidungsmenge. Meist ist {\displaystyle g(\vartheta )=\vartheta }.
Eine typische Verlustfunktion ist dann
- {\displaystyle L_{r}(\vartheta ,\omega ):=\Vert \omega -g(\vartheta )\Vert ^{r}}
für ein {\displaystyle r>0}.
Im Rahmen der Probabilistischen Klassifikation können Scoring rules als Verlustfunktion eingesetzt werden.
Laplace-Verlust
[Bearbeiten | Quelltext bearbeiten ]Ist {\displaystyle r=1}, also
- {\displaystyle L_{1}(\vartheta ,\omega ):=\Vert \omega -g(\vartheta )\Vert },
so spricht man vom Laplace-Verlust.
Bei Wahl des Laplace-Verlusts die L-Unverfälschtheit zur Median-Unverfälschtheit und die Risikofunktion zum Mittleren betraglichen Fehler.
Gauß-Verlust
[Bearbeiten | Quelltext bearbeiten ]Ist {\displaystyle r=2}, also
- {\displaystyle L_{2}(\vartheta ,\omega ):=\Vert \omega -g(\vartheta )\Vert ^{2}},
so spricht man vom Gauß-Verlust.
Wählt man in der Schätztheorie den Gauß-Verlust, so vereinfacht sich die L-Unverfälschtheit zur Erwartungstreue und die Risikofunktion zum mittleren quadratischen Fehler.
0-1-Verlust
[Bearbeiten | Quelltext bearbeiten ]Eine weitere wichtige Verlustfunktion ist der sogenannte 0-1-Verlust. Er ist definiert als
- {\displaystyle L_{\varepsilon }(\vartheta ,\omega ):={\begin{cases}1&{\text{ falls }}\Vert \omega -g(\vartheta )\Vert >\varepsilon \0円&{\text{ falls }}\Vert \omega -g(\vartheta )\Vert \leq \varepsilon \end{cases}}}
für ein {\displaystyle \varepsilon >0}. Er bestraft alle Entscheidungen, die nahe genug an der „richtigen" Entscheidung liegen, überhaupt nicht und alle, die einen gewissen Abstand zu ihr überschreiten, gleich stark. Im Rahmen von den mengenwertigen Bereichsschätzern wird der 0-1-Verlust dann auch definiert als
- {\displaystyle L(\vartheta ,\omega ):={\begin{cases}1&{\text{ falls }}g(\vartheta )\notin \omega \0円&{\text{ falls }}g(\vartheta )\in \omega \end{cases}}},
da die Entscheidungen {\displaystyle \omega } dann Mengen und keine einzelnen Werte mehr sind.
Neyman-Pearson-Verlustfunktion
[Bearbeiten | Quelltext bearbeiten ]Für statistische Tests verwendet man eine Abwandlung des 0-1-Verlustes, die sogenannten Neyman-Pearson-Verlustfunktion. Ist {\displaystyle \Theta =\Theta _{0}\cup \Theta _{1}} eine Zerlegung des Parameterraumes in Hypothese {\displaystyle \Theta _{0}} und Alternative {\displaystyle \Theta _{1}} sowie {\displaystyle a_{0}} die Entscheidung für die Hypothese und {\displaystyle a_{1}} die Entscheidung für die Alternative, so wird die Verlustfunktion definiert durch
- {\displaystyle L(\vartheta ,a_{0})={\begin{cases}0&{\text{ falls }}\vartheta \in \Theta _{0}\\L_{1}&{\text{ falls }}\vartheta \in \Theta _{1}\end{cases}}}
- {\displaystyle L(\vartheta ,a_{1})={\begin{cases}0&{\text{ falls }}\vartheta \in \Theta _{1}\\L_{0}&{\text{ falls }}\vartheta \in \Theta _{0}\end{cases}}}.
Dabei ist {\displaystyle L_{0},L_{1}>0}. {\displaystyle L_{0}} entspricht dann dem Verlust bei einem Fehler 1. Art, {\displaystyle L_{1}} bei einem Fehler 2. Art.
Siehe auch
[Bearbeiten | Quelltext bearbeiten ]Literatur
[Bearbeiten | Quelltext bearbeiten ]- Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3 .