„Breitensuche" – Versionsunterschied
Version vom 27. September 2020, 13:31 Uhr
Breitensuche (englisch breadth-first search, BFS) ist ein Verfahren in der Informatik zum Durchsuchen bzw. Durchlaufen der Knoten eines Graphen. Sie zählt zu den uninformierten Suchalgorithmen. Im Gegensatz zur Tiefensuche werden zunächst alle Knoten beschritten, die vom Ausgangsknoten direkt erreichbar sind. Erst danach werden Folgeknoten beschritten (siehe Abbildung).
Arbeitsweise
Die Breitensuche ist eine uninformierte Suche, welche durch Expansion der einzelnen Level der Graphen ausgehend vom Startknoten den Graph in die Breite nach einem Element durchsucht.
Zuerst wird ein Startknoten {\displaystyle u} ausgewählt. Von diesem Knoten aus wird nun jede Kante {\displaystyle (u,v)} betrachtet und getestet, ob der gegenüberliegende Knoten {\displaystyle v} schon entdeckt wurde bzw. das gesuchte Element ist. Ist dies noch nicht der Fall, so wird der entsprechende Knoten in einer Warteschlange gespeichert und im nächsten Schritt bearbeitet. Hierbei ist zu beachten, dass Breitensuche immer zuerst alle Knoten der gleichen Ebene bearbeitet, und nicht wie die Tiefensuche einem Pfad in die Tiefe folgt. Nachdem alle Kanten des Ausgangsknotens betrachtet wurden, wird der erste Knoten der Warteschlange entnommen und das Verfahren wiederholt.
Algorithmus
- Bestimme den Knoten, an dem die Suche beginnen soll, markiere ihn als besucht und speichere ihn in einer Warteschlange ab.
- Entnimm einen Knoten vom Beginn der Warteschlange.
- Falls das gesuchte Element gefunden wurde, brich die Suche ab und liefere „gefunden" zurück.
- Anderenfalls hänge alle bisher unmarkierten Nachfolger dieses Knotens ans Ende der Warteschlange an und markiere sie als besucht.
- Wenn die Warteschlange leer ist, dann wurde jeder Knoten bereits untersucht. Beende die Suche und liefere „nicht gefunden" zurück.
- Wiederhole Schritt 2.
Nachstehend formulierte Algorithmen sind als Pseudocode zu verstehen und geben aus Gründen der Lesbarkeit nur an, ob der Zielknoten gefunden wurde. Weitere, in Anwendungsfällen wichtige Informationen – wie z. B. die aktuelle Pfadtiefe oder der bisherige Suchweg – könnten zusätzlich eingefügt werden.
Rekursiv formuliert:
BFS(start_node, goal_node) return BFS'({start_node}, ∅, goal_node); BFS'(fringe, visited, goal_node) if(fringe == ∅) // Knoten nicht gefunden return false; if (goal_node ∈ fringe) return true; return BFS'({child | x ∈ fringe, child ∈ expand(x)} \ visited, visited ∪ fringe, goal_node);
Als Schleife formuliert:
BFS(start_node, goal_node) erzeuge eine leere Warteschlange queue for(all nodes i) visited[i] = false; // anfangs sind keine Knoten besucht queue.enqueue(start_node); // mit Start-Knoten beginnen visited[start_node] = true; while(! queue.empty() ) // solange queue nicht leer ist node = queue.dequeue(); // erstes Element von der queue nehmen if(node == goal_node) return true; // testen, ob Ziel-Knoten gefunden foreach(child in expand(node)) // alle Nachfolge-Knoten, ... if(visited[child] == false) // ... die noch nicht besucht wurden ... queue.enqueue(child); // ... zur queue hinzufügen... visited[child] = true; // ... und als bereits gesehen markieren return false; // Knoten kann nicht erreicht werden
Eigenschaften
Bezeichne {\displaystyle |V|} die Anzahl der Knoten und {\displaystyle |E|} die Anzahl der Kanten im Graphen. Speicherplatzverbrauch und Laufzeit des Algorithmus sind in Landau-Notation angegeben.
Speicherplatzverbrauch
Da alle bisher entdeckten Knoten gespeichert werden, beträgt der Speicherplatzverbrauch von Breitensuche {\displaystyle {\mathcal {O}}(|V|)}. Die Breitensuche ist für Verfahren, bei denen die Knoten erst während der Breitensuche generiert werden (z. B. das Branch-&-Bound-Verfahren), aufgrund des großen Platzverbrauches meist ungeeignet. Ein der Breitensuche ähnliches Verfahren, das jedoch meist mit deutlich weniger Speicher auskommt, ist die iterative Tiefensuche.
Laufzeit
Da im ungünstigsten Fall alle möglichen Pfade zu allen möglichen Knoten betrachtet werden müssen, beträgt die Laufzeit der Breitensuche {\displaystyle {\mathcal {O}}(|V|+|E|)}[1] . Beachte, dass {\displaystyle {\mathcal {O}}(|E|)} zwischen {\displaystyle {\mathcal {O}}(1)} und {\displaystyle {\mathcal {O}}(|V|^{2})} variieren kann, abhängig davon, wie dünn der Graph ist.
Wenn die Anzahl der Knoten im Graphen im Voraus bekannt ist und zusätzliche Datenstrukturen verwendet werden, um zu bestimmen, welche Knoten bereits zur Warteschlange hinzugefügt wurden, kann die Platzkomplexität als {\displaystyle {\mathcal {O}}(|V|)} ausgedrückt werden. Dies gilt zusätzlich zu dem für das Graphen selbst erforderlichen Speicherplatz, der abhängig von der von einer Implementierung des Algorithmus verwendeten Graphendarstellung variieren kann.
Vollständigkeit
Wenn in jedem Knoten nur endlich viele Alternativen existieren, ist die Breitensuche vollständig. Dies bedeutet, dass, wenn eine Lösung existiert, diese auch gefunden wird. Dies ist unabhängig davon, ob der zugrunde liegende Graph endlich ist oder nicht. Sollte jedoch keine Lösung existieren, so divergiert die Breitensuche bei einem unendlichen Graphen.
Bei der Analyse von Algorithmen wird angenommen, dass die Eingabe für die Breitensuche ein endlicher Graph ist, der explizit als Adjazenzliste oder ähnliche dargestellt wird. Bei der Anwendung von Graph-Traversierungen in der künstlichen Intelligenz kann die Eingabe jedoch eine implizite Darstellung eines unendlichen Graphen sein. In diesem Zusammenhang wird eine Suchverfahren als vollständig beschrieben, wenn garantiert wird, dass ein Zielzustand gefunden wird, falls einer existiert. Die Breitensuche ist abgeschlossen, die Tiefensuche jedoch nicht. Bei Anwendung auf unendlich viele Graphen, die implizit dargestellt werden, findet die Breitensuche schließlich den Zielzustand, aber die Tiefensuche kann in Teilen des Graphen verloren gehen, die keinen Zielzustand haben und niemals zurückkehren.[2]
Optimalität
Jede durch Breitensuche gefundene Lösung hat den kürzesten Abstand zum Wurzelknoten. Führt man Kantengewichte ein, so muss das Ergebnis, welches am nächsten zum Startknoten liegt, nicht notwendigerweise auch das Ergebnis mit den geringsten Pfadkosten sein. Dieses Problem umgeht man, indem man die Breitensuche zur uniformen Kostensuche erweitert. Sind jedoch alle Kantengewichte äquivalent, so ist jede durch Breitensuche gefundene Lösung optimal, da in diesem Fall die Lösung, die am nächsten zum Ausgangsknoten liegt, auch die Lösung mit den geringsten Kosten ist. Ob existierende Lösungen überhaupt gefunden werden hängt mit Endlichkeitseigenschaften des Suchbaums zusammen (siehe Vollständigkeit).
Die uniforme Kostensuche (englisch uniform-cost search) ist eine Erweiterung der Breitensuche für Graphen mit gewichteten Kanten. Der Algorithmus besucht Knoten in Reihenfolge aufsteigender Pfadkosten vom Wurzelknoten und wird deshalb üblicherweise mit einer Vorrangwarteschlange implementiert, in der alle noch nicht besuchten Nachbarn bereits besuchter Knoten mit der Pfadlänge als Schlüssel verwaltet werden. Die Optimalität ist nur für nicht-negative Kantengewichte garantiert.
Anwendung
Die Breitensuche kann für viele Fragestellungen in der Graphentheorie verwendet werden. Einige sind:
- Finde alle Knoten innerhalb einer Zusammenhangskomponente
- Prüfe, ob der gegebene Graph paar ist und finde ggf. eine zulässige 2-Färbung seiner Knoten[3]
- Finde zwischen zwei Knoten u und w einen kürzesten Pfad (ungewichtete Kanten)
- Kürzeste-Kreise-Problem
Siehe auch
Literatur
- Thomas H. Cormen, Charles Leiserson, Ronald L. Rivest, Clifford Stein: Introduction to Algorithms. MIT Press, 2nd edition 2001, ISBN 0-262-53196-8
- Sven Oliver Krumke, Hartmut Noltemeier: Graphentheoretische Konzepte und Algorithmen. 3. Auflage. Springer Vieweg, 2012, ISBN 978-3-8348-1849-2
Weblinks
Einzelnachweise
- ↑ Winfried Hochstättler: Algorithmische Mathematik. Springer, Heidelberg, u. a. 2010, ISBN 978-3-642-05421-1, S. 56–58.
- ↑ Coppin, B. (2004). Artificial intelligence illuminated. Jones & Bartlett Learning. pp. 79–80.
- ↑ Dieter Jungnickel: Graphen, Netzwerke und Algorithmen. BI Wissenschaftsverlag, 3. Auflage 1994, ISBN 3-411-14263-4, S. 95–100