„Wikipedia:Archiv/Datenbankabfragen" – Versionsunterschied
Version vom 11. April 2006, 17:06 Uhr
Wichtige Information: Wikisign hat den Betrieb eingestellt. Die hier vorhandenen und neu erbetenen Abfragen können aber weiterhin ausgeführt werden.
Diese Seite dient als Hauptseite für die Koordination von Datenbankabfragen. Die Software MediaWiki bietet zwar eine Funktion, die SQL-Abfragen auf der Datenbank erlaubt (Spezial:Asksql), aber aus Performance-Gründen ist diese in der Wikipedia abgeschaltet. Es werden jedoch in mehr oder weniger regelmäßigen Abständen Kopien der verschiedenen Wikipedia-Datenbanken zum Download angeboten (Wikipedia:Download), die für eigene Abfragen - offline-Abfragen - verwendet werden können.
Diese Seite ist ein Versuch, nach dem Vorbild von Offline reports eine gemeinsame Seite zur Verfügung zu stellen, auf der man Wünsche für Datenbankabfragen äußern kann, und die jeder mit den nötigen Mitteln und Fähigkeiten abarbeiten kann:
- Auf Abfragewünsche kannst du eine Anfrage stellen (Archiv)
Einige Benutzer (u.a. MichaelDiederich, SirJective) laden sich regelmäßig die neueste Kopie der deutschen Wikipedia-Datenbank herunter, und führen auf Anfrage Abfragen aus. (Eine Alternative war, Datenbankabfragen auf dem externen Server von wikisign.org durchzuführen. Die Abfragen werden auf den dort angegebenen Datenbank-Dumps ausgeführt (Mehr Informationen).) Wer wirklich den aktuellen Datenbestand benötigt, kann sich im Wikipedia:Chat an einen Developer wenden, oder - wenn vorher bekannt ist, welche (wenigen!) Seiten betrachtet werden müssen - die Seiten über Spezial:Export als XML-Dump aus der WP herunterladen und manuell oder mit Hilfsprogrammen verarbeiten.
Die Ergebnisse werden üblicherweise auf Unterseiten des anfragenden Benutzers oder dieser Seite hochgeladen. Zu jeder neuen Ergebnisseite sollte auf der Seite selbst die verwendete Abfrage hinterlegt werden, um eine einfache Aktualisierung durch andere zu ermöglichen. Neue Seiten, die für andere Bearbeiter interessant sein könnten, sollten hier verlinkt werden.
Aktuelle Dumps
Achtung: Seit MediaWiki Version 1.5 sind die Tabellen cur und old nicht mehr als SQL-Dump formatiert, sondern in XML. Siehe Wikipedia:Download für eine Anleitung zur Verarbeitung der Dumps (einschließlich dem Import in eine eigene MediaWiki-Installation).
Derzeit von http://dumps.wikimedia.org/dewiki/ herunterladbare Dumps:
- 23. Januar 2006
- 5. Februar 2006
- 20. Februar 2006
- 18. März 2006 (ohne History)
- 20. März 2006 (ohne History)
- 27. März 2006
Siehe auch: Datenbankschema, SQL-Queries (veraltet)
Wartungslisten
Einige der Wartungslisten werden mit jedem Dump aktualisiert, einige erst, wenn sie größtenteils abgearbeitet sind.
Etliche der hier aufgeführten Wartungslisten werden nicht routinemäßig, sondern auf Anfrage, d.h. wenn konkreter Bedarf besteht, aktualisiert.
Aktualisierungswünsche sind ausdrücklich willkommen!
Liste | Beschreibung | Stand | Status |
---|---|---|---|
Vorlage:Highlight2 colspan="4" | Bilder | |||
Wikipedia:Bilder ohne Lizenzangabe | Bilder ohne erkennbare Angabe einer akzeptierten Lizenz | 9. September 2005 | Zwei (von 22) Listen abgearbeitet, sechs weitere in Bearbeitun |
Benutzer:SirJective/Wartungslisten/Bildprobleme | Bilder ohne Beschreibung, Beschreibungen ohne Bild etc. | 26. November 2004 | |
Benutzer:SirJective/Wartungslisten/Identische Bildbeschreibung | Bilder mit identischen Bildbeschreibungen in verschiedenen WPs | 3. Februar 2005 | |
Benutzer:SirJective/Wartungslisten/Selbst erstellte Bilder | Bildbeschreibungsseiten, auf denen keine Lizenz, aber der Text "selbst erstellt" steht | erledigt | |
Vorlage:Highlight2 colspan="4" | Wiki-Syntax | |||
Benutzer:SirJective/Wartungslisten/Klammer-Ungleichgewicht | Artikel mit Absätzen, bei denen die Anzahl der öffnenden und schließenden eckigen Klammern verschieden sind, sowie Artikel, deren Anzahl der öffnenden und schließenden geschweiften Klammern verschieden sind | 31. Januar 2006 | Teile L, N und O zum Abarbeiten vorhanden |
Benutzer:SirJective/Wartungslisten/Pre-Text | Artikel, die möglicherweise fest formatierten Text enthalten | 27. Januar 2005 | Liste nur für nur Sonderzeichen und A als Test der Abfrage, sollte evtl. vervollständigt werden |
Vorlage:Highlight2 colspan="4" | Personen/Personendaten | |||
Benutzer:SirJective/Unkategorisierte Personen | Personen (identifiziert durch bestimmte Zeichenketten im Text), die in keine Kategorie eingeordnet sind | erledigt | |
Benutzer:SirJective/Personendaten | Probleme in Artikeln, die Personendaten haben | 7. Januar 2005 | |
Benutzer:SirJective/Personen ohne Personendaten | Artikel, die vermutlich Personen beschreiben, aber noch keine Personendaten haben | 3. März 2005 | |
Benutzer:FEXX/war | Artikel, die die Zeichenfolge "|KURZBESCHREIBUNG=war" enthalten | erledigt | |
Benutzer:MichaelDiederich/Plus als dagger | Artikel, die vermutlich ein als Dagger (†) verwendetes Plus (+) enthalten | 31. Januar 2006 | erledigt |
Vorlage:Highlight2 colspan="4" | Artikeltitel | |||
Benutzer:SirJective/Wartungslisten/Namensraum-Titel | Artikel, deren Titel mit einem Namensraum kollidiert | 20. Oktober 2005 | |
Benutzer:SirJective/Klammerzusatz | Artikeltitel mit Klammerzusatz ohne klammerlose Version | 6. April 2005 | |
Benutzer:SirJective/Wartungslisten/Ähnliche Titel | Artikel, deren Titel sich sehr ähnlich sind | 11. Dezember 2005 | erledigt |
Nicht vorhandene Artikel mit Sonderzeichen am Anfang | 27. Februar 2006 | ||
Benutzer:Sansculotte/Zu lange Titel | Artikel mit einem sehr langen Titel | 28. Dez 2005 | |
Vorlage:Highlight2 colspan="4" | Verlinkungen auf vorhandene Seiten | |||
Wikipedia:Redirects im falschen Namensraum | Redirects, die wir vermutlich nicht haben wollen | erledigt | |
Benutzer:Rdb/Falsche Redirects | Sehr kurze Artikel, die das Wort "siehe" enthalten und eventuell zu Redirects gemacht werden müssen | erledigt | |
Benutzer:Echoray/Sackgassen-Artikel | Artikel, die keine Links zu anderen Artikeln haben | erledigt | |
Benutzer:SirJective/Wartungslisten/Halbwaisen | Artikel, die nicht von Artikeln, aber möglicherweise von anderen Namensräumen aus verlinkt sind | 6. April 2005 | |
Wikipedia:Selbstlinks | Seiten mit Links auf sich selbst | 31. Januar 2006 | erledigt |
Benutzer:SirJective/Wartungslisten/Selbstlinks via Redirect | Seiten mit Links auf Redirects, die auf die ursprüngliche Seite verweisen | 3. Feb 2005 | |
Vorlage:Highlight2 colspan="4" | Verlinkungen auf nicht vorhandene Seiten (broken links) | |||
Benutzer:SirJective/Wartungslisten/Fehlende Artikel mit langem Titel | brokenlinks mit sehr langem Titel | 26. Jun 2005 | |
Benutzer:SirJective/Wartungslisten/Kürzere Treffer | fehlende Artikel, zu denen Artikel mit verkürztem Titel existiert | 7. Januar 2005 | |
Vorlage:Highlight2 colspan="4" | Kategorien | |||
Benutzer:SirJective/Wartungslisten/Topkategorien | Kategorien, die in keine Kategorie eingeordnet sind | 20. Oktober 2005 | |
Benutzer:Ezrimerchant/Sehr kleine Kategorien | Kategorien mit höchstens 2 Artikeln und Unterkategorien | 20. Oktober 2005 | |
Benutzer:Bierdimpfl/Nicht kategorisierte Seiten | Artikel die in keine Kategorie eingeordnet sind | 23. Januar 2006 | |
Vorlage:Highlight2 colspan="4" | Begriffsklärung | |||
Benutzer:SirJective/Wartungslisten/Nicht verwaiste Begriffsklärungsseiten | BKS, die noch Links von Artikeln haben | 23. Dez 2004 | |
Benutzer:SirJective/Wartungslisten/Begriffsklärungskandidaten | Seiten, die vielleicht als BKS in Frage kommen | 23.06.2005 | |
Vorlage:Highlight2 colspan="4" | Interwiki | |||
Benutzer:SirJective/Gleichlautender Titel | Artikel mit gleichem Titel in verschiedenen Wikipedias und möglicherweise noch Interwikilinks brauchen können | ||
Benutzer:Mathias Schindler/Interwikiliste | |||
Vorlage:Highlight2 colspan="4" | Weblinks | |||
Benutzer:SirJective/Wartungslisten/Artikel mit vielen Weblinks | 21. April 2005 | ||
Wikipedia:Defekte Weblinks | 7. Feb 2006 | ||
Vorlage:Highlight2 colspan="4" | Sonstige | |||
Wikipedia:Fehlende Artikel | listet jene fehlenden Artikel die am öftesten in anderen Artikel vorkommen. | 11. März 2006 | mit jedem Dump zu aktualisieren |
Wikipedia:Kurze Artikel | Artikel mit sehr kurzem Quelltext | 05.02.2006 | mit jedem Dump zu aktualisieren |
Benutzer:SirJective/Kurze Artikel | Artikel mit sehr kurzem Quelltext in bestimmten Kategorien; Demo-Liste anlässlich einer Diskussion über Stubs | ||
Wikipedia:Falsches Datumsformat | Artikel mit Datumsangaben im Format TT.MM.JJJJ | 23. Januar 2006 | nach Abarbeitung zu aktualisieren (derzeit hat nur SirJective das bisher verwendete Programm) |
Benutzer:SirJective/Wartungslisten/Älteste neue Artikel | die ältesten Artikel, die nach ihrer Erstellung noch nicht editiert wurden | 20. Oktober 2005 | |
Benutzer:SirJective/Wartungslisten/Doppeleinträge | geschlossen | ||
Benutzer:SirJective/Newpages verdoppelt | geschlossen | ||
Benutzer:SirJective/Wartungslisten/Vergessene Löschkandidaten | Löschkandidaten älteren Datums | erledigt | |
Wikipedia:Datenbankabfragen/IP-Diskussionen | Veraltete, überflüssige IP-Diskussionen die gelöscht werden sollen | 28. Januar 2006 | nicht erledigt |
Benutzer:APPER/ISBN | fehlerhafte ISBN-Nummern | 20. März 2006 | nicht erledigt |
Vorlage:Highlight2 colspan="4" | Übersichten | |||
Hier sind z.B. Kategoriebäume oder inhaltlich gegliederte Artikellisten, die durch Abfragen erneuert werden können. Die Grenze zur Wartungsliste ist natürlich fließend. Diese Seiten sollten je nach Bedarf (auf Wunsch) aktualisiert werden. | |||
Portal:Astronomie/Index | Alphabetischer Index | 15. Februar 2006 | |
Portal:Militär/Register | Alphabetischer Index | 2. März 2006 |