Jump to content
Wikimedia Meta-Wiki

User talk:Duesentrieb/CatScan

From Meta, a Wikimedia project coordination wiki
This is an archived version of this page, as edited by Elephantus (talk | contribs) at 01:15, 18 January 2006 (CatScan proposal: show articles greater than <size>). It may differ significantly from the current version .

This page is for discussion about CatScan [1], a tool written by User:Duesentrieb. If I do not respond, please leave a quick note on my talk page at the german wikipedia.


Cat Scan

Latest comment: 18 years ago 1 comment1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Hallo Daniel,

Dein Tool Cat Scan betrachte ich als Weihnachtgeschenk. Vielen Dank und ein frohes Weihnachten.

ArtMechanic 00:14, 24. Dez 2005 (CET)

Das neue CheckUsage-Tool ist auch klasse! Vielen Dank für die vielen Erfindungen. :-) --Eloquence 01:38, 24. Dez 2005 (CET)

Cat Scan

Latest comment: 18 years ago 1 comment1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Kann man bei dem Cat Scan die Commons als Wiki einstellen? --Atamari 05:09, 26. Dez 2005 (CET)Reply

Ja, kann man: "commons.wikimedia.org" als Wiki angeben. Wird in Zukunft dann irgendwann noch etwas einfacher. -- D. Dÿsentrieb 11:34, 26. Dez 2005 (CET)

Cat Scan

Latest comment: 18 years ago 2 comments1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Hi. Your Cat Scan is a great tool. I' using it to get information on how many stub articles, need_translation articles etc.. But since listing out those articles can be time consuming, could you provide "show count only" option to supress the complete article list. Thank you Borgx 02:44, 27. Dez 2005 (CET)

The time to actually list the articles should be marginal, if you don't have a very slow connection. For the database, counting the entries takes just as long as listing them. I.e. such a feature would not really make the response any faster. -- D. Dÿsentrieb 13:31, 29. Dez 2005 (CET)

I still think the option "show count only" is necessary, because now your cat scan abort processing at 1000 entries.

It takes just as much time to count them as to list them. The limit of 1000 is there to keep database load reasonable - providing a full count would create a lot of load.
I will look into caching some of the results, so maybe I can provide something like that in the future, but probably only with a lag of about a day or so. -- Duesentrieb 23:34, 14 January 2006 (UTC) Reply

Cat Scan geht nicht

Latest comment: 18 years ago 1 comment1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Hi Duesentrieb, wahrscheinlich haben es dir schon sehr viele Leute gesagt, aber wir haben ein Problem mit dem Catscan. Er bekommt keine Verbindung zu Datenbank "WikiList database". Wahrscheinlich kannst du gar nichts dafür, aber ich wollte es dir nur sagen :)

Außerdem hätte ich noch einen kleinen Verbesserungsvorschlag: Ich hatte gestern einen Teffer, der in sehr vielen Kategorien drin war. Eventuell wäre ein Zeilenumbruch nach zwei oder drei Kategorien kein Fehler. Ist nur so eine Idee!

Gruß und Danke nochmal, --Flominator 09:58, 28. Dez 2005 (CET)

Noch ne Idee: Wie wäre es, wenn du diesen Fehler abfängst und eine entsprechende Fehlermeldung und einen Link auf deine Benutzerseite angibst? --Flominator 10:03, 28. Dez 2005 (CET)

Du weißt es sicherlich schon, aber: Als Host muß der "localhost" gegen "sql" ausgetauscht werden. Kolossos 12:22, 29. Dez 2005 (CET)
Jo, danke... Ich bin auf dem CCC, aus irgendwelchen gründen konnte ich gestern keine Mail lesen, und mich auch nicht einloggen, um das zu fixen, nachdem Kate mir gesagt hatte, was lost ist. Sollte jetzt wieder OK sein.
@flominator: ja, links auf eine disku-seite für jedes tool wären nicht schlecht. Werde ich irgendwann noch einbauen. -- D. Dÿsentrieb 13:34, 29. Dez 2005 (CET)

Cat Scan und kurze Artikel

Latest comment: 18 years ago 1 comment1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Der Cat Scan listet keine kurze Artikel mehr, hier muss dringend Abhilfe geschaffen werden. Kannst du das dir mal bitte angucken und reparieren. --Atamari 14:38, 30. Dez 2005 (CET)

Wenn du Stubs meinst, liegt das daran, dass die Kategorien tot sind. Falls es sich auf die de:Vorlage:Catscan Portal bezog, so kann ich mitteilen, dass es wieder funktioniert. Es stellt sich mir die Frage, ob der Catscan wohl auch nach Vorlagen suchen kann, die gelöscht wurden, aber noch immer im Artikeltext stehen? --Flominator 00:55, 31. Dez 2005 (CET)
Wenn das Programm den Verzeichnisbaum erfasst und im Cache behält, wäre es auch nicht möglich die Artikelgröße mit abzulegen (oder zumindest vom letzten Dump). Dann könnte in dem Formular ein Feld in dem man die Mindestgröße oder Höchstgröße mit angeben. Evt. einen Parameter in dem man die Artikel nach Artikelgröße auflistet. Wenn es nur die Artikelgröße des letzten Dump ist, kann man damit leben - viele Artikel ändern sich nicht so schnell. Irgendwie könnte man die Idee doch in die Richtung weiter entwickeln.... --Atamari 02:08, 31. Dez 2005 (CET)
Kann man so einen Parameter noch einfügen??? --Atamari 16:57, 6. Jan 2006 (CET)
Öh, der CatScan kann doch seit zwei Tagen nach Artikelgrösse suchen? "Mit ablegen" geht übrigens nicht - alle abfragen laufen *live* auf der Datenbank, die bekommt permanent Updates vom Hauptserver. Es wird nichts gecached, die Datenbasis ist dynamisch. -- D. Dÿsentrieb 18:58, 6. Jan 2006 (CET)
Das ist ja mal super - da ist man zwei Tage nur mit halber Kraft dabei, dann so etwas... :-) das schaue ich mir gleich noch näher an. --Atamari 20:30, 6. Jan 2006 (CET)

Catscan: Kombinierte Suche

Latest comment: 18 years ago 1 comment1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Hi Daniel, hälst du es für möglich, mit dem Catscan kurze Artikel einer Kategorie zu suchen, die eine Vorlage enthalten oder eben nicht? --Flominator 09:11, 6. Jan 2006 (CET)

Hm, vielleicht... das Kombinieren von Optionen macht die Oberfläche komplizierter, und auch das erstellen der SQL abfragen recht schwierig. Für die Artikelgrösse könnte es gehen, für die Link-Zahl eher nicht... mal schaun. -- D. Dÿsentrieb 19:00, 6. Jan 2006 (CET)
Eine derartige Funktion wäre zumindest hilfreich, um kurze aber vollständige Artikel aus der generierten Stubliste ausschließen zu können (z.B. durch Verwendung einer de:Vorlage:Vollständig). Es stellt sich aber die Frage, ob es nicht ausreichend ist, den Vorlagennamen fest vorzugeben, so dass in der Oberfläche nur eine Checkbox erscheinen müßte, die das Ausschließen ermöglicht. Allerdings müßte der Vorlagenname wohl je nach ausgewähltem Wiki variieren.-- StefanL 02:34, 7. Jan 2006 (CET)

Catscan: Ausgabeformat

Latest comment: 18 years ago 3 comments2 people in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Wiki-Syntax

Hallo Duesentrieb, mit dem Catscan hast du ein wirklich sehr praktisches Tool geschaffen. Um Ergebnisse des Catscans in Portal-, Diskussions- oder Benutzerseiten einfügen zu können, wäre es hilfreich, alternativ zu CSV auch eine Ausgabe als Tabelle und/oder Liste in Wiki-Syntax (einschließlich Verlinkung) auswählen zu können. Weiterhin wäre auch eine optionale Ausgabe des Parameters für die Sortierposition innerhalb der Kategorien hilfreich. Beide Funktionen gemeinsam wäre eine große Hilfe zur Überwachung der Kategorisierung in einem Themengebiet.-- StefanL 02:34, 7. Jan 2006 (CET)

Hm, gute idee... solange keiner auf die Idee kommt, aus den so generierten Listen Artikel oder Navi-Leisten zu erstellen ;) Ich werd's mir mal anschauen, wenn ich etwas Zeit habe -- D. Dÿsentrieb 04:20, 7. Jan 2006 (CET)
Navileistenformat sollte man nicht unbedingt unterstützen. Für eine Navileistenerstellung sollte aber das CSV-Format fast ebensogut geeignet sein, wie ein Listen- oder Tabellenformat in Wiki-Syntax, so dass in dieser Hinsicht wohl kaum Nachteile zu erwarten sind.-- StefanL 14:05, 7. Jan 2006 (CET)
Eventuell hilft ja auch de:vorlage:Catscan Portal weiter ... --Flominator 18:44, 12 January 2006 (UTC) Reply
Diese Vorlage war mir bekannt und reduziert die Zahl der Fälle etwas, in denen man eine Ergebnisliste im Portalnamensraum ablegen muß. Im Falle stark frequentierter Portale mit großen Kategoriestrukturen könnte es aber die Toolserverbelastung erheblich reduzieren, wenn nur ein Benutzer den Scan erstellt und diesen dann geeignet ablegt.
Das Hauptanwendungsgebiet sehe ich jedoch bei Komplettscans des jeweiligen Themengebiets. Werden diese im Wiki regelmäßig abgelegt, so erhält man mittels Versionsvergleich dieser Listen eine Beobachtungsmöglichkeit für Kategorisierungsveränderungen einschließlich Zu- und Abgängen in diesem Themengebiet.-- StefanL 21:43, 14 January 2006 (UTC)

Ich werde Wiki-Syntax nach und nach in alle meine Tools einbauen. Bitte noch etwas gedult, dauert noch ein paar Tage. -- Duesentrieb 23:28, 14 January 2006 (UTC) Reply

Erweiterte Kategorieliste

Bei der Betriebsart "for all categories" wäre es weiterhin nützlich, optional eine Ausgabe mit Zusatzinformationen je angezeigter Kategorie vorzusehen:

  • Tiefe innerhalb des Baumes, in der die Kategorie gefunden wurde.
  • Anzahl der Artikel der Kategorie
  • Anzahl der Artikel der Kategorie inkl. aller direkten und indirekten Unterkategorien
  • Anzahl der direkten Unterkategorien
  • Anzahl aller direkten und indirekten Unterkategorien
  • Kennzeichnung, wenn die direkten Unterkategorien nicht gescannt wurden.
  • Kennzeichnung, wenn nicht alle direkten Unterkategorien gescannt wurden.

Dieses wäre zur Diskussion neuer Kategorisierungsstrukturen hilfreich. Weiterhin hilft es auch, um die Anwendbarkeit von Catscan im Hinblick auf Größenbeschränkungen zu verbessern.-- StefanL 00:33, 8. Jan 2006 (CET)

Ausgabe in Baumstruktur

Es könnte auch helfen, die Ausgabe optional auf Baumstruktur umstellen zu können (direkte Anzeige und Liste in Wiki-Syntax).-- StefanL 00:33, 8. Jan 2006 (CET)

Anzeige der Kategorisierung

Bisher wird bei einigen Betriebsarten wie "for pages" die Kategorisierung der Artikel und Kategorien angezeigt und bei einigen nicht. Hier wurde ich eine globale Check-Box vorschlagen, die für alle Betriebsarten ermöglicht, die Kategoriesierungsanzeige ein oder auszuschalten. Dabei könnte auch noch wählbar sein, ob nur diejenigen Kategorien angezeigt werden, die sich in der gescannten Kategoriestruktur befinden, oder alternativ alle Kategorien, in die der jeweilige Artikel eingeordnet ist.

Eine weitere Option sollte die Anzeige der bei der Artikelkategorisierung angebenen Sortierposition aktivieren.

Mir ist aufgefallen, dass die Reihenfolge, in der die Kategorien des Artikels aufgelistet werden, recht zufällig zu sein scheint. Hier wäre es wünschenswert, wenn diese in der Reihenfolge angezeigt würden, in der sie im Artikel angegeben sind. Falls dies nicht praktikabel sein sollte, wäre eine alfabetische Sortierung sinnvoll. Insbesondere bei Ausgabe in Wiki-Syntax und Beobachtung der Veränderung ist es wichtig, dass bei einen erneuten Scan die Reihenfolge unverändert bleibt.

Zumindest für die Betriebsarten "for all categories" und eventuell auch "for all pages" wäre noch eine zusätzliche Variante hilfreich: Es werden nur diejenigen Kategorien bzw. Artikel gelistet, die zusätzlich in Kategorien eingetragen sind, die sich ausserhalb des gescannten Baumes befinden. Damit könnte man prüfen, welche seitlichen Zugänge in einen Teilbaum des Kategoriesystems hineinführen. Bei der Anzeige in dieser Sonderbetriebsart sollte erkennbar sein, welche übergeordneten Kategorien ausserhalb des Baumes liegen. Entweder könnten die Kategorien innerhalb weggelassen werden, oder es werden beispielsweise links vom Artikellink die innerhalb des Baumes befindlichen Kategorien angezeigt und rechts die ausserhalb des Baumes befindlichen Kategorien. Diese Darstellung könnte so auch für die normalen Betriebsarten angewendet werden, so dass ein möglichst einheitliches Erscheinungsbild entsteht.-- StefanL 03:27, 9. Jan 2006 (CET)

Auch für die Umkehrung, nur Artikel anzuzeigen, die keine ausserhalb des angegebenen Baumes gelegenen Kategorien aufweisen, macht Sinn: Suche nach Artikel aus Wartungskategorien, die nicht (thematisch) kategorisiert sind.StefanL 00:17, 11 January 2006 (UTC)

Catscan: Abgleich mit Liste

Latest comment: 18 years ago 2 comments1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Zum Abgleich von Listen mit Kategorien wäre es hilfreich, wenn es eine weitere Betriebsart geben würde: Es werden alle Artikel des ausgewählten Kategorienbaumes gelistet, die in einer angegebenen Liste verlinkt (bzw. alternativ nicht verlinkt) sind. Auch die Umkehrung wäre hilfreich: Artikel, die in der Liste aber nicht der Kategorie enthalten sind, auflisten. Anwendungsbeispiele wären: de:Register Bahn mit de::Kategorie:Schienenverkehr vergleichen, Navileisten mit Kategorien abgleichen, Kategorien mit alternativer Darstellung als Liste im editierbaren Teil mit dem automatisch generierten Teil abgleichen (z.B. für derartige Anwendungen: http://commons.wikimedia.org/w/index.php?title=Category:William-Adolphe_Bouguereau&oldid=697934). Aus letzterem Grund sollte als Liste auch (der editierbare Teil) einer Kategorie angebbar sein.-- StefanL 02:34, 7. Jan 2006 (CET)

Bin mir nicht so sicher, ob das sinnvoll ist - ich fürchte, das würde den Navileisten-Wahn verstärken. Ist aber sicher machbar... mal gucken. -- D. Dÿsentrieb 04:22, 7. Jan 2006 (CET)
Missbrauch ist natürlich auch hier möglich (wo nicht?). Gegen Navileisten-Wahn helfen vermutlich am besten alternative Konzepte, die es in anderer Weise ermöglichen, den Navigationsbedarf abzudecken. Dazu könnte das Kategoriesystem einen wesentlich größeren Beitrag leisten als bisher, wenn man alle Möglichkeiten des Kategoriesystems nutzt bzw. diese noch verbessern würde. Dazu könnte dein Tool und die hier vorgeschlagene Funktion sehr hilfreich sein.-- StefanL 15:12, 7. Jan 2006 (CET)

Ich denke, ich werde das einbauen - hab aber im Moment andere Dinge zu tun. -- Duesentrieb 23:40, 14 January 2006 (UTC) Reply

Catscan: Invertierte Scanrichtung

Latest comment: 18 years ago 1 comment1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Eine weitere Betriebsart, bei der statt der untergeordneten die übergeordneten Kategorien rekursiv gescannt werden, wäre auch hilfreich. Einerseits könnte man damit nach Artikeln suchen, die weit oben im Kategoriebaum provisorisch einsortiert sind. Wichtiger wäre die Invertierung allerdings für die reine Kategorieanzeige. Beispielsweise waren hier mal die Elektrolokomotiven indirekt bei den Straßenfahrzeugen eingeordnet. Derartige Fehlzuordnungen könnten mit dieser Funktion erkannt werden. Für diese invertierte Scanrichtung wäre es auch wünschenswert, direkt einen Artikel statt einer Kategorie als Basis angeben zu können.-- StefanL 01:26, 8. Jan 2006 (CET)

Verstehe ich nicht ganz... du willst alle Artikel sehen, die in einer Kategorie oder einer Oberkategorie einsortiert sind? Wäre das wirklich hilfreich? Sollen Auch Artikel in der Ausgangskategorie gelistet werden? Ich würde befürchten, dass das sehr schnell unübersichtlich wird... Sinn macht das evtl, wenn die Oberkategorien eigentlich gar keine Artikel enthalten sollte, da findet man dann leicht "provisorisch" einsortierte Seiten. Aber wie oft kommt das vor? -- D. Dÿsentrieb 15:06, 8. Jan 2006 (CET)
Wie gesagt, wichtiger wäre die reine Kategorieanzeige. Falls diese wesentlich einfacher zu realisieren ist, solltest du dich darauf beschränken. Ich hatte mir aber überlegt, ob nur dieser Spezialfall Sinn macht oder auch andere Anwendungen mit Artikellistung sinnvoll sein könnten. Dabei kam ich auf die Suche nach provisorisch kategorisierten Artikeln. Vorteilhaft sind natürlich relativ schwach mit Artikeln besetzte Oberkategorien. Ich könnte mir aber vorstellen, dass die Verwendung in Kombination mit der Suche nach kleinen Artikeln oder den letzten Änderungen hilfreich sein könnte, um provisorische Kategorisierungen zu entdecken. Eine andere Möglichkeit wäre der regelmäßige Export der generierten Liste auf eine Benutzerseite und Nutzung des Versionsvergleichs, um Neuzugänge dort zu entdecken. Bei der Frage, ob die aktuelle Kategorie mit eingeschlossen werden soll, tendiere ich zu weglassen, halte dies aber für eher unkritisch.-- StefanL 16:03, 8. Jan 2006 (CET)
Meine Meinung zu letzterem habe ich nochmal geändert. Die angegebene Kategorie sollte beim Scan mit eingeschlossen werden. Dies ist flexibler, da man zum Weglassen stattdessen die übergeordneten Kategorien auflisten könnte. Andersherum würde es nicht immer funktionieren. StefanL 00:08, 11 January 2006 (UTC)

Catscan:Hinweis auf Diskussion

Latest comment: 18 years ago 1 comment1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Hallo Duesentrieb, zunächst einmal vielen herzlichen Dank. Dein Tool gehört zu den besten „Erfindungen", die mir hier in der Wikipedia untergekommen sind. Auf den gestrigen Löschkandidaten findet unter „de::Kategorie:Wikipedia Überarbeiten/Geschichte" eine Diskussion statt, in der es unter anderem auch um den Catscan geht. Dabei wurde die Frage aufgeworfen, ob nicht eine kurze Dokumentation sinnvoll sei. Vielleicht schaust Du ja mal dort rein. Ich persönlich komme mit dem Script auch so gut klar, das scheint aber nicht allen Wikipedianern so zu gehn. Vor allem finde ich die dort geäußerte Idee, einer Seite mit dem Titel de:Wikipedia:CatScan gar nicht so schlecht. So könnte man bei solchen Gelegenheiten auch immer auf einen kurzen Text verweisen. Falls du Hilfe brauchst, unterstütze ich dich auch gerne dabei. Zuächst nochmals besten Dank und herzliche Grüße! --Frank Schulenburg 10:35, 8. Jan 2006 (CET)

Ja, schon, aber... Das ding ist noch sehr im Fluss, die Doku wäre sehr schnell überholt. Und das Tool funktioniert für alle Projekte, also sollte die Seite eigentlich de:meta:CatScan sein, dann aber auf englisch...
Eine zentrale Seite für Dokumentation, Fragen und Vorschläge wäre sicher gut - aber evtl besser eine gemeinsame für alle meine Tools? Ausserdem bekomme ich dann keinen "Balken" mehr, wenn jemand was fragt... und ich müsste immer meta checken...
Also: im Prinzip ja, aber wie/wo? Ich versuche, mir was einfallen zu lassen. -- D. Dÿsentrieb 14:52, 8. Jan 2006 (CET)
Melde dich einfach bei mir, wenn du meinst, daß ich dir in irgendeiner Weise helfen kann. Beste Grüße --Frank Schulenburg 15:03, 8. Jan 2006 (CET)

Catscan: Größenbeschränkung

Latest comment: 18 years ago 2 comments1 person in discussion

moved here from de:Benutzer Diskussion:Duesentrieb -- Duesentrieb 15:48, 9 January 2006 (UTC) Reply

Für meine eigenen Anwendungen dürften die weiter oben genannten Limits derzeit wohl ausreichend sein. Dennoch habe ich mir mal Gedanken dazu gemacht. Zumindest wenn beim Catscan Artikel aufgelistet werden sollen, gibt es aus Benutzersicht (von wenigen Ausnahmen abgesehen) nur zwei sinnvolle Scantiefen: Entweder 1 oder unbeschränkt. Wenn der Scan durch irgendeine Limitierung unvollständig ausgeführt wurde, ist das Ergebnis weitgehend Datenmüll. Es ist natürlich verständlich, dass du die Serverbelastung begrenzen möchtest. Die Scantiefe halte ich dabei für ein ungeeignetes Mittel, da sie kaum etwas über die wirkliche Größe des Baumes aussagt. Ein Zusammensetzen des gewünschten Ergebnisses aus mehreren Teilscans ist erstens umständlich, und führt auch zu einer noch höheren Belastung des Toolservers, da ggf. ganz erhebliche Überschneidungen der Teilscans auftreten können, weil die Kategoriestruktur kein reiner Baum ist.

Die Begrenzung auf 512 Unterkategorien finde ich da schon besser. Allerdings halte ich hier ein wirklich festes Limit auch nicht für ideal. Meine Idee dazu wäre, den Catscan bei Überschreitung dieser Größe künstlich zu verlangsamen, indem nur sporadisch Serveranfragen gestellt werden. Zum Beispiel könnten alle 10 Sekunden die Artikel einer Unterkategorie ausgelesen werden. Damit wäre der Toolserver nicht blockiert und es gäbe auch eine gewisse abschreckende Wirkung, um eine übermäßige Anzahl riesiger Scans zu verhindern. Die zu erwartende Scanzeit sollte allerdings zu Beginn angezeigt werden. Da die Verlangsamung künstlich ist, sollte es auch möglich sein, diese Zeit fast exakt einzuhalten.

Die Begrenzung auf 1000 angezeigte Artikel sollte eigentlich kein Problem sein, sofern CSV- und Wiki-Syntax-Ausgabe davon nicht betroffen sind. Mehr als 1000 Artikel dürften für direktes Betrachten ohnehin ungeeignet sein. Bezieht sich diese Grenze aber wirklich auf die angezeigten Artikel oder etwa auf die Anzahl der Artikel, die auf gewissse Eigenschaften überprüft wurden? Letzteres wäre sicher eine große Einschränkung. Ggf. könnte man die Geschwindigkeit des Catscans auch in Abhängigkeit von der Artikelanzahl reduzieren.-- StefanL 00:51, 9. Jan 2006 (CET)

Stimmt, die scan tiefe könnte unbeschränkt sein - oder ein limit von 100 oder sowas haben; obwohl - jeder schritt in die "Tiefe" erfordert eine neue abfrage, das kann eine weile dauern. Wenn man das von der Wurzelkategorie aus macht... naja, die 512 kats greifen dann ja. Eine künstliche Verlangsamung ist nicht möglich, weil die meiste zeit darauf verwendet wird, herauszufinden, welche artikel angezeigt werden sollen - das ist ein schritt. Die grenze von 1000 artikeln bezieht sich auf die angezeigten artikel - also die ersten 1000, die die Kriterien erfüllen. -- D. Dÿsentrieb 02:09, 9. Jan 2006 (CET)
Wäre es auch möglich, beispielsweise die zweiten 1000 Artikel usw. aus der Datenbank auszulesen? Wäre eventuell eine Aufteilung des letzten Schritts nach Anfangsbuchstaben möglich? Dies nur als Anregung; vielleicht kann man ja so sehr große Scans handhabbar machen.StefanL 23:54, 10 January 2006 (UTC)
naja, die "zweiten tausend" kann ich schon ab fragen, dauert aber genau so lange wie 2000 abzufragen. Mit dem Anfangsbuchtaben könnte ich mal gucken - aber evtl gibt's ja auch über 1000 mit dem selben Anfangsbuchstaben - das wird kompliziert. -- Duesentrieb 23:38, 14 January 2006 (UTC) Reply
Diese Methode macht ja ohnehin nur für CSV-Ausgabe (und zukünftig Wikisyntax-Ausgabe) Sinn, bei denen du bisher keine Limitierung verwendest. Also sollte dies dann auch für den einzelnen Buchstaben unlimitiert möglich sein. Der Vorteil wäre aber, dass man in diesem Mode eine größere Anzahl von Kategorien zulassen könnte. Wenn mehr als 500 Kategorien gescannt werden, dürfte die statistische Verteilung doch vermutlich ausreichend gut sein, dass man pro Anfangsbuchstabe nicht mehr als etwa 10% der Artikel erhalten sollte. Damit sollte es dann möglich sein, die Grenze von 500 auf 5000 zu erhöhen. Und ob es noch sinnvolle Anwendungen für Scans von mehr als 5000 Kategorien gibt, möchte ich bezweifeln.
Wäre der Aufwand für den zweiten 1000 auch so hoch, wenn man in der Datenbankanfrage spezifiziert, dass 1000 Artikel (alfabetisch) beginnend mit dem letzen Artikel der vorherigen Anfrage ausgegeben werden sollen? Dann müßte die Datenbank ja nicht von Anfang an neu filtern und durchzählen.-- StefanL01:05, 15 January 2006 (UTC)

Redirects

Latest comment: 18 years ago 1 comment1 person in discussion

Some options concerning categorized redirects could be useful:

  • hide redirects
  • show redirects only
  • show double redirects only
  • resolve redirects (analyze and show article instead of redirect)

StefanL 00:39, 11 January 2006 (UTC)

Since redirects are seldom categorized,m i don't see how this makes sense in this context... -- Duesentrieb 23:36, 14 January 2006 (UTC) Reply

Nur IPs

Hallo Duesentrieb! Der CatScan ist ja schon nahezu perfekt. :-) Jetzt mein persönlicher Ich-ärgere-den-Developer-am-Sonntag-Morgen-Wunsch: angemeldete Benutzer ausblenden. Das ist nützlich, wenn man einen relativ umfangreichen Kategorienbaum schnell auf subtile Vandalismen überprüfen will. Ganz perfekt wäre es natürlich, wenn hinter jeder ausgeworfenen Änderung die Größenverschiebung in Bytes angegeben würde (z.B. +20 Bytes oder -2841 Bytes). ;) Ja nun, man wird doch mal träumen dürfen... Schöne Grüße, --Markus Mueller, hier ohne Account. 09:48, 15 January 2006 (UTC)

Hm, ja, mal gucken... sieht fast so aus, als müsste ich den CatScan als solchen wieder abschaffen, und dafür eine "Einschränkung nach Kategorie" in verschiedene Tools einbauen. Sonst wird das zu viel in einem Tools. Jedenfalls danke für die Idee. Ob sich das mit dem Grössenunterschied machen lässt, weiss ich noch nicht.
Tipp am Rande: in Projekten, in denen ich keinen Account habe, unterschreibe ich immer mit [[:de:Benutzer:Duesentrieb]] ~~~~~ - das sieht dann so aus: de:Benutzer:Duesentrieb 10:40, 15 January 2006 (UTC)

CatScan proposal: show articles greater than <size>

Latest comment: 18 years ago 1 comment1 person in discussion

CatScan already has the option to show articles which are smaller than a certain size. It would be useful to be able to select just the articles greater than a certain size - this would make removing "stub" templates from the articles which have outgrown them easier. Thanks! --Elephantus 01:15, 18 January 2006 (UTC) Reply

AltStyle によって変換されたページ (->オリジナル) /