WikiBot: Unterschied zwischen den Versionen

Aus SkylineTV LIVE Wiki
Wechseln zu: Navigation, Suche
Zeile 115: Zeile 115:
 
Dynamische Informationen aus [[Episodenliste]]
 
Dynamische Informationen aus [[Episodenliste]]
 
| Anzahl der Streams an Ort/mit Person/an einem Zeitpunkt (Jahr, Monat, Tag,  Wochentag beliebig kombinierbar)
 
| Anzahl der Streams an Ort/mit Person/an einem Zeitpunkt (Jahr, Monat, Tag,  Wochentag beliebig kombinierbar)
| [https://de.wikipedia.org/wiki/Unscharfe_Suche Fuzzy-Search] über Artikel-Titel im Zielbereich
+
| [https://de.wikipedia.org/wiki/Unscharfe_Suche Fuzzy-Search] über Artikel-Titel im Zielbereich, wenn (Teil-)Datum erkannt --> Abfrage der Episodenliste
 
| Ja
 
| Ja
 
|-
 
|-

Version vom 20. Februar 2022, 17:27 Uhr

Der WikiBot ist ein Softwaresystem zur automatischen Aktualisierung von Wiki-Inhalten und zur Bereitstellung einer Wiki-Abfrage-API, die unter anderem von Chatbots verwendet werden kann.

Automatisierte Wiki-Aktualisierung

Update-Routine

Jeden Tag um 00:00 Uhr (Systemzeit: GMT) aktualisiert der Bot folgende Inhalte:

  • Hauptseite: Was geschah am?
  • Hauptseite: Schon gewusst?
  • Stream-Artikel:
    • Ein neuer Streameintrag in der Episodenliste führt zur automatisierten Erstellung eines Streamartikels.
    • Die Streamseiten der letzten 50 Streams werden geupdatet hinsichtlich Kategorien und Streamdetails-Tabelle.
  • Personen-Artikel:
    • Streammitwirkungen werden basierend auf Links in der Episodenliste aktualisiert.
  • Streamort-Artikel:
    • Anlegung neuer Streamortseiten, basierend auf toten (=roten) Links in der Episodenliste.
    • Aktualisierung der Livestreams-Listen in Streamort-Artikeln.
  • Personen-Artikel:
    • Streammitwirkungen werden basierend auf neuen Verlinkungen in der Episodenliste aktualisiert.

Botflags

Botflags sind spezielle Belegungen eines bot-flag-Attributs eines HTML-Div-Elementes. Sie zeigen dem Bot die Stellen im Wikitext an, in welchen er editieren darf. Dies bedeutet jedoch auch, dass alle manuellen Änderungen, die man innerhalb des div-Tags tätigt zeitnah überschrieben werden können und daher verloren gehen.

<div bot-flag="FLAG_NAME">Alles hier drin wird vom Bot überschrieben</div>

Als Best-Practice lässt man deshalb die Struktur dieser Tags unberührt. Je nach gewünschter Botfunktionalität kann aus einer Menge fest definierter Flags ausgewählt werden. Zu beachten ist jedoch, dass der Bot nur bestimmte Wiki-Artikel für bestimmte Flagarten überprüft. Eine Übersicht über alle Flags und ihren Zielbereich findet sich in der folgenden Tabelle.

Flag-Name Bot-Aktion Ziel-Artikel
STREAM_MITWIRKUNGEN Der Bot sucht in allen Zeilen der Episodenliste nach Links zu Personen und erstellt eine neue Episodenliste, die nur aus linkenthaltenden Zeilen enthält. Zusätzlich fügt er die Überschrift "Mitwirkungen bei SkylineTV LIVE" ein sowie einen kurzen Text in welchem Bereich (Guide/Kamera/Sprachstudio) die Mitwirkung wie oft erfolgte. Alle Artikel der Kategorie:Person
STREAMS_IN_ORT Der Bot sucht in der Spalte "Ort" der Episodenliste nach allen Episoden, die an diesem Ort stattfanden (also in der Episodenliste entsprechend verlinkt sind). Diese Episoden werden in eine neue ortspezifische Episodenliste eingefügt. Zusätzlich wird die Überschrift: "Livestreams In ORT fand(en) bisher X Livestream(s) statt." eingefügt. Alle Artikel der Kategorie:Streamort
WAS_GESCHAH_AM Der Bot findet in der Episodenliste alle Streams, die am heutigen Tag stattfanden und fügt sie in eine Liste ein. Hauptseite
RANDOM_TRIVIA Der Bot fügt in eine Liste zufällige Trivia aus dem gesamten Wiki ein (Voraussetzung: Sektion namens Trivia und einzelne Trivia-Punkte als Liste formatiert). Es werden mindestens 700-Zeichen Trivia eingefügt. Hauptseite
STREAM_KATEGORIEN Der Bot findet für eine Streamseite heraus, in welche Kategorien er womöglich einsortiert werden soll. Dazu verwendet er Informationen aus der Episodenliste (Land, Ort, Titel (Drohne im Titel -> Drohnenstream, ...)), sowie die API von OpenStreetMap, um das Bundesland herauszufinden, sollte sich der Stream in Deutschland abgespielt haben. Unterstützt werden auch mehrere Orte und mehrere Länder.
Die OSM-API kann bei uneindeutigen Ortsnamen das falsche Bundesland herausfinden!
Die zeitlich 50 letzten Stream-Artikel, wie verlinkt in der Episodenliste seit 2022.
STREAM_INFO_TABELLE Der Bot fügt eine ausgefüllte Vorlage:Streamdaten für einen Stream ein, basierend auf Daten in der Episodenliste und Twitch-Daten (bei regulären Streams). Die zeitlich 50 letzten Stream-Artikel, wie verlinkt in der Episodenliste seit 2022.

Wiki-Chatbot

Der WikiBot bietet eine Abfrage-API für Wikiinhalte. Dazu aktualisiert der Bot jeden Tag eine lokale Kopie des Wikis, um a) die Latenz der Abfrage zu erhöhen, b) das Wiki nicht mit ständigen Api-Requests zu belästigen und c), um zu verhindern, dass trollaffine Nutzer Wikiseiten absichtlich verändern, um etwaige angebundene Chatbots zum Posten dubioser Inhalte zu veranlassen.

Je nach Implementierung des API-Nutzers kann die Syntax zur Verwendung der Befehle leicht variieren. Im Folgenden wird davon ausgegangen, dass der Bot für einen Twitch-Chat angebunden wurde und Befehle deshalb mit einem Ausrufezeichen beginnen.

Übersicht der Befehle

Der Bot bietet in seiner aktuellen Version fünf Befehlstypen mit z.T. sehr unterschiedlichen Sucheigenschaften.

Befehl Parameter Zielbereich Antwortinhalte Art der Suche Backlink-Auflösung[1]
!trivia Keiner Alle relevanten, nicht-geblacklisteten Wikiartikel Zufällige Trivia aus zufälligem Artikel Keine Nicht nötig
Artikeltitel Alle relevanten, nicht-geblacklisteten Wikiartikel Zufällige Trivia aus spezifiziertem Wiki-Artikel Fuzzy-Search über Artikel-Titel im Zielbereich Ja
!streams Keiner Keiner Link zur Episodenliste Keine Nicht nötig
Artikeltitel Artikel aus:

Dynamische Informationen aus Episodenliste

Anzahl der Streams an Ort/mit Person/an einem Zeitpunkt (Jahr, Monat, Tag, Wochentag beliebig kombinierbar) Fuzzy-Search über Artikel-Titel im Zielbereich, wenn (Teil-)Datum erkannt --> Abfrage der Episodenliste Ja
!insider Keiner Keiner Link zur Kategorie:Insider Keine Nicht nötig
Artikeltitel Artikel aus: Artikel-Anfangstext (Sektion 0) Fuzzy-Search über Artikel-Titel im Zielbereich Ja
!person Keiner Keiner Link zur Kategorie:Person Keine Nicht nötig
Artikeltitel Artikel aus: Artikel-Anfangstext (Sektion 0) Fuzzy-Search über Artikel-Titel im Zielbereich Ja
!wikisearch Keiner Keiner Link zur Seite WikiBot. Keine Nicht nötig
Abfragebefehl Alle relevanten, nicht-geblacklisteten Wikiartikel Titel des Suchergebnis-Artikels, Anzahl der Suchtreffer, ggbfs. Auszug aus dem Wikitext der Stelle(n), die auf den Suchbegriff passen Suchmaschinen-Suche über gesamtes Wiki (Ausnahme: Blacklist). Suche im Wikitext oder explizit im Titel (titel:"SkylineTV LIVE") Nein

Abfragesprache für !wikisearch

Normale Freitextsuche

Die normale Freitextsuche sucht nach den exakten Wörtern im Wikitext. Mehrere Wörter, die durch Leerzeichen getrennt sind, werden mit einem logischen Und verbunden.

Finde Artikel, die das Wort Lego enthalten:

!wikisearch Lego

Finde Artikel, die das Wort Lego und Star und Wars enthalten:

!wikisearch Lego Star Wars

Finde Artikel, die die Phrase Der Herr segne dich enthalten (genau in dieser Reihenfolge, Wörter direkt hintereinander):

!wikisearch "Der Herr segne dich"

Finde Artikel, bei dem spätestens nach sechs Wörtern einmal Kassel nach dem Wort Zissel vorkommt:

!wikisearch "Zissel Kassel"~6

Boolsche Operatoren

Mithilfe der boolschen Operatoren AND, OR und NOT und den Klammerausdrücken ( und ), lassen sich komplexere Abfragen bilden.

Finde Artikel, die das Wort Lego enthalten, aber nicht Tim, um beispielsweise Streams zu erhalten, in denen zwar Lego vorkam, jedoch ohne Lego-Fan Tim Wawambo:

!wikisearch Lego NOT Tim

Finde Artikel, die irgendwas mit dem Zisselfest zu tun haben, aber auch das Wort Bonusstream enthalten:

!wikisearch (Elsa OR Zissel OR Kassel) AND Bonusstream

Suche nach Titeln

Normale Suchanfragen suchen standardmäßig im Wikitext. Wenn zusätzlich oder ausschließlich im Titel einer Seite gesucht werden soll, kann dies mit dem Feld-Präfix titel: geschehen.

Suche im Titel nach Frankfurt und nach bauma im Wikitext.

wikisearch titel:Frankfurt bauma

Suche nach den Wörtern Weihnachtsmarkt und Fulda im Titel.

!wikisearch titel:(Weihnachtsmarkt Fulda)

Eine exakte Titelsuche für einen bekannten Titel kann somit beispielsweise mit titel:"Exakter Titel" erfolgen.

Wildcard-Operatoren

Für einzelne Wörter existieren die Wildcard-Operatoren * (ersetzt beliebig viele Zeichen) und ? (ersetzt ein Zeichen). Eine Suche nach !wikisearch *ramsam* findet beispielsweise Artikel, die Aramsamsam enthalten.

Gewichtung von Abfrageelementen

Mit dem Operator ^ können einzelne Abfrageelemente eine höhere Gewichtung bei der Auswertung der Suchanfrage erhalten. Z.B. bedeutet !wikisearch (Elsa Zissel)^5 Hund, dass Elsa und Zissel fünfmal wichtiger sind als andere Wörter, wie hier "Hund".

Artikel-Blacklist

Die Blacklist für Artikel ist ausschließlich für den Befehl !wikisearch [Befehl] und !trivia relevant, da nur für diese ein gesamter Index für das Wiki angelegt wird. Alle anderen Suchbegriffe arbeiten ohnehin nur auf begrenzten Kategorie-Bereichen. Artikelnamen in der Blacklist werden nicht in diesen Index aufgenommen. Standardmäßig werden weder Diskussions-, Benutzer-, noch Spezialseiten indiziert. Zu den sonstigen ausgeschlossenen Artikeln gehören: Episodenliste, WikiBot, Sandbox, alle Seiten die mit Sandbox: beginnen.

Fehler und Kontakt

Bei Fehlern, Verbesserungsvorschlägen oder Mitentwicklungsinteresse, kontaktiere am besten Benutzer:Zeno.

Fußnoten

  1. Eine Backlink-Auflösung bedeutet, dass alle Seitenaliase berücksichtigen werden, also Weiterleitungslinks von Seiten zu Hauptartikeln. Mit Backlink-Auflösung kann man beispielsweise sowohl mit der Suche nach Elton, als auch nach Amoszool die Hauptseite Elton erfragen. Ohne ginge dies nur mit der Suche nach Elton. Wiki-Ersteller können somit dynamisch einstellen, welche Suchbegriffe auf welche Seiten führen sollen, wenn sie entsprechende Weiterlinkungsseiten anlegen (wie eben die Seite Amoszool).