Benutzer:Lemmi04/Computerlexikographie
Die Computerlexikographie ist ein Teilbereich der Computerlinguistik. Der Begriff Computerlinguistik im engeren Sinn bezeichnet wissenschaftliche Untersuchungen zur Erstellung und zur Nutzung lexikalischer Ressourcen im Zusammenhang mit sprachtechnologischen Anwendungen. Im weiteren Sinn umfasst der Begriff auch sprachtechnologische Entwicklungen und Werkzeuge zur Unterstützung traditioneller lexikographischer Prozesse, die zu elektronischen oder gedruckten Wörterbüchern für menschliche Benutzer führen. Die Computerlexikographie ist ein junger Zweig der Computerlinguistik und in Deutschland noch nicht akademisch verankert. Es gibt zwar ein Lehrbuch zur Computerlexikographie und einzelne Lehrveranstaltungen zu diesem Thema, aber keinen diesem Thema gewidmeten Lehrstuhl und keine einschlägige Konferenz.
Benachbarte Disziplinen
Die Computerlexikographie ist keine eigene akademische Disziplin, aber ein reges Forschungsfeld, das mit zahlreichen thematisch verwandten Disziplinen vernetzt ist:
Lexikographie und Metalexikographie
Korpuslinguistik
Computerlinguistik und Sprachtechnologie
Künstliche Intelligenz
Geschichte der Computerlexikographie
Die Anfänge der Computerlexikographie können bis in die frühen achtziger Jahre zurückverfolgt werden. Damals setzte sich die Erkenntnis durch, dass sprachtechnologische Anwendungen wie die maschinelle Übersetzung nicht praxistauglich sind, wenn ihnen nicht breit angelegte lexikalische Ressource mit reichhaltigen Informationen zu den syntaktischen und semantischen Eigenschaften lexikalischer Einheiten zur Verfügung stehen. Die zu lösenden Fragen waren: wie können solche Informationen mit vertretbarem Aufwand beschafft oder erstellt werden? In welcher Form müssen diese Informationen vorliegen, damit sie von sprachtechnologischen Systemen verwendet werden können? Um diese Zeit stellten größere Wörterbuchverlage (in den angelsächsischen Ländern Longman, Webster) die Druckbänder einiger für den menschlichen Benutzer konzipierten Wörterbüchern zur Verfügung. Die Fülle der hierin vorhandenen Informationen führte zu zahlreichen Vorhaben, diese Informationen in einer für sprachtechnologische Anwendungen hinreichend formalisierten Form bereitzustellen. Das Stichwort dieser Epoche war 'machine readable dictionary'. Der anfänglichen Euphorie folgte bald Ernüchterung. Es stellte sich heraus, dass die in Wörterbüchern für den menschlichen Benutzer kodierten Angaben werden umfangreich genug noch präzise genug formuliert waren, um sie ohne zu großen Aufwand in lexikalische Datenbanken für sprachtechnologische Programme zu überführen. Im deutschsprachigen Raum kam es nur sehr sporadisch zur Umwandlung von Printwörterbüchern in lexikalische Datenbanken, da es keinen vergleichbaren Verlag gab, der bereit gewesen wäre, Wörterbuchdaten in größerem Umfang der Forschung zur Verfügung zu stellen [1] .
Literatur
Ted Briscoe, Bran Boguraev: Computational lexicography for natural language processing. White Plains:Longman 1989 Heyn, Matthias: Wiederverwendung maschinenlesbarer Wörterbücher. Eine computergestützte metalexikographische Studie zur Wiederverwendung des Oxford Advanced Learner's Dictionary in NLP. : Tübingen: Niemeyer 1992 (Lexicographica Series Maior). Matthias Heyn, Oliver Christ und Ulrich Heid: Computergestützte Metalexikographie. Erfahrungen bei der Ermittlung der Wiederverwendbarkeit eines Wörterbuchs für maschinelle Sprachverarbeitung. In: LDV-Forum 1.1992, S. 23-33 (http://www.jlcl.org/1992_Heft1/LDV-Forum1.1992.pdf) Lothar Lemnitzer, Claudia Kunze: Computerlexikographie. Tübingen:Gunter Narr Verlag, 2007 Lenders, Winfried: Semantische Relationen in Wörterbuch-Einträgen - Eine Computeranalyse des Duden-Universalwörterbuchs. In: Schaeder, Burkhard und Rieger, Burghard (Hrsg.): Lexikon und Lexikographie. Hildesheim, Zürich, New York: Olms, 1990, pp. 92-119.
Links
- ↑ Eine der wenigen Arbeiten, der deutschsprachige Wörterbuchdaten zugrunde liegen, ist Lenders 1990.