Die freie Software DocAnalyser des Lehrgebiets Kommunikationsnetze der FernUniversität sucht automatisiert nach passenden Begriffen, die eine Internet-Recherche effizienter machen. Obwohl bereits fünf bis sechs spezielle Suchbegriffe bei komplexen Recherchen häufig zum Erfolg führen, ist dies selbst für rechercheerfahrene Nutzerinnen und Nutzer häufig ein langwieriger, aufwändiger und fehleranfälliger Lese- und Lernprozess. Die frei verfügbare, interaktive Suchanwendung DocAnalyser empfindet diesen Leseprozess technisch nach. Mit dieser Software ist es erstmals möglich, automatisiert thematisch verwandte Dokumente im Web zu finden, indem komplette Seiten oder ausgewählte Teile semantisch – also entsprechend ihrer Bedeutung für den Text – analysiert werden.
Die zutreffenden Begriffe für Internetrecherchen zu finden, ist oft zeitaufwändiger als die letztendlich erfolgreiche eigentliche Suche. Zielorientiert und automatisiert hilft hier die neue Software DocAnalyser. Entwickelt hat sie Dr. Mario Kubek, Privatdozent am Lehrgebiet Kommunikationsnetze der FernUniversität in Hagen, im Rahmen seiner Habilitation. Sein Ziel war es, genau diejenigen Dokumente zu finden, die ein aktuelles Informationsbedürfnis optimal befriedigen, aber keine Lawine von Ergebnissen mit nur geringer Relevanz lostreten. Interessierte können sich den DocAnalyser unter http://www.docanalyser.de kostenfrei downloaden und nutzen.
Lese- und Lernprozess automatisiert
Bei einer herkömmlichen Suche müssen die Begriffe, die am schnellsten zum Ziel führen, häufig zunächst in einem langwierigen, aufwändigen und fehleranfälligen Lese- und Lernprozess ermittelt werden. Dabei wird die Suche verfeinert und gegebenenfalls in neue Richtungen gelenkt. Diesen Prozess bildet der DocAnalyser technisch ab. „Ich ‚werfe‘ ein Dokument in den DocAnalyser, der automatisch die für mich wichtigen Ergebnisse generiert“, erläutert Dr. Mario Kubek. „Er nimmt mir das Lesen eines unbekannten Dokumentes ab, stellt mir die für meine Suche wichtigen Begriffe automatisiert zur Verfügung und erspart mir sehr viel manuelle Arbeit. Er kann sogar nach Bildern suchen.“
Diese interaktive Suchanwendung findet thematisch verwandte Dokumente im Web, indem sie komplette Seiten oder ausgewählte Teile semantisch – also entsprechend ihrer Bedeutung für den Text – analysiert. Sie identifiziert weitere Schlüsselwörter und Quellthemen und generiert selbst neue Suchanfragen, mit denen weitere relevante Webdokumente gefunden werden. Quellthemen sind diejenigen Wörter in einem Text, die seine Bedeutung besonders beeinflussen.
Software lernt lokal
Zudem kann der DocAnalyser bedeutungsähnliche Beziehungen zwischen Such- und Schlüsselwörtern erlernen. So können automatisch erzeugte oder manuelle Sucheingaben durch passende Wörter erweitert und allgemeine Anfragen immer weiter spezialisiert werden. Dieses Lernen findet lokal in den User-Webbrowsern statt – nutzerspezifisch und individuell auf der Basis der bisher analysierten Inhalte. Die gefundenen Dokumente präsentiert der DocAnalyser nach ihrer Relevanz geordnet in einer Ergebnisliste, also in der von herkömmlichen Suchmaschinen bekannten Form. Selbstverständlich ist es auch möglich, nur mit eigenen Termen zu suchen.
So werden vor allem die Dokumente gefunden, die einen wirklichen inhaltlichen Beitrag zum Thema haben. Das grenzt zum einen die Menge der Suchergebnisse deutlich ein, zum anderen findet man auch diejenigen relevanten Dokumente, die statt der eingegebenen Suchbegriffe – wie z.B. „Vogelgrippe“ oder „Virus“ – andere, aber dennoch zum Thema gehörende enthalten, etwa „H5N1“.
https://fernuni.de/docanalyser