GESIS Training Courses
user_jsdisabled
Suche

Wiss. Koordination

Christopher Michels

Administrative Koordination

Loretta Langendörfer M.A.
Tel: +49-221-47694-143

Smart Harvesting II (SH2)

Dozent(en):
Nadine Dulisch, Christopher Michels, Mandy Neumann

Datum: 20.03.2018 ics-Datei

Veranstaltungsort: Köln

Seminarinhalt

Im DFG-geförderten Projekt Smart Harvesting II werden softwarebasierte Lösungen zur Erfassung und Aufbereitung bibliographischer Metadaten aus dem Web für Literaturdatenbanken wie dblp, entwickelt. Durch die vorherrschende Heterogenität solcher Rohdaten ist diese Arbeit im Falle der manuellen Erfassung sehr personal- und zeitintensiv. In Fällen, in denen bereits auf technische Unterstützung gesetzt wird, werden hierfür spezialisierte Programme, sogenannte Wrapper, eingesetzt, die von fachkundigen Softwareentwicklern erstellt und gewartet werden müssen. Ein Teil unseres Projektes ist es daher, wartungsarme Wrapper zu entwickeln, die auch von Nicht-Informatikern, z.B. Bibliothekaren oder Dokumentaren, einfach bedient und auf häufig neugestaltete, dynamische Webapplikationen angepasst werden können. Hierfür setzen wir auf die quelloffene Abfragesprache OXPath - eine Erweiterung von XPath, die eine deklarative Nachahmung der Interaktion mit einer Website erlaubt und in diesem Zuge Daten gezielt extrahieren kann. Erste Erfahrungen in einem Workshop mit Bibliothekaren und in Übungsgruppen mit Studierenden haben gezeigt, dass bereits Grundkenntnisse in XML und XPath ausreichen, um in den Prozess der Erstellung und Wartung von OXPath-Wrappern einzusteigen. Die gewonnenen Daten können vielseitig eingesetzt werden.
        
In diesem Workshop soll das DFG-geförderte Projekt Smart Harvesting II aus praktischer Sicht vorgestellt werden. Neben einem kurzen Gesamtüberblick über das Projekt wird daher zunächst explizit die quelloffene Abfragesprache OXPath vorgestellt. Dieser Workshop soll dazu beitragen, die potentielle Nutzergruppe unserer Projektergebnisse zu erweitern.
 
Im Rahmen dieses Workshops sollen die Teilnehmer anhand eines konkreten Beispiels an OXPath herangeführt und in die Lage versetzt werden, eigene Ausdrücke für ihre Anwendungsfälle zu entwerfen. Die in Smart Harvesting II entwickelten Softwarelösungen werden dabei ebenfalls vorgestellt um zu zeigen, wie diese zusätzliche Hilfestellungen bei der Metadatengewinnung aus dem Web bieten können.


Zielgruppe

Der Smart Harvesting II Workshop richtet sich an Verantwortliche und Mitarbeiter von Infrastruktureinrichtungen und aus den Bereichen Metadatengewinnung, Erwerbung sowie solche mit IT-Hintergrund.


Lernziel

Dieser Workshop bietet den Teilnehmern eine Einführung in OXPath als Abfragesprache zur Webdatenextraktion.


Voraussetzungen

Interesse an Metadatenharvesting.


Zeitplan

Literaturempfehlungen

Referenteninformationen - Nadine Dulisch

Referenteninformationen - Christopher Michels

Referenteninformationen - Mandy Neumann