Skip to content

Analyse wissenschaftlicher Publikationen

by - November 27, 2010

Bei der Analyse wissenschaftlicher Publikationen stößt man schnell auf Begriffe wie Szientometrie, Bibliometrie oder h-Index. Im Rahmen des AAN-Systems gibt es aber noch mehr interessante Sichtweisen als die Klärung dieser Begriffe und deren Umfeld. Als Einstieg in die Thematik bieten sich folgende Punkte an:

  • Frei zugängliche Publikationen und Verzeichnisse, in denen man diese finden kann
    Aus einer aktuellen Studie geht hervor, dass 20% der Publikationen aus dem Jahr 2008 im Internet zugänglich sind. Eine besondere Form dieser Publikationen sind Open access journals, die z.B. im DOAJ gesammelt werden. Durch angebotene Schnittstellen schreit diese Quelle geradezu danach, genutzt zu werden. Eine andere Quelle, die vielleicht auch für die private Recherche interessant ist, ist die elektronische Zeitschriftenbibliothek der Uni-Bib Regensburg.
  • Datenformate zur Übertragung von Metadaten
    Mit BuRST und dem OAI-Protocol gibt es zwei Verfahren, die auf Standard-Vokabularien basieren und mit denen eine komfortable Übermittlung von Metadaten möglich ist.
  • Aktuelle Entwicklungen im Kontext von AAN
    Die Anbindung von Publikationen an das AAN System ist ein hochaktuelles Thema. Derzeit werden Datensätze aus dem DOAJ in die AAN Ontologie integriert und eine Parser-Komponente implementiert.
  • Daten-Extraktion aus PDF-Dateien
    Publikationen liegen häufig im PDF-Format vor. Um Metadaten aus diesen zu extrahieren, kann man sich verschiedener Werkzeuge bedienen. Zunächst wird aus einem PDF der Reintext extrahiert. Die Software ParsCit ist darauf spezialisiert, Referenzen aus Texten auszulesen und zu analysieren. Dazu nutzt sie CRF++, um durch maschinelles Lernen und dem Conditional Random Field Modell bestimmte Felder erkennen zu können.
  • Scientometrics, Bibliometrics, Citation Analysis
    Den größten Teil des Einstiegs in die Materie bilden Grundlagen der Zitationsanalyse und bibliometrische Maße. Durch die Analyse von Zitationen kann ermittelt werden, wie stark Autoren zusammengearbeitet haben oder wie relevant Publikationen für bestimmte Bereiche sind. Bibliometrische Maße, wie der Hirsch-Index, versuchen die Leistung von Autoren zu messen.

Diese Themen bilden die Grundlage für erste Analysen von Publikationen in Artefact-Actor-Networks. Durch die Kombination der im System abrufbaren semantischen Beziehungen und Volltexten, und durch Erweiterungen der vorgestellten Analyse-Konzepte, können vielfältige Ergebnisse berechnet und praktisch genutzt werden. Die Folien zur Präsentation können via SlideShare heruntergeladen werden.

From → Seminarthemen

Schreibe einen Kommentar

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: