Skip to content

Information Retrieval und Recommender Systems

by - November 6, 2010

Hallo zusammen, nach meiner Sitzung mit Wolle möchte ich nun einen Blogeintrag zu meinem Thema erstellen. Damit sollt auch ihr eine Idee bekommen, was euch unter dem Titel „Information Retrieval und Recommender Systems“ in meinem späteren Vortrag und der Ausarbeitung erwartet.

Schematischer Ablauf von der Beschaffung und dem Abruf von Informationen

Die Abbildung soll schematisch den Ablauf von der Beschaffung und dem Abruf von Informationen darstellen. Die Beschaffung (information extraction) kann beispielsweise mittels parsing oder crawling realisiert werden. Anschließend geht es an die geeignete Speicherung der gewonnen Informationen in entsprechenden Datenstrukturen und Datenbanken. Erst im letzten Schritt kann das Auffinden bzw. das Wiederauffinden der Informationen stattfinden. Immer häufiger findet man das „Social Information Retrieval“ als eine Spezialform des Information Retrieval. Dieses bezieht beispielsweise Tags, Bookmarks, Ratings, soziale Netzwerke und andere Aspekte beim Auffinden von Informationen.

Für gute Vorschläge und Empfehlungen werden sogenannte Recommendation-Algorithmen benötigt. Im Allgemeinen unterscheiden sie sich in ihren Eigenschaften (Laufzeit, Effizienz und Speicherverbrauch). Im Speziellen arbeiten sie auch auf verschiedenen Ebenen. Es wird zwischen der inhaltlichen (1) und der sozialen Ebene (2) unterschieden:

  1. Die vorliegenden Artefakte (Texte, Paper, Webseiten, etc.) werden mit Textanalyse-Werkzeugen untersucht. Aus Texthäufigkeiten und Schlagwörtern werden Empfehlungen generiert.
  2. Hier steht der Benutzer bzw. die Benutzung und der Umgang mit Artefakten im Vordergrund („wer liest was“, „wer sind die Personen“, „wie ist man auf die Informationen gestoßen“, „was empfehlen Freunde“ etc.). Aus dem Profil (inkl. sozialem Netzwerk) und dem Verhalten werden Vorschläge und Empfehlungen getroffen.

Interessant ist ebenfalls die Kombination aus beiden Ebenen. Gegebenenfalls kann dadurch eine bessere Menge an Empfehlungen erzeugt werden (etwa die Teilmenge aus den Treffern beider Verfahren).

In meiner Ausarbeitung und dem Vortrag möchte ich den Fokus auf Recommender Systems legen. Dabei werde ich die erwähnten Algorithmen näher untersuchen und die Arbeitsweisen anschaulich darstellen. Außerdem möchte ich die verschiedenen Arten von Empfehlungsdiensten an möglichst vielen Beispielen aufzeigen (amazon, google, youtube, mendeley, ..). Der Schwerpunkt wird hier auf den Vorschlägen für textbasierte Artefakte sein.
Außerdem schaue ich mir einige Werkzeuge  und ihre Funktionsweisen aus diesem Bereich an. Dazu zählen die Google Custom Search und Apache Solr.

Dieser Eintrag dient als erster Vorschlag zu dem gegebenen Thema und wird sicherlich bei dem nächsten Treffen mit Wolle spezialisiert und verfeinert.

Update:

Anbei die Slideshare-Version meines Vortrags.

From → Seminarthemen

Schreibe einen Kommentar

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: