Vortragsfolien

 Documents

 30 views
of 22
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Description
Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback) 12.06.2002 Niko Zenker 1 Gliederung I. Motivation…
Share
Transcript
Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback) 12.06.2002 Niko Zenker 1 Gliederung I. Motivation II. Methoden zur Anfrageverfeinerung III. Auswertungen der Verfeinerungs- mechanismen IV. Zusammenfassung 12.06.2002 Niko Zenker 2 Motivation  keine genauen Kenntnisse über den Aufbau der DB und Retrieval-Umgebung  Anfragen beruhen auf dem Prinzip „Glück“  Verfeinerungen können per Hand realisiert werden  durch Einführung von Relevanz-Feedback Methoden wird dieser Prozess teilautomatisiert 12.06.2002 Niko Zenker 3 Grundidee  Auswählen von wichtigen Termen oder Ausdrücken, die an bestimmte vorherige Dokumente gebunden sind  Dokumente, die der Benutzer vorher schon nicht sehen wollte, scheinen auch nicht von Interesse zu sein  Ziel: gute Ergebnisse bei vagen Anfrangen 12.06.2002 Niko Zenker 4 Information Retrieval Anfrage Dokumente Verarbeitung Verarbeitung Anfrage- Dokument- darstellung darstellung Verlgeich (Ähnlichkeitsberechnung) Ergebnisdokumente Relevanzbewertung und Feedback 12.06.2002 Niko Zenker 5 Vektor-Modell  Anfragen werden mittels Vektor an die entspr. Daten gestellt Qn  (q1 , q2 ,..., qi ) mit i  N und 0  qi  1  Relevanz Feedback Methode(n) generiert neuen Anfragevektor Q  (q1, q2 ,..., qi) 12.06.2002 Niko Zenker 6 Anfrageverfeinerung Vektor Abgleich Fügt die Gewichte der Terme, der Dokumente Ide dec-hi direkt zu den Anfragetermen hinzu. (Vector Benutzt alle relevanten, Adjustment) aber nur die höchst unrelevanten zurückgelieferten Terme. Qnew  Qold   all Di  one D i relvant nonrelevant 12.06.2002 Niko Zenker 7 Anfrageverfeinerung (II) Vektor Abgleich Fügt die aktuellen Gewichte der Terme, der Ide regular Dokumente direkt zu den Anfragetermen hinzu. (Vector Benutzt alle relevanten, Adjustment) und alle unrelevanten zurückgelieferten Terme. Qnew  Qold   all Di  all D i relvant nonrelevant 12.06.2002 Niko Zenker 8 Anfrageverfeinerung (III) Vektor Abgleich Reduziert die Termgewichte durch Standard nach Division mit der Anzahl Rocchio der entsprechenden Dokumente. (Vector Adjustment) Di Di Qnew  Qold      n1 n1 n2 n2 rel nonrel doc doc   1 12.06.2002 Niko Zenker 9 Wahrscheinlichkeitsfeedback  Ziel ist es, die Dokumente nach ihrer Wahrscheinlichkeit zu ordnen, die vom Benutzer als relevant in Bezug auf die Query eingestuft wurden Pr( x | rel ) log Pr( x | nonrel ) 12.06.2002 Niko Zenker 10 Anfrageverfeinerung (IV) konventionelles Verhältnis, der Wahrscheinlichkeiten der Wkt.-feedback relevanten zu den (Probabilistic nichtrelevanten Termen der Retrieval- conventional) Ergebnisses.  pi (1  ui )  pi  P( xi | rel )  ri  0,5 qinew  log   R  1,0  ui (1  pi )  n  r  0,5 ui  P( xi | nonrel )  i i N  R  1,0 12.06.2002 Niko Zenker 11 Anfrageverfeinerung (V) angepassetes Wkt.- Verallgemeinerung des feedback bzgl. der konventionellen Modells, im Bezug auf das Herkunft Auftreten bestimmter (Probabilistic Dokumente. adjusted derivation) ni ri   pi(1  ui)  pi  P( xi | rel )  N qinew  log   R 1    ui (1  pi )  ni ni  ri  ui  P( xi | nonrel )  N N  R 1 12.06.2002 Niko Zenker 12 Beispiel  500 Dokumente in der DB (N)  100 mit den gewünschten Informationen (ni)  25 werden als relevant markiert (R)  nur 10 dieser als relevant markierten Dokumente enthalten die gewünschte Information (ri) 12.06.2002 Niko Zenker 13 Beispiel (II) 10  0,5 100  10  0,5 pi  ui  25  1,0 500  25  1 qinew  0,48536662 100 100 10  100  10  pi  500 u   500 25  1 500  25  1 i qinew  0,44109877 12.06.2002 Niko Zenker 14 Anfrageverfeinerung (VI) angepassetes Wkt.- selbe Prinzip wie zuvor, feedback bzgl. der nur mit anderen Werten Herkunft (verbessert) für R‘ = R+3 und ri‘=ri+3 (Probabilistic adjusted derivation revised) ni ri   pi(1  ui)  pi  P( xi | rel )  N qinew  log   R  1    ui (1  pi )  ni ni  ri  ui  P( xi | nonrel )  N N  R  1 12.06.2002 Niko Zenker 15 Auswertung der Methoden  die Effizienz der Methoden, errechnet man durch einen Vergleich der ersten Iteration des Feedback-Verfahrens und der Initiationssuche  normalerweise benutzt man Recall und Precision Messungen um dieses Ergebnis zu errechnen 12.06.2002 Niko Zenker 16 Precision & Recall relvante Dokumente  Precision gefundene relevante Dokumente alle gefundenen Dokumente  Recall gefundene relevante Dokumente__ gespeicherte relevante Dokumente Menge aller gefundene Dokumente relevante Dokumente 12.06.2002 Niko Zenker 17 Auswertung der Methoden (II)  die Auswertung der Feedback-Dokumente wird erschwert  weil sich die Ergebnisse teils deutlich vom echten Feedback-Ergebnis unterscheiden  der User will nicht zweimal das selbe Dokument sehen  die Relevanz-Feedback Operation muss entscheiden, ob sie neue Dokumente anzeigt, die nicht ursprünglich vom User gesehen wurden 12.06.2002 Niko Zenker 18 Partial Query Expansion vs. Full Query Expansion  FQE:  alle Anfragevektoren haben die selbe Länge wie der Ursprung  Gewichtungen werden verändert  PQE:  reduzieren auf durchschnittliche Länge der Anfragevektoren  Terme mit hoher Frequenz werden übernommen 12.06.2002 Niko Zenker 19 Ergebnisse aus der Forschung  gewichtete Terme produzieren bessere Ergebnisse beim Feedback-Prozess  full expansion erweist sich als besser als partial expansion  die beste Feedback-Methode ist: „Ide dec hi“  Wahrscheinlichkeits-Feedback ist im Allgemeinen schlechter als Vektor-Feedback 12.06.2002 Niko Zenker 20 Optimierung des Feedbacks  die durchschnittliche Länge der Anfrage ist von besonderem Interesse  schlechte Initial-Ergebnisse iterieren meist mit guten Ergebnissen  präzise gestellte Anfragen werden vom Feedback-Prozess besser adaptiert 12.06.2002 Niko Zenker 21 Zusammenfassung  Relevanz-Feedback ist eine „billige“ Methode für die Neuformulierung von Anfragen mit Bezug auf die vorherigen Ergebnisse  wegen der Einfachheit der Veränderungen der Anfragen, sollten Relevanz-Feedback-Systeme in jedes Text-Retrieval-System eingebunden werden 12.06.2002 Niko Zenker 22
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks