StudOn Test zu Aufgabenblatt 8, LSA C) -> Kosinusdistanz

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

StudOn Test zu Aufgabenblatt 8, LSA C) → Kosinusdistanz
Hallo,
ich verstehe nicht ganz warum (bei mir) das Dokument 1 am besten zur Suchanfrage passt.
Cos-Distanzen der Dokumente:
d1=0,197743
d2=-0,7705
d3=-0,7257

Da die Cos-Distanz die Ähnlichkeit der Vektoren (über den Winkel dazwischen) beschreibt, dachte ich eigentlich das der Wert so nah wie möglich bei 1 sein muss (gleiche Richtung) oder bei -1 (entgegengesetzt). Ein Wert von 0 würde doch eigentlich Orthogonalität beschreiben.

Deswegen verstehe ich nicht ganz, warum d1 am besten passt und nicht etwa d2.

Danke schonmal für eine Antwort.


Guten Morgen,
mit deiner Interpretation hast du fast ganz recht. Tatsächlich suchst du den Dokumentenvektor, der so stark wie möglich in die selbe Richtung wie der Anfragenvektor gerichtet ist. Eine negative Kosinusdistanz ist daher zu vermeiden - immerhin zeigen die Vektoren damit in entgegengesetzte Richtungen. Daher ist Orthogonalität immer noch besser als eine negative Kosinusdistanz.

In kurz: d = -1 ist der schlechteste mögliche Fit, und d = +1 der bestmögliche. In diesem Fall ist d1, als einzig positiver Wert, also das beste, was wir haben.

Grüße,
Frederik