Literatur: Jurafky, Martin: Speech and Language Processing

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

Literatur: Jurafky, Martin: Speech and Language Processing
Hey,
ich hab am Ende der letzten Vorlesung von einem Language Parsing/Processing Buch gesprochen,
welches ich persönlich für Computerlinguistik-verwandte Themen hinzuziehen würde.
Das Buch heißt Speech and Language Processing und ist von Dan Jurafsky and James H. Martin.
Ich hatte einen kostenlosen Draft der dritten Auflage gefunden, den Herr Jurafsky selbst bereitstellt.
Zudem ist der Draft gegenüber der letzten Auflagen mMn vorzuziehen, da einige Kapitel in den letzten Jahren aktualisiert wurden.

Direktlink zum PDF

Liebe Grüße,
nakami

1 „Gefällt mir“

Als wir heute über Modallogik gesprochen haben, ist mir aufgefallen, dass häufiger einige typische Modal-Wörter in ihrer Aussage relativ sind und Menschen effektiv unterschiedliche Gewichtungen (sicherlich auch im jeweiligen Kontext variierend) den Wörtern geben. Sowas wie “meistens” oder “fast immer” z.B. ist relativ durch das handelnde Individuum gewichtet, jedoch ist die generelle Tendenz der Aussage dieser Wörter intuitiv ja doch dieselbe. Vielleicht ist es etwas weit hergeholt, jedoch wird in SLP versucht andere relative Wortklassen statistisch zu visualisieren.

Im Kapitel 18 “Lexicons for Sentiment and Affect Extraction” gibt es zwei Abbildungen (Figure 18.8 und 18.9; Seite 10) über einen Versuch IMDB-Filmrezensionen (1 (schlecht) bis 10 (gut)) in Relation zu der Häufigkeit von relativen Signalwörtern innerhalb der Rezension aufzuzeigen. Ich denke es ist klar, dass diese sog. Potts Diagramme mit Vorsicht zu genießen sind, wenn schon u.a. nicht einmal erwähnt wird, ob auf Negation geachtet wurde.

Hängt jetzt nicht unmittelbar mit Modallogik zusammen, aber es ist dennoch - meiner Meinung nach zumindest - sicherlich interessant relative Begriffe auf deterministische Zahlenwerte zu mappen.