Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.
9.4 c)
In der Aufgabenstellung zu Teilaufgabe c) steht nicht, ob die einzelnen Woerter wie in a) erst angepasst werden sollen. D.h. meine Ausgabe sieht bspw. so aus:
US! 194
USE 2639, 13, 2014, 210, 921, 1407, 270, 115
USED 116, 921, 270, 14, 2639, 1407, 2014, 210
Under 711, 2002
Unfix 2149
University". 192
University). 79
Ich habe da meine Zweifel, ob das so gewollt ist und stattdessen sowas erwartet wird:
us 194
use 2639, 13, 2014, 210, 921, 1407, 270, 115
used 116, 921, 270, 14, 2639, 1407, 2014, 210
under 711, 2002
unfix 2149
university 192, 79
Es reicht, die Wörter so zu zerteilen, wie das die WordCount-Vorgabe auch macht. Ansonsten hätte man die WordCount-Aufgabe ja im Prinzip zwei Mal auf dem Aufgabenblatt.
Naja, ich richte mich eigentlich immer nach der Aufgabenstellung und wenn in der nichts steht dann mache ich auch nichts.
Hier kam es mir nur ein bisschen komisch vor, weil die map-Funktion (laut Aufgabenstellung) nur ein Dreizeiler ist.
Hallo,
wie kann man denn Bildschirmausgaben (System.out.println) machen bei hadoop, um zu debuggen? Denn wenn ich es mit System.out.println/System.err.println versuche, erscheint nur der übliche Kompilier-Log auf der Konsole ohne meine gewünschte Ausgabe…
Tipp: Man sollte beim debuggen einfach in den ‘context’ schreiben, das ist ein ganz passabler workaround.
Sollen bei Aufgabe 9.4a) Worte mit nur Sonderzeichen ignoriert werden oder als leerer String eingereiht werden?
Wie du solche Wörter behandelst, ist im Prinzip egal (steht ja nicht in der Aufgabenstellung). Nimm doch einfach den leeren String, dann sparst du dir eine Fallunterscheidung.
Entschuldigung, ich bin etwas verwirrt.
Bitte im klarsten Klartext nochmal für die Langsamsten.
Ich habe das gleiche Problem wie der Threadstarter.
Ist die Ausgabe
University". 192
University). 79
nun ok? Oder sollte es vielmehr so:
university 79, 192
aussehen?
Die erste Variante reicht, die zweite ist aber auch okay. Ist ja, wie gesagt, nicht genau spezifiziert, was verlangt ist. Außerdem geht es bei der Teilaufgabe vielmehr darum, dass die Konfiguration und das Zusammenspiel von Mapper und Reducer richtig umgesetzt wurde.
Ok, danke.
Mir ist übrigens aufgefallen, das in WordCount im vorgegebenen Code die Reducer-Klasse als Combiner-Klasse gesetzt wird.
Es kommt das gleiche Ergebnis raus, wenn man die Zeile auskommentiert und die CommonFriends geht sogar kaputt, wenn man die Zeile übernimmt.
Eine Recherche ergab, dass es keine Standard-CombinerClass gibt. Aber scheinbar wirft der vor dem Reduce-Aufruf trotzdem alle Zwischenergebnisse des gleichen Keys zusammen.
Bei mir funktionieren alle Teilaufgaben auch ohne die CombinerClass zu setzen.
Kann ich davon ausgehen, dass das auf dem Server dann auch funktioniert?
Den Reducer als CombinerClass zu setzen dürfte nur funktionieren, wenn die Eingabedatentypen des Reducers gleich den Ausgabedatentypen sind. Wenn du es nicht brauchst, lass den [m]setCombinerClass()[/m]-Aufruf einfach weg.