MapReduce

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

MapReduce
Ich steht aktuell denke ich etwas auf dem Schlauch. Kann auch an der Uhrzeit liegen.

Wenn ich das jetzt richtig verstandenhabe, sollen wir bei der findShortestPaths die Adjazenzmatrix erstmal zu einer List von Pairs konvertieren und die dann x-mal mit MapReduce aufrufen und danach sortieren(?) und dann wieder aufrufen, bis wir unser Ergebnis bekommen?

Mir gehts gerade nur rein um das Verständnis.


Ich glaub das mit dem sortieren muss man gar nicht machen. Hab des nämlich erst probiert und dann wieder gelöscht :D. man soll denk ich nur das submit vom mapreducer solange ausführen bis nix mehr verändert wird. So hab ichs jedenfalls gemacht und der test hat funktioniert.


Ja ich hab die submit aufgerufen, bis sich nichts mehr ändert.

Aber ich habe ein Frage zum Kmeans:
Wie sind die Daten zu interpretieren, die man bekommt?
also man hat ein 2d “Array” von Double. ich nehme an eine liste von Punkten.
jetzt ist die Frage was bedeuten die Doublewerte?
z.b.: [5.1, 3.5, 1.4, 0.2]
hätte vermutet, dass es x, y, z im 3D raum ist, aber was mach ich mit dem 4 Wert?


Erstell dir lieber nen eigenen Thread;)

Zur Frage:

IRIS ist ein 4-D Datensatz damit hast du auch 4 Dimensionen, die anderen Datensätze haben sogar noch mehr Dimensionen