Average depth of unbalanced trees

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

Average depth of unbalanced trees
Hallo liebe Freunde von AuD :slight_smile:

Hat man damals in AuD (das ist bei mir 5 Jahre her) gelernt, was die durschnittliche Tiefe eines unbalancierten Baums ist?

Best Case: log_2(n) (d.h. komplett balanciert)
Worst Case: n (d.h. Strich in der Landschaft)

wobei n die Anzahl der Knoten ist.

Und was ist dazwischen?


Die Frage ist leider nicht besonders sinnvoll, denn es kommt sehr stark drauf an, was für Daten du mit welchem Muster einfügst. Wenn du wirklich zufällige Daten hast gibt es eine Abschätzung, allerdings wird das etwas komplizierter und kam definitiv in AuD nicht dran. Schau selbst: http://staff.ustc.edu.cn/~csli/graduate/algorithms/book6/chap13.htm (unten bei randomly generated)


Danke schonmal für den Link.

Bin mir nicht sicher, ob das genau das ist, was ich suche.
Tatsächlich würde ich gerne bestimmen, was die durchschnittliche Tiefe der Bäume in einem Random Forest ist. Zu 100% zufällig sollten die Bäume im Random Forest ja auch nicht sein.

Der Fall O(n) kann (glaube ich) gar nicht eintreten.
Auch das mehrere Knoten über eine Strecke auf der keine Abzweigungen sind verbunden sind, glaube ich kann nicht passieren. Denn sonst müssten beim Training etwas schief gelaufen sein, da nur ein subtree gebaut wird, wenn noch mehrere Klassen an einem Knoten vorhanden sind…

Aber sei’s drum.

Nach dem ich etwas weiter im Netz recherchiert habe, scheint das ganze Problem doch deutlich schwerer zu sein, als angenommen. Man findet zu diesem Thema kaum bis keine Literatur - zumindest keine die nicht einen Doktor in Mathematik voraussetzt um sie zu verstehen …