cg-Verfahren

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

cg-Verfahren
Bei Blatt 10, Aufgabe 2 sollte man eine Gleichung für die optimale Schrittweite beim cg-Verfahren zeigen.

Die Lösung für t bestimmt man mit argmin { F (x_i + t * s_i) : t > 0 }, z.B. per 1D-Minimierung mit Newton.
Nach dem Newton-Verfahren müsste im Zähler der Gradient von Q stehen und im Nenner die Hesse-Matrix von Q.

Irgendwie erschließt sich mir nicht, wie man auf den Gradienten und die Hesse-Matrix von Q kommt.


Du willst hier ja die Schrittweite optimieren, also betrachtest du Q nur als Funktion von t. Ich denke du kannst dann Q(x_0 + ts_0) einfach nach t ableiten, Q’(x_0 + ts_0) = 0 setzen und entsprechend nach t auflösen. Tut man das, kommt man auf genau den Term der dort für t_0 angegeben ist. Dann muss man nur noch mit der zweiten Ableitung von Q nach t verifizieren, dass es sich um ein Minimum handelt.