- Halley-Verfahren
-
Das Halley-Verfahren (auch Verfahren der berührenden Hyperbeln) ist, ähnlich wie das Newton-Verfahren, eine Methode der numerischen Mathematik zur Bestimmung von Nullstellen f(x)=0 reeller Funktionen . Im Gegensatz zum Newton-Verfahren hat es die Konvergenzordnung 3, benötigt dazu aber zusätzlich zur ersten auch die zweite Ableitung. Es ist nach dem Astronomen Edmond Halley benannt, der auch das Wiederkehrgesetz des nach im benannten Halleyschen Kometen bestimmte. Ein vergleichbares Verfahren ist das Euler-Tschebyschow-Verfahren.
Inhaltsverzeichnis
Beschreibung des Verfahrens
Sei f eine reelle Funktion mit stetiger zweiter Ableitung, und sei a eine einfache Nullstelle von f, d. h. . Dann konvergiert für Startpunkte x0 nahe a die durch die Iteration
- , k=0,1,2,...
erzeugte Folge sukzessiver Näherungen mit kubischer Konvergenzordnung gegen a.
Varianten dieses Verfahrens sind das ursprünglich von Halley verwendete irrationale bzw. parabolische Halley-Verfahren mit der Iterationsvorschrift
- ,
und in Verallgemeinerung dessen das Laguerre-Verfahren
- .
Für Polynome wird dabei n gleich dem Grad gesetzt. Da der Term unter der Wurzel negativ werden kann, können diese beiden Varianten auch für rein reelle Polynome und reelle Startwerte zu komplexen Nullstellen konvergieren. Bei der in nachfolgenden Iterationen notwendigen Bestimmung der Quadratwurzel aus komplexen Zahlen ist hier immer die Lösung mit positivem Realteil zu wählen, so dass der Nenner den größtmöglichen Betrag hat.
Motivation
Sei f eine reelle Funktion mit stetiger zweiter Ableitung, und sei a eine einfache Nullstelle von f, d. h. . Dann wird der Funktionsverlauf von f in der Nähe von a in zweiter Ordnung „gerade gebogen“, indem statt f die Funktion betrachtet wird. Diese Konstruktion ist von der Nullstelle unabhängig. Nun wird das Newton-Verfahren auf g angewandt. Es ist
und daher
Dieselbe Vorschrift ergibt sich aus dem allgemeineren Householder-Verfahren in der zweiten Ordnung
Beispiel
Die Iteration für die Quadratwurzel von z.B. a=5 ergibt mit f(x) = x2 − a die Iterationsvorschrift
und damit die Berechnungstabelle
k xk f(xk) 0 3.00000000000000000000000000000000000000000000000000000000000 4.00000000000 1 2.25000000000000000000000000000000000000000000000000000000000 0.0625000000000 2 2.23606811145510835913312693498452012383900928792569659442724 5.99066414899E-7 3 2.23606797749978969640929385361588622700967141237081284965284 5.37483143712E-22 4 2.23606797749978969640917366873127623544061835961152572427090 0.000000000000 Es ergibt sich eine Folge von 0, 1, 5, 21, >60 gültigen Stellen, d. h. eine Verdreifachung in jedem Schritt. Das Newtonverfahren hat die Verfahrensvorschrift:
Im direkten Vergleich zeigt das Halley Verfahren die schnellere Konvergenz. Es benötigt jedoch mehr Rechenoperationen pro Schritt.
Kubische Konvergenz
Sei f dreimal stetig differenzierbar. Da a als Nullstelle von f vorausgesetzt wurde, gilt näherungsweise . Genauer gilt auf einem Intervall I, welches a enthält, nach dem Mittelwertsatz der Differentialrechnung die zweiseitige Abschätzung
- ,
d. h. sowohl x − a = O(f(x)) als auch f(x) = O(x − a). Es reicht also, das Verhältnis der Funktionswerte von einem Iterationsschritt zum nächsten zu bestimmen.
Irrationales oder parabolisches Halley-Verfahren
Die Taylorentwicklung zweiten Grades von f ist
- .
Dies ergibt zunächst eine Näherung durch eine Parabel, die den Graphen von f im Punkt x von zweiter Ordnung berührt. Ist f(x) klein genug, so hat diese Parabel eine Nullstelle, die deutlich nahe an x liegt, nämlich bei
Die entsprechende Iteration ist
- .
Da der Nenner von h in der Nähe einer Nullstelle von f von Null verschieden ist, gilt h = O(f(x)). Durch diese Konstruktion von h verschwinden die ersten drei Glieder der Taylor-Entwicklung, daher gilt f(xk + 1) = O(h3) = O(f(xk)3).
Diese Form des Verfahrens wurde ursprünglich von E. Halley vorgeschlagen. Entwickelt man die Wurzel nach , so erhält man das, heute übliche, rationale oder hyperbolische Halley-Verfahren.
Hyperbolisches Halley-Verfahren
Benutzt man in der Taylor-Entwicklung von f(x + h) die Identität (a + bh)(a − bh) = a2 − b2h2 = a2 + O(h2), so kann man diese in einen Bruch von in h linearen Funktionen verwandeln, d.h. f wird in der Nähe von x durch eine hyperbolische Funktion angenähert, und von dieser nachfolgend die Nullstelle bestimmt:
Die Funktion f wird also durch eine Hyperbel approximiert, die f in x zu ebenfalls zweiter Ordnung berührt. Der Zähler der Hyperbelfunktion verschwindet für , woraus sich die Halley-Iteration (s.o.) ergibt. Wieder gilt h = O(f(x)) und damit
Daraus folgt dann für die Halley-Iteration
d. h. die kubische Konvergenz.
mehrdimensionale Erweiterung
Eine Erweiterung des Verfahrens auf Funktionen mehrerer Veränderlicher ist möglich. Es kann der gleiche binomische Trick zur Herstellung einer Hyperbelfunktion verwendet werden. Dabei ist aber zu beachten,
- dass F'(x) eine Matrix ist, die als invertierbar vorausgesetzt wird,
- dass F''(x) ein Tensor dritter Stufe ist, genauer eine vektorwertige symmetrische Bilinearform, und
- dass die unvollständig ausgewertete zweite Ableitung , die ebenfalls eine Matrix ist, im Allgemeinen nicht mit der Matrix F'(x) kommutiert.
Dies sind keine Hindernisse, diese Eigenschaften machen nur die Rechnung etwas unübersichtlicher. Es bezeichne s = − F'(x) − 1F(x) den üblichen Newtonschritt, sei der entsprechend modifizierte Term zweiter Ordnung. Dann gilt für die Taylorentwicklung in x
Der in t lineare Teil des Zählers wird nun zu Null gesetzt und weiter umgeformt. Dabei wird die Symmetrie von C(.,.) ausgenutzt:
Werden nun die Kurznotationen durch die ursprünglichen Ausdrücke ersetzt, so ergibt sich
- .
Man überzeugt sich leicht, dass diese Formel sich im eindimensionalen Fall zur Halley-Iteration reduziert. Der sich daraus ergebende Iterationsschritt des mehrdimensionalen Halley-Verfahrens kann in 3 einfacheren Schritten bestimmt werden:
- Newton-Schritt: Löse F'(xk)sk = − F(xk)
- Korrektur des Newton-Schritts: Löse
- Setze xk + 1 = xk + tk
Ist die 2.Ableitung Lipschitz-stetig, so konvergiert das Verfahren lokal kubisch.
Da F(x) als klein vorausgesetzt wurde, ist es nicht mehr notwendig, die Inverse der großen Klammer zu bestimmen. Es kann wieder der binomische Trick (bzw. die Taylorformel 1. Grades) benutzt werden, um den einfacheren, aber bis auf Terme dritter Ordnung (nun in F(x)) identischen Ausdruck
zu erhalten. Die daraus abgeleitete Iteration ist das Euler-Tschebyschow-Verfahren.
Weblinks
- Eric W. Weisstein: Halley's method. In: MathWorld. (englisch)
- Pascal Sebah und Xavier Gourdon (2001): Newton’s method and high order iterations, Abschnitt „Cubic Iteration“
Quellen
- T.R. Scavo and J.B. Thoo: On the geometry of Halley’s method. In:American Mathematical Monthly. Volume 102 (1995), number 5, S. 417–426.
- Dieser Artikel wurde dem Artikel en:Halley's method der englischen Wikipedia nachempfunden (Stand 26. Januar 2007).
- Hubert Schwetlick: Numerische Lösung nichtlinearer Gleichungen. Deutscher Verlag der Wissenschaften, 1979.
Wikimedia Foundation.