Algoritma Gauss-Newton

Di dalam ilmu matematika, algoritme Gauss-Newton digunakan untuk memecahkan masalah-masalah kuadrat terkecil. Algoritme ini merupakan sebuah modifikasi dari metode Newton untuk mengoptimalkan sebuah fungsi. Tidak seperti metode Newton, algoritme Gauss-Newton hanya bisa digunakan untuk mengoptimumkan jumlah dari nilai fungsi kuadrat. Metode ini merupakan hasil penemuan dari matematikawan bernama Carl Friedrich Gauss.

Permasalahan

Diberikan m fungsi f₁, ..., f_m of n parameters p₁, ..., p_n with m≥n, kita ingin meminimumkan jumlah

S(p)=\sum _{i=1}^{m}(f_{i}(p))^{2}.

Disini, p adalah vektor kolom (p₁, ..., p_n)^T.

Algoritme

Algoritme Gauss-Newton merupakan prosedur iterasi. Ini berarti bahwa pengguna harus menetapkan sebuah penduga pertama untuk parameter vektor p, yang mana akan kita sebut p⁰.

Berikutnya penduga p^k untuk parameter vektor yang kemudian dihasilkan oleh perulangan hubungan

p^{k+1}=p^{k}-{\Big (}J_{f}(p^{k})^{\top }J_{f}(p^{k}){\Big )}^{-1}J_{f}(p^{k})^{\top }f(p^{k}),

di mana f=(f₁, ..., f_m)^T dan J_f(p) menunjukkan Jacobian dari f saat p.

Matriks invers tidak pernah dihasilakan secara eksplisit dalam praktiknya. Sebagai pengganti, kita gunakan

p^{k+1}=p^{k}+\delta ^{k},\,

Dan kita hitung perbaikan δ^k dengan menyelesaikan sistem linear

J_{f}(p^{k})^{\top }J_{f}(p^{k})\,\delta ^{k}=-J_{f}(p^{k})^{\top }f(p^{k}),

Penelusuran garis

Sebuah implementasi yang baik dari algoritme Gauss-Newton juga menggunakan algoritme penelusuran garis: sebagai pengganti dari formula sebelumnya untuk p^k+1, kita gunakan

p^{k+1}=p^{k}+\alpha ^{k}\,\delta ^{k},

Dimana kita berusaha memilih sebuah nilai optimal untuk bilangan α^k.

Derivasi dari metode Newton

Hubungan perulangan metode Newton untuk meminimumkan sebuah fungsi S adalah

p^{k+1}=p^{k}-[H_{S}(p^{k})]^{-1}\nabla S(p^{k}),\,

di mana $\nabla S$ dan $H_{S}$ berarti gradien dan Hessian dari S . Sekarang kita misalkan S memiliki bentuk

S(p)=\sum _{i=1}^{m}(f_{i}(p))^{2}=f(p)^{\top }f(p)

di mana $f$ adalah sebuah nilai fungsi vector yang merupakan komponen $f_{i}$ .

Dalam kasus ini, gradien diberikan oleh

\nabla S(p)=2J_{f}(p)^{\top }f(p)

di mana $J_{f}$ adalah Jacobian dari $f$ , dan Hessian diberikan oleh

H_{S}(p)=2J_{f}(p)^{\top }J_{f}(p)+2\sum _{i=1}^{m}f_{i}(p)\,H_{f_{i}}(p)

di mana $H_{f_{i}}$ adalah Hessian dari $f_{i}$ .

Catatan bahwa syarat kedua dalam ekspresi ini untuk v $H_{S}$ menuju nol sama $S(p)$ menuju nol. Jadi jika nilai minimum dari S(p) tertutup untuk nol, dan nilai percobaan dari p adalah tertutup untuk minimum, kemudian kita bisa mengira Hessian dengan:

H_{S}(p)=2J_{f}(p)^{\top }J_{f}(p)

Dengan memasukkan ekspresi ini untuk gradeien dan Hessian kedalam hubungan perulangan sebelumnya kita memiliki

p^{k+1}=p^{k}-\left(J_{f}(p^{k})^{\top }J_{f}(p^{k})\right)^{-1}J_{f}(p^{k})^{\top }f(p^{k}).

Algoritme lainnya

Metode lain untuk menyelesaikan masalah kuadrat terkecil hanya menggunakan derivatif pertama adalah penurunan gradien. Bagaimanapun, metode ini tidak memasukkan nilai maupun perhitungan derivatif kedua dengan perkiraan yang sama. Karenanya, metode ini tidak efisien untuk fungsi-fungsi tertentu, seperti fungsi Rosenbrock.

Pada kasus di mana minimum lebih besar dari nol, pengabaian syarat/ketentuan pada Hessian bisa jadi signifikan. Pada kasus ini, salah satunya bisa menggunakan algoritme Levenberg-Marquardt, yang merupakan kombinasi dari Gauss-Newton dan penurunan gradien.

Referensi

Nocedal, Jorge (1999). Numerical optimization. New York: Springer. ISBN 0387987932. Parameter |coauthors= yang tidak diketahui mengabaikan (|author= yang disarankan) (bantuan)

Deuflhard, P. (2003). Numerical analysis in modern scientific computing: an introduction (edisi ke-2nd ed). New York: Springer. ISBN 0387954104. Parameter |coauthors= yang tidak diketahui mengabaikan (|author= yang disarankan) (bantuan)Pemeliharaan CS1: Teks tambahan (link)