Phương pháp gradient liên hợp giải hệ phương trình đại số tuyến tính - Bùi Thị Thanh Xuân

KẾT LUẬN Trong bài báo này chúng tôi đã giới thiệu đến một số phương pháp giải hệ đại số tuyến tính, trên cơ sở đó nghiên cứu đến một phương pháp hiệu quả giải hệ ĐSTT, đó chính là phương pháp Gradient liên hợp (CG). Ngoài ra chúng tôi cũng đã mô phỏng thuật toán CG bằng Matlab để so sánh sự hiệu quả của phương pháp trong các điều kiện của ma trận hệ số A

5 trang | Chia sẻ: thucuc2301 | Lượt xem: 590 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Phương pháp gradient liên hợp giải hệ phương trình đại số tuyến tính - Bùi Thị Thanh Xuân, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Bùi Thị Thanh Xuân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 117 - 121 117 PHƢƠNG PHÁP GRADIENT LIÊN HỢP GIẢI HỆ PHƢƠNG TRÌNH ĐẠI SỐ TUYẾN TÍNH Bùi Thị Thanh Xuân*, Dƣơng Thị Nhung Trường Đại học Công nghệ thông tin và Truyền thông – ĐH Thái Nguyên TÓM TẮT Phƣơng pháp Gradient liên hợp đƣợc Hestenses và Stiefel nêu ra đầu tiên vào những năm 1950 để giải hệ phƣơng trình đại số tuyến tính (PTĐSTT). Vì việc giải một hệ phƣơng trình tuyến tính tƣơng đƣơng với việc tìm cực tiểu của một hàm toàn phƣơng xác định dƣơng nên năm 1960 Fletcher – Reeves đã cải biên và phát triển nó thành phƣơng pháp Gradient liên hợp cho cực tiểu không ràng buộc. Phƣơng pháp Gradient liên hợp (CG) chỉ cần tới đạo hàm bậc nhất nhƣng làm tăng hiệu quả và độ tin cậy của thuật toán. Trên cơ sở đó, bài báo nghiên cứu thuật toán CG và cài đặt thử nghiệm trên Matlab. Từ khóa: hệ phương trình đại số tuyến tính, phương pháp lặp, phương pháp Gradient liên hợp, CG, dạng toàn phương. TỔNG QUAN* Xét hệ phƣơng trình đại số tuyến tính Ax b trong đó A là ma trận vuông cấp n, x và b là véc tơ n chiều 11 12 1 1 1 21 22 2 2 2 1 2 ... ... ... ... ... ... ... ... ... n n n n nn n n a a a x b a a a x b a a a x b Hệ phƣơng trình đại số tuyến tính xuất hiện trong rất nhiều lĩnh vực nhƣ trong kinh tế, thống kê, hệ thống điện, xử lý ảnh, tối ƣu hóa, giải số các phƣơng trình vi phân,... với kích thƣớc của bài toán n có thể là 2 hoặc đến hàng chục triệu. Do đó một yêu cầu cần thiết là cần có các phƣơng pháp hiệu quả để giải hệ đại số tuyến tính nói trên. Các nhà Toán học đã nghiên cứu các phƣơng pháp giải hệ ĐSTT và phân loại thành 2 nhóm phƣơng pháp giải: phƣơng pháp trực tiếp (phƣơng pháp cho ta nghiệm đúng của hệ sau một số hữu hạn các phép tính) và phƣơng pháp lặp (phƣơng pháp xây dựng một dãy vô hạn các xấp xỉ k x mà giới hạn của nó là nghiệm đúng của hệ) Các nhà toán học cũng đƣa ra sự hạn chế của các phƣơng pháp trực tiếp. Chẳng hạn nhƣ phƣơng pháp Cramer về mặt lý thuyết là giải đƣợc hệ với n tùy ý, trong thực tế nếu ta có hệ * Tel: 0906 062458, Email: bttxuan@ictu.edu.vn n ẩn số phƣơng pháp Cramer cần n!(n+1)(n-1) phép tính số học, khi đó máy tính hiện đại không thể tính đƣợc với n =20! Hay với phƣơng pháp Gauss đòi hỏi 3 2 3 n phép tính và hơn nữa thuật toán Gauss không ổn định. Nhƣ vậy để giải số các bài toán có kích thƣớc lớn cần dùng đến các phƣơng pháp lặp.Các phƣơng pháp lặp có thể kể đến nhƣ phƣơng pháp Jacobi, Gauss-Seidel, phƣơng pháp độ dốc lớn nhất (Steepest descent), ...đặc biệt là phƣơng pháp Gradient liên hợp (Conjugate Gradient method) tỏ ra hiệu quả khi ma trận hệ số là ma trận đối xứng, xác định dƣơng. Trong không gian nR ta đƣa vào một tích vô hƣớng mới đƣợc xác định bởi công thức: , , A x y Ax y , trong đó .,. là tích vô hƣớng thông thƣờng cho bởi 1 , n i i i x y x y . Tích vô hƣớng mới này đƣợc gọi là tích năng lượng và chuẩn cảm sinh bởi nó đƣợc gọi là chuẩn năng lượng. Nhƣ vậy , A x Ax x Xét quá trình lặp ( 1) ( ) ( ) , 0,1,2... k k kx xB Ax b k (*) với 0 x bất kỳ. Định lý Samarski: Giả sử A là ma trận đối xứng xác định dƣơng và B là ma trận xác định Bùi Thị Thanh Xuân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 117 - 121 118 dƣơng. Khi đó nếu 2 B A thì phƣơng pháp lặp (*) hội tụ theo chuẩn năng lƣợng của A, tức là lim 0 k k A x x . PHƢƠNG PHÁP ĐỘ DỐC LỚN NHẤT (STEEPEST DESCENT) Cho hệ phƣơng trình đại số tuyến tính Ax b với giả thiết A là ma trận đối xứng xác định dƣơng 0, 0Tx Ax x . Bài toán trên tƣơng đƣơng với bài toán cực tiểu hóa dạng toàn phƣơng: min nx x  , trong đó dạng toàn phƣơng 1 2 T Tx x Ax b x Gradient của dạng toàn phƣơng: 1 2 , ,.., T n x x x x x x x . Gradient là trƣờng véc tơ hƣớng theo hƣớng giảm nhanh nhất của x tại điểm x đã cho 1 1 2 2 Tx A x Ax b . Nếu A đối xứng thì x Ax b . Cho gradient bằng 0 ta thu đƣợc nghiệm của phƣơng trình Ax b . Nghiệm của phƣơng trình là điểm tới hạn của hàm . Nếu A vừa đối xứng vừa xác định dƣơng thì nghiệm của phƣơng trình Ax b là điểm cực tiểu toàn cục của x . Do x đạt cực trị khi gradient 0x Ax b nên bài toán tìm cực trị tƣơng đƣơng với việc giải hệ phƣơng trình đại số tuyến tính Ax b . Ta biết rằng gradient là hƣớng hàm tăng nhanh nhất. Nhƣ thế muốn đi đến cực tiểu ta cho x, tính gradient và tìm theo hƣớng ngƣợc lại cho đến khi hàm không giảm nữa. Phƣơng pháp độ dốc lớn nhất (steepest desceent) thực hiện nhƣ sau: - Xuất phát từ 0x tạo ra dãy 1 2, ,...x x tiến gần đến nghiệm x. - Tại mỗi bƣớc chọn hƣớng giảm nhanh nhất – hƣớng ngƣợc lại với gradient của tại ix : i ix b Ax Sai số i ie x x . Độ lệch i ir b Ax . Nhƣ vậy ;i i i ir Ae r x độ lệch là hƣớng giảm nhanh nhất của hàm x . Thuật toán Steepest Descent Cho 0x Tính 0 0r b Ax Lặp k =1,2,... T k k k T k k r r r Ar 1k k k kx x r 1 1k kr b Ax cho tới khi hội tụ. Phƣơng pháp Steepest descent lặp theo hƣớng của các bƣớc trƣớc nên hội tụ không nhanh, sẽ hiệu quả hơn nếu trong mỗi bƣớc của thuật toán khi ta trƣợt theo hƣớng nào đó thì ta trƣợt đến chỗ thuật toán dừng tại bƣớc lặp cuối cùng. PHƢƠNG PHÁP GRADIENT LIÊN HỢP Phƣơng pháp Gradient liên hợp là phƣơng pháp tìm cực tiểu hóa của dạng toàn phƣơng: * arg min 1 2 nx R T T x x x x Ax b x (1) trong đó n nA R là ma trận đối xứng xác định dƣơng và nb R là véc tơ cho trƣớc. Rõ ràng ta có: 2,x Ax b A (2) Từ (2) ta thấy rằng x* cũng chính là nghiệm của phƣơng trình tuyến tính Ax b . Từ định lý Taylor cho g t y tz chúng ta thu đƣợc với mọi t  và với mọi ny  và nz  ta có: 2 2 T Tty tz y t y z z Az (3) Phƣơng pháp tìm kiếm theo hƣớng: Cho một xấp xỉ jx của phƣơng án tối ƣu x* và một véc tơ hƣớng jp , phƣơng pháp CG sẽ đƣa ra một xấp xỉ tiếp theo 1jx thông qua 2 bƣớc: Bùi Thị Thanh Xuân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 117 - 121 119 Tìm argminj j jx p Đặt 1j j j jx x p Giả sử rằng 0x là xấp xỉ ban đầu, sau đó, áp dụng k bƣớc lặp sẽ trả về kết quả là một dãy lặp 1 0 k j j x . Từ (2) và (3) chúng ta tìm đƣợc T j j j T j j p r p Ap trong đó j j jr x Ax b , ở đây jr thƣờng đƣợc gọi là độ lệch (residual). Định nghĩa 1. Tập hƣớng 1 0 k j j p là tập hƣớng liên hợp nếu , 0Ti j j iAp p p Ap i j Ký hiệu: 0 1 1 0, ,.., W 0k nW span p p p Siêu phẳng: 0 0W w ,w W n k k k k kU x z R z x 0 0U x Bổ đề 1. Cho ip liên hợp, 1j j j jx x p . Cho j jr Ax b , 0x cho trƣớc. argminj j jf x p . Khi đó , , ( )i i i ip r p f y y U Chứng minh: Nhận xét rằng i ix U . Lấy Wi i iy U x y và , 0i iA x y p , , , , 0 , , ( ) i i i i i i i i i i i i p r y p Ax b y p Ax b Ay b p A x y p r p y y U Định lý 1. Cho ip liên hợp. Khi đó arg min 1 * j j y U x y j k Chứng minh: Ta chứng minh định lý bằng phƣơng pháp quy nạp 1 11: argmin y U k x y . Giả sử (*) đúng với k i , tức là arg min 1 j j y U x y j i . Cần chứng minh (*) đúng với 1k i , tức là cần chứng minh 1 1 argmin i i y U x y trong đó 1i i i ix x p . Theo định nghĩa 1iU , 1ix U có thể viết ix y p trong đó , iy U Áp dụng (3) và bổ đề 1 ta có: 2 2 2 2 i T T i i i T T i i i x y p y p y p Ap y p y p Ap Ta có: 1 2 min min min 2ni i T T i i i i x U y U x y p r p Ap  . Vế phải đạt cực tiểu khi iy x và T i i i T i i p r p Ap . Vế trái đạt cực tiểu chính xác khi 1i i i ix x p . Nhƣ vậy để xây dựng thuật toán Gradient liên hợp ta phải: Xây dựng công thức truy toán sinh các hƣớng liên hợp ip Rút gọn một số công thức tính toán Sử dụng các hƣớng liên hợp tính toán các ix Bổ đề 2. Cho 0 0 0 0,p r r Ax b 1 0 , , k k j k k j j j j Ar p p r p Ap p Kết luận: , 0, 0m jAp p m j k Chứng minh bằng phƣơng pháp quy nạp: Với 1k kiểm tra trực tiếp ta thấy 0 1, 0Ap p . Giả sử với k i , hệ véc tơ 0 i j j p là liên hợp từng đôi một. Chúng ta cần chứng minh rằng 1, 0, 0m iAp p m i . Đặt m i , sau đó ta có: 1 1 1 0 , , , , , i i j m i m k m j j j j Ar p Ap p Ap r Ap p Ap p Bùi Thị Thanh Xuân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 117 - 121 120 1 1 , , , 0 , i m m k m m m m Ar p Ap r Ap p Ap p Bổ đề 3. Giả sử 0 k j j p đƣợc xây dựng theo Bổ đề 2. Khi đó 0 1 1, ,..,k kW span r r r , 0, 0j mr r j m k , , 0j k k kr p r r j k kp thỏa mãn 1 1 1 1 1 , , , k k k k k k k k k r r p r p r r Thuật toán CONJUGATE GRADIENT - Cho xấp xỉ ban đầu 0x - Đặt 0 0 0 0,r Ax b p r k = 0 For k = 1: k max 1 1 1 1 k k k k k k k k k k k k k k k k k k k k k k p r p Ap x x p r r Ap p Ar p Ap p r p end Ta thấy rằng phƣơng pháp CG nếu không có sai số tính toán thì sẽ dừng sau không quá n bƣớc và thu đƣợc nghiệm đúng. Tuy nhiên trong quá trình giải có sai số tính toán nên phƣơng pháp CG coi nhƣ phƣơng pháp lặp để tìm nghiệm gần đúng. Đánh giá sai số của phƣơng pháp Gradient liên hợp: 0 1 * 2 * 1 l l A A x x x x với 1 nA là số điều kiện của A Thử nghiệm trên MATLAB n = 100; R = randn(n); for npot = 0.1:0.4:2 A = (R'*R)^npot; lamb = eig(A); kappa = max(lamb)/min(lamb); xsol = rand(n,1); b = A*xsol; Norm2 = sqrt(xsol'*xsol); NormA = sqrt(xsol'*A*xsol); x = zeros(size(b)); g = A*x-b; p = -g; for i = 1:n Ap = A*p; alfa = -(p'*g)./(p'*Ap); x = x + alfa*p; g = g + alfa*Ap; beta = (g'*Ap)./(p'*Ap); p = -g + beta*p; err2(i) = sqrt((x-xsol)'*(x-xsol))/Norm2; errA(i) = sqrt((x-xsol)'*A*(x-xsol))/NormA; end subplot(1,2,1); plot(lamb,zeros(size(lamb)),'o'); Tittel = ['Eigenvalues, n=' num2str(n)]; title(Tittel); subplot(1,2,2); semilogy(1:n, err2, 1:n, errA); legend('chuan 2', 'chuan A'); xlabel('So lan lap'); ylabel('Sai so'); Tittel = ['npot = ',num2str(npot),'\kappa = ',num2str(kappa)]; title(Tittel); pause; end Hình 1. Ma trận có điều kiện tốt, hội tụ nhanh 0.5 1 1.5 2 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Eigenvalues, ndim=100 0 50 100 10 -16 10 -14 10 -12 10 -10 10 -8 10 -6 10 -4 10 -2 10 0 So lan lap sa i s o npot = 0.1 = 3.5136 chuan 2 chuan A Bùi Thị Thanh Xuân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 116 (02): 117 - 121 121 Hình 2. Ma trận có điều kiện trung bình Hình 3. Ma trận với điều kiện xấu, tốc độ hội tụ chậm KẾT LUẬN Trong bài báo này chúng tôi đã giới thiệu đến một số phƣơng pháp giải hệ đại số tuyến tính, trên cơ sở đó nghiên cứu đến một phƣơng pháp hiệu quả giải hệ ĐSTT, đó chính là phƣơng pháp Gradient liên hợp (CG). Ngoài ra chúng tôi cũng đã mô phỏng thuật toán CG bằng Matlab để so sánh sự hiệu quả của phƣơng pháp trong các điều kiện của ma trận hệ số A. TÀI LIỆU THAM KHẢO 1. A. van der Sluis and H. A. van derVorst (1986), The Rate of Convergence of Conjugate Gradients, Numerische Mathematik 48, no. 5, 543–560. 2. Magnus R. Hestenes and Eduard Stiefel (1952), Methods of Conjugate Gradients for Solving Linear Systems, Journal of Research of the National Bureau of Standards 49, 409–436. 3. R. Fletcher and M. J. D. Powell (1963), A Rapidly Convergent Descent Method for Minimization, Computer Journal 6,163–168. 4. Đặng Quang Á (2009), Giáo trình Phương pháp số, Nxb Đại học Thái Nguyên. 5. Nguyễn Hoàng Hải (2006), Lập trình Matlab và ứng dụng, Nxb Khoa học kỹ thuật SUMMARY THE CONJUGATE GRADIENT METHOD FOR SOLVING THE SYSTEM OF LINEAR EQUATIONS Bui Thi Thanh Xuan * , Duong Thi Nhung College of Information & Communication Technology – TNU The conjugate gradient method (CG) has been first introduced in 1952 by M. R. Hestenes and E. Stiefel. It has been the subject of intense analysis for more than 50 years. The method was originally consider to be direct method for linear equations, but its favorable properties as an iterative method was soon realized, and it was later generalized to more general optimization problems. It provides a very effective way to optimize large, deterministic systems by gradient descent. In this paper, we introduce about CG and experiment with CG method using Matlab. Key words: iterative method, linear equations, conjugate gradient method, CG, quadratic functions. Ngày nhận bài:23/09/2013; Ngày phản biện:04/10/2013; Ngày duyệt đăng: 26/02/2014 Phản biện khoa học: TS. Trương Hà Hải – Trường ĐH Công nghệ Thông tin & Truyền thông - ĐHTN * Tel: 0906 062458, Email: bttxuan@ictu.edu.vn 0 5 10 15 20 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Eigenvalues, ndim=100 0 50 100 10 -15 10 -10 10 -5 10 0 So lan lap sa i s o npot = 0.5 = 535.4972 chuan 2 chuan A 0 1000 2000 3000 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Eigenvalues, ndim=100 0 50 100 10 -3 10 -2 10 -1 10 0 So lan lap sa i s o npot = 1.3 = 12438519.0126 chuan 2 chuan A

Các file đính kèm theo tài liệu này:

brief_42086_45933_66201410262521_5385_2048648.pdf