ĐIỀU KHIỂN BỀN VỮNG
3.1 Giới thiệu
3.1.1 Khái niệm điều khiển bền vững
Hệ thống điều khiển bền vững làm cho chất lượng của sản phẩm ổn định, không phụ thuộc vào sự thay đổi của đối tượng cũng như của nhiễu tác động lên hệ thống.Mục đích của điều khiển bền vững là chất lượng vòng kín được duy trì mặc dù có những sự thay đổi trong đối tượng.
[IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image002.jpg[/IMG]
P0 :Mô hình chuẩn (mô hình danh
định)
[IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image004.gif[/IMG]:Mô hình thực tế với sai lệch
[IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image006.gif[/IMG] so với mô hình chuẩn
Hình 3.1 : Mô hình điều khiển bền vững
Cho tập mô hình có sai số [IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image004.gif[/IMG] và một tập các chỉ tiêu chất lượng, giả sử
P0 [IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image009.gif[/IMG][IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image004.gif[/IMG]là mô hình danh định dùng để thiết kế bộ điều khiển K.Hệ thống
hồi tiếp vòng kín được gọi là có tính :
- Ổn định danh định: nếu K ổn định nội với mô hình danh định P0
- Ổn định bền vững: nếu K ổn định nội với mọi mô hình thuộc [IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image004.gif[/IMG]
- Chất lượng danh định: nếu các mục tiêu chất lượng được thỏa đối với mô hình danh định P0
- Chất lượng bền vững: nếu các mục tiêu chất lượng được thỏa đối với mọi mô hình thuộc [IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image004.gif[/IMG]
Mục tiêu bài toán ổn định bền vững là tìm bộ điều khiển không chỉ ổn định mô hình danh định P0 mà còn ổn định một tập các mô hình có sai số [IMG]file:///C:/Users/user/AppData/Local/Temp/msohtmlclip1/01/clip_image004.gif[/IMG]
33 trang |
Chia sẻ: tlsuongmuoi | Lượt xem: 2456 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Chương 3: Điều khiển bền vững, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Chương 3
ĐIỀU KHIỂN BỀN VỮNG
3.1 Giới thiệu
3.1.1 Khái niệm điều khiển bền vững
Hệ thống điều khiển bền vững làm cho chất lượng của sản phẩm ổn định, không phụ thuộc vào sự thay đổi của đối tượng cũng như của nhiễu tác động lên hệ thống.Mục đích của điều khiển bền vững là chất lượng vòng kín được duy trì mặc dù có những sự thay đổi trong đối tượng.
P0 :Mô hình chuẩn (mô hình danh
định)
:Mô hình thực tế với sai lệch
so với mô hình chuẩn
Hình 3.1 : Mô hình điều khiển bền vững
Cho tập mô hình có sai số và một tập các chỉ tiêu chất lượng, giả sử
P0 là mô hình danh định dùng để thiết kế bộ điều khiển K.Hệ thống
hồi tiếp vòng kín được gọi là có tính :
- Ổn định danh định: nếu K ổn định nội với mô hình danh định P0
- Ổn định bền vững: nếu K ổn định nội với mọi mô hình thuộc
- Chất lượng danh định: nếu các mục tiêu chất lượng được thỏa đối với mô hình danh định P0
- Chất lượng bền vững: nếu các mục tiêu chất lượng được thỏa đối với mọi mô hình thuộc
Mục tiêu bài toán ổn định bền vững là tìm bộ điều khiển không chỉ ổn định mô hình danh định P0 mà còn ổn định một tập các mô hình có sai số
3.1.2 Chuẩn của tín hiệu
3.1.2.1 Khái niệm chuẩn
Trong điều khiển nói riêng cũng như trong các công việc có liên quan đến tín hiệu nói chung,thông thường ta không làm việc chỉ riêng với một tín hiệu hoặc một vài tín hiệu điển hình mà ngược lại phải làm việc với một tập gồm rất nhiều các tín hiệu khác nhau. Khi phải làm việc với nhiều tín hiệu khác nhau như vậy chắc chắn ta sẽ gặp bài toán so sánh các tín hiệu để chọn lọc ra được những tín hiệu phù hợp cho công việc.
Các khái niệm như tín hiệu x1(t) tốt hơn tín hiệu x2(t) chỉ thực sự có nghĩa nếu như chúng cùng được chiếu theo một tiêu chuẩn so sánh nào đó. Cũng như vậy nếu ta khẳng định rằng x1(t) lớn hơn x2(t) thì phải chỉ rõ phép so sánh lớn hơn đó được hiểu theo nghĩa nào, x1(t) có giá trị cực đại lớn hơn , có năng lượng lớn hơn hay x1(t) chứa nhiều thông tin hơn x2(t)…..Nói một cách khác ,trước khi so sánh x1(t) với x2(t) chúng ta phải gắn cho mỗi một tín hiệu một giá trị đánh giá tín hiệu theo tiêu chuẩn so sánh được lựa chọn .
Định nghĩa: Cho một tín hiệu x(t) và một ánh xạ x(t) →||x(t)|| R+ chuyển x(t) thành một số thực dương ||x(t)||.Số thực dương này sẽ được gọi là chuẩn của x(t) nếu nó thỏa mãn:
a. ||x(t)|| ≥ 0 và ||x(t)|| = 0 khi và chỉ khi x(t) =0 (3.1)
b. ||x(t)+y(t)|| ≤ ||x(t)|| + ||y(t)|| x(t), y(t) (3.2)
c. ||ax(t)|| = |a|.||x(t)|| x(t) và . (3.3)
3.1.2.2 Một số chuẩn thường dùng trong điều khiển cho một tín hiệu x(t):
- Chuẩn bậc 1: (3.4)
- Chuẩn bậc 2: . (3.5)
Bình phương chuẩn bậc hai chính là giá trị đo năng lượng của tín hiệu x(t).
-Chuẩn bậc p: với p N (3.6)
- Chuẩn vô cùng: (3.7)
đây là biên độ hay đỉnh của tín hiệu
Khái niệm chuẩn trong định nghĩa trên không bị giới hạn là chỉ cho một tín hiệu x(t) mà còn được áp dụng được cho cả vector tín hiệu gồm nhiều phần tử và mỗi phần tử lại là một tín hiệu.
Xét một vector tín hiệu:
x(t) =
- Chuẩn 1 của vector x:
(3.8)
- Chuẩn 2 của vector x:
(3.9)
- Chuẩn vô cùng của vector x:
(3.10)
3.1.2.3 Quan hệ của chuẩn với ảnh Fourier và ảnh Laplace:
Để phục vụ mục đích sử dụng khái niệm chuẩn vào điều khiển ,ta cần quan tâm tới mối liên quan giữa chuẩn tín hiệu x(t) là ||x(t)|| với ảnh Fourier X(j) cũng như ảnh Laplace X(s) của nó.
Định lí 3.1: (Parseval) Chuẩn bậc hai của một tín hiệu x(t) và ảnh Fourier X(j) của nó có quan hệ :
(3.11)
Cho tín hiệu nhân quả causal x(t). Gọi X(s) là ảnh Laplace của nó .Giả sử rằng X(s) có dạng thực -hữu tỷ với bậc của đa thức tử số không lớn hơn bậc đa thức mẫu số ,tức là:
với m < n (3.12)
Định lí 3.2: Xét tín hiệu nhân quả causal x(t) có X(s) dạng (3.12) .Để chuẩn bậc 1 của x(t) là một số hữu hạn ||x(t)||1= K < thì điều kiện cần và đủ là tất cả các điểm cực của X(s) phải nằm bên trái trục ảo (có phần thực âm) .
3.1.3 Đại số ma trận
3.1.3.1 Một số ma trận thường gặp:
- Một ma trận A=(aij) có số hàng bằng số cột được gọi là ma trận vuông. Đường chéo nối các phần tử aii trong ma trận vuông được gọi là đường chéo chính .Đường chéo còn lại được gọi là đường chéo phụ.
A = (3.13)
- Một ma trận vuông A=(aij) có aij = 0 khi i ≠ j ,tức là các phần tử không nằm trên đường chéo chính đều bằng 0, được gọi là ma trận đường chéo. Ma trận đường chéo được ký hiệu bởi:
A = = diag(aij) (3.14)
- Ma trận đường chéo I = diag(1) = gọi là ma trận đơn vị.
- Ma trận vuông A=(aij) có aij = 0 khi i > j (hoặc i < j) được gọi là ma trận tam giác
+ Ma trận tam giác dưới
A= (3.15)
+ Ma trận tam giác trên
A= (3.16)
3.1.3.2 Các phép tính về ma trận:
- Phép cộng / trừ: Cho hai ma trận A=(aij) và B=(bij) cùng có m hàng và n cột .Tổng hay hiệu A ± B = C =(cij) của chúng được định nghĩa là một ma trận cũng có m hàng và n cột với các phần tử
cij = aij + bij i=1,2,…..,m và j=1,2,…..,n.
- Phép nhân với số thực: Cho ma trận A=(aij) có m hàng và n cột và một số vô hướng thực(phức) x tùy ý .Tích B = xA = Ax = (bij) được hiểu là ma trận cũng có m hàng và n cột với các phần tử
Bij = x.aij i=1,2,….m và j=1,2,…..,n
- Phép chuyển vị: Ma trận chuyển vị của ma trận A=(aij) với m hàng và n cột là ma trận AT = (aji) có n hàng và m cột được tạo từ ma trận A qua việc hoán chuyển hàng thành cột và ngược lại cột thành hàng.
- Phép nhân ma trận: Cho ma trận A=(aik) có m hàng và p cột và ma trận B=(bkj) có p hàng và n cột ,tức là :
+ A=(aik) i=1,2,....,m và k=1,2,….,p
+ B=(bkj) k=1,2,….,p và j=1,2,…..,n
Tích AB = C =(cij) của chúng là một ma trận có m hàng và n cột với các phần tử
Cij =
Một ma trận vuông A được gọi là ma trận trực giao nếu ATA=AAT=I
3.1.3.3 Hạng của ma trận:
Cho n vector vi i=1,2,…,n Chúng sẽ được gọi là độc lập tuyến tính nếu đẳng thức a1v1+a2v2+…….+anvn=0 trong đó ai là những số thực (hoặc phức) sẽ đúng khi và chỉ khi a1 = a2 = …..=an = 0
Xét một ma trận A=(aij) bất kì có m hàng và n cột .Nếu trong số m vector hàng có nhiều nhất p ≤ m vector độc lập tuyến tính và trong số n vector cột có nhiều nhất q ≤ n vector độc lập tuyến tính thì hạng ma trận đươc hiểu là:
Rank(A) = min{p,q}
Một ma trận vuông A kiểu (nn) sẽ được gọi là không suy biến nếu Rank(A)=n .Ngược lại nếu Rank(A) <n thì A được nói là ma trận suy biến
Hạng ma trận có các tính chất sau:
- Rank(A) = min{p,q} (3.17)
- Rank(AB) ≤ rank(A) và rank(AB) ≤ rank(B) (3.18)
- Rank(A + B) ≤ rank(A) + rank(B) (3.19)
- Nếu B không suy biến thì rank(AB) = rank(B) (3.20)
3.1.3.4 Ma trận nghịch đảo:
Cho ma trận A=(aij),i=1,2,…,m ; j=1,2,…,n,trong đó aij là những số thực (hoặc phức),nói cách khác A Î Rmn(hoặc A Î Cmn ).Nếu tồn tại một ma trận B thỏa mãn :
AB = BA = I (ma trận đơn vị) (3.21)
Thì ma trận B được gọi là ma trận nghịch đảo của A và ký hiệu là B = A-1.
Do phải tồn tại cả hai phép nhân AA-1 và A-1A cho ra kết quả có cùng kiểu nên ma trận A phải là một ma trận vuông,tức là phải có m = n.Hơn nữa do det(I) = 1 ¹ 0 nên:
det(A)det(A-1) ¹ 0 => det(A) ¹ 0 và det(A-1) ¹ 0. (3.22)
Vậy A phải là ma trận không suy biến.
Ma trận nghịch đảo A-1 của A có tính chất sau:
- Ma trận nghịch đảo A-1 của A là duy nhất (3.23)
- Tập hợp tất cả các ma trận vuông cùng kiểu và không suy biến cùng với phép nhân ma trận tạo thành một nhóm (không giao hoán). (3.24)
- Nghịch đảo ma trận kiểu (22):(3.25)
- (AB)-1 = B-1A-1 (3.26)
- (A-1)T = (AT)-1 (3.27)
- Nếu A = diag(ai) và không suy biến thì A-1 = diag (3.28)
- A-1 = (3.29)
trong đó Aadj là ma trận có các phần tử a -ij = (-1)i+jdet(Aij) với Aij là ma trận thu được từ A bằng cách bỏ đi hàng thứ j và như cột thứ i.
- Cho ma trận A Î Rnn không suy biến . Nếu U Î Rnm và V Î Rnm là hai ma trận làm cho (I+VTA-1U) cũng không suy biến thì
(A+UVT)-1 = A-1 – A-1U(I+VTA-1U)-1VTA-1 (3.30)
- Cho ma trận vuông A = không suy biến,trong đó A1,A2,A3,A4 cũng là các ma trận.
Nếu A1 không suy biến và B = A4 – A3A1-1A2 cũng không suy biến thì
(3.31)
Nếu A4 không suy biến và C = A1 – A2A4-1A3 cũng không suy biến thì
(3.32)
3.1.3.5 Vết của ma trận:
Cho ma trận vuông A=(aij) ,i,j=1,2,……,n kiểu (nxn).Vết của A được hiểu là tổng giá trị các phần tử trên đường chéo chính của A và được ký hiệu bằng trace(A):
trace= (3.33)
Vết của ma trận có các tính chất:
a. trace(AB) = trace(BA) (3.34)
b. trace(S-1AS) = trace(A) với S là ma trận không suy biến bất kì (3.35)
3.1.3.6 Giá trị riêng và vector riêng:
Số thực được gọi là giá trị riêng và vector x được gọi là vector riêng bên phải ứng với giá trị riêng của A thỏa mãn:
Ax = x x (3.36)
(A - I)x = 0 x (3.37)
Giá trị riêng và vector riêng của ma trận A có những tính chất sau:
a. Hai ma trận tương đương A và S-1AS luôn cùng giá trị riêng, nói cách khác giá trị riêng của ma trận bất biến với phép biến đổi tương đương:
det(A-I)=det(S-1AS-I) (3.38)
b. Các giá trị riêng của ma trận bất biến với phép chuyển vị, tức là:
det(A-I)=det(AT-I) (3.39)
c. Nếu A không suy biến thì AB và BA có cùng các giá trị riêng ,tức là:
det(AB-I)=det(BA-I) (3.40)
d. Nếu A là ma trận đối xứng (AT=A) thì các vector riêng ứng với những giá trị riêng khác nhau sẽ trực giao với nhau
Trong Matlab ,sử dụng hàm eig(A) để tìm ma trận riêng và vector riêng.
3.1.3.7 Tính toán ma trận:
Cho ma trận X = (xij) Î Cmn là một ma trận thực (hoặc phức) và F(X) Î C là một vô hướng thực hoặc phức của X .Đạo hàm của F(X) đối với X được định nghĩa
(3.41)
Cho A và B là những ma trận phức với không gian tương thích .Một số công thức đạo hàm :
3.1.3.8 Chuẩn của ma trận:
Người ta cần đến chuẩn của ma trận là nhằm phục vụ việc khảo sát tính giải tích của nó.Có nhiều chuẩn khác nhau cho một ma trận A=(aij) ,i=1,2,…,m;j=1,2,…,n.
Những chuẩn thông thường được sử dụng:
- Chuẩn 1 của ma trận A
(3.47)
- Chuẩn 2 của ma trận A
(3.48)
- Chuẩn vô cùng của ma trận A
(3.49)
- Chuẩn Euclide của ma trận A (chuẩn Frobenius)
(3.50)
với là ma trận chuyển vị và lấy liên hiệp. là trị riêng của ma trận là một số thực không âm.
3.1.4 Trị suy biến của ma trận – độ lợi chính(Principal gain)
Trị suy biến của ma trận A(m x l) được ký hiệu là được định nghĩa như sau:
(3.51)
với .
Nếu chúng ta biểu diễn ma trận A dưới dạng A(s) và đặt , thì trị suy biến của là một hàm của và được gọi là độ lợi chính của A(s). Ở đây chúng ta giả sử rằng được sắp xếp theo thứ tự sao cho . Như vậy, là trị suy biến lớn nhất và là trị suy biến nhỏ nhất. Ký hiệu là trị suy biến lớn nhất và là trị suy biến nhỏ nhất.
Ta có:
(3.52)
với .
Độ lợi của hệ đa biến nằm giữa độ lợi chính lớn nhất và nhỏ nhất.
Trong Matlab tìm trị suy biến của ma trận A dùng lệnh svd(A)
Ví dụ: Cho ma trận A:
>> A =;
>> S =svd(A)
S =
[14.9359
5.1883]
S: vector của các giá trị suy biến của ma trận A
=14.9359
(A)=5.1883
3.1.5 Ổn định nội
Ổn định nội là yêu cầu cơ bản đối với một hệ thống hồi tiếp thực. Ý nghĩa của ổn định nội là khi đầu vào hệ thống bằng không thì tất cả các trạng thái hệ thống đều phải về không từ mọi giá trị ban đầu. Mọi hệ thống tự động đều phải bảo đảm ổn định nội mới hoạt động được.
G
K
w1
e1
e2
w2
+
+
+
+
Hình 3.2 : Sơ đồ hệ thống dùng để phân tích ổn định nội
Định nghĩa :
Hệ hồi tiếp hình 3.2 được gọi là ổn định nội nếu tất cả các hàm truyền đạt từ w1, w2 đến e1, e2 đều ổn định.
Điều kiện ổn định nội chặt hơn điều kiện ổn định dựa trên hàm truyền vào-ra thông thường, vì nó tránh việc khử các cực và zero không ổn định giữa các khâu liên tiếp nhau. Khi thành lập hàm truyền vào-ra, có thể xảy ra hiện tượng khử cực và zero không ổn định của các khâu liên tiếp nhau. Như vậy, điều kiện ổn định nội bảo đảm các tín hiệu bên trong hệ thống đều hữu hạn khi tín hiệu vào là hữu hạn.
Ví dụ, ta khảo sát điều kiện ổn định nội của hệ thống hình 3.2:
Suy ra:
Điều kiện ổn định nội của hệ là các hàm truyền , , , đều ổn định.
3.1.6 Định lý độ lợi nhỏ (Small Gain Theorem)
Cho hệ thống được biểu diễn như hình 3.3: Gọi li là trị riêng của G
G
r
y
-
u
Hình 3.3 : Hệ thống hồi tiếp vòng kín
Định lý độ lợi nhỏ được phát biểu như sau:
Giả thiết rằng G(s) ổn định, r(G(jw)) là bán kính phổ của G(jw). Hệ thống vòng kín ổn định nếu , hoặc
Đối với hệ SISO thì
(3.53)
Định lý độ lợi nhỏ chỉ là điều kiện đủ để xét ổn định của hệ thống. Điểm mạnh của định lí này là nó không yêu cầu những thông tin chi tiết về hệ thống.Vì vậy nó không chỉ ứng dụng được cho hệ thống tuyến tính bất biến theo thời gian mà còn ứng dụng được cho hệ thống phi tuyến, thay đổi theo thời gian.
3.1.7 Ổn định bền vững
3.1.7.1 Định lý ổn định bền vững
Đây là mô hình cơ bản dùng để phân tích tính ổn định bền vững của một hệ thống. Nếu hệ danh định ổn định thì M ổn định và D là sai số có thể làm cho hệ thống mất ổn định. Định lý sau thiết lập điều kiện của M để cho hệ thống vẫn ổn định dưới ảnh hưởng của D
v
M
D
w
Hình 3.4 : Sơ đồ cấu trúc phân tích ổn định bền vững
Định lý ổn định bền vững:
Giả sử M và D ổn định, hệ thống vòng kín hình 3.4 sẽ ổn định khi và chỉ khi biểu đồ cực của đường cong Nyquist det(I-MD) không bao điểm gốc. Khi đó hệ thống vòng kín sẽ ổn định bền vững với mọi D nếu và chỉ nếu khi một trong các điều kiện sau thỏa mãn:
a. (3.54)
b. (3.55)
c. (3.56)
3.1.7.2 Điều kiện ổn định bền vững đối với sai số cộng:
Với , (3.57)
K
v
-
G
+
w
M
Hình 3.5 : Sai số cộng
Ta có:
(3.58)
hay
(3.59)
vậy
(3.60)
Kết luận: Hệ thống vòng kín hình 3.5 ổn định bền vững khi và chỉ khi:
=||M(s)||∞= (3.61)
3.1.7.3 Điều kiện ổn định bền vững đối với sai số nhân ở đầu ra
K
v
-
G
+
w
M
Hình 3.6 : Sai số nhân ở đầu ra
Với , (3.62)
Ta có:
(3.63)
hay
(3.64)
vậy
(3.65)
Kết luận: Hệ thống vòng kín hình 3.6 ổn định bền vững khi và chỉ khi:
(3.66)
3.2 Phương pháp LQG (Linear Quadratic Gaussian)
3.2.1 Đặt vấn đề
Cho hệ thống
(3.67)
Ngõ ra y là ngõ ra hồi tiếp và đo được. Ngõ ra z là điều khiển được. Tín hiệu nhiễu w là nhiễu hệ thống và v là nhiễu đo .
Tín hiệu v và w là những quá trình nhiễu trắng .Trạng thái ban đầu của x(0) được giả sử là một vector ngẫu nhiên .
Nhiều sự giả sử khác nhau định nghĩa trạng thái x(t) tR và ngõ ra điều khiển được z(t),tR là những quá trình ngẫu nhiên .Biểu thức sai số toàn phương :
(3.68)
là một quá trình ngẫu nhiên.
Vấn đề của điều khiển hệ thống là giá trị mong đợi của tích phân :
(3.69)
là nhỏ. Đây là vấn đề điều khiển tuyến tính nhiễu loạn. Khoảng thời gian [0 T] là xác định nhưng thật sự chúng ta xem xét trường hợp T. Tại bất kỳ thời gian t toàn bộ tín hiệu đo được ở quá khứ y(s) s được giả sử có giá trị cho hồi tiếp. Hình (3.7) làm rõ trường hợp này :
SYSTEM
CONTROLLER
w
v
u
+
+
y
z
Hình 3.7 : Hồi tiếp LQG
3.2.2 Bộ quan sát
Xem xét hệ thống quan sát :
(3.70)
Đây là hệ thống (3.67) nhưng không có nhiễu hệ thống w và nhiễu đo v. Trạng thái x của hệ thống (3.70) không thể sử dụng được trực tiếp bởi vì chỉ ngõ ra y là đo được. Xây dựng lại trạng thái với sự chính xác tùy ý bởi việc kết nối một bộ quan sát :
(3.71)
Tín hiệu là một ước lượng của trạng thái x(t).Nó thỏa mãn phương trình vi phân trạng thái của hệ thống (3.70) với thành phần thêm vào L.L là ma trận độ lợi quan sát cần được lựa chọn phù hợp. Sai số quan sát y(t) là sự khác nhau giữa ngõ ra đo được thực tế y(t) và ngõ ra .Thành phần thêm vào Lcung cấp một sự điều chỉnh chủ động ngay khi sai số của sự quan sát là khác 0.
SYSTEM
SYSTEM
MODEL
L
+
-
Hình 3.8 : Cấu trúc của một bộ quan sát
Hình (3.8) cho thấy cấu trúc của bộ quan sát .Định nghĩa :
(3.72)
là sai số ước lượng trạng thái. Phương trình vi phân của nhận được sau khi trừ (3.70) cho (3.71) :
(3.73)
Nếu hệ thống (3.70) được tìm thấy thì tồn tại ma trận độ lợi L mà sai số hệ thống (3.73) là ổn định. Nếu sai số hệ thống là ổn định thì cho bất kỳ sai số (0). Vì vậy
(3.74)
Trạng thái ước lượng hội tụ về trạng thái thực.
Trong Matlab dùng hai lệnh acker và place để tính ma trận L của khâu quan sát trạng thái :
L= acker(A’,C’,p)
L= place(A’,C’,p)
A’ : Chuyển vị của ma trận A
C’ : Chuyển vị của ma trận C
p : Khai báo các điểm cực mong muốn
3.2.3 Bộ lọc Kalman
3.2.3.1 Đặt vấn đề:
Bộ lọc Kalman là một bộ quan sát được sử dụng cho các ứng dụng yêu cầu xây dựng lại hệ phương trình trạng thái khi tính đến ảnh hưởng của nhiễu đo được.
Phương trình trạng thái của đối tượng :
=Ax+Bu+w (3.75)
y=Cx+v (3.76)
với trạng thái x(t)R,ngõ vào điều khiển u(t)R, và ngõ ra đo lường y(t)R.Tín hiệu w(t) là nhiễu quá trình chưa biết trước tác động làm nhiễu hệ thống.Tín hiệu v(t) là một nhiễu đo không xác định được , làm suy giảm việc đo lường chẳng hạn như nhiễu cảm biến.Giá trị ban đầu x(0), nhiễu w(t) hoặc v(t) không biết được chính xác.Giả sử x(0), w(t) và v(t) đều trực giao qua lại với nhau.
B
L
C
C
A
B
A
y
-
x
x
w(t)
v(t)
u
Hệ thống
Bộ lọc Kalman
Hình 3.9 : Bộ quan sát trạng thái của Kalman
Gọi là ước lượng của x .
Phương trình trạng thái của khâu lọc Kalman :
(3.77)
Mục tiêu của thiết kế bộ lọc Kalman : Tìm độ lợi ước lượng L để có sự ước lượng tối ưu trong sự hiện diện của nhiễu w(t) và v(t)
Sai số ước lượng: (3.78)
Độ lợi L sẽ được chọn sao cho giá trị trung bình của sai số ước lượng toàn phương là bé nhất .
3.2.3.2 Cơ sở toán học:
Lý thuyết xác suất:
Từ phương trình (3.75) được thêm vào bởi nhiễu quá trình, trạng thái x(t) bây giờ cũng là một quá trình ngẫu nhiên như là y(t). Để khảo sát những đặc tính thông thường của quá trình ngẫu nhiên cần nhắc lại một số khái niệm lý thuyết xác suất (Papoulis 1984). Mặc dù w(t) và v(t) là những đại lượng ngẫu nhiên không biết được, nhưng cần biết một vài đặc điểm để hổ trợ việc thiết kế các bộ điều khiển. Chẳng hạn như có thể biết được giá trị trung bình hoặc tổng năng lượng của chúng.
Cho vector ngẫu nhiên zR ,f() là hàm mật độ xác suất (PDF) của z. Đại lượng PDF đặc trưng cho xác suất mà z lấy giá trị bên trong vùng vi phân d đặt giữa .
Giá trị mong muốn của hàm g(z) của vector ngẫu nhiên được xác định như sau :
E =ƒ()d (3.79)
Giá trị trung bình hay mong muốn của z được xác định như sau:
E{z}=ƒ()d (3.80)
được ký hiệu bằng . Chú ý rằng R.
Hiệp phương sai của z được cho bởi
P=E (3.81)
Chú ý rằng P là ma trận hằng n×n
Phần quan trọng của vector ngẩu nhiên được đặc trưng bởi Gaussian hoặc nomal PDF
ƒ()=e (3.82)
Trong trường hợp vô hướng , (3.82) trở thành:
(3.83)
được minh họa ở hình 3.10 .Vì vậy những vector ngẫu nhiên lấy giá trị gần với có xác suất lớn nhất và xác suất sẽ giảm khi lấy giá trị xa .Nhiều biến ngẫu nhiên là Gaussian.
Nếu vector ngẫu nhiên là một hàm của thời gian được gọi là một quá trình ngẫu nhiên được tượng trưng là z(t). Khi đó PDF có thể thay đổi theo thời gian và chúng ta viết là ƒ(,t). Điều đó có thể tưởng tượng rằng PDF ở hình 3.10 thay đổi theo thời gian. Trong tình huống này, giá trị mong đợi và ma trận hiệp phương sai là những hàm thời gian vì thế chúng có thể biểu hiện (t) và P(t).
Hình 3.10 : Gaussian PDF
Nhiều quá trình ngẫu nhiên z(t) quan trọng là có PDF bất biến theo thời gian Đó là những quá trình tĩnh, thậm chí chúng là hàm thời gian ngẫu nhiên chúng vẫn có trị trung bình và hiệp phương sai là hằng số.
Đặc trưng cho liên hệ giữa hai quá trình ngẫu nhiên z(t) và x(t), có thể sử dụng PDF kết hợp ƒ, tượng trưng cho xác xuất mà (z(t1), x(t2)) ở trong vùng vi phân d× d ở giữa (). Giả sử rằng các quá trình z(t) và x(t) là liên kết tĩnh , PDF kết hợp không là hàm của cả hai thời gian t và tnhưng nó chỉ dựa vào sai biệt (t-).
Trong nhiều trường hợp tĩnh, giá trị mong muốn của hàm hai biến g(z,x) được xác định bởi:
E=g()ƒ(,t- t)dd (3.84)
Ma trận tương quan chéo được xác định bởi
R()=E (3.85)
Do đó, ma trận tương quan chéo của hai quá trình không tĩnh mà được xác định bởi
R(t,)=E (3.86)
Xem như z(t) và z(t) như là hai quá trình ngẫu nhiên của quá trình tĩnh, hàm tự tương quan z(t) được xác định như sau:
R()=E (3.87)
Hàm tự tương quan đem đến cho ta vài thông tin quan trọng về quá trình ngẫu nhiên z(t). Thí dụ như :
trace=trace=E (3.88)
tương đương với tổng năng lượng của quá trình z(t).
Nếu
(3.89)
z(t) và x(t) dược gọi là trực giao với nhau.
Nếu
R()=P (3.90)
trong đó P là ma trận hằng và (t) là xung Dirac. z(t) là trực giao với
z(t +) với các giá trị ≠ 0. Điều này có nghĩa là giá trị của quá trình z(t) tại thời điểm t không có sự liên hệ với giá trị tại các thời điểm t.Vì vậy z(t) là một nhiễu trắng .Ví dụ như nhiễu nhiệt ở mạch điện nguyên nhân vì sự chuyển động nhiệt ở các electron ở điện trở .
Chú ý rằng Pδ(0) là hiệp phương sai của z(t). P được gọi là ma trận mật độ phổ.Thỉnh thoảng nó cũng được xem như là ma trận hiệp phương sai
3.2.2.3 Thiết kế bộ lọc Kalman:
Giả sử x(0) có thể được thay thế bằng các đại lượng biết trước (giá trị trung bình của x(0)) và hiệp phương sai P) , có thể biểu diễn nó như sau :
(0)(x,P) (3.91)
giả sử w(t) và v(t) có trị trung bình bằng 0 và giả sử rằng nhiễu quá trình và nhiễu đo là nhiễu trắng quá trình để:
R()=E (3.92) R ()=E (3.93)
Ma trân mật độ phổ W và V sẽ giả sử đã biết trước.Theo tính chất của hàm tự tương quan, W và V là bán xác định dương. Giả sử thêm rằng V là không suy biến.Tóm lại, có thể giả sử rằng :
w(t) (0,W), W0 (3.94) v(t) (0,V), V>0 (3.95)
Việc giả sử w(t) và v(t) là nhiễu trắng có thể là xấu trong một vài ứng dụng.Thí dụ như nhiễu ở tần số thấp. Tuy nhiên, giả sử rằng w(t) không là nhiễu trắng, có thể xác định được một hệ thống:
=Ax+Bn (3.96)
w=C+D (3.97)
có nhiễu trắng ngõ vào là n(t) và ngõ ra là w(t). Chúng được gọi là các bộ lọc nắn nhiễu . Những đặc tính động này có thể kết hợp với phương trình của đối tượng (3.75), (3.76) để có được đặc tính động được hiệu chỉnh như sau.
(3.98)
y= (3.99)
Đặc tính động có nhiễu trắng quá trình n(t). Một thủ tục tương tự có thể làm theo các bước như thế nếu v(t) không phải là nhiễu trắng. Do đó, có thể mô tả một hệ thống không có nhiễu trắng dưới dạng một hệ thống điều chỉnh với nhiễu trắng và nhiễu đo lường .
Xác định hệ thống (3.96), (3.97) miêu tả nhiễu không phải là nhiễu trắng w(t) (hoặc v(t)) dựa trên phân tích mật độ phổ của nhiễu w(t). Chi tiết xem Lewis (1986 )
Bây giờ thiết kế bộ ước lượng cho hệ thống (3.75), (3.76) dưới những giả sử đã được liệt kê. Cho bộ quan sát có dạng như sau:
(3.100)
hoặc (3.101)
Hàm thời gian (t) là ước lượng trạng thái và
= EC (3.102)
là ước lượng của ngõ ra y(t).
Độ lợi của bộ ước lượng L phải được chọn để cung cấp ước lượng tối ưu trong sự hiện diện của nhiễu w(t) và v(t). Để chọn L, chúng ta sẽ phải xác định sai số ước lượng:
(t)=x(t)- (t) (3.103)
Sử dụng( 3.75) và (3.100) sai số hệ thống là :
=(A-LC)+ w-Lv
A+w-Lv (3.104)
chú ý rằng sai số hệ thống xảy ra khi có sự tham gia của nhiễu quá trình và nhiễu đo lường . Ngõ ra của sai số hệ thống có thể được cho bởi ỹ=y- để:
ỹ=C (3.105)
Hiệp phương sai của sai số được cho bởi:
P(t)=E (3.106)
thay đổi theo thời gian. Do đó, (t) là quá trình ngẫu nhiên không tĩnh. Hiệp phương sai của sai số là thước đo sự không chắc chắn trong ước lượng. Những giá trị càng nhỏ cho P(t) đồng nghĩa với việc ước luợng càng tốt hơn vì những sai số được phân bố càng gần với trị trung bình bằng 0 nếu P(t) là nhỏ hơn.
Nếu bộ quan sát là ổn định tiệm cận và w(t) và v(t) là quá trình tĩnh khi đó sai số (t) sẽ thực sự tiến đến trạng thái ổn định với trị trung bình và hiệp phương sai là hằng số. Độ lợi L sẽ được chọn lựa để làm tối thiểu hiệp phương sai cũa sai số P. Vì vậy, độ lợi tối ưu L sẽ là ma trận hằng của độ lợi bộ quan sát
Trước khi xác định độ lợi tối ưu L, chúng ta sẽ tính toán giá trị trung bình và hiệp phương sai của sai số ước lượng của (t). Sử dụng (3.104) và sự tuyến tính của phép toán mong muốn:
E (3.107)
Vì thế E=A (3.108)
Do đó, Elà lượng biến đổi theo thời gian tuân theo phương trình vi phân với ma trận hệ thống A.Nếu A=A-LC là ổn định thì Eluôn bền vững tại giá tri tĩnh zero. Khi đó
(3.109)
Theo trừơng hợp này ước lượng (t) tiến tới E{x(t)} .Như vậy ước lượng này được cho là không lệch. Cũng như theo (3.109), giá trị trung bình của sai số ban đầu (0) bằng với giá trị zero nếu như bộ quan sát (3.101) có giá trị đầu (0)= với là giá trị trung bình của x(0)
Nếu như nhiễu quá trình w(t) hoặc nhiễu đo được v(t) có giá trị trung bình không phải là zero thì theo (3.107) giá trị E của trạng thái tĩnh cũng không bằng zero. Trong trường hợp này (t) không đến được ổn định tiệm cận để đạt được trạng thái thật x(t), nhưng có được một khoảng offset bằng giá trị hằng- E. Khi đó trạng thái ước lượng là bị lệch.
Để xác định P, chú ý rằng lời giải phương trình (3.104) được cho :
x(t)=ex(0)-+ (3.110)
Tìm ma trận tương quan chéo R(t,t) và R(t,t) sử dụng (3.110) và giả sử rằng x(0) (và cả (0) ,w(t) và v(t) là trực giao).Do đó
R(t,t)=E=- (3.111)
Chú ý rằng
R(t,=V (3.112)
Nhưng tích phân (3.111) có giá trị giới hạn trên là t. Xung đơn vị có thể được biểu hiện như sau
(3.113)
ở đây hàm xung vuông:
(3.114)
được đặt tại trung tâm t = 0.
Vì vậy, ta chỉ xét một nửa vùng tại bên trái=t. Do đó từ (3.111) được suy ra:
R (3.115)
Tương tự,
= hoặc
= (3.116)
Phương trình đạo hàm cho P(t)=E
(t)=E (3.117)
Theo (3.104) , (3.115) và (3.116) ta có :
E (3.118)
E (3.119)
Từ (3.118) và (3.119)
2 (3.120)
Cho bất kì L để (A-LC) là ổn định ,chúng ta giải (3.120) tìm P(t) sử dụng điều kiện đầu là với là hiệp phương sai của trạng thái đầu mà nó tượng trưng cho tính không chắc chắn trong ước lượng đầu
Thực sự những độ lợi cho kết quả P(t) càng nhỏ thì càng tốt vì sai số (t) càng gần với trị trung bình bằng 0.Do đó P(t) là thước đo chất lượng của bộ quan sát ,và ma trận hiệp phương sai càng nhỏ thì bộ quan sát càng tốt hơn Chúng ta nói rằng P là thước đo sự không chắc chắn trong ước lượng .
P(t) tiến tới giá trị trạng thái bền vững P khi ngay khi là ổn định tiệm cận.Tại trạng thái bền vững thì , (3.121) trở thành phương trình đại số
0= (3.121)
Hiệp phương sai của sai số trạng thái bền vững là ma trận bán xác định dương được xác định từ (3.121). Để lấy độ lợi của bộ quan sát là hằng số, có thể chọn lựa L để làm tối thiểu hoá hiệp phương sai của sai số P trạng thái bền vững.
Ta có chỉ tiêu chất lượng (PI)
J= (3.122)
Do đó nếu P nhỏ thì J sẽ nhỏ. Để chọn L sao cho J đạt được tối thiểu phải thỏa mãn phương trình (3.121), xác định phương trình Hamiltonian
H= (3.123)
Trong đó
g =AP+PA+LVL+W (3.124)
Và S là ma trận n×n thừa số Lagrange không xác định
Để làm tối thiểu hoá J và thoả mãn g=0, điều này có thể làm tương đương là tối thiểu H nhưng không cần điều kiện nào. Điều kiện cần thiết để tối thiểu hóa được cho bởi
(3.125)
(3.126)
(3.127)
Nếu A=A-LC là ổn định và S là xác định dương .Theo (3.127)
L=PCV-1 (3.128)
Thay thế giá trị L vào phương trình (3.125)
=0 (3.129)
hoặc
AP+PA+W-PCV = 0 (3.130)
Để xác định độ lợi bộ quan sát tối ưu L, chúng ta có thể giải phương trình (3.130) tìm hiệp phương sai của sai số P và sau đó sử dụng (3.128) để tính toán L. Phương trình ma trận toàn phương (3.130) được gọi là phương trình Riccati đại số. Có nhiều cách giải (3.130) để tìm P.Độ lợi tối ưu L xác định nhờ sử dụng (3.128) gọi là độ lợi Kalman và bộ quan sát được xây dựng gọi là bộ lọc Kalman .Trạng thái bền vững ở đây chỉ đến một sự thật rằng mặc dù độ lợi tối uu làm tối thiểu hoá P(t) là biến đổi theo thời gian, chúng ta đã chọn lựa độ lợi tối ưu mà nó làm tổi thiểu sai số tương quan trạng thái bền vững để đạt được độ lợi quan sát là hằng số
Bộ lọc Kalman với trạng thái bền vững là bộ ước lượng tốt nhất với các độ lợi là hằng số. Nếu như nhiễu quá trình w(t) và nhiễu đo được v(t) là nhiễu Gaussian nó cũng là bộ ước luợng trạng thái bền vững tối ưu cho bất kì hình thức nào.
Ước lượng ngõ ra:
(3.131)
Giả sử (C,A) là có thể quan sát được và (A,) là có thể tìm được .Khi đó ARE tìm được ma trận xác định dương duy nhất P .Hơn nữa,sai số hệ thống (3.104) sử dụng độ lợi kalman cho bởi (3.128) với P là ma trận xác định dương duy nhất của ARE là ổn định tiệm cận.
Một cách chắc rằng nhiễu hệ thống sẽ giảm.Tuy nhiên vị trí thực sự rất xa vời so với thực tế.
Tóm lại ,từ mô hình hệ thống:
(3.132)
y=Cx (3.133)
x(0)~(x,P) , w(t) ~(0,W), v(t) ~(0,V)
w(t) và v(t) là nhiễu trắng quá trình trực giao với nhau và với x(0)
Giá trị đầu
(0)= (3.134)
Phương trình ARE của hiệp phương sai sai số
AP +PA (3.135)
Độ lợi Kalman
L=PC (3.136)
Đặc tính động học ước lượng:
(3.137)
Bộ lọc Kalman rất cần thiết giả sử rằng V>0 khi đó nhiễu đo sẽ làm sai lệch tất cả tín hiệu đo. Nếu có một vài tín hiệu nhiễu tự do và bộ lọc phức tạp được biết đến như bộ lọc Deyst được sử dụng để giải quyết vấn đề này.Hơn nữa giả sử rằng (A, tìm được có nghĩa là nhiễu quá trình kích thích tất cả các trạng thái
Trong matlab sử dụng lệnh Kalman tính khâu lọc kalman liên tục từ mô hình sys của đối tượng:
[kest,L,P] = kalman(sys,W,V[,N,sensor,known])
W,V là các ma trận hiệp phương sai mô tả đặc điểm nhiễu hệ thống và nhiễu đo lường.
N :mặc định bằng 0
Hai vector sensor,known :chứa chỉ số của các biến ra đo được và các đầu vào ta biết.
Kết quả tính kest :chính là mô hình trạng thái của khâu lọc Kalman
Ma trận L :ma trận bộ lọc Kalman phản hồi sai lệch quan sát.
P :là ma trận hiệp phương sai của sai lệch tĩnh
3.2.3 Giải thuật thiết kế LQG
Bộ điều chỉnh toàn phương tuyến tính (LQR) và bộ lọc Kalman được sử dụng với nhau để thiết kế bộ điều chỉnh động. Thủ tục này được gọi là thiết kế bộ tuyến tính toàn phương Gaussian (LQG). Điều thuận lợi quan trọng của việc thiết kế LQG là cấu trúc của bộ điều khiển được cho bởi thủ tục. Điều này làm cho các bộ LQG được thiết kế rất có ích cho việc điều khiển các hệ thống hiện đại (ví dụ như điều khiển không gian và hàng không ) khi cấu trúc bộ điều khiển không biết trước được.
Giả sử phương trình đo lường ngõ ra được cho bởi
(3.138)
y=Cx+v (3.139)
với x(t)R , u(t) là bộ điều khiển ngõ vào, w(t) là nhiễu quá trình, và v(t) là nhiễu đo. Giả sử phương trình hồi tiếp trạng thái đầy đủ
u=-Kx+r (3.140)
đã được thiết kế, với r(t) là ngõ vào .Độ lợi trạng thái hồi tiếp là K được chọn bởi một số kỹ thuật chẳng hạn như kỹ thuật LQR .Nếu phương trình điều khiển (3.140) được thay vào (3.138) thì hệ thống điều khiển vòng kín được tìm thấy như sau:
(3.141)
Thiết kế hồi tiếp trạng thái đầy đủ rất được quan tâm nếu các điều kiện được giử thì hệ thống vòng kín đảm bảo ổn định.Hơn nữa,sử dụng hồi tiếp trạng thái tất cả các nghiệm cực của phương trình (A-BK) có thể đặt tuỳ ý như mong muốn .Kết quả các phương trình thiết kế của hồi tiếp trạng thái đơn giản hơn phương trình cho hồi tiếp ngõ ra . Tuy nhiên luật điều khiển (3.138) không thể thực hiện khi tất cả các trạng thái không thể đo được.
Bây giờ bộ quan sát hoặc bộ lọc Kalman
(3.142)
đã được thiết kế. Đó là độ lợi L của bộ lọc được tìm ra bằng những kĩ thuật đã thảo luận cung cấp ước lượng trạng thái.Khi đó tất cả các trạng thái không thể đo và điều khiển (3.138) không thể thực hiện trong thực tế, giả sử rằng ước lượng hồi tiếp thay thế các trạng thái thực x(t) luật điều khiển hồi tiếp là
u = -K+r (3.143)
Nếu K được chọn sử dụng phương trình Riccati LQR và L được chọn bởi sử dụng phưong trình Ricati của bộ lọc Kalman.Điều này được gọi là thiết kế LQG
Điều quan trọng của các kết quả này là trạng thái hồi tiếp của K và độ lợi của bộ quan sát L có thể được thiết kế riêng rẽ.
3.2.4 Ví dụ:
Mô hình con lắc ngược:
Xét hệ thống con lắc ngược như hình sau.Con lắc ngược được gắn vào xe kéo bởi động cơ điện.Chúng ta chỉ xét bài toán hai chiều,nghĩa là con lắc chỉ di chuyển trong mặt phẳng.Con lắc ngược không ổn định vì nó luôn ngã xuống trừ khi có lực tác động thích hợp.Giả sử khối lượng con lắc tập trung ở đầu thanh như hình vẽ (khối lượng thanh không đáng kể).Lực điều khiển u tác động vào xe.Yêu cầu của bài toán là điều khiển vị trí của xe và giữ cho con lắc ngược luôn thẳng đứng. Bài toán điều khiển hệ con lắc ngược chính là mô hình của bài toán điều khiển định hướng tàu vũ trụ khi được phóng vào không gian.
Hình 3.11: Mô hình con lắc ngược
Chú thích :
M: trọng lượng xe (Kg)
l: chiều dài con lắc ngược (m)
g: Gia tốc trọng trường (m/s2)
: Góc giữa con lắc ngược và phương thẳng đứng (rad)
m: Trọng lượng con lắc ngược(Kg)
u: lực tác động vào xe (N)
x: vị trí xe (m)
Trước tiên ta hãy xây dựng mô hình toán học của hệ con lắc ngược
Gọi (xG,yG) là toạ độ của vật nặng ở đầu con lắc,ta có:
Áp dụng định luật II Newton cho chuyển động theo phương x,ta có:
Thay xG ở biểu thức trên ta có:
Khai triển các đạo hàm,rút gọn ta được:
Mặt khác, áp dụng định luật II Newton cho chuyển động quay của con lắc quanh trục ta được:
Thay vào ta có:
Khia triển các đạo hàm ở biểu thức trên và rút gọn ta được:
Chúng ta sẽ viết chương trình mô phỏng đặc tính động của đối tượng
Chúng ta thấy rằng hệ con lắc ngược là hệ phi tuyến , để có thể điều khiển hệ con lắc ngược bằng phương pháp LQG chúng ta cần mô hình tuyến tính.Giả sử góc nhỏ để chúng ta có thể xấp xỉ sin bằng 0,cos bằng 1 và cũng giả sử nhỏ để .Với các điều kiện trên,chúng ta có thể tuyến tình hoá các phương trình phi tuyến:
Đặt các biến trạng thái: (3.144)
Kết hợp với hai phương trình trên ta suy ra hệ phương trình biến trạng thái như sau:
(3.145)
Viết lại dưới dạng ma trận
u (3.146)
Phương trình ở ngõ ra,chúng ta giả sử hai trường hợp:
(3.147)
Nếu chỉ đo được hai biến trạng thái(vị trí x và góc lệch )thì :
(3.148)
Chúng ta sẽ khảo sát hệ con lắc ngược có các thông số nhưsau:M=1kg,l=1m Lấy giá trị gia tốc trọng trường g=9.8m/s2
Phương trình (3.146) trở thành:
(3.149)
Thiết kế LQG:
Lọc Kalman:
- Bộ quan sát:
Nếu không có đường phản hồi qua L thì không tiệm cận về x được vì
vậy L được chọn sao cho Úx
Bộ quan sát được thiết kế theo giả thuyết
Giả sử ta có hệ thống:
,nhiễu (3.150)
là các nhiễu trắng có phân bố gaussian với
độc lập nhau
Bộ quan sát có phương trình trạng thái:
(3.151)
B
C
A
L
+
+
-
+
+
u
y
Hình 3.12 Bộ lọc Kalman
(3.152)
Lọc Kalman được xây dựng trên cơ sở:xác định L sao cho kỳ vọng toán cực tiểu.
(3.153)
Trong đó P là nghiệm của phương trình Riccati
(3.154)
Bộ điều khiển LQG (Linear Quard Gaussian):
Trong bộ điều khiển LQ ta hồi tiếp trạng thái tuy nhiên trong thực tế nhiều khi ta phải quan sát để lấy được biến trạng thái ước lượng (do không đo được) và hồi tiếp trạng thái ước lượng => LQG
-
A
L
C
u
y
+
+
+
+
-
B
Kc
-
Hình 3.13: Bộ điều khiển LQG
Điều khiển LQG là kết hợp điều khiển LQR với lọc Kalman .
Bước 1:Thiết kế điều khiển LQR=>KC
Bước 2:Thiết kế bộ lọc Kalman =>L
3.3 Điều khiển bền vững H¥
3.3.1 Biểu Đồ Bode Đa Biến (Multivariable Bode Plot)
Biên độ của ma trận hàm truyền toàn phương tại bất kỳ một tần số nào, phụ thuộc vào hướng tín hiệu kích thích đầu vào.Biên độ của ma trận hàm truyền H() được bao phía trên bởi giá trị suy biến cực đại, kí hiệu , phía dưới bởi giá trị suy biến cực tiểu của nó, kí hiệu . Chính vì vậy,chúng ta cần tính toán hai giá trị ràng buộc này.
Ví dụ: Biểu Đồ Bode Biên Độ Hệ MIMO:
Giả sử hệ thống đa biến:
bu
Ax
u
x
x
+
=
ú
ú
ú
ú
û
ù
ê
ê
ê
ê
ë
é
+
ú
ú
ú
ú
û
ù
ê
ê
ê
ê
ë
é
-
-
-
-
-
-
=
0
0
1
0
0
0
0
1
3
8
0
0
8
3
0
0
0
0
1
2
0
0
2
1
&
(3.155) ,
có hàm truyền hệ MIMO là:
Với:
.
Hàm H(s) là ma trận , nó có hai giá trị suy biến. Chú ý rằng giá trị suy biến là liên tục, ngọai trừ gía trị suy biến cực đại và cực tiểu. Những giá trị suy biến có thể giao nhau , được minh chứng bằng hình học.
Hình 3.14 Biểu Đồ Bode Biên độ hệ MIMO của giá trị suy biến trong miền tần số
Trong Malab dùng hàm sigma(H)
Để minh họa sự khác biệt giữa đồ thị trị suy biến hệ MIMO và giản đồ Bode hệ SISO riêng biệt, xét hệ thống sau. Hàm truyền của hệ thống này là ma trận vuông có hạng 2. Hàm truyền hệ SISO riêng biệt trong hệ thống vòng hở 2 ngõ vào/2 ngõ ra là:
--contiep---
Các file đính kèm theo tài liệu này:
- CHNG3_1.DOC
- CHNG3_2.DOC