Những hạn chế về nguyên tắc của các lý thuyết điều khiển tối ưu hiện nay và những hiểu sai thường gặp khi vận dụng

Tóm tắt Những hạn chế về nguyên tắc của các lý thuyết điều khiển tối ưu hiện nay và những hiểu sai thường gặp khi vận dụng: ...ế góc α biểu thị phạm vi điều khiển tại một điểm .Góc α biến thiên theo XX && , tăng thì α giảm α = π khi X& = 0 (trên trục hoành ) α = 0 khi XX &&&& minmax = và tại đó chỉ tồn tại duy nhất một quĩ đạo điều khiển .Tốc độ mà tại đó XX &&&& minmax = gọi là tốc độ giới hạn X gh& và luôn luôn ...quĩ đạo là giảm tốc thì chú thích là tăng tốc) của các tác giả [6] vì quĩ đạo điều khiển ở những miền chỉ tăng tốc hoặc chỉ giảm tốc. Những miền này không tồn tại ở những trường hợp đơn giản thường gặp mà ở đó gia tốc lớn nhất và nhỏ nhất luôn trái dấu nhau. Sự nhầm lẫn của các tác giả này là ... ba và cắt đường chuyển đổi ANO v.v... Quỹ đạo pha đó cứ xoắn dần vào gốc tọa độ. Vì thế trượng hợp này quá trình quá độ là một dao động tắt dần (vì quỹ đạo pha ứng với quá trình đó hội tụ vào tiêu điểm cân bằng 0). Trường hợp hình 5c cũng hiểu sai tương tự. Thực ra quá trình trên không ph...

pdf8 trang | Chia sẻ: havih72 | Lượt xem: 184 | Lượt tải: 0download
Nội dung tài liệu Những hạn chế về nguyên tắc của các lý thuyết điều khiển tối ưu hiện nay và những hiểu sai thường gặp khi vận dụng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
 1
NHỮNG HẠN CHẾ VỀ NGUYÊN TẮC CỦA CÁC LÝ THUYẾT ĐIỀU KHIỂN TỐI 
ƯU HIỆN NAY VÀ NHỮNG HIỂU SAI THƯỜNG GẶP KHI VẬN DỤNG 
 TS . Lê Văn Ngự 
 Viện NC Điện tử, Tin học, Tự động hóa 
Tóm tắt 
 Cho đến nay việc giải các bài toán điều khiển tối ưu chủ yếu dựa trên cơ sở của các nguyên 
lý Bellmal, nguyên lý cực đại Pontriagin hoặc các lý thuyết khác. Những lý thuyết này còn có 
chung hạn chế về nguyên tắc là ở chỗ nó chỉ là những điều kiện cần mà không đủ. Khi vận 
dụng còn có yếu tố kinh nghiệm trực quan và có thể dẫn đến hiểu sai. Từ những kết quả 
nghiên cứu theo hướng tiếp cận khác bài báo đã chỉ rõ một số trường hợp hiểu sai ngay ở các 
bài toán được coi là kinh điển trong các sách giáo khoa bậc Đại học và các tài liệu khác của 
các tác giả trong và ngoài nước. 
1. Thiết lập bài toán 
 Đến nay ở hầu hết các tài liệu bài toán được đặt ra như sau. 
 Cho đối tượng điều khiển có mô hình động lực học dạng ( ) ( )u,xftx =& (1) 
Trong đó : x( xnxixx ,,,,2,1 LL ) là biến (vec tơ ) trạng thái 
 ( )uruiuuu ,,,,2,1 KK là vec tơ điều khiển 
 với điều kiện hạn chế uu u maxmax ≤≤− (2) 
Hàm mục tiêu có dạng : ( ) ( )dttuxGtuxQ T∫=
0
,,,, (3) 
Trong đó G(x,u,t) là hàm đối với x,u và thời gian t . 
Vec tơ điều khiển )(* tu cần phải xác định để chuyển đối tượng từ trạng thái ban đầu x(to) 
đến trạng thái cuối x(T) để hàm mục tiêu Q đạt giá trị nhỏ nhất gọi là điều khiển tối ưu.Quỹ 
đạo trạng thái tương ứng từ x(to) đến x(T) gọi là quĩ đạo tối ưu. Khi G=1 thì được gọi là bài 
toán tối ưu tác động nhanh. 
 Đây là bài toán rất khó , đến nay vẫn chưa có cách giải hoàn chỉnh.Là bài toán được thiết 
lập cho hệ thống nhiều biến có liên quan đến những khái niệm trừu tượng và phải được hiểu 
chính xác.Những khó khăn này tồn tại ở ngay bước thiết lập bài toán. 
 Thứ nhất là điều kiện hạn chế của u trong trường hợp tổng quát là đại lượng biến đổi phụ 
thuộc vào trạng thái của đối tượng mà không phải luôn luôn ở dạng uu u maxmax ≤≤− (mặc dù 
các thành phần có thể hạn chế ở dạng maxmax iii uuu ≤≤− ) 
 Thứ hai là hàm mục tiêu được thiết lập ở dạng tích phân của biến thời gian. Điều này gặp 
phải khó khăn là ngay ở những trường hợp đơn giản cũng không tìm được hàm tường minh 
của các đại lượng theo thời gian.Trường hợp tác động nhanh khi G=1 thì hàm mục tiêu 
∫=
T
dtQ
0
.1 không biểu hiện rõ quan hệ của nó với các đại lượng khác của bài toán ,ngay cả 
khoảng thời gian xảy ra quá trình cũng chưa biết và thực tế thời gian không được tính theo 
biểu thức này.Các lí thuyết áp dụng cho trường hợp này phải qua các bước tính toán rất phức 
tạp nhưng kết quả vẫn bị hạn chế do bản thân các lí thuyết chưa hoàn chỉnh .Dưới đây xin 
trình bày hướng tiếp cận mới. 
2. Hướng tiếp cận mới 
 Mục tiêu cơ bản của bài toán không thay đổi nhưng hướng tiếp cận mới được thể hiện ở 
các nội dung sau 
 2
2.1 Quan niệm sự biến thiên trạng thái động học như là một thuộc tính của đối tượng. Do đó 
việc khảo sát sự biến thiên trạng thái được thực hiện độc lập với tác động điều khiển (là 
nguyên nhân gây ra biến đổi trạng thái ,thường có liên quan trực tiếp hay gián tiếp đến quá 
trình biến đổi năng lượng) 
 2.2. Xác lập hàm mục tiêu là hàm của các biến trạng thái ( )XXQ &, mà không theo biến thời 
gian.Thời gian được coi như một tham số ,khi cần nó có thể được xác định theo các biến 
trạng thái. 
2.3 Xác định quĩ đạo tối ưu đồng thời với điều khiển tối ưu dựa trên các quan hệ của các biến 
trạng thái đối với ( )XXQ &, và ( )XU &X, 
3 Các bước thực hiện 
 3.1. Sự biến thiên trạng thái động học 
 Ở đây khảo sát sự biến thiên trạng thái mà không quan tâm đến tác động điều khiển là 
nguyên nhân gây ra nó nên gọi là biến thiên trạng thái động học.Không gian trạng thái được 
biểu diễn bởi trục hoành là X và trục tung là X& (hình 1) 
 Mục tiêu là phải điều khiển đối tượng từ trạng thái ban đầu đến trạng thái cuối để 
Qmin ,tức là phải xác định quĩ đạo tối ưu. 
 Trước khi xác định quĩ đạo tối ưu ta hãy xét quĩ đạo trạng thái nói chung,tức là quan hệ 
giữa 
⋅
X và X. Tại mỗi điểm ta có 
dt
dX
dt
Xd
dX
Xd
⋅
⋅
= 
X
X
dX
Xd &&&& = (4) 
 Đây là phương trình vi phân của quĩ đạo trạng thái của đối tượng bất kì. Ý nghĩa hình học 
của (4) là độ dốc của quĩ đạo tại điểm (X, X& ).Nó phụ thuộc vào các biến trạng thái và có quan 
hệ với u từ mô hình động lực học. 
 Tại một điểm đã cho có X& đã biết, độ dốc chỉ phụ thuộc X&& và bị hạn chế trong giới 
hạn XX X &&&& && maxmin ≤≤ do u bị hạn chế .Các giá trị giới hạn này hoàn toàn xác định được từ 
mô hình động lực học . 
 Nếu tại một điểm ta dựng các vecto tiếp tuyến với các quỹ đạo ứng với XX &&&& minmax , và góc 
giữa chúng là α thì các quĩ đạo đi qua điểm đó phải nằm trong góc α.Vì thế góc α biểu thị 
phạm vi điều khiển tại một điểm .Góc α biến thiên theo XX && , tăng thì α giảm 
 α = π khi X& = 0 (trên trục hoành ) 
 α = 0 khi XX &&&& minmax = và tại đó chỉ tồn tại duy nhất một quĩ đạo điều khiển .Tốc độ 
mà tại đó XX &&&& minmax = gọi là tốc độ giới hạn X gh& và luôn luôn xác định được .Tập hợp các 
điểm có tốc độ giới hạn tạo thành quĩ đạo giới hạn .Việc điều khiển không thực hiện được ở 
tốc độ cao hơn tốc độ giới hạn . 
 3
 Nếu trên quỹ đạo giới hạn có X&& là dương thì tồn tại điểm K tại đó 0Xmin =&& và đổi dấu từ 
âm sang dương,vì thế quĩ đạo ứng với Xmin&& là cực tiểu.Trên khoảng từ K đến quĩ đạo giới 
hạn luôn có X&& >0 ,vì thế quĩ đạo luôn luôn tăng .Tương tự nếu trên quĩ đạo giới hạn có X&& là 
âm thì tồn tại điểm H tại đó X&& max =0 và đổi dấu từ dương sang âm vì thế quĩ đạo ứng với 
X&& max là cực tiểu .Trên khoảng từ H đến quĩ đạo giới hạn luôn có X&& <0 ,quĩ đạo luôn luôn 
giảm .Tập hợp các điểm K và H tạo thành quĩ đạo gọi là quĩ đạo không (đường nét đứt hình 
1)Quĩ đạo này chia không gian trạng thái thành ba miền có các tính chất khác nhau là : 
 1.Miền có thể tăng hoặc giảm (ở dưới điểm K và H) 
 2.Miền chỉ có thể tăng (ở trên điểm K).Là miền điều khiển không bền vững 
 3.Miền chỉ có thể giảm (ở trên điểm H) 
3.2. Điều khiển từ trạng thái đầu đến trạng thái cuối 
 Việc điều khiển từ trạng thái đầu ( )xxA &, đến trạng thái cuối ( )xxB &, cũng chỉ có thể thực 
hiện được trong phạm vi nhất định.Ta dựng các nhánh quĩ đạo ứng với X&& max và Xmin&& đi ra 
khỏi A và đi tới B ,nếu chúng cắt nhau trong miền tốc độ giới hạn thì các quĩ đạo điều khiển 
từ A đến B nằm trong miền giới hạn của các đường này (Hình 2.a) 
nếu chúng cắt nhau ở ngoài miền tốc độ cho phép thì phải xét cụ thể điều kiện có thể thiết lập 
được đoạn quĩ đạo nối các nhánh với nhau H.2,b hay không, nhất là ở miền gần quĩ đạo giới 
hạn. 
3.3. Áp dụng cho bài toán tối ưu tác động nhanh 
 Ví dụ khảo sát bài toán tối ưu tác động nhanh cho đối tượng có mô hình động lực học 
UX =&& , 1≤U . Ta thấy ngay quĩ đạo tối ưu với thời gian ngắn nhất là quĩ đạo ứng với tốc độ 
cao nhất , khi X&& max =1 và Xmin&& = −1 
X&
A 
B 
X 
X&
A
B
X
a b 
H.2. Miền điều khiển từ A đến B
α 
O x 
K H
H .1 .Các miền biến thiên trạng thái 
X&
 4
Từ phương trình (4) khi X&& max =1 ta có dXXdX =&& . Tích phân biểu thức này được: 
0CX2X2 =+−& 
Tương tự khi Xmin&& = −1 có: 0CX2X 2 =++& 
Đó là các nhánh Parabol , đúng như cách tính theo nguyên lí Pontriagin.Khi đã xác định được 
quĩ đạo tối ưu ta dễ dàng tính được thời gian theo biểu thức Xd/dXdT &= 
4. Đối chiếu với một số tác giả khác 
 Phần này nhằm làm rõ hơn một số nội dung đã được đề cập ở một số tài liệu khác 
4.1 Nguyên lý cực đại Pontriagin 
 Về nguyên tắc không thể áp dụng nguyên lý cực đại Pontriagin vì nó chỉ là điều kiện cần. 
Nếu không thỏa mãn nguyên lý này thì kết luận là không tối ưu, còn khi thỏa mãn thì chưa thể 
kết luận được là tối ưu. 
4.2 Sự biến thiên của quỹ đạo tối ưu 
 Lời chú thích không đúng với sự biến thiên của quỹ đạo điều khiển ở một số khoảng (quĩ 
đạo là tăng tốc thì chú thích là giảm, quĩ đạo là giảm tốc thì chú thích là tăng tốc) của các tác 
giả [6] vì quĩ đạo điều khiển ở những miền chỉ tăng tốc hoặc chỉ giảm tốc. Những miền này 
không tồn tại ở những trường hợp đơn giản thường gặp mà ở đó gia tốc lớn nhất và nhỏ nhất 
luôn trái dấu nhau. Sự nhầm lẫn của các tác giả này là ở chỗ cho rằng gia tốc lơn nhất luôn là 
dương, nhỏ nhất là âm. 
 Quỹ đạo tối ưu ở trường hợp tổng quát không tiếp tuyến với quỹ đạo tốc độ giới hạn. 
 Khi nói về cách dựng quỹ đạo tối ưu ở trường hợp các nhánh qua điểm đầu và điểm cuối 
của quỹ đạo không cắt nhau trong miền tốc độ cho phép thì dựng các đoạn tối ưu ứng với 
maxλ&& hoặc minλ&& tiếp tuyến với quỹ đạo tốc độ giới hạn để nối chúng với nhau. Vì ở tốc độ giới 
hạn chỉ tồn tại một quỹ đạo điều khiển duy nhất qua đó và nó hoàn toàn đã được xác định và 
nói chung không là tiếp tuyến với quỹ đạo tốc độ giới hạn (khác với các tác giả [1], [6]). 
4.3 Không thể thay thế tương đương đường cong tối ưu bằng đường gẫy khúc 
 Khi áp dụng vào thực tế người ta thường thay thế quỹ đạo tối ưu lý thuyết bằng quỹ đạo 
gần đúng. Việc thay thế này về nguyên tắc phải thực hiện điều khiển được trên thực tế. Trong 
tính toán để tính gần đùng người ta thường thay thế đường cong bằng đường gãy khúc gồm 
ngững đoạn thẳng có điểm giao nhau với đường cong. Tuy nhiên đối với đường cong điều 
khiển tối ưu thì việc thay thế như trên nói chung là không đúng. Lý do vì tại mỗi điển các quỹ 
đạo điều khiển tối ưu là biên của phạm vi điều khiển, nếu thay bằng đoạn thẳng giao nhau với 
đường cong thì sẽ có phần vượt ra khỏi phạm vi điều khiển. 
λ D
C 
B 
A λ&
0 Accelerate Decelerate Accelerate Decelerate 
H.3. Lời chú thích sai 
 5
 Ví dụ tại điểm P có hai nhánh quỹ đạo cong tối ưu đi qua (Hình 4). Nếu ta thay các cung 
cong bằng các đoạn thẳng PN và PM thì toàn bộ đoạn thẳng PN và phần cuối của đoạn thăng 
PM nằm ngoài phạm vi điều khiển (vì tại M hướng của quỹ đạo thảng nằm ngoài phạm vi 
điều khiển). Ta có thể xác định được đoạn nào trên PM nằm ngoài phạm vi điều khiển. 
 Dưới đây sẽ xét trường hợp không đúng khi thay thế đường cong chuyển đổi tối ưu bằng 
một đường gẫy khúc để điều khiển tối tượng về gốc tọa độ của [2] hình 5.a, b 
 Trường hợp ở hình 5a là thay thế việc điều khiển theo đường cong tối ưu là Parabol bằng 
đường thẳng (theo chế độ trượt) về gốc tọa độ khi điều khiển đối tượng được mô tả bởi 
phương trình d2y/dt2 = U với | U | ≤ 1. Trường hợp này đã được đề cập ở [5] 
 Trường hợp ở hình 5b là thay thế quỹ đạo chuyển đổi tối ưu lý thuyết là Parabol bằng 
đượng gẫy khúc ANOPB để tại đó đổi chiều tác động nhằm điều khiển đối tượng theo các quỹ 
đạo tối ưu dầnhội tụ về gốc tạo độ. Theo tài liệu đã dẫn thì quá trình được thực hiện như sau. 
P
M 
N 
H.4. Không thể điều khiển theo đoạn thẳng 
y1 
y2 
B 
Q P 
M2 
M
C 
N L 
A 
y2 
B P 
M2
M1 
N 
A 
y1 
a) b) 
H.5. Không điều khiển được về 0 
c) 
O 
O 
 6
Từ trạng thái ban đầu M1 chuyển động theo quỹ đạo tối ưu rồi cắt đường chuyển đổi AN và 
sau đó lại chuyển động theo quỹ đạo tối ưu thứ hai và cắt đượng chuyển đổi PO rồi tiếp tục 
theo quỹ đạo tối ưu thứ ba và cắt đường chuyển đổi ANO v.v... Quỹ đạo pha đó cứ xoắn dần 
vào gốc tọa độ. Vì thế trượng hợp này quá trình quá độ là một dao động tắt dần (vì quỹ đạo 
pha ứng với quá trình đó hội tụ vào tiêu điểm cân bằng 0). 
 Trường hợp hình 5c cũng hiểu sai tương tự. 
 Thực ra quá trình trên không phải là quá trình tắt dần và hội tụ về 0, mà như H.6. Theo lý 
thuyết thì mọi quỹ đạo pha tại trục hoành đều có tiếp tuyến thẳng đứng, tại gốc tọa độ là trục 
tung. Vì thế đoạn NOP ở lân cận 0 luôn ở phía trước đường cong chuyển đổi lý thuyết, nghĩa 
là các quỹ đạo tối ưu gặp đoạn thẳng trước khi gặp đường cong chuyển đổi mà không phải ở 
phía sau như hình 5b 
 Nếu chuyển đổi điều khiển ở đoạn thẳng lân cận bên trái điểm 0 thì quỹ đạo tối ưu cắt trục 
hoành ở bên trái điêmr 0 rồi ra xa khỏi điển 0. Cũng tương tự khi chuyển đổi điều khiển ở 
đoạn thẳng lân cận bên phải 0. H.6,a 
 Nếu cho đường gẫy khúc ở phía sau đường cong thì đoạn thẳng qua 0 chính là trục tung. 
Các quỹ đạo tối ưu cắt nhau trên trục tung thì đối xứng với nhau qua 0 . Nếu đổi chiều điều 
khiển trên trục tung thì quá trình hoặc là đi xa khỏi 0 hoặc là chuyển động quanh 0 tùy theo 
chiều và vị trí chuyển đổi. Nếu ở điển phía trên 0 chuyển điều khiển từ âm sang dương thì đi 
xa khỏi 0, chuyển từ dương sang âm thì quỹ đạo tiếp theo sẽ cắt trục tung ở điểm dưới và đối 
sứng qua 0 và tại đó lại chuyển sang dương thì quỹ đạo lại cắt trục tung ở điểm chuyển đổi lần 
trước và nếu chuyển đổi tiếp thì quá trình chuyển động quanh 0 lặp lại mà không tiến tới 0. 
Cũng tương tự với đối với điểm chuyển đổi ở phía dưới 0. 
 Tóm lại là về nguyên tắc không thể thay thế tương đương quỹ đạo cong tối ưu bằng đường 
gấp khúc. 
O y1 
b) 
H.6. Quỹ đạo tối ưu lân cận 0 
a) 
O y1 
y2 
 7
4.4. Điều khiển ở chế độ gần tối ưu 
 Trong thực tế thường phải thỏa mãn đồng thời các yêu cầu khác nhau vì vậy phải thực hiện 
điều khiển các chế độ gần tối ưu . Quá trình điều khiển thường có ba giai đoạn: giai đoạn quá 
độ ban đầu đưa đến chế độ ổn định, giai đoạn ổn định để thực hiện nhiệm vụ nào đó và cuối 
cùng là giai đoạn quá độ về trạng thái ngừng hoạt động. Trong ba giai đoạn thì giai đoạn ổn 
định thường là quan trọng nhất cần có yêu cầu cao về chất lượng điều khiển ta thực hiện theo 
chế độ trượt. Giai đoạn đầu và cuối điều khiển theo chế độ tối ưu hoặc gần tối ưu. Giả sử theo 
phương án trên thì có thể thực hiện điều khiển gần tối ưu từ điểm P về O (H.7) như sau: 
- Thay quỹ đạo chuyển đổi tối ưu về 0 bằng miền lân cận nó. 
- Xác định miền điều khiển được về 0 theo đường thẳng ở chế độ trượt (giới hạn bởi trục 
hoành và đường X1 = - X22) (xem [5]) 
- Từ P điều khiển theo quỹ đạo tối ưu thì PM là đoạn điều khiển được về 0 theo đường thẳng 
nhưng ở tốc độ thấp. Muốn được tốc độ cao hơn thì tới N. 
- Từ N có thể theo các đường thẳng có độ nghiêng khác nhau tới miền lân cận đường chuyển 
đổi tối ưu 
- Theo quỹ đạo tối ưu về miền điều khiển được theo đường thẳng lân cận O. 
- Về O theo đường thẳng. 
 Bằng cách này có thể dễ dàng chọn được chế độ điều khiển thích hợp. Việc chuyển đổi 
được thực hiện ở một miền mà không phải ở điểm nên dễ thực hiện. 
5. Kết luận 
 Các lí thuyết hiện nay còn hạn chế về nguyên tắc .Khi áp dụng còn các yếu tố trực quan và 
dễ dẫn đến hiểu sai. Là vấn đề khó và phong phú vì vậy những nội dung đề cập ở đây chỉ là 
bước đầu, tuy nhiên cũng góp phần làm sáng tỏ hơn bản chất của bài toán. Vấn đề cần được 
nghiên cứu tiếp. 
H.7. Điều khiển gần tối ưu 
P 
X2 
X1 = - 22X 
X1 = - 222
1 X 
O
M 
N 
X1 
 8
Tài liệu tham khảo : 
[1] .KIM B.K, SHIN K.G., (1983) Suboptimal control of indiustrial manipulator with a 
weighted minimum time - fuel criterion. Proc. 22 nd IEEE Conf. Decis and Cont. San 
Anlonio. Vol.3. New York.N.Y 
[2]. PHẠM CÔNG NGÔ., (1996) Lý thuyết điều khiển tự động . NXB KHKT 
[3]. NGUYỄN THƯƠNG NGÔ., (1999) Lý thuyết điều khiển tự động hiện đại . NXB KHKT 
 [4]. LE VAN NGU., (1999) The change of the minimum time controllable trajectory and the 
enduring controllable zones of industrial robot with geometric path constrains. 30th 
International Symposium on robotics, Proc. pp177- 180, Tokyo, Japan 
 [5]. LÊ VĂN NGỰ ., (2000) Bổ sung cơ sở lý thuyết cho phương pháp điều khiển tối ưu. 
Tuyển tập báo cáo khoa học. Hội nghị toàn quốc lầm thứ 4 về Tự động hóa. 
pp. 317- 322 
 [6]. SHIN K.G.,MCKAY ND., (1985)Minimum time control robotic manipulation with 
geometric path constraints. IEEE trans. Auto.cont. Vol30, No6, pp 531 - 541. 
[7]. NGUYỄN DOÃN PHƯỚC, PHAN XUÂN MINH., (1999) Điều khiển tối ưu và bền 
vững . NXB Khoa học Kỹ thuật 
người nhận : Phạm anh tuấn Viện cơ học ĐT 7627205 
 264 Đội cấn. mechatronics@hn.vnn.vn 

File đính kèm:

  • pdfnhung_han_che_ve_nguyen_tac_cua_cac_ly_thuyet_dieu_khien_toi.pdf