Một phương pháp sinh hệ luật mờ Mamdani cho bài toán hồi quy với ngữ nghĩa đại số gia tử

Tóm tắt Một phương pháp sinh hệ luật mờ Mamdani cho bài toán hồi quy với ngữ nghĩa đại số gia tử: ...h 1: Một thiết kế phân hoạch tập mờ dạng tam giác với tham số k = 2, µL = 0.4020657, µc− = 0.6768686 4. THUẬT TOÁN TIẾN HÓA DỰA TRÊN ĐSGT Hình 2: Phân hoạch với 2 tập mờ và 5 tập mờ Khi thiết kế các thuật toán tiến hóa, mã hóa cá thể là công việc quan trọng. Dựa trên cấu trúc mã hóa chúng ta t...X(kF+1), đặt phần tử thứ f của luật R bằng w. Nếu luật sau khi đột biến có độ dài lớn hơn `max (chiều dài tối đa của luật do người dùng chọn trước) thì đột biến sẽ bị bỏ qua. Sau khi đột biến hệ luật có thể có các luật có độ dài bằng 0 và các luật trùng nhau. Thực hiện loại bỏ các luật này, với l... 110 M S E x 104 Complexity Training HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 20 40 60 80 100 120 M S E x 104 Complexity Testing HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.9 1.1 1.3 1.5 1.7 1.9 2.1 2.3 2.5 20 30 40 50 60 70...

pdf12 trang | Chia sẻ: havih72 | Lượt xem: 273 | Lượt tải: 0download
Nội dung tài liệu Một phương pháp sinh hệ luật mờ Mamdani cho bài toán hồi quy với ngữ nghĩa đại số gia tử, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
 các tham số mờ của ĐSGT bao gồm F + 1 véc tơ, mỗi véc tơ gồm
2 phần tử thực mã hóa tham số mờ của ĐSGT µLf và µC
−
f (ở đây chúng tôi sử dụng ĐSGT
có 2 gia tử). Ck là một véc tơ F + 1 chiều, phần tử thứ f là một số tự nhiên kf xác định độ
dài tối đa các hạng từ sử dụng để phân hoạch thuộc tính thứ f . CRB mã hóa cơ sở luật gồm
Mp luật (Mp có thể khác nhau giữa các cá thể), với mỗi luật là một véc tơ có F + 1 phần
tử, mỗi phần tử gồm một từ ngôn ngữ và tập mờ tương ứng trong X(kf ). Như vậy CRB gồm
Mp ∗ (F + 1) phần tử.
Hình 3: Cấu trúc mã hóa một cá thể
Chúng ta giới hạn số luật trong mỗi cơ sở luật nằm trong khoảng [Mmin,Mmax] nhằm
đảm bảo hệ luật sinh ra đạt được sự cân bằng giữa tính dễ hiểu và độ chính xác đồng thời
giới hạn không gian tìm kiếm các hệ luật. Hàm mục tiêu của mỗi cá thể gồm hai thành phần
(MSE,Comp), trong đó MSE được xác định theo (2) và Comp là tổng độ dài của các luật
232 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG
trong cơ sở luật.
4.2. Các toán tử di truyền
4.2.1. Toán tử lai ghép
Với hai cá thể bố mẹ p1, p2 sử dụng phương pháp lai ghép một điểm (one-point crossover)
độc lập trên Cµ, Ck và CRB. Thực hiện lai ghép trên Cµ với xác suất Pcµ, điểm lai ghép
được chọn ngẫu nhiên trong đoạn [1, (F + 1) ∗ 2− 1]. Ck được lai ghép với xác suất Pck, điểm
lại ghép được chọn ngẫu nhiên trong đoạn [1, F + 1]. CRB được lai ghép với xác suất PcRB,
điểm lai ghép được chọn ngẫu nhiên trong đoạn [1, ρmin − 1], trong đó ρmin là số luật ít nhất
của 2 cơ sở luật trong p1 và p2. Chú ý nếu trên CRB toán tử lai ghép không được thực hiện
thì toán tử đột biến trên CRB luôn xảy ra. Sau khi lai ghép có thể tạo ra các luật trùng nhau,
thực hiện loại bỏ các luật trùng nhau chỉ giữ lại một luật.
4.2.2. Toán tử đột biến
Với cá thể con s thực hiện đột biến độc lập trên Cµ, Ck và CRB. Thực hiện đột biến trên
Cµ với xác suất Pmµ, chọn ngẫu nhiên một gen thứ f ∈ [1, (F + 1) ∗ 2 − 1], thay đổi giá
trị tại f của Cµ bằng một giá trị ngẫu nhiên trong đoạn [min,max] ⊂ [0, 1] do người dùng
xác định trước. Trên Ck thực hiện đột biến với xác suất Pmk, chọn ngẫu nhiên một gen thứ
f ∈ [1, (F + 1)], thay đổi giá trị của gen này bằng cách ngẫu nhiên tăng hoặc giảm một đơn
vị. Nếu giá trị mới nằm ngoài đoạn [1, kmax] thì đột biến sẽ bị bỏ qua. Trên CRB thực hiện
đột biến với xác suất PmRB, nếu đột biến xảy ra thì chọn thực hiện một trong hai toán tử
đột biến dưới đây. Toán tử đột biến thứ nhất xảy ra với xác suất PmAdd, nếu không toán tử
đột biến thứ hai được áp dụng.
- Toán tử đột biến thứ nhất: thêm γ luật vào CRB (các luật được sinh ra theo thuật toán
trong mục 3.2.3), với γ được chọn ngẫu nhiên trong đoạn [1, γmax], nếu γ +M > Mmax
thì γ = Mmax −M .
- Toán tử đột biến thứ hai: thay đổi ngẫu nhiên δ giá trị của CRB, với δ được chọn ngẫu
nhiên trong đoạn [1, δmax]. Chọn ngẫu nhiên một luật R, tiếp theo chọn ngẫu nhiên
một phần tử, giả sử là f . Nếu f ≤ F thì chọn ngẫu nhiên một từ ngôn ngữ w trong
{Don′tcare} ∪ X(kf ), nếu f = F + 1 thì chọn ngẫu nhiên một từ ngôn ngữ w trong
X(kF+1), đặt phần tử thứ f của luật R bằng w. Nếu luật sau khi đột biến có độ dài lớn
hơn `max (chiều dài tối đa của luật do người dùng chọn trước) thì đột biến sẽ bị bỏ qua.
Sau khi đột biến hệ luật có thể có các luật có độ dài bằng 0 và các luật trùng nhau. Thực
hiện loại bỏ các luật này, với luật trùng nhau thì giữ lại một luật.
4.2.3. Thuật toán sinh luật ngẫu nhiên từ dữ liệu
Chọn ngẫu nhiên một mẫu dữ liệu (xi, yi) trong tập dữ liệu huấn luyện. Thực hiện sinh
một luật R có độ dài ` dựa trên các hệ khoảng mờ tương tự S(kf ) được xác định từ bộ tham
số mờ của ĐSGT trong Cµ và Ck trong cùng cá thể như sau:
AN EVOLUTIONARY METHOD TO GENERATE MAMDANI RULE-BASED SYSTEMS 233
Bước 1: Xác định các tập từ ngôn ngữ X(kf) và các hệ khoảng mờ tương tự S(kf ) của các
thuộc tính tương ứng với các bộ tham số mờ của ĐSGT trong Cµ và chiều dài tối đa của từ
trong Ck.
Bước 2: Sinh luật Ri có chiều dài F , với mẫu dữ liệu xi = (xi1, xi2, . . . , xiF , yi) ∈ D, thực
hiện:
• Xác định tập các điều kiện tiền đề Ai của luật được sinh bởi mẫu dữ liệu (xi, yi)
Ai = {(A1,ji , A2,ji , . . . , AF,ji)|Af,ji ∈ X(kf ), xif ∈ T (Af,ji), f = 1, 2, . . . , F, ji ∈ [1, |X(kf )|]}
• Sinh luật gồm vế trái là Ai và kết luận là AF+1,ji tương ứng với mẫu dữ liệu (xi, yi)
Ri = (Ai ∈ AF+1,ji) với AF+1,ji ∈ X(kF+1), yi ∈ T (AF+1,ji), ji ∈ [1, |X(kF+1)|]
Trong đó T (Af,ji) là khoảng mờ tương tự của hạng từ Af,ji trong S(kf ).
Bước 3: Sinh luật R có chiều dài ` từ luật Ri. Chọn ngẫu nhiên ` ∈ [1, `max], thực hiện sinh
ngẫu nhiên ` giá trị nguyên f1, . . . , fl khác nhau trong đoạn [1, F ], thay đổi các điều kiện tiền
đề có thứ tự khác với f1, . . . , fl của luật Ri thành Don’tcare khi đó chúng ta được luật R có
chiều dài `.
4.2.4. Thuật toán tiến hóa HA-(2+2)M-PAES
Trong phần này trình bầy những bước cơ bản của thuật toán HA-(2+2)M-PAES được
phát triển dựa trên lược đồ tiên hóa (2+2)M-PAES đề xuất trong [6]. Mục tiêu của thuật toán
là xây dựng một mặt xấp xỉ tối ưu Pareto với mỗi điểm là một cá thể với 2 mục tiêu MSE
và Comp. Kí hiệu PA là mặt xấp xỉ tối ưu Pareto của thế hệ hiện tại. Thuật toán gồm các
bước sau:
Bước 1: Sinh ngẫu nhiên 2 cá thể o1, o2. Các gen trong Cµ là các số thực được sinh ngẫu
nhiên trong đoạn [min,max]. Các gen trong Ck là các số tự nhiên được sinh ngẫu nhiên trong
đoạn [1, kmax]. Các gen trong CRB gồm M luật được sinh theo thuật toán trong mục 3.2.3
với M được chọn ngẫu nhiên trong đoạn [Mmin,Mmax].
Bước 2: Bổ sung o1, o2 vào PA
Bước 3: Lặp i = 1, . . ., MaxGen (số thế hệ tối đa)
Bước 3.1. Chọn ngẫu nhiên hai cá thể cha mẹ p1, p2 trong PA (p1, p2 có thể trùng nhau)
Bước 3.2. Thực hiện lai ghép hai cá thể cha mẹ p1, p2 để sinh ra hai cá thể con s1, s2
Bước 3.3. Thực hiện đột biến lần lượt trên s1, s2
Bước 3.4. Tính giá trị mục tiêu (MSE, Comp) của s1, s2
Bước 3.5. Lần lượt thực hiện bổ sung s1, s2 vào PA nếu có thể
Bước 3.6. Lặp lại bước 3.1 cho đến khi i > MaxGen
Một cá thể con s nếu không bị trội bởi bất kỳ phần tử nào có trong PA thì s được bổ sung
vào PA đồng thời loại bỏ tất cả các phần tử trong PA bị trội bởi s. Sau đó kiểm tra nếu số
cá thể trong PA lớn hơn số lượng tối đa (archiveSize) được phép lưu trữ trong PA thì loại bỏ
ngẫu nhiên một cá thể trong vùng có mật độ cao nhất ra khỏi PA. Xác định vùng có mật độ
cao nhất theo thuật toán trong [4].
234 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG
5. NGHIÊN CỨU MÔ PHỎNG MÁY TÍNH
Bài toán #Pat #Att
Electrical Maintainance (ELE) 1,056 4
(Dự báo bảo trì lưới điện)
Weather Ankara (WA) 1,609 9
(Dự báo nhiệt độ trung bình ở Ankara)
Weather Izmir (WI) 1,461 9
(Dự báo nhiệt độ trung bình ở Izmir)
Auto-MPG (MPG6) 398 5
(Dự báo tiêu thụ nhiên liệu của ô tô )
Stock (STP-Dự báo giá cổ phiếu) 950 9
Treasury (TR) 1,049 15
(Dự báo lãi xuất huy động của ngân hàng)
Bảng 1: Các bài toán sử dụng thử nghiệm
min 0.3 Pcµ 0.75
max 0.7 Pck 0.3
kmax 3 PcRB 0.3
archiveSize 64 Pmµ 0.3
MaxGen 3,000,000 Pmk 0.3
Mmin 5 PmRB 0.1
Mmax 50 PmAdd 0.75
γmax 5 `max 5
δmax 5
Bảng 2: Các tham số thử nghiệm
Chúng tôi tiến hành thử
nghiệm thuật toán HA-(2+2)M-
PAES trên 6 bài toán hồi qui
cho trong Bảng 1, #Pat là số
mẫu, #Att là số thuộc tính.
Phương pháp thử nghiệm Five-
Fold, mỗi dataset được chia
thành 5 phần (đã được chia và
lưu trữ trong [10]), thử nghiệm
mỗi Fold 6 lần (6 × 5 = 30
lần thử). Mỗi lần thử nghiệm
tạo ra một mặt Pareto xấp
xỉ tối ưu, sắp xếp các cá thể
trong mặt Pareto theo thứ tự
tăng dần của giá trị MSE trên
tập huấn luyện. Trên mỗi mặt
Pareto đã được sắp chỉ giữ lại
tối đa 20 hoặc bằng với số
lượng cá thể của mặt Pareto
có số cá thể ít nhất trong 30
mặt Pareto. Thực hiện tính
trung bình giá trị MSE, Comp
trên 30 mặt Pareto. Như vậy
với mỗi bài toán ta thu được
một mặt Pareto xấp xỉ tối ưu
trung bình theo giá trị MSE và
Comp. Các mặt Pareto xấp xỉ
tối ưu trung bình của 6 bài toán được thể hiện trong hình 4. Bên cạnh thể hiện trực quan mặt
xấp xỉ tối ưu Pareto, chúng tôi thực hiện phân tích thống kê theo phương pháp t-test với độ
tin cậy 95% trên giá trị MSETr và MSETs để xác định có sự khác biệt giữa thuât toán của
chúng tôi và các thuật toán trong [8] hay không?.
Chúng tôi áp dụng kiểm tra trên 2 điểm có độ chính xác và độ phức tạp trái ngược nhau
của mặt Pareto: điểm ứng với lời giải cóMSETr nhỏ nhất, Comp lớn nhất (kí hiệu là: FIRST)
và MSETr lớn nhất, Comp nhỏ nhất (ký hiệu là: LAST). Các kết quả thống kê được trình
bầy trong các Bảng 3,4. Các ký hiệu được sử dụng tương tự như trong [8], “*” thể hiện cho
kết quả tốt nhất với chữ in đậm, “+” thể hiện kết quả của dòng tương ứng kém hơn kết quả
tốt nhất, và “=” thể hiện không có sự khác biệt thống kê của dòng tương ứng với kết quả tốt
nhất. Ký hiệu MSETr¸MSETs, σtr, σts, ttr, tts lần lượt là giá trị MSE trung bình, độ lệch
chuẩn, kết quả thống kê trên tập dữ liệu huấn luyện và tập dữ liệu kiểm tra và Comp, #R
lần lượt là trung bình độ phức tạp và trung bình số luật của hệ luật.
Quan sát Hình 4 chúng ta thấy rằng, thuật toán HA-(2+2)M-PAES tạo ra mặt xấp xỉ tối
ưu Pareto trội hơn trên 5 bài toán, trừ bài toán ELE. Hệ luật được sinh ra có độ phức tạp nhỏ
hơn nhiều trên các bài toán STP, TR, MPG6. Mặt Pareto trên tập kiểm tra không khác nhiều
AN EVOLUTIONARY METHOD TO GENERATE MAMDANI RULE-BASED SYSTEMS 235
so với mặt Pareto trên tập huấn luyện trên 5 bài toán trừ bài toán MPG6. Từ đây chúng ta
có thể kết luận rằng thuật toán tạo ra MFRBS có tính ổn định trong quá trình suy diễn.
El
ec
tr
ic
al
M
ai
n
ta
in
an
ce
(E
LE
) 
W
ea
th
er
A
n
ka
ra
(W
A
) 
W
ea
th
er
Iz
m
ir 
(W
I) 
A
u
to
-
M
PG
(M
PG
6) 
St
o
ck
(S
TP
) 
Tr
ea
su
ry
(T
R
) 
0.6
0.8
1
1.2
1.4
1.6
1.8
2
2.2
20 30 40 50 60 70 80 90 100 110
M
S
E
x 104
Complexity
Training
HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
0.6
0.8
1
1.2
1.4
1.6
1.8
2
2.2
20 40 60 80 100 120
M
S
E
x 104
Complexity
Testing HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
0.9
1.1
1.3
1.5
1.7
1.9
2.1
2.3
2.5
20 30 40 50 60 70 80 90 100
M
S
E
Complexity
Training
HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
0.9
1.1
1.3
1.5
1.7
1.9
2.1
2.3
2.5
20 30 40 50 60 70 80 90 100
M
S
E
Complexity
Testing
HA-(2+2)M-PAES
(2+2)M-PAES
(2+2)M-PAES(I)
1.5
2
2.5
3
3.5
4
4.5
40 60 80 100 120 140
M
S
E
Complexity
Training
HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
0.8
1
1.2
1.4
1.6
1.8
2
2.2
10 30 50 70 90
M
S
E
Complexity
Testing HA-(2+2)M-PAES
(2+2)M-PAES(C)
0.7
0.9
1.1
1.3
1.5
1.7
1.9
2.1
10 20 30 40 50 60 70 80 90 100
M
S
E
Complexity
Training
HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
1.5
2
2.5
3
3.5
4
4.5
40 60 80 100 120 140
M
S
E
Complexity
Testing
HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
0.2
0.4
0.6
0.8
1
1.2
70 80 90 100 110 120 130 140 150 160 170 180 190
M
S
E
Complexity
Training HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
0.2
0.4
0.6
0.8
1
1.2
70 80 90 100 110 120 130 140 150 160 170 180 190
M
S
E
Complexity
Testing
HA-(2+2)M-PAES
(2+2)M-PAE(C)
(2+2)M_PAES(I)
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
30 50 70 90 110 130 150
M
S
E
Complexity
Training HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
30 50 70 90 110 130 150
M
S
E
Complexity
Testing
HA-(2+2)M-PAES
(2+2)M-PAES(C)
(2+2)M-PAES(I)
Hình 4: Mặt xấp xỉ tối ưu Pareto trung bình theo độ chính xác MSE và độ phức tạp Comp
236 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG
Bài toán Thuật toán #R Comp MSETr σtr ttr MSETs σts tts
ELE
(2+2)M-PAES(I) 34.480 68.210 13660.200 1851.500 = 15768.600 3239.900 =
(2+2)M-PAES(C) 24.240 96.480 13539.800 3764.700 * 15278.800 4129.000 =
HA-(2+2)M-PAES 34.966 75.414 13732.337 2499.690 = 14969.681 4010.176 *
WA
(2+2)M-PAES(I) 20.200 75.160 1.911 0.381 + 1.997 0.298 +
(2+2)M-PAES(C) 15.270 98.650 1.694 0.489 + 2.094 0.973 +
HA-(2+2)M-PAES 24.100 58.000 1.265 0.175 * 1.383 0.229 *
WI
(2+2)M-PAES(I) 17.830 61.810 1.474 0.343 + 1.647 0.343 +
(2+2)M-PAES(C) 13.120 83.550 1.441 0.276 + 1.556 0.243 +
HA-(2+2)M-PAES 24.167 57.833 0.873 0.102 * 1.034 0.161 *
MPG6
(2+2)M-PAES(I) 40.360 130.280 2.565 0.341 + 4.185 1.352 =
(2+2)M-PAES(C) 48.030 121.660 2.820 0.428 + 4.304 1.365 =
HA-(2+2)M-PAES 47.700 112.033 2.153 0.192 * 4.036 1.117 *
STP
(2+2)M-PAES(I) 48.530 184.000 0.748 0.098 + 0.934 0.175 =
(2+2)M-PAES(C) 49.420 181.730 0.795 0.225 + 1.046 0.309 +
HA-(2+2)M-PAES 49.100 146.700 0.567 0.109 * 0.720 0.192 *
TR
(2+2)M-PAES(I) 25.100 103.920 0.056 0.020 = 0.100 0.097 =
(2+2)M-PAES(C) 19.100 147.000 0.066 0.025 = 0.132 0.132 =
HA-(2+2)M-PAES 29.267 62.267 0.038 0.014 * 0.068 0.094 *
Bảng 3: So sánh kết quả thử nghiệm thuật toán HA-(2+2)M-PAES với các thuật toán trong
[8] tại điểm FIRST
Bảng 3 so sánh kết quả giữa lời giải tốt nhất của thuật toán HA-(2+2)M-PAES và hai
thuật toán (2+2)M-PAES(I) và (2+2)M-PAES(C) trong [8]. Từ bảng này cho thấy giá trị
MSE của thuật toán HA-(2+2)M-PAES tốt hơn trên 5 bài toán trên cả tập huấn luyện và
tập kiểm tra, ngoại trừ bài toán ELE thấp hơn trên tập huấn luyện. Tuy nhiên kết quả phân
tích thống kê cho thấy thuật toán HA-(2+2)M-PAES và thuật toán tốt nhất không cho thấy
sự khác biệt. Ở đây có sự khác biệt lớn về độ chính xác giữa thuật toán của chúng tôi với các
thuật toán được so sánh. Như bài toán WA giá trị MSE của thuật toán của chúng tôi là 1.265
so với (1.911 và 1.694) trên tập dữ liệu huấn luyện và 1.383 so với (1.997 và 2.094) trên tập
kiểm tra. Trên các bài toán WA, WI, STP và TR thuật toán của chúng tôi tạo ra các hệ luật
có độ phức tạp thấp nhưng độ chính xác cao hơn nhiều như bài toán STR giá trị MSE là 0.720
so với (0.934, 1.046) trên tập kiểm tra hoặc bài toán TR giá trị MSE là 0.068 so với (0.100,
0.132). Các hệ luật được tạo ra có chiều dài luật ngắn hơn so với các thuật toán trong [8], với
bài toán WA phương pháp của chúng tôi trung bình chiều dài luật là 2.4 so với (3.72 và 6.46)
hoặc bài toán WI chiều dài trung bình luật là 2.393 so với (3.467 và 6.368),. . . . Từ đây chúng
tôi thấy rằng thuật toán của chúng tôi sinh ra các luật có tính khái quát cao hơn, do đó dễ
hiểu hơn với người dùng.
Từ Bảng 3 cho thấy kết quả phân tích thống kê t-test với độ tin cậy 95% thì thuật toán
chúng tôi đề xuất khác biệt so với các thuật toán trong [8] trên 3 bài toán (WA, WI, STR)
trên tập dữ liệu kiểm tra, các bài toán còn lại không có sự khác biệt nào. Phân tích các kết
quả trong Bảng 4 cũng cho kết quả tương tự như trong Bảng 3.
AN EVOLUTIONARY METHOD TO GENERATE MAMDANI RULE-BASED SYSTEMS 237
Bài toán Thuật toán #R Comp MSETr σtr ttr MSETs σts tts
ELE
(2+2)M-PAES(I) 13.560 29.560 16358.500 2713.600 * 18896.000 3672.500 *
(2+2)M-PAES(C) 20.000 45.100 16595.800 5556.400 = 18977.300 5816.400 =
HA-(2+2)M-PAES 22.448 41.655 19296.504 5920.099 + 21042.461 9578.943 +
WA
(2+2)M-PAES(I) 7.380 19.110 2.142 0.449 + 2.244 0.529 +
(2+2)M-PAES(C) 10.700 32.250 1.877 0.733 = 2.119 0.937 =
HA-(2+2)M-PAES 15.300 28.167 1.686 0.359 * 1.795 0.401 *
WI
(2+2)M-PAES(I) 6.370 12.370 1.670 0.539 + 1.827 0.566 +
(2+2)M-PAES(C) 10.380 36.270 1.577 0.377 + 1.678 0.325 +
HA-(2+2)M-PAES 14.767 28.033 1.080 0.330 * 1.176 0.342 *
MPG6
(2+2)M-PAES(I) 32.600 73.960 2.829 0.350 + 4.109 1.321 =
(2+2)M-PAES(C) 31.160 84.900 2.985 0.457 + 4.327 1.410 =
HA-(2+2)M-PAES 37.267 79.700 2.295 0.204 * 4.114 1.065 *
STP
(2+2)M-PAES( I) 47.530 163.420 0.849 0.164 = 0.958 0.183 =
(2+2)M-PAES( C) 44.460 144.400 0.881 0.225 = 1.102 0.323 +
HA-(2+2)M-PAES 37.900 103.833 0.645 0.195 * 0.763 0.201 *
TR
(2+2)M-PAES(I) 10.850 41.500 0.070 0.025 = 0.123 0.125 =
(2+2)M-PAES(C) 15.650 73.030 0.076 0.027 = 0.148 0.135 =
HA-(2+2)M-PAES 23.500 43.600 0.048 0.031 * 0.063 0.034 *
Bảng 4: So sánh kết quả thử nghiệm thuật toán HA-(2+2)M-PAES với thuật toán trong [8]
tại điểm LAST
6. KẾT LUẬN
Bài báo đề xuất một thuật toán tiến hóa HA-(2+2)M-PAES xây dựng hệ luật mờ Mamdani
dựa trên ngữ nghĩa và phương pháp luận của ĐSGT và lược đồ tiến hóa (2+2)M-PAES trong [6]
giải bài toán hồi qui. Thuật toán cho phép học đồng thời cơ sở luật, phân hoạch và điều chỉnh
các tập mờ với số tham số cố định 2 ∗ (F + 1) thay vì biến thiên theo số tập mờ được sử dụng
trong phân hoạch như trong [8]. Chúng tôi đề xuất phương pháp cá thể dựa trên tính chất
của tập từ ngôn ngữ sinh ra bằng ĐSGT. Phương pháp mã hóa đề xuất làm giảm thời gian
tính giá trị hàm mục tiêu và không gian tìm kiếm so với các thuật toán trong [8]. Thêm vào
đó thuật toán phát triển phương pháp sinh luật từ mẫu dữ liệu dựa trên những thông tin mới
nhất của chính cá thể thay vì sinh luật ngẫu nhiên như trong [8]. Với thuật toán sinh luật như
vậy sẽ tạo ra các luật có tiềm năng đốt cháy dữ liệu cao hơn.
Kết quả thử nghiệm thuật toán HA-(2+2)M-PAES trên sáu bài toán hồi qui cho thấy mặt
Pareto tạo ra trội hơn so với mặt Pareto tạo ra trong [8] trừ bài toán ELE. Trên các điểm
được xem xét của mặt Pareto (FIRST, LAST) độ chính xác của hệ luật được sinh ra từ thuật
toán HA-(2+2)M-PAES tốt hơn trên cả tập huấn luyện và tập kiểm tra. Thuật toán tạo ra
các luật có tính khái quát cao hơn làm tăng tính dễ hiểu của hệ luật. Từ kết quả thử nghiệm,
chúng tôi có thể kết luật rằng ĐSGT giúp cho việc tối ưu tốt hơn nhờ giảm bớt không gian
tìm. Hệ luật được tạo ra dễ hiểu hơn với người dùng do sử dụng các từ ngôn ngữ có ngữ nghĩa
thay vì các nhãn.
TÀI LIỆU THAM KHẢO
[1] Nguyễn Cát Hồ, Hoàng Văn Thông, Nguyễn Văn Long, “Một phương pháp tiến hóa sinh
hệ luật mờ cho bài toán phân lớp với ngữ nghĩa thứ tự ngôn ngữ", Tạp chí Tin học và
238 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG
Điều khiển học, T.28, S.4, tr. 333-345, 2012.
[2] Cat Ho Nguyen, Witold Pedrycz, Thang Long Duong, ThaiSon Tran, “A genetic design
of linguistic terms for fuzzy rule based classifiers", International Journal of Approximate
Reasoning, vol. 54, pp. 1–21, 2012.
[3] Hisao Ishibuchi and Takashi Yamamoto, “Fuzzy rule selection by multi-objective genetic
local search algorithms and rule evaluation measures in data mining", Fuzzy Sets and
Systems vol. 141, pp. 59–88, 2004.
[4] Joshua D. Knowles and David W.corne, “Approximating the Nondominated Front Using
the Pareto Archived Evolution Strategy”, Evolutionary Computation vol. 8, No. 2, pp.
149-172, 2000.
[5] Rafael Alcalá, Jesús Alcalá-Fdeza, Francisco Herrera, and José Otero, “Genetic learning
of accurate and Compact fuzzy rule based systems based on the 2-tuples linguistic repre-
sentation”, International Journal of Approximate Reasoning, vol. 44, pp. 45–64, 2007.
[6] Marco Cococcioni, Pietro Ducange, Beatrice Lazzerini, and Francesco Marcelloni, “A
Pareto-based multi-objective evolutionary approach to the identification of Mamdani
fuzzy systems”, Soft Comput., vol. 11, pp. 1013–1031, 2007.
[7] Michela Antonelli, Pietro Ducange, Beatrice Lazzerini, and Francesco Marcelloni, “Learn-
ing concurrently partition granularities and rule bases of Mamdani fuzzy systems in a
multi-objective evolutionary framework”, International Journal of Approximate Reason-
ing, vol. 50, pp.1066–1080, 2009.
[8] Michela Antonelli, Pietro Ducange, Beatrice Lazzerini, and Francesco Marcelloni, “Learn-
ing concurrently data and rule bases of Mamdani fuzzy rule-based systems by exploiting
a novel interpretability index”, Soft Comput., vol. 15, pp. 1981–1998, 2011.
[9] E. H. Mamdani and S. Assilian, “An experiment in linguistic synthesis with a fuzzy logic
controller”, Int. J. Man-Mach. Stud. vol. 7, pp. 1–13, 1975.
[10] KEEL-dataset repository 
[11] Pietari Pulkkinen and Hannu Koivisto, “A Dynamically constrained multiobjective genetic
fuzzy system for regression problems”, IEEE Transactions on Fuzzy Systems, vol. 8, no.
1, pp. 161-177, 2010.
Ngày nhận bài 26 – 9 – 2013
Nhận lại sau sửa 26 – 7 – 2014

File đính kèm:

  • pdfmot_phuong_phap_sinh_he_luat_mo_mamdani_cho_bai_toan_hoi_quy.pdf