Một phương pháp sinh hệ luật mờ Mamdani cho bài toán hồi quy với ngữ nghĩa đại số gia tử
Tóm tắt Một phương pháp sinh hệ luật mờ Mamdani cho bài toán hồi quy với ngữ nghĩa đại số gia tử: ...h 1: Một thiết kế phân hoạch tập mờ dạng tam giác với tham số k = 2, µL = 0.4020657, µc− = 0.6768686 4. THUẬT TOÁN TIẾN HÓA DỰA TRÊN ĐSGT Hình 2: Phân hoạch với 2 tập mờ và 5 tập mờ Khi thiết kế các thuật toán tiến hóa, mã hóa cá thể là công việc quan trọng. Dựa trên cấu trúc mã hóa chúng ta t...X(kF+1), đặt phần tử thứ f của luật R bằng w. Nếu luật sau khi đột biến có độ dài lớn hơn `max (chiều dài tối đa của luật do người dùng chọn trước) thì đột biến sẽ bị bỏ qua. Sau khi đột biến hệ luật có thể có các luật có độ dài bằng 0 và các luật trùng nhau. Thực hiện loại bỏ các luật này, với l... 110 M S E x 104 Complexity Training HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 20 40 60 80 100 120 M S E x 104 Complexity Testing HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.9 1.1 1.3 1.5 1.7 1.9 2.1 2.3 2.5 20 30 40 50 60 70...
các tham số mờ của ĐSGT bao gồm F + 1 véc tơ, mỗi véc tơ gồm 2 phần tử thực mã hóa tham số mờ của ĐSGT µLf và µC − f (ở đây chúng tôi sử dụng ĐSGT có 2 gia tử). Ck là một véc tơ F + 1 chiều, phần tử thứ f là một số tự nhiên kf xác định độ dài tối đa các hạng từ sử dụng để phân hoạch thuộc tính thứ f . CRB mã hóa cơ sở luật gồm Mp luật (Mp có thể khác nhau giữa các cá thể), với mỗi luật là một véc tơ có F + 1 phần tử, mỗi phần tử gồm một từ ngôn ngữ và tập mờ tương ứng trong X(kf ). Như vậy CRB gồm Mp ∗ (F + 1) phần tử. Hình 3: Cấu trúc mã hóa một cá thể Chúng ta giới hạn số luật trong mỗi cơ sở luật nằm trong khoảng [Mmin,Mmax] nhằm đảm bảo hệ luật sinh ra đạt được sự cân bằng giữa tính dễ hiểu và độ chính xác đồng thời giới hạn không gian tìm kiếm các hệ luật. Hàm mục tiêu của mỗi cá thể gồm hai thành phần (MSE,Comp), trong đó MSE được xác định theo (2) và Comp là tổng độ dài của các luật 232 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG trong cơ sở luật. 4.2. Các toán tử di truyền 4.2.1. Toán tử lai ghép Với hai cá thể bố mẹ p1, p2 sử dụng phương pháp lai ghép một điểm (one-point crossover) độc lập trên Cµ, Ck và CRB. Thực hiện lai ghép trên Cµ với xác suất Pcµ, điểm lai ghép được chọn ngẫu nhiên trong đoạn [1, (F + 1) ∗ 2− 1]. Ck được lai ghép với xác suất Pck, điểm lại ghép được chọn ngẫu nhiên trong đoạn [1, F + 1]. CRB được lai ghép với xác suất PcRB, điểm lai ghép được chọn ngẫu nhiên trong đoạn [1, ρmin − 1], trong đó ρmin là số luật ít nhất của 2 cơ sở luật trong p1 và p2. Chú ý nếu trên CRB toán tử lai ghép không được thực hiện thì toán tử đột biến trên CRB luôn xảy ra. Sau khi lai ghép có thể tạo ra các luật trùng nhau, thực hiện loại bỏ các luật trùng nhau chỉ giữ lại một luật. 4.2.2. Toán tử đột biến Với cá thể con s thực hiện đột biến độc lập trên Cµ, Ck và CRB. Thực hiện đột biến trên Cµ với xác suất Pmµ, chọn ngẫu nhiên một gen thứ f ∈ [1, (F + 1) ∗ 2 − 1], thay đổi giá trị tại f của Cµ bằng một giá trị ngẫu nhiên trong đoạn [min,max] ⊂ [0, 1] do người dùng xác định trước. Trên Ck thực hiện đột biến với xác suất Pmk, chọn ngẫu nhiên một gen thứ f ∈ [1, (F + 1)], thay đổi giá trị của gen này bằng cách ngẫu nhiên tăng hoặc giảm một đơn vị. Nếu giá trị mới nằm ngoài đoạn [1, kmax] thì đột biến sẽ bị bỏ qua. Trên CRB thực hiện đột biến với xác suất PmRB, nếu đột biến xảy ra thì chọn thực hiện một trong hai toán tử đột biến dưới đây. Toán tử đột biến thứ nhất xảy ra với xác suất PmAdd, nếu không toán tử đột biến thứ hai được áp dụng. - Toán tử đột biến thứ nhất: thêm γ luật vào CRB (các luật được sinh ra theo thuật toán trong mục 3.2.3), với γ được chọn ngẫu nhiên trong đoạn [1, γmax], nếu γ +M > Mmax thì γ = Mmax −M . - Toán tử đột biến thứ hai: thay đổi ngẫu nhiên δ giá trị của CRB, với δ được chọn ngẫu nhiên trong đoạn [1, δmax]. Chọn ngẫu nhiên một luật R, tiếp theo chọn ngẫu nhiên một phần tử, giả sử là f . Nếu f ≤ F thì chọn ngẫu nhiên một từ ngôn ngữ w trong {Don′tcare} ∪ X(kf ), nếu f = F + 1 thì chọn ngẫu nhiên một từ ngôn ngữ w trong X(kF+1), đặt phần tử thứ f của luật R bằng w. Nếu luật sau khi đột biến có độ dài lớn hơn `max (chiều dài tối đa của luật do người dùng chọn trước) thì đột biến sẽ bị bỏ qua. Sau khi đột biến hệ luật có thể có các luật có độ dài bằng 0 và các luật trùng nhau. Thực hiện loại bỏ các luật này, với luật trùng nhau thì giữ lại một luật. 4.2.3. Thuật toán sinh luật ngẫu nhiên từ dữ liệu Chọn ngẫu nhiên một mẫu dữ liệu (xi, yi) trong tập dữ liệu huấn luyện. Thực hiện sinh một luật R có độ dài ` dựa trên các hệ khoảng mờ tương tự S(kf ) được xác định từ bộ tham số mờ của ĐSGT trong Cµ và Ck trong cùng cá thể như sau: AN EVOLUTIONARY METHOD TO GENERATE MAMDANI RULE-BASED SYSTEMS 233 Bước 1: Xác định các tập từ ngôn ngữ X(kf) và các hệ khoảng mờ tương tự S(kf ) của các thuộc tính tương ứng với các bộ tham số mờ của ĐSGT trong Cµ và chiều dài tối đa của từ trong Ck. Bước 2: Sinh luật Ri có chiều dài F , với mẫu dữ liệu xi = (xi1, xi2, . . . , xiF , yi) ∈ D, thực hiện: • Xác định tập các điều kiện tiền đề Ai của luật được sinh bởi mẫu dữ liệu (xi, yi) Ai = {(A1,ji , A2,ji , . . . , AF,ji)|Af,ji ∈ X(kf ), xif ∈ T (Af,ji), f = 1, 2, . . . , F, ji ∈ [1, |X(kf )|]} • Sinh luật gồm vế trái là Ai và kết luận là AF+1,ji tương ứng với mẫu dữ liệu (xi, yi) Ri = (Ai ∈ AF+1,ji) với AF+1,ji ∈ X(kF+1), yi ∈ T (AF+1,ji), ji ∈ [1, |X(kF+1)|] Trong đó T (Af,ji) là khoảng mờ tương tự của hạng từ Af,ji trong S(kf ). Bước 3: Sinh luật R có chiều dài ` từ luật Ri. Chọn ngẫu nhiên ` ∈ [1, `max], thực hiện sinh ngẫu nhiên ` giá trị nguyên f1, . . . , fl khác nhau trong đoạn [1, F ], thay đổi các điều kiện tiền đề có thứ tự khác với f1, . . . , fl của luật Ri thành Don’tcare khi đó chúng ta được luật R có chiều dài `. 4.2.4. Thuật toán tiến hóa HA-(2+2)M-PAES Trong phần này trình bầy những bước cơ bản của thuật toán HA-(2+2)M-PAES được phát triển dựa trên lược đồ tiên hóa (2+2)M-PAES đề xuất trong [6]. Mục tiêu của thuật toán là xây dựng một mặt xấp xỉ tối ưu Pareto với mỗi điểm là một cá thể với 2 mục tiêu MSE và Comp. Kí hiệu PA là mặt xấp xỉ tối ưu Pareto của thế hệ hiện tại. Thuật toán gồm các bước sau: Bước 1: Sinh ngẫu nhiên 2 cá thể o1, o2. Các gen trong Cµ là các số thực được sinh ngẫu nhiên trong đoạn [min,max]. Các gen trong Ck là các số tự nhiên được sinh ngẫu nhiên trong đoạn [1, kmax]. Các gen trong CRB gồm M luật được sinh theo thuật toán trong mục 3.2.3 với M được chọn ngẫu nhiên trong đoạn [Mmin,Mmax]. Bước 2: Bổ sung o1, o2 vào PA Bước 3: Lặp i = 1, . . ., MaxGen (số thế hệ tối đa) Bước 3.1. Chọn ngẫu nhiên hai cá thể cha mẹ p1, p2 trong PA (p1, p2 có thể trùng nhau) Bước 3.2. Thực hiện lai ghép hai cá thể cha mẹ p1, p2 để sinh ra hai cá thể con s1, s2 Bước 3.3. Thực hiện đột biến lần lượt trên s1, s2 Bước 3.4. Tính giá trị mục tiêu (MSE, Comp) của s1, s2 Bước 3.5. Lần lượt thực hiện bổ sung s1, s2 vào PA nếu có thể Bước 3.6. Lặp lại bước 3.1 cho đến khi i > MaxGen Một cá thể con s nếu không bị trội bởi bất kỳ phần tử nào có trong PA thì s được bổ sung vào PA đồng thời loại bỏ tất cả các phần tử trong PA bị trội bởi s. Sau đó kiểm tra nếu số cá thể trong PA lớn hơn số lượng tối đa (archiveSize) được phép lưu trữ trong PA thì loại bỏ ngẫu nhiên một cá thể trong vùng có mật độ cao nhất ra khỏi PA. Xác định vùng có mật độ cao nhất theo thuật toán trong [4]. 234 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG 5. NGHIÊN CỨU MÔ PHỎNG MÁY TÍNH Bài toán #Pat #Att Electrical Maintainance (ELE) 1,056 4 (Dự báo bảo trì lưới điện) Weather Ankara (WA) 1,609 9 (Dự báo nhiệt độ trung bình ở Ankara) Weather Izmir (WI) 1,461 9 (Dự báo nhiệt độ trung bình ở Izmir) Auto-MPG (MPG6) 398 5 (Dự báo tiêu thụ nhiên liệu của ô tô ) Stock (STP-Dự báo giá cổ phiếu) 950 9 Treasury (TR) 1,049 15 (Dự báo lãi xuất huy động của ngân hàng) Bảng 1: Các bài toán sử dụng thử nghiệm min 0.3 Pcµ 0.75 max 0.7 Pck 0.3 kmax 3 PcRB 0.3 archiveSize 64 Pmµ 0.3 MaxGen 3,000,000 Pmk 0.3 Mmin 5 PmRB 0.1 Mmax 50 PmAdd 0.75 γmax 5 `max 5 δmax 5 Bảng 2: Các tham số thử nghiệm Chúng tôi tiến hành thử nghiệm thuật toán HA-(2+2)M- PAES trên 6 bài toán hồi qui cho trong Bảng 1, #Pat là số mẫu, #Att là số thuộc tính. Phương pháp thử nghiệm Five- Fold, mỗi dataset được chia thành 5 phần (đã được chia và lưu trữ trong [10]), thử nghiệm mỗi Fold 6 lần (6 × 5 = 30 lần thử). Mỗi lần thử nghiệm tạo ra một mặt Pareto xấp xỉ tối ưu, sắp xếp các cá thể trong mặt Pareto theo thứ tự tăng dần của giá trị MSE trên tập huấn luyện. Trên mỗi mặt Pareto đã được sắp chỉ giữ lại tối đa 20 hoặc bằng với số lượng cá thể của mặt Pareto có số cá thể ít nhất trong 30 mặt Pareto. Thực hiện tính trung bình giá trị MSE, Comp trên 30 mặt Pareto. Như vậy với mỗi bài toán ta thu được một mặt Pareto xấp xỉ tối ưu trung bình theo giá trị MSE và Comp. Các mặt Pareto xấp xỉ tối ưu trung bình của 6 bài toán được thể hiện trong hình 4. Bên cạnh thể hiện trực quan mặt xấp xỉ tối ưu Pareto, chúng tôi thực hiện phân tích thống kê theo phương pháp t-test với độ tin cậy 95% trên giá trị MSETr và MSETs để xác định có sự khác biệt giữa thuât toán của chúng tôi và các thuật toán trong [8] hay không?. Chúng tôi áp dụng kiểm tra trên 2 điểm có độ chính xác và độ phức tạp trái ngược nhau của mặt Pareto: điểm ứng với lời giải cóMSETr nhỏ nhất, Comp lớn nhất (kí hiệu là: FIRST) và MSETr lớn nhất, Comp nhỏ nhất (ký hiệu là: LAST). Các kết quả thống kê được trình bầy trong các Bảng 3,4. Các ký hiệu được sử dụng tương tự như trong [8], “*” thể hiện cho kết quả tốt nhất với chữ in đậm, “+” thể hiện kết quả của dòng tương ứng kém hơn kết quả tốt nhất, và “=” thể hiện không có sự khác biệt thống kê của dòng tương ứng với kết quả tốt nhất. Ký hiệu MSETr¸MSETs, σtr, σts, ttr, tts lần lượt là giá trị MSE trung bình, độ lệch chuẩn, kết quả thống kê trên tập dữ liệu huấn luyện và tập dữ liệu kiểm tra và Comp, #R lần lượt là trung bình độ phức tạp và trung bình số luật của hệ luật. Quan sát Hình 4 chúng ta thấy rằng, thuật toán HA-(2+2)M-PAES tạo ra mặt xấp xỉ tối ưu Pareto trội hơn trên 5 bài toán, trừ bài toán ELE. Hệ luật được sinh ra có độ phức tạp nhỏ hơn nhiều trên các bài toán STP, TR, MPG6. Mặt Pareto trên tập kiểm tra không khác nhiều AN EVOLUTIONARY METHOD TO GENERATE MAMDANI RULE-BASED SYSTEMS 235 so với mặt Pareto trên tập huấn luyện trên 5 bài toán trừ bài toán MPG6. Từ đây chúng ta có thể kết luận rằng thuật toán tạo ra MFRBS có tính ổn định trong quá trình suy diễn. El ec tr ic al M ai n ta in an ce (E LE ) W ea th er A n ka ra (W A ) W ea th er Iz m ir (W I) A u to - M PG (M PG 6) St o ck (S TP ) Tr ea su ry (T R ) 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 20 30 40 50 60 70 80 90 100 110 M S E x 104 Complexity Training HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 20 40 60 80 100 120 M S E x 104 Complexity Testing HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.9 1.1 1.3 1.5 1.7 1.9 2.1 2.3 2.5 20 30 40 50 60 70 80 90 100 M S E Complexity Training HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.9 1.1 1.3 1.5 1.7 1.9 2.1 2.3 2.5 20 30 40 50 60 70 80 90 100 M S E Complexity Testing HA-(2+2)M-PAES (2+2)M-PAES (2+2)M-PAES(I) 1.5 2 2.5 3 3.5 4 4.5 40 60 80 100 120 140 M S E Complexity Training HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.8 1 1.2 1.4 1.6 1.8 2 2.2 10 30 50 70 90 M S E Complexity Testing HA-(2+2)M-PAES (2+2)M-PAES(C) 0.7 0.9 1.1 1.3 1.5 1.7 1.9 2.1 10 20 30 40 50 60 70 80 90 100 M S E Complexity Training HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 1.5 2 2.5 3 3.5 4 4.5 40 60 80 100 120 140 M S E Complexity Testing HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.2 0.4 0.6 0.8 1 1.2 70 80 90 100 110 120 130 140 150 160 170 180 190 M S E Complexity Training HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0.2 0.4 0.6 0.8 1 1.2 70 80 90 100 110 120 130 140 150 160 170 180 190 M S E Complexity Testing HA-(2+2)M-PAES (2+2)M-PAE(C) (2+2)M_PAES(I) 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 30 50 70 90 110 130 150 M S E Complexity Training HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 30 50 70 90 110 130 150 M S E Complexity Testing HA-(2+2)M-PAES (2+2)M-PAES(C) (2+2)M-PAES(I) Hình 4: Mặt xấp xỉ tối ưu Pareto trung bình theo độ chính xác MSE và độ phức tạp Comp 236 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG Bài toán Thuật toán #R Comp MSETr σtr ttr MSETs σts tts ELE (2+2)M-PAES(I) 34.480 68.210 13660.200 1851.500 = 15768.600 3239.900 = (2+2)M-PAES(C) 24.240 96.480 13539.800 3764.700 * 15278.800 4129.000 = HA-(2+2)M-PAES 34.966 75.414 13732.337 2499.690 = 14969.681 4010.176 * WA (2+2)M-PAES(I) 20.200 75.160 1.911 0.381 + 1.997 0.298 + (2+2)M-PAES(C) 15.270 98.650 1.694 0.489 + 2.094 0.973 + HA-(2+2)M-PAES 24.100 58.000 1.265 0.175 * 1.383 0.229 * WI (2+2)M-PAES(I) 17.830 61.810 1.474 0.343 + 1.647 0.343 + (2+2)M-PAES(C) 13.120 83.550 1.441 0.276 + 1.556 0.243 + HA-(2+2)M-PAES 24.167 57.833 0.873 0.102 * 1.034 0.161 * MPG6 (2+2)M-PAES(I) 40.360 130.280 2.565 0.341 + 4.185 1.352 = (2+2)M-PAES(C) 48.030 121.660 2.820 0.428 + 4.304 1.365 = HA-(2+2)M-PAES 47.700 112.033 2.153 0.192 * 4.036 1.117 * STP (2+2)M-PAES(I) 48.530 184.000 0.748 0.098 + 0.934 0.175 = (2+2)M-PAES(C) 49.420 181.730 0.795 0.225 + 1.046 0.309 + HA-(2+2)M-PAES 49.100 146.700 0.567 0.109 * 0.720 0.192 * TR (2+2)M-PAES(I) 25.100 103.920 0.056 0.020 = 0.100 0.097 = (2+2)M-PAES(C) 19.100 147.000 0.066 0.025 = 0.132 0.132 = HA-(2+2)M-PAES 29.267 62.267 0.038 0.014 * 0.068 0.094 * Bảng 3: So sánh kết quả thử nghiệm thuật toán HA-(2+2)M-PAES với các thuật toán trong [8] tại điểm FIRST Bảng 3 so sánh kết quả giữa lời giải tốt nhất của thuật toán HA-(2+2)M-PAES và hai thuật toán (2+2)M-PAES(I) và (2+2)M-PAES(C) trong [8]. Từ bảng này cho thấy giá trị MSE của thuật toán HA-(2+2)M-PAES tốt hơn trên 5 bài toán trên cả tập huấn luyện và tập kiểm tra, ngoại trừ bài toán ELE thấp hơn trên tập huấn luyện. Tuy nhiên kết quả phân tích thống kê cho thấy thuật toán HA-(2+2)M-PAES và thuật toán tốt nhất không cho thấy sự khác biệt. Ở đây có sự khác biệt lớn về độ chính xác giữa thuật toán của chúng tôi với các thuật toán được so sánh. Như bài toán WA giá trị MSE của thuật toán của chúng tôi là 1.265 so với (1.911 và 1.694) trên tập dữ liệu huấn luyện và 1.383 so với (1.997 và 2.094) trên tập kiểm tra. Trên các bài toán WA, WI, STP và TR thuật toán của chúng tôi tạo ra các hệ luật có độ phức tạp thấp nhưng độ chính xác cao hơn nhiều như bài toán STR giá trị MSE là 0.720 so với (0.934, 1.046) trên tập kiểm tra hoặc bài toán TR giá trị MSE là 0.068 so với (0.100, 0.132). Các hệ luật được tạo ra có chiều dài luật ngắn hơn so với các thuật toán trong [8], với bài toán WA phương pháp của chúng tôi trung bình chiều dài luật là 2.4 so với (3.72 và 6.46) hoặc bài toán WI chiều dài trung bình luật là 2.393 so với (3.467 và 6.368),. . . . Từ đây chúng tôi thấy rằng thuật toán của chúng tôi sinh ra các luật có tính khái quát cao hơn, do đó dễ hiểu hơn với người dùng. Từ Bảng 3 cho thấy kết quả phân tích thống kê t-test với độ tin cậy 95% thì thuật toán chúng tôi đề xuất khác biệt so với các thuật toán trong [8] trên 3 bài toán (WA, WI, STR) trên tập dữ liệu kiểm tra, các bài toán còn lại không có sự khác biệt nào. Phân tích các kết quả trong Bảng 4 cũng cho kết quả tương tự như trong Bảng 3. AN EVOLUTIONARY METHOD TO GENERATE MAMDANI RULE-BASED SYSTEMS 237 Bài toán Thuật toán #R Comp MSETr σtr ttr MSETs σts tts ELE (2+2)M-PAES(I) 13.560 29.560 16358.500 2713.600 * 18896.000 3672.500 * (2+2)M-PAES(C) 20.000 45.100 16595.800 5556.400 = 18977.300 5816.400 = HA-(2+2)M-PAES 22.448 41.655 19296.504 5920.099 + 21042.461 9578.943 + WA (2+2)M-PAES(I) 7.380 19.110 2.142 0.449 + 2.244 0.529 + (2+2)M-PAES(C) 10.700 32.250 1.877 0.733 = 2.119 0.937 = HA-(2+2)M-PAES 15.300 28.167 1.686 0.359 * 1.795 0.401 * WI (2+2)M-PAES(I) 6.370 12.370 1.670 0.539 + 1.827 0.566 + (2+2)M-PAES(C) 10.380 36.270 1.577 0.377 + 1.678 0.325 + HA-(2+2)M-PAES 14.767 28.033 1.080 0.330 * 1.176 0.342 * MPG6 (2+2)M-PAES(I) 32.600 73.960 2.829 0.350 + 4.109 1.321 = (2+2)M-PAES(C) 31.160 84.900 2.985 0.457 + 4.327 1.410 = HA-(2+2)M-PAES 37.267 79.700 2.295 0.204 * 4.114 1.065 * STP (2+2)M-PAES( I) 47.530 163.420 0.849 0.164 = 0.958 0.183 = (2+2)M-PAES( C) 44.460 144.400 0.881 0.225 = 1.102 0.323 + HA-(2+2)M-PAES 37.900 103.833 0.645 0.195 * 0.763 0.201 * TR (2+2)M-PAES(I) 10.850 41.500 0.070 0.025 = 0.123 0.125 = (2+2)M-PAES(C) 15.650 73.030 0.076 0.027 = 0.148 0.135 = HA-(2+2)M-PAES 23.500 43.600 0.048 0.031 * 0.063 0.034 * Bảng 4: So sánh kết quả thử nghiệm thuật toán HA-(2+2)M-PAES với thuật toán trong [8] tại điểm LAST 6. KẾT LUẬN Bài báo đề xuất một thuật toán tiến hóa HA-(2+2)M-PAES xây dựng hệ luật mờ Mamdani dựa trên ngữ nghĩa và phương pháp luận của ĐSGT và lược đồ tiến hóa (2+2)M-PAES trong [6] giải bài toán hồi qui. Thuật toán cho phép học đồng thời cơ sở luật, phân hoạch và điều chỉnh các tập mờ với số tham số cố định 2 ∗ (F + 1) thay vì biến thiên theo số tập mờ được sử dụng trong phân hoạch như trong [8]. Chúng tôi đề xuất phương pháp cá thể dựa trên tính chất của tập từ ngôn ngữ sinh ra bằng ĐSGT. Phương pháp mã hóa đề xuất làm giảm thời gian tính giá trị hàm mục tiêu và không gian tìm kiếm so với các thuật toán trong [8]. Thêm vào đó thuật toán phát triển phương pháp sinh luật từ mẫu dữ liệu dựa trên những thông tin mới nhất của chính cá thể thay vì sinh luật ngẫu nhiên như trong [8]. Với thuật toán sinh luật như vậy sẽ tạo ra các luật có tiềm năng đốt cháy dữ liệu cao hơn. Kết quả thử nghiệm thuật toán HA-(2+2)M-PAES trên sáu bài toán hồi qui cho thấy mặt Pareto tạo ra trội hơn so với mặt Pareto tạo ra trong [8] trừ bài toán ELE. Trên các điểm được xem xét của mặt Pareto (FIRST, LAST) độ chính xác của hệ luật được sinh ra từ thuật toán HA-(2+2)M-PAES tốt hơn trên cả tập huấn luyện và tập kiểm tra. Thuật toán tạo ra các luật có tính khái quát cao hơn làm tăng tính dễ hiểu của hệ luật. Từ kết quả thử nghiệm, chúng tôi có thể kết luật rằng ĐSGT giúp cho việc tối ưu tốt hơn nhờ giảm bớt không gian tìm. Hệ luật được tạo ra dễ hiểu hơn với người dùng do sử dụng các từ ngôn ngữ có ngữ nghĩa thay vì các nhãn. TÀI LIỆU THAM KHẢO [1] Nguyễn Cát Hồ, Hoàng Văn Thông, Nguyễn Văn Long, “Một phương pháp tiến hóa sinh hệ luật mờ cho bài toán phân lớp với ngữ nghĩa thứ tự ngôn ngữ", Tạp chí Tin học và 238 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG Điều khiển học, T.28, S.4, tr. 333-345, 2012. [2] Cat Ho Nguyen, Witold Pedrycz, Thang Long Duong, ThaiSon Tran, “A genetic design of linguistic terms for fuzzy rule based classifiers", International Journal of Approximate Reasoning, vol. 54, pp. 1–21, 2012. [3] Hisao Ishibuchi and Takashi Yamamoto, “Fuzzy rule selection by multi-objective genetic local search algorithms and rule evaluation measures in data mining", Fuzzy Sets and Systems vol. 141, pp. 59–88, 2004. [4] Joshua D. Knowles and David W.corne, “Approximating the Nondominated Front Using the Pareto Archived Evolution Strategy”, Evolutionary Computation vol. 8, No. 2, pp. 149-172, 2000. [5] Rafael Alcalá, Jesús Alcalá-Fdeza, Francisco Herrera, and José Otero, “Genetic learning of accurate and Compact fuzzy rule based systems based on the 2-tuples linguistic repre- sentation”, International Journal of Approximate Reasoning, vol. 44, pp. 45–64, 2007. [6] Marco Cococcioni, Pietro Ducange, Beatrice Lazzerini, and Francesco Marcelloni, “A Pareto-based multi-objective evolutionary approach to the identification of Mamdani fuzzy systems”, Soft Comput., vol. 11, pp. 1013–1031, 2007. [7] Michela Antonelli, Pietro Ducange, Beatrice Lazzerini, and Francesco Marcelloni, “Learn- ing concurrently partition granularities and rule bases of Mamdani fuzzy systems in a multi-objective evolutionary framework”, International Journal of Approximate Reason- ing, vol. 50, pp.1066–1080, 2009. [8] Michela Antonelli, Pietro Ducange, Beatrice Lazzerini, and Francesco Marcelloni, “Learn- ing concurrently data and rule bases of Mamdani fuzzy rule-based systems by exploiting a novel interpretability index”, Soft Comput., vol. 15, pp. 1981–1998, 2011. [9] E. H. Mamdani and S. Assilian, “An experiment in linguistic synthesis with a fuzzy logic controller”, Int. J. Man-Mach. Stud. vol. 7, pp. 1–13, 1975. [10] KEEL-dataset repository [11] Pietari Pulkkinen and Hannu Koivisto, “A Dynamically constrained multiobjective genetic fuzzy system for regression problems”, IEEE Transactions on Fuzzy Systems, vol. 8, no. 1, pp. 161-177, 2010. Ngày nhận bài 26 – 9 – 2013 Nhận lại sau sửa 26 – 7 – 2014
File đính kèm:
- mot_phuong_phap_sinh_he_luat_mo_mamdani_cho_bai_toan_hoi_quy.pdf