Một phương pháp tiến hóa sinh hệ luật mờ cho bài toán phân lớp với ngữ nghĩa thứ tự ngôn ngữ - Mot phuong phap tien hoa sinh he luat mo cho bai toan phan lop voi ngu nghia thu tu ngon ngu

Tóm tắt Một phương pháp tiến hóa sinh hệ luật mờ cho bài toán phân lớp với ngữ nghĩa thứ tự ngôn ngữ: ...ân lớp theo luật có độ đốt cháy cao nhất Rw. Nó được phát biểu như sau: µw(dp) = max{µAj (dp), j = 1, 2, ..., N} (2.4) trong đó µAj (dp) là mức độ đốt cháy luật Rj của mẫu dữ liệu dp được xác định theo (2.2). 3. CÁC TIÊU CHUẨN ĐÁNH GIÁ LUẬT Các thuật toán xây dựng hệ mờ phân lớp, thường sử dụng ... trợ R′ ứng với lớp Cj endif R′ ←− R′ ∪R′(Cj); endif R←− R ∪R(Cj); endfor g ←− g + 1; if g ≤ n then < ←− REPRODUCE(R,R′, P,M, n,X, f); //thực hiện thuật toán tạo sinh until (g > n) or (< trùng R); return R; End Thuật toán tạo sinh REPRODUCE(R,R′, D,M, n,X, f), thực hiện tạo sinh...tối đa Rmax cho trước khi đó mỗi cá thể của quần thể có Rmax biến mục tiêu là r1, ..., rRmax. Giá trị của các biến mục tiêu được giới hạn trong khoảng [0,1]. Khi đó luật có chỉ số [ri × |R|] với i = 1..Rmax trong hệ luật R sẽ được chọn vào hệ luật tối ưu, trong đó |R| là số luật của hệ luật R. Ở ...
13 trang | Chia sẻ: havih72 | Lượt xem: 575 | Lượt tải: 0Free
Nội dung tài liệu Một phương pháp tiến hóa sinh hệ luật mờ cho bài toán phân lớp với ngữ nghĩa thứ tự ngôn ngữ, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
toán khác nhau là khác nhau.
Vì vậy, tham số ngưỡng để quyết định một mẫu dữ liệu thuộc về không gian quyết định của
luật nào đó phải phụ thuộc vào từng bài toán. Chúng tôi đề xuất tiêu chuẩn đánh giá luật
(3.4) dựa trên (3.3) với tham số ngưỡng là một hàm phụ thuộc tham số α, trong đó α ∈ (0, 1)
và được xác định tùy theo từng bài toán, hay tập mẫu, bằng giải thuật di truyền.
f ′F (Aj ⇒ Cj) = fF (Aj ⇒ Cj) + γj(1− αlj ), (3.4)
Trong (3.4), γj là số mẫu dữ liệu có độ đốt cháy luật Rj lớn hơn α
lj . Ta thực hiện xác
định tham số α tối ưu cho từng bài toán được tiến hành đồng thời với quá trình xác định các
tham số mờ của ĐSGT đối với bài toán đó.
4. THUẬT TOÁN TOÁN TIẾN HÓA SINH HỆ LUẬT OPHA-SGERD
Trong phần này sẽ mô tả thuật toán OPHA-SGERD để sinh hệ luật. Với mỗi thuộc tính
thứ j của bài toán ta sử dụng một tập X(kj) ∪ {Don′tcare} các từ ngôn ngữ để sinh ra điều
kiện tiền đề thứ j của luật, trong đó Don′tcare là tập mờ có µDon′tcare(x) = 1.
Thuật toán được thiết kế dựa trên ý tưởng của thuật toán tiến hóa trong [17]. Mỗi cá
thể trong quần thể là một luật mờ Rr có n biến điều kiện tiền đề và lớp kết luận trong
C,Rr : Ar → Cr, trong đó Ar = (Ar[1], ..., Ar[n]), Ar[j] là biến điều kiện tiền đề thứ j của
luật và nhận giá trị trong tập X(kj) ∪ {Don′tcare}. Gọi các biến điều kiện tiền đề có giá trị
Don′tcare là các biến không hoạt động, các biến điều kiện tiền đề có giá trị thuộc X(kj) là
các biến hoạt động. Tại mỗi thế hệ, từ tập luật ứng cử chọn ra Q luật có độ đo thích nghi
cao nhất trên mỗi lớp làm quần thể hiện tại. Từ quần thể hiện tại tạo sinh ra các luật con có
chiều dài lớn hơn cha mẹ của chúng một đơn vị. Những luật con có độ đo thích nghi cao hơn
cha mẹ của chúng cùng với các luật cha mẹ được giữ lại làm tập luật ứng cử cho thế hệ kế
tiếp. Quần thể khởi tạo là tập các luật có độ dài 1 được sinh ra từ tổ hợp tất cả các khả năng
của các giá trị ngôn ngữ X(kj).
Môt số ký hiệu: R là tập luật ứng cử cho quần thể kế tiếp trong quá trình tiến hóa; R là tập
các luật của quần thể hiện tại,R′ là tập luật bổ trợ cho quá trình tạo sinh;R(Cj),<(Cj), R′(Cj)
338 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG
là các tập luật có cùng lớp kết luận Cj ; |R(Cj)|, |<(Cj)| lần lượt là số luật của tập luật R(Cj)
và <(Cj); Rr.fitness và Rr.Class là độ đo thích nghi và lớp kết luận của luật Rr.
Hàm SORT(<(Cj)) thực hiện sắp xếp các luật trong tập luật <(Cj) theo độ đo thích nghi
của luật giảm dần.
Algorithm OPHA-SGERD (D,M,n,Q,X, f)
Input
- Tập mẫu dữ liệu D = {(dp, Cp) : p = 1..m}, số lớp kết luận M , số thuộc tính n
- Số luật Q được chọn ứng với mỗi lớp, tập các tập từ ngôn ngữ X = {X(kj) : j = 1..n}
- Hàm độ đo thích nghi f của luật (chọn trước 1 trong 4 hàm (3.1), (3.2), (3.3) hoặc (3.4))
Output
- Tập luật mờ R có tối đa M ×Q luật
Method Phương pháp tiến hóa sinh hệ luật
Begin
Khởi tạo < bằng tập luật rỗng;
for j ← 1 to n do
for each x in X(kj) do
Sinh luật Rr có Ar[i] = Don′tcare với i = 1..n, i 6= j và Ar[j] = x;
Rr.Class←− argmax{conf(Ar =⇒ Ch)|} ; //xác định lớp kết luận
Rr.fitness←− f(Rr); //tính độ đo thích nghi của luật Rr
< ←− < ∪ {Rr};
endfor
endfor
g ←− 1;
Khởi tạo R′ bằng tập luật rỗng; //R′ là tập bổ trợ sử dụng trong quá trình tạo sinh
repeat
for j ←− 1 to M do
Khởi tạo <(Cj) bằng tập luật rỗng;//<(Cj) để lưu các luật trong R có vế phải
là Cj ;
for each Rr in < do
if Rr.Class = Cj then <(Cj)←− <(Cj) ∪ {Rr};
endfor
SORT(<(Cj)); //sắp xếp tập luật <(Cj) theo độ đo thích nghi của luật giảm dần
endfor
Khởi tạo R bằng tập luật rỗng;
for j ←− 1 to M do
if g > 1 then
Đặt R(Cj) gồm min{Q, |<(Cj)|} luật đầu tiên của <(Cj) đã được sắp;
else
if |<(Cj)| ≥ 2 ∗Q then
Đặt R(Cj) gồm Q luật đầu tiên của <(Cj);
<(Cj)←− R(Cj) \R(Cj);
Đặt R′(Cj) gồm Q luật đầu tiên của <(Cj); //xác định tập bổ trợ R′ ứng
với lớp Cj //
else
Đặt R(Cj) gồm |<(Cj)|/2 luật đầu tiên của <(Cj);
MỘT PHƯƠNG PHÁP TIẾN HÓA SINH HỆ LUẬT MỜ 339
<(Cj)←− <(Cj) \R(Cj);
R′(Cj)←− <(Cj); //xác định tập bổ trợ R′ ứng với lớp Cj
endif
R′ ←− R′ ∪R′(Cj);
endif
R←− R ∪R(Cj);
endfor
g ←− g + 1;
if g ≤ n then < ←− REPRODUCE(R,R′, P,M, n,X, f); //thực hiện thuật toán
tạo sinh
until (g > n) or (< trùng R);
return R;
End
Thuật toán tạo sinh REPRODUCE(R,R′, D,M, n,X, f), thực hiện tạo sinh trên các
luật của quần thể R và quần thể bổ trợ R′ để tạo ra tập luật ứng cử của thế hệ kế tiếp bao
gồm các luật của R và các luật thế hệ con có độ đo thích nghi cao hơn cha mẹ sinh ra chúng.
Với mỗi luật Rj có lớp kết luận Cj của R thực hiện tao sinh trên luật Rj như sau: chọn
ngẫu nhiên một luật Rp trong số các luật có cùng lớp kết luận Cj của R. Nếu luật Rp trùng
với luật Rj thì chọn lại luật Rp bằng cách chọn ngẫu nhiên một luật trong các luật có cùng
lớp kết luận Cj của R
′. Tiếp theo chọn ngẫu nhiên một biến xi trong số các biến hoạt động
của của luật Rp. Kiểm tra, nếu biến xi tương ứng trong luật Rj có giá trị là Don
′tcare thì
lần lượt sinh ra các luật con của Rj bằng cách thay thế giá trị Don
′tcare của biến xi của luật
Rj bằng một giá trị ngôn ngữ trong tập X(ki). Xác định lớp kết luận của các luật mới sinh
theo (2.3) và giá trị độ đo thích nghi theo hàm (3.1), (3.2), (3.3) hoặc (3.4) được chọn. Các
luật có độ đo thích nghi cao hơn độ đo thích nghi của luật Rj được giữ lại làm luật ứng cử
cho thế hệ kế tiếp. Nếu biến xi tương ứng trong luật Rj có giá trị khác Don
′tcare thì không
thực hiện tạo sinh trên luật Rj .
Hàm RANDOM(R,Cj) thực hiện chọn ngẫu nhiên một luật trong các luật có cùng lớp
kết luận Cj của tập luật R, hàm RANDOMACTIV E(Rp) thực hiện chọn ngẫu nhiên chỉ số
của biến trong số các biến hoạt động của luật Rp.
Algorithm REPRODUCE(R,R′, D,M, n,X, f)
Input:
- Tập luật mờ R, tập luật mờ bổ trợ R′, tập mẫu dữ liệu D = {(dp, Cp) : p = 1..m}
- Số lớp kết luận M , số thuộc tính n, tập các tập từ ngôn ngữ X = {X(kj) : j = 1..n}
- Hàm độ đo thích nghi f của luật (chọn 1 trong 4 hàm (3.1), (3.2), (3.3) hoặc (3.4))
Output:
- Tập luật mờ <
Method: Tạo sinh hệ luật ứng cử cho quần thể kế tiếp
Begin
< ←− R;
for each Rj in R do
Rp ←− RANDOM(R,Cj);
if Rp trùng Rj then Rp ←− RANDOM(R′, Cj);
i←− RANDOMACTIV E(Rp);
if Aj [i] = Don′tcare then // Aj là vế trái của luật Rj
340 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG
for each x in X(ki) do
Sinh luật Rr có Ar[t] = Aj [t] với t = 1..n;
Ar[i]←− x;//Ar là vế trái của luật Rr
Rr.Class←− argmax{conf(Ar =⇒ Ch)|Ch = 1, 2, ...,M}
Rr.fitness←− f(Rr); //tính độ đo thích nghi của luật
if Rr.fitness > Rj .fitness then < ← < ∪ {Rr};//bổ sung luật Rr vào <
endfor
endif
endfor
return <;
End
5. TỐI ƯU THAM SỐ MỜ ĐSGT VÀ TỐI ƯU HỆ LUẬT
5.1. Tối ưu tham số mờ ĐSGT
Để nâng cao hiệu quả phân lớp của hệ luật thì các tập mờ phải được điều chỉnh thích nghi
với từng bài toán. Trong nghiên cứu này, các tập mờ được xây dựng dựa trên các từ ngôn ngữ
được thiết kế dựa trên ĐSGT. Vì vậy để điều chỉnh các tập mờ thì ta phải thực hiện điều
chỉnh các tham số mờ của ĐSGT tức là đi tìm các tham số mờ tối ưu để làm tăng hiệu quả
phân lớp của hệ luật.
Sử dụng ĐSGT có 2 gia tử (V,L) cho tất cả các bài toán, vì vậy việc tối ưu tham số của
ĐSGT cho mỗi bài toán là đi tìm các bộ tham số tối ưu op = {(oµjfmc−, oµjL, okj , oα) : j =
1..n} với hàm độ đo thích nghi (3.4) hoặc op = {(oµjfmc−, oµjL, okj , oα) : j = 1..n} với các
hàm còn lại.
Để tìm tham số mờ tối ưu của ĐSGT, ta thực hiện thiết kế một thuật giải di truyền dựa
trên sơ đồ mã hóa nhị phân với hàm muc tiêu perf(R,D) là hiệu quả phân lớp của hệ luật R
được sinh ra từ thuật toán OPHA-SGERD trên tập mẫu dữ liệu D với phương pháp Test-All.
Các toán tử đột biến, lại ghép và lựa chọn quần thể kế tiếp được thừa kế trong [9].
Algorithm OP − PARHA(D,M,n,Q, f, PAR,Npop,Gmax, Pmu, Pcross, lchrom)
Input:
- Tập mẫu dữ liệu D = {(dp, Cp) : p = 1..m}, số lớp kết luận M , số thuộc tính n
- Số luật Q được chọn ứng với mỗi lớp
- Hàm độ đo thích nghi f của luật (chọn 1 trong 4 hàm (3.1), (3.2), (3.3) hoặc (3.4))
- Tập các ràng buộc tham số mờ của ĐSGT
PAR = {(minµjfmc−,maxµjfmc−,minµjL,maxµkL,min kj ,max kj) : j = 1..n}
- Npop là số cá thể trong quần thể, Gmax là số thế hệ tiến hóa, Pmu là xác xuất đột
biến, Pcross là xác xuất lai ghép, lchrom là chiều dài gen
Output:
- Bộ tham số tối ưu op = {(oµjfmc−, oµjL, okj , oα) : j = 1..n} với hàm độ đo thích nghi
(3.4) hoặc op = {(oµjfmc−, oµjL, okj) : j = 1..n} với các hàm còn lại.
Method: Phương pháp tối ưu tham số mờ của ĐSGT
Begin
i←− 0;
Khởi tạo quần thể POP0 = {p0,1, ..., p0,Npop};
MỘT PHƯƠNG PHÁP TIẾN HÓA SINH HỆ LUẬT MỜ 341
op.objvalue←− 0; //khởi tạo giá trị hàm mục tiêu của biến lưu bộ tham số tối ưu
repeat
for each p in POPi do
Xây dựng tập các tập từ ngôn ngữ X = {X(kj) : j = 1..n} bằng ĐSGT với bộ
tham số mờ p;
R←− OPHA− SGERD(D,M,n,Q,X, f); //xây dựng hệ luật R với tập các
tập từ ngôn ngữ X
p.objvalue←− perf(R,D); //tính giá trị hàm mục tiêu của cá thể p
if op.objvalue < p.objvalue then op←− p;
endfor
i←− i+ 1;
if i ≤ gmax then
Thực hiện lai ghép, đột biến;
Lựa chọn quần thể thế hệ thứ i (thế hệ kế tiếp): POPi;
endif
until i > Gmax;
return op; //trả lại bộ tham số tối ưu
End
5.2. Thuật toán HA-OFRB tối ưu hệ luật
Thuật toán OPHA-SGERD sinh ra hệ luật có tối đa M ×Q luật theo phương pháp Test-
All. Thuật toán sinh ra hệ luật với số luật khá lớn M ×Q luật, để đảm bảo tính dễ hiểu của
hệ luật thì ta cần tìm một hệ luật con S tối ưu trong M ×Q luật, sao cho S có hiệu quả phân
lớp chính xác cao nhất có thể, có số luật ít nhất và tổng chiều dài các luật của hệ luật là
nhỏ nhất (tức là S thỏa mãn hàm đa mục tiêu: fmo(S) = {max fp(S),min fn(S),min fl(S)},
trong đó fp(S) là hiệu quả phân lớp chính xác của hệ luật S, fn(S) là số luật trong S, fl(S) là
tổng chiều dài của các luật trong S). Đây là bài toán tối ưu đa mục tiêu, để giải quyết vấn đề
này, trong [15] H.Ishibuchi và các đồng nghiệp đã đề xuất giải pháp thay thế hàm đa mục tiêu
fmo(S) bằng hàm một mục tiêu f(S) = max{wpfp(S)−wnfn(S)−wlfl(S)} với wp, wn, wl là
các tham số cho trước có giá trị trong khoảng (0, 1) và thỏa mãn wp +wn +wl = 1. Như vậy
việc tìm kiếm hệ luật S tối ưu trở thành bài toán tối ưu hàm một mục tiêu f(S).
Để tìm hệ luật tối ưu, ta xây dựng một giải thuật di truyền để làm việc này, với sơ đồ mã
hóa nhị phân và hàm mục tiêu f(S). Với số luật tối đa Rmax cho trước khi đó mỗi cá thể của
quần thể có Rmax biến mục tiêu là r1, ..., rRmax. Giá trị của các biến mục tiêu được giới hạn
trong khoảng [0,1]. Khi đó luật có chỉ số [ri × |R|] với i = 1..Rmax trong hệ luật R sẽ được
chọn vào hệ luật tối ưu, trong đó |R| là số luật của hệ luật R. Ở đây, ta sử dụng toán tử đột
biến, lại ghép và lựa chọn quần thể kế tiếp trong [9]. Do thuật giải di truyền tương tự như
trong mục 5.1 nên không trình bày lại ở đây.
6. THỬ NGHIỆM VÀ ĐÁNH GIÁ
Trong phần này sẽ thử nghiệm và so sánh hiệu quả phân lớp của thuật toán OPHA-
SGERD trên 9 bài toán được lấy từ UCI [18] với thuật toán SGERD trong[17]. Phương pháp
thử nghiệm Ten-fold, với các tiêu chuẩn đánh giá luật (3.2), (3.3) và (3.4). Kết quả thực
nghiệm lần lượt trình bày trong bảng 6.3, 6.4 và 6.5.
342 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG
Quá trình thử nghiệm được thực hiện với hai pha. Pha thứ nhất tìm các tham số tối ưu
của ĐSGT, thực nghiệm với các tham số của giải thuật di truyền như sau: xác suất lai ghép
Pcross = 0.85, xác suất đột biến Pmu = 0.05, giới hạn các biến mục tiêu 0.3 ≤ µjfmc− ≤
0.7, 0.3 ≤ µjL ≤ 0.7, 1 ≤ kj ≤ 3 với j = 1..n, 0.3 ≤ α ≤ 0.7, chiều dài mỗi gen lchrom = 24,
số cá thể 250 và số thế hệ tiến hóa 150, tham số của thuật toán OPHA-SGERD Q = 20,
chiều dài tối đa của luật ≤ 3, phương pháp thử nghiệm sinh luật Test-All. Pha thứ hai tìm
hệ luật tối ưu từ hệ luật R được sinh ra từ thuật toán OPHA-SGERD. Thực hiện thuật
toán HA-OFRB với các tham số: Rmax được giới hạn với giá trị xấp xỉ bằng số luật của hệ
luật công bố trong [17], chi tiết mô tả trong bảng 6.2, xác suất lai ghép Pcross = 0.85, xác
suất đột biến Pmu = 0.05, giới hạn các biến mục tiêu 0 ≤ ri ≤ 1 với i = 1..Rmax, chiều
dài mỗi gen lchrom = 24, số cá thể 250, số thế hệ tiến hóa 500, tham số hàm mục tiêu
wp = 0.99, wn = 0.001, wl = 1− wp − wn.
Kí hiệu: #Na số thuộc tính, #Nc số lớp, #Np số mẫu dữ liệu, #Nar trung bình số luật,
#Nal trung bình chiều dài luật, Perf tỉ lệ phân lớp chính xác.
Bảng 6.1. Các bài toán thử nghiệm Bảng 6.2. Các giá trị của Rmax
trong quá trình tối ưu hệ luật
Bảng 6.3. So sánh kết quả thử nghiệm thuật toán OPHA-SGERD
và thuât toán SGERD với hàm đánh giá (3.2)
Từ các bảng kết quả cho thấy, tỉ lệ phân lớp chính xác cao hơn của thuật toán OPHA-
SGERD cao hơn so với thuật toán SGERD. Bảng 6.3 cho thấy thuật toán OPHA-SGERD có
tỉ lệ phân lớp chính xác cao hơn thuật toán SGERD trên 8 bài toán, trong đó có một số bài
toán có tỉ lệ cao hơn khá nhiều như bài toán Glass là 5.32%, Sonar là 5.0% và Image là 2.67%.
MỘT PHƯƠNG PHÁP TIẾN HÓA SINH HỆ LUẬT MỜ 343
Bảng 6.4 So sánh kết quả thử nghiệm thuật toán OPHA-SGERD
và thuât toán SGERD với hàm đánh giá (3.3)
Bảng 6.5. So sánh kết quả thử nghiệm thuật toán OPHA-SGERD
với hàm đánh giá (3.3) và (3.4)
Bảng 6.6. So sánh kết quả thử nghiệm thuật toán OPHA-SGERD
với các tiểu chuẩn đánh giá khác nhau
Chỉ có duy nhất bài toán Iris có tỉ lệ thấp hơn, tuy nhiên tỉ lệ thấp hơn rất nhỏ chỉ 0.26%.
Bảng 6.4 cho thấy thuật toán OPHA-SGERD có tỉ lệ phân lớp chính xác cao hơn thuật
toán SGERD trên 6 bài toán, đặc biệt là bài toán Glass có tỉ lệ cao hơn nhiều là 9.98%, Pima
là 3.87%, Sonar là 4.6%. Các bài toán có tỉ lệ thấp hơn không đáng kể như bài toán Cancer
344 NGUYỄN CÁT HỒ, HOÀNG VĂN THÔNG, NGUYỄN VĂN LONG
là 0.6%, Vowel là 3.28% và Yeast là 2.35%. Với tiêu chuẩn đánh giá (3.3) cho thấy thuật toán
OPHA-SGERD tạo ra hệ luật có tỉ lệ phân lớp chính xác cao đồng thời dễ hiểu với người sử
dụng nhờ vào các điều kiện tiền đề là các từ ngôn ngữ được sinh ra bởi ĐSGT và chiều dài
luật ngắn. Bảng 6.4 cho thấy chiều dài hệ luật sinh ra bởi thuật toán OPHA-SGERD thấp
hơn thuật toán SGERD trên 8 bài toán và chỉ cao hơn trên 1 bài toán. Bảng 6.5 cho thấy tiêu
chuẩn đánh giá (3.4) cho ta hệ luật có tỉ lệ phân lớp chính xác cao hơn tiêu chuẩn đánh giá
(3.3), tuy nhiên sự khác biệt không được rõ ràng, do chỉ có 5 trong 9 bài toán có tỉ lệ phân lớp
chính xác cao hơn, cao nhất trên bài toán Vowel là 2.12%. Từ bảng 6.6 cho thấy tiêu chuẩn
đánh giá (3.4) tạo ra hệ luật có tỉ lệ phân lớp chính xác cao nhất trong 3 tiêu chuẩn đánh giá
(3.2), (3.3) và (3.4).
Từ những so sánh đánh giá ở trên cho thấy thuật toán OPHA-SGERD tạo ra các hệ luật
có tỉ lệ phân lớp chính xác cao hơn thuật toán SGERD, dễ hiểu với người sử dụng do có chiều
dài luật ngắn và các điều kiện tiền đề là các từ ngôn ngữ có ngữ nghĩa.
7. KẾT LUẬN
Bài báo đã đề xuất một phương pháp xây dựng hệ luật mờ cho bài toán phân lớp dựa trên
việc cải tiến phương pháp SGERD bằng việc ứng dụng ĐSGT và thuật toán tối ưu hệ luật,
đồng thời đề xuất tiêu chuẩn đánh giá các luật dựa trên việc cải tiến tiêu chuẩn đánh giá đề
xuất trong [17].
Phương pháp sinh hệ luật ứng cử có ý tưởng khác so với các phương pháp đề xuất [6-8,
10-15, 20]. Từ các luật có chiều dài 1 với không gian mờ lớn có độ đo thích nghi nhỏ. Sau mỗi
bước thuật toán sinh ra các luật có chiều dài tăng thêm một đơn vị. Các luật thế hệ con có
không gian mờ giảm và độ đo thích nghi tăng lên. Do đó tăng tính chính xác khi phân lớp và
đảm bảo hệ luật sinh ra đơn giản bởi các luật có độ dài ngắn được xem xét trước. Với việc
áp dụng ĐSGT hệ luật được tạo ra đảm bảo tính dễ hiểu với con người. Đặc biệt thuật giải
di truyền với số thế hệ hữu hạn, nhiều nhất bằng số thuộc tính của luật, tốn ít thời gian cho
việc xây dựng hệ luật ứng cử và vì vậy có thể giải quyết được các bài toán với số mẫu dữ liệu
và số chiều lớn.
Kết quả thử nghiệm cho thấy, hệ luật xây dựng dựa trên ĐSGT cho kết quả phân lớp
chính xác cao hơn 8 trong 9 bài toán với tiêu chuẩn đánh giá (3.2) và 6 trong 9 bài toán với
tiêu chuẩn đánh giá (3.3). Nhìn chung hệ luật sinh ra dễ hiểu với người sử dụng do chiều dài
của luật giảm. Tiêu chuẩn đánh giá (3.4) đề xuất trong bài báo cho kết quả phân lớp chính
xác cáo hơn các tiêu chuẩn đánh giá còn lại trong hầu hết các bài toán.
TÀI LIỆU THAM KHẢO
[1] Nguyen Cat Ho, Fuzziness in structure of linguistic truth values: A foundation for development
of fuzzy reasoning, Proc. of ISMVL’ 87, Boston, USA, IEEE Computer Society Press, New
York, 1987 (326–335).
[2] Nguyen Cat Ho and W. Wechler, Extended hedge algebras and their application to fuzzy logic,
Fuzzy Sets and Systems 52 (1992) 259–281.
[3] Nguyen Cat Ho, H. Van Nam, Ordered structure-based semantics of linguistic terms of linguistic
variables and approximate reasoning, AIP conference proceedings on Computing Anticipa-
tory Systems, CASYS’99 Third International Conference 157 (1) (2000) 98–116.
MỘT PHƯƠNG PHÁP TIẾN HÓA SINH HỆ LUẬT MỜ 345
[4] Nguyen Cat Ho, T. Đinh Khang, L.Xuan Viet, Fuzziness measure, quantified semantic mapping
and interpolative method of approximate reasoning in medical expert systems, Tạp chí Tin học
và Điều khiển học 18 (3) (2002) 237–252.
[5] Nguyen Cat Ho, Nguyen Van Long, Đại số gia tử đầy đủ tuyến tính, Tạp chí Tin học và Điều
khiển học 19 (3) 274–280.
[6] Dương Thăng Long, Nguyễn Cát Hồ, Trần Thái Sơn, Một phương pháp xây dựng hệ luật mờ
có trọng số để phân lớp dựa trên đại số gia tử, Tạp chí Tin học và Điều khiển học 26 (1)
(2010) 55–72.
[7] Nguyễn Cá Hồ, Trần Thái Sơn, Dương Thăng Long, Tiếp cận đại số gia tử cho phân lớp mờ,
Tạp chí Tin học và Điều khiển học 25 (1) (2009) 53–68.
[8] Nguyễn Cát Hồ, Trần Thái Sơn, Dương Thăng Long, Đại số gia tử hạn chế AX2 (ĐSGT2) và
ứng dụng cho bài toán phân lớp mờ, Tạp chí Khoa học và Công nghệ, năm 2010.
[9] Hoàng Kiếm, Lê Hoàng Thái, Giải thuật di truyền - Cách giải tự nhiên các bài toán trên
máy tính, Nhà Xuất bản giáo dục, năm 2000.
[10] H. Ishibuchi, T. Nakashima, T Murata, Three-objective genetics-based machine learning for
linguistic rule extraction, Information Scienc 136 (2001) 109–133.
[11] Hisao Ishibuchi and Takashi Yamamoto, Fuzzy rule selection by multi-objective genetic local
search algorithms and rule evaluation measures in data mining, Fuzzy Sets and Systems 141
(1) (2004) 59–88.
[12] H. Ishibuchi, Multiobjective genetic fuzzy systems: Review and future research directions, Proc.
of 2007 IEEE International Conference on Fuzzy Systems, London, UK, July 23-26, 2007
(913–918)
[13] H. Ishibuchi, T. Murata, and I.B.Turksen, Single-objective and two-objective genetic algorithms
for selecting linguistic rules for pattern classication problems, Fuzzy Sets and Syst. 89 (2)
(1997) 135–150.
[14] H. Ishibuchi and T. Yamamoto, Rule weight specication in fuzzy rule-based classication systems,
IEEE Trans. Fuzzy Syst. 13 (4) (Aug. 2005) 428–435.
[15] Hisao Ishibuchi∗ and Takashi Yamamoto, Fuzzy rule selection by multi-objective genetic local
search algorithms and rule evaluation measures in data mining, Fuzzy Sets and Systems 141
(2004) 59–88.
[16] E. G. Mansoori, M. J. Zolghadri, and S. D. Katebi, A weighting function for improving fuzzy
classication systems performance, Fuzzy Sets Syst. 158 (5) (2007) 583–591.
[17] Eghbal G. Mansoori, Mansoor J. Zolghadri, and Seraj D. Katebi, SGERD: A steady-sate gener-
atic algorithm for extracting fuzzy classification rules from data, IEEE Transactions on Fuzzy
Systems 16 (4) (August 2008).
[18] The Machine Learning Repository of University of California - Irvine,
[19] J. H. Holland, Adaptation in Natural and Articial Systems.AnnArbor, MI: Univ. Michigan
Press, 1975.
[20] Johannes A. Roubos, Magne Setnes and Janos Abonyi, Learning fuzzy classication rules from
labeled data, Information Sciences 150 (2003) 77–93.
Ngày nhận bài 16 - 7 - 2012
Nhận lại sau sửa ngày 5 - 12 - 2012
File đính kèm:
mot_phuong_phap_tien_hoa_sinh_he_luat_mo_cho_bai_toan_phan_l.pdf