Phương pháp bán giám sát trong phân loại lớp phủ trên ảnh vệ tinh sử dụng thuật toán Mountain

Tóm tắt Phương pháp bán giám sát trong phân loại lớp phủ trên ảnh vệ tinh sử dụng thuật toán Mountain: ...ật độ của dữ liệu điểm ảnh trong vùng lân cận của tập dữ liệu. Giá trị tiềm năng của mỗi dữ liệu điểm ảnh càng cao thì khả năng điểm ảnh đó là trọng tâm cụm càng cao. Trọng tâm cụm đầu tiên được chọn chính là giá trị cao nhất của Hr,1: 1 ,1(H ), 1,...,1p 1p rc x H max r n    (6) Để chọ...ác giả sử dụng tư liệu ảnh vệ tinh Landsat 8 OLI chụp ngày 14-02-2014 khu vực huyện Bảo Lâm, tỉnh Lâm Đồng – Hình 2a). Tư liệu ảnh Landsat được tiền xử lí và xác định giá trị phản xa phổ [16]. Ở bước tiếp theo, tính toán chỉ số thực vật NDVI theo công thức (12). Kết quả xác định chỉ số NDVI ...ong Bảng 5. TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 _____________________________________________________________________________________________________________ 140 a) b) Hình 4. Kết quả xác định chỉ số thực vật NDVI đối với ảnh vệ tinh Landsat khu vực huyện Bảo Lâm (a) và thành ...

pdf12 trang | Chia sẻ: havih72 | Lượt xem: 147 | Lượt tải: 0download
Nội dung tài liệu Phương pháp bán giám sát trong phân loại lớp phủ trên ảnh vệ tinh sử dụng thuật toán Mountain, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
trọng tâm cụm dựa trên mật độ đo gọi là hàm 
Mountain xác định theo công thức sau: 
2
2
1
( ) exp( )
2
n
j
j
x x
h x


  (1) 
trong đó: 
h(x) là chiều cao của hàm Mountain tại một điểm x; 
xj là dữ liệu điểm ảnh thứ j và δ là một hằng số ứng dụng cụ thể. 
 Khởi 
tạo 
trọng 
tâm 
Phân 
loại 
Tổng 
hợp 
Ảnh 
kết 
quả 
Ảnh vệ tinh 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 
_____________________________________________________________________________________________________________ 
134 
Công thức (1) cho biết kết quả đo tại một điểm x bị ảnh hưởng bởi tất cả các điểm 
xj trong tập dữ liệu. Phép đo này tỉ lệ nghịch với khoảng cách từng điểm xj với điểm x 
đang xem xét. Hằng số δ xác định chiều cao cũng như thông số kết quả hàm Mountain. 
Trọng tâm cụm thứ nhất c1 xác định bằng cách chọn điểm với giá trị h(x) lớn 
nhất. Trọng tâm cụm tiếp theo loại trừ ảnh hưởng của cụm c1 nên tính lại hàm h(x) thay 
bằng hnew(x). Hàm hnew(x) tính bằng h(x) trừ đi tỉ lệ trọng tâm hàm mật độ Gaussian tại 
c1: 
2
1
1 2
1
( ) ( ) ( )* exp( )
2
n
j
new
j
c x
h x h x h c


   (2) 
Với β là hằng số xác định chiều cao tương ứng với tâm cụm tiếp theo, trong đó 
chiều cao của các cụm sau luôn lớn hơn các cụm trước đó. Chú ý rằng hàm hnew(x) 
giảm tới 0 tại x=c1. Trọng tâm cụm thứ 2 chọn điểm có hnew(x) lớn nhất. Quá trình tiếp 
tục cho đến khi đủ số lượng trọng tâm cụm đạt được. 
2.2. Phương pháp đề xuất 
Để có thể áp dụng thuật toán Mountain cho ảnh vệ tinh đa phổ với k kênh, dữ liệu 
ảnh được chuyển thành một file vector X. Mỗi thành phần của X được biểu diễn bởi 
các giá trị trên các kênh phổ từ 1 đến k. 
Đặt dữ liệu thứ j của vector X là: 
1 2{ } { , ,..., }, 1,...j j j j jkx x x x x j n    (3) 
Không mất tính tổng quát, dữ liệu các điểm ảnh được chuẩn hóa theo công thức 
sau: 
min max min( ) / ( ), 1,... ; 1,...,jp jp p p px x x x x j n p k      (4) 
trong đó: 
min
max
min{ }, 1,..., ; 1,...,
m ax{ }, 1,..., ; 1,...,
p jp
p jp
x x j n p k
x x j n p k
   
   
Do tính độc lập của các điểm ảnh, mỗi điểm ảnh jpx (được biểu diễn bằng k thành 
phần) đều có khả năng trở thành trọng tâm của các cụm. Nếu coi mỗi điểm ảnh jpx đều 
là một trọng tâm cụm tiềm năng, độ đo tiềm năng của dữ liệu điểm ảnh jpx được định 
nghĩa là một hàm khoảng cách giữa jpx và tất cả các điểm ảnh khác trên ảnh: 
2
,1 2
1 1
( , )
exp ( ) , 1,...,
n
jp rp
r
j
d x x
H r n
d
 
    
  
 (5) 
Trong đó, Hr,1 là giá trị biểu thị khả năng trở thành tâm cụm của một điểm ảnh. 
Giá trị này càng lớn thì khả năng điểm ảnh đang xét trở thành tâm cụm càng cao và 
ngược lại, giá trị này nhỏ thì khả năng điểm ảnh đang xét là trọng tâm cụm càng thấp. 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk 
_____________________________________________________________________________________________________________ 
135 
d1 là một hằng số dương, xác định vùng lân cận của dữ liệu điểm ảnh. Các điểm ảnh 
nằm ngoài bán kính d1 ảnh hưởng rất ít tới giá trị trọng tâm cụm tiềm năng. Hiển nhiên, 
giá trị trọng tâm cụm tiềm năng của dữ liệu sẽ xấp xỉ với mật độ của dữ liệu điểm ảnh 
trong vùng lân cận của tập dữ liệu. Giá trị tiềm năng của mỗi dữ liệu điểm ảnh càng cao 
thì khả năng điểm ảnh đó là trọng tâm cụm càng cao. Trọng tâm cụm đầu tiên được 
chọn chính là giá trị cao nhất của Hr,1: 
1 ,1(H ), 1,...,1p 1p rc x H max r n    (6) 
Để chọn trọng tâm của cụm thứ 2, giá trị tiềm năng của mỗi dữ liệu điểm ảnh 
được xét lại để giảm sự ảnh hưởng của hàm Mountain xung quanh trọng tâm cụm thứ 
nhất: 
2
2
1 2
( , )
* exp ( ) , 1,...,
n
1p rp
r,2 r,1 1
j
d c x
H H H r n
d
 
     
  
 (7) 
Trong đó d2 là một hằng số dương, xác định vùng lân cận của dữ liệu điểm ảnh. 
Theo công thức (7), các dữ liệu điểm ảnh gần với trọng tâm cụm đầu tiên sẽ giảm mạnh 
giá trị tiềm năng nên không có khả năng được chọn là trọng tâm cụm tiếp theo. Với 
việc xét lại giá trị tiềm năng của mỗi dữ liệu điểm ảnh, trọng tâm cụm thứ hai được 
chọn chính là giá trị cao nhất của Hr,1: 
2 2 ,2(H ), 1,...,p 2p rc x H max r n    (8) 
Tương tự, lựa chọn trọng tâm cụm thứ m, sau đó xem xét lại giá trị tiềm năng của 
mỗi dữ liệu ảnh: 
2
( 1)
, , 1 1 2
1 2
( , )
* exp ( ) , 1,...,
n
m p rp
r m r m m
j
d c x
H H H r n
d

 

 
     
  
 (9) 
Chọn trọng tâm cụm thứ m có Hr,m lớn nhất: 
,(H ), 1,...,mp mp m r mc x H max r n    (10) 
Để kết thúc quá trình phân cụm, sử dụng tiêu chuẩn sau: 
1
mH
H
 (11) 
Với α là một phân số nhỏ [10] – [11] được lựa chọn trong khoảng (0;1). Giá trị 
của α ảnh hưởng đến kết quả của bài toán, khi α bé thì chọn được nhiều trọng tâm cụm, 
và ngược lại khi α lớn, số lượng trọng tâm cụm chọn được sẽ ít. Rất khó để chọn một 
giá trị α thỏa mãn mọi trường hợp, do vậy cần phải có sự thử nghiệm với nhiều giá trị 
khác nhau của α, d1 và d2 để lựa chọn giá trị có kết quả tốt nhất. Khi không thỏa mãn 
tiêu chuẩn (11), thuật toán sẽ dừng lại và tùy từng trường hợp cụ thể để lựa chọn số 
lượng tâm cụm cho phù hợp. 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 
_____________________________________________________________________________________________________________ 
136 
Sau khi có các trọng tâm cụm, tiến hành phân cụm dựa trên các trọng tâm cụm ở 
trên. Để gán các cụm này về các lớp tương ứng với các loại hình lớp phủ trên ảnh vệ 
tinh, trong nghiên cứu này sử dụng chỉ số khác biệt thực vật NDVI (Normalized 
Difference Vegetation Index) [7, 14]. Chỉ số NDVI được xác định dựa trên sự phản xạ 
khác nhau của thực vật ở dải sóng đỏ và cận hồng ngoại, thể hiện qua công thức sau 
[14]: 
D
D
NIR RENDVI
NIR RE



 (12) 
Trong đó, NIR và RED tương ứng là giá trị phản xạ phổ tại kênh cận hồng ngoại 
và kênh đỏ ảnh vệ tinh. Đối với ảnh vệ tinh Landsat 5 TM và Landsat 7 ETM+, các 
kênh này tương ứng là kênh 4 và kênh 3, trong khi với ảnh Landsat 8 OLI là các kênh 5 
và 4. [15] 
Giá trị chỉ số NDVI nằm trong khoảng từ -1 đến 1, trong đó NDVI thấp thể hiện 
những khu vực có độ che phủ thực vật thấp. Giá trị NDVI cao đại diện cho những khu 
vực có độ che phủ thực vật cao, còn giá trị NDVI âm thể hiện các khu vực đất ẩm và 
mặt nước. [14] 
Như vậy, thuật toán đề xuất có thể tóm tắt qua các bước sau: 
Bước 1. Chuẩn hóa dữ liệu 
a) Đọc ảnh vệ tinh Landsat vào mảng X theo công thức (3); 
b) Chuẩn hóa mảng X theo công thức (4). 
Bước 2. Tìm các trọng tâm cụm 
a) Tính toán giá trị biểu thị khả năng trở thành tâm cụm Hr của tất cả các điểm 
ảnh theo công thức (5); 
b) Tìm điểm ảnh có Hr lớn nhất theo công thức (6) và gán chúng là tâm cụm, sau 
đó loại chúng ra khỏi tập ứng viên tâm cụm tiềm năng; 
c) Cập nhật lại giá trị Hr của các điểm ảnh còn lại theo công thức (7); 
d) Lặp lại các bước (8), (9) và (10) cho đến khi đủ số lượng tâm cụm hoặc thỏa 
mãn điều kiện dừng (11). 
Bước 3. Phân cụm ảnh X dựa trên các trọng tâm cụm tìm được ở trên. 
Bước 4. Lấy dữ liệu mẫu trên ảnh và tính toán ngưỡng giá trị NDVI theo các lớp 
phủ. 
Bước 5. Gán các cụm về các lớp tương ứng với các lớp phủ trên ảnh vệ tinh 
Landsat dựa trên chỉ số thực vật NDVI. 
Bước 6. Hiển thị kết quả bằng cách gán màu sắc và chồng ghép các lớp sau khi 
phân loại. 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk 
_____________________________________________________________________________________________________________ 
137 
3. Kết quả thực nghiệm 
Để xử lí và phân loại lớp phủ trên ảnh vệ tinh, nhóm tác giả sử dụng ngôn ngữ lập 
trình C++. Đây là ngôn ngữ mạnh và rất hiệu quả trong xử lí ảnh số, đặc biệt đối với 
những ảnh có dung lượng lớn như ảnh vệ tinh. Địa bàn thử nghiệm gồm 2 khu vực với 
đặc trưng lớp phủ khác nhau: Khu vực miền núi (huyện Bảo Lâm, tỉnh Lâm Đồng) và 
khu vực đồng bằng, đô thị (thành phố Thái Nguyên, tỉnh Thái Nguyên). 
Thử nghiệm 1. Trong thử nghiệm này, nhóm tác giả sử dụng tư liệu ảnh vệ tinh 
Landsat 8 OLI chụp ngày 14-02-2014 khu vực huyện Bảo Lâm, tỉnh Lâm Đồng – Hình 
2a). Tư liệu ảnh Landsat được tiền xử lí và xác định giá trị phản xa phổ [16]. Ở bước 
tiếp theo, tính toán chỉ số thực vật NDVI theo công thức (12). Kết quả xác định chỉ số 
NDVI được thể hiện trên Hình 2b. 
 a) b) 
Hình 2. Ảnh Landsat 8 OLI ngày 14-02-2014 
khu vực Bảo Lâm, Lâm Đồng (a) và ảnh chỉ số thực vật NDVI (b) 
Để xác định ngưỡng giá trị chỉ số NDVI đối với các loại hình lớp phủ, trong bài 
báo tiến hành lấy các dữ liệu mẫu đối với từng đối tượng, được trích xuất trực tiếp trên 
ảnh NDVI. Số lượng mẫu tùy thuộc từng bài toán cụ thể cũng như tùy từng loại hình 
lớp phủ. Trong nghiên cứu này, thử nghiệm phân loại với 6 đối tượng lớp phủ bao 
gồm: sông ngòi, ao, hồ (lớp 1); đất trống, đất xây dựng (lớp 2); đồng cỏ, thực vật thưa 
(lớp 3); cây gỗ thấp (lớp 4); rừng trồng (lớp 5) và thực vật dày, cây lâu năm (lớp 6). 
Các tham số thực nghiệm được lựa chọn với d1 = 0,15 và d2 = 1,5*d1, điều kiện dừng 
hiệu quả là 0,01<α<0,30. 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 
_____________________________________________________________________________________________________________ 
138 
Kết quả xác định ngưỡng giá trị NDVI tương ứng với các loại đối tượng lớp phủ 
khu vực huyện Bảo Lâm (Lâm Đồng) bằng thuật toán Mountain được thể hiện trong 
Bảng 1 như sau: 
Bảng 1. Phân lớp các loại hình lớp phủ dựa trên chỉ số NDVI 
STT Tên đối tượng Giá trị NDVI Ghi chú 
1 Sông ngòi, ao hồ -1,0 < NDVI < 0,0218 
2 Đất trống, đất xây dựng 0,0219 < NDVI < 0,2135 
3 Đồng cỏ, thực vật thưa 0,2136 < NDVI < 0,3082 
4 Cây gỗ thấp 0,3083 < NDVI < 0,4135 
5 Rừng trồng 0,4136 < NDVI <0,6733 
6 Thực vật dày, cây lâu năm 0,6734 < NDVI < 1,0 
Kết quả phân loại lớp phủ khu vực huyện Bảo Lâm (Lâm Đồng) bằng thuật toán 
K – Means, ISODATA và Mountain được thể hiện trên Hình 3(a-c) và Bảng 2. Có thể 
nhận thấy, khi phân loại bằng thuật toán ISODATA và K – Means, một số lớp đã bị 
gán nhầm vào lớp khác, đặc biệt là đối với đối tượng nước (Hình 3a, 3b). Ngoài ra, đối 
tượng đất trống, đất xây dựng hầu như không thể phân loại hiệu quả bằng các thuật 
toán này. Những hạn chế này đã được khắc phục khi sử dụng phương pháp dựa trên 
thuật toán Mountain (Hình 3c). 
 (a) (b) (c) 
Hình 3. Kết quả phân loại lớp phủ khu vực huyện Bảo Lâm 
 sử dụng thuật toán K – Means (a), ISODATA (b) và thuật toán Mountain (c) 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk 
_____________________________________________________________________________________________________________ 
139 
Bảng 2. Số liệu diện tích các loại lớp phủ khu vực huyện Bảo Lâm (%) 
sau khi phân loại 
STT Loại đối tượng K-Means Iso-data Mountain 
1 Sông ngòi, ao hồ 6,671 % 4,408 % 4,073 % 
2 Đất trống, đất xây dựng 8,980 % 8,754 % 12,601 % 
3 Đồng cỏ, thực vật thưa 15,253 % 15,390 % 17,420 % 
4 Cây gỗ thấp 19,069 % 22,330 % 16,001 % 
5 Rừng trồng 26,492 % 28,653 % 25,841 % 
6 Thực vật dày, cây lâu năm 23,536 % 20,465 % 24,063 % 
Để so sánh độ chính xác kết quả phân loại dựa trên thuật toán Mountain, nhóm 
nghiên cứu đã so sánh với kết quả phân loại sử dụng thuật toán K – Means và 
ISODATA. Chỉ số đánh giá độ chính xác được lựa chọn bao gồm chỉ số DB-I (Davies 
Bouldin index) [12] và Kappa index (Bảng 3). Lưu ý rằng, giá trị chỉ số DB-I càng nhỏ 
thì chất lượng phân loại càng tốt, trong khi đó giá trị chỉ số Kappa càng lớn thể hiện độ 
chính xác càng cao. Bảng 3 cho thấy, giá trị chỉ số DB-I khi phân loại bằng thuật toán 
Mountain là 2,1974, trong khi phân loại với thuật toán K – Means và ISODATA, giá trị 
chỉ số này tương ứng là 5,2312 và 3,7612. Tương tự, với chỉ số Kappa, phương pháp đề 
xuất đạt giá trị 0,6732 so với 0,4256 và 0,5721 khi phân loại bằng thuật toán K – 
Means và ISODATA. 
Bảng 3. So sánh độ chính xác của kết quả phân loại 
 với các thuật toán K – Means và ISODATA 
STT 
 Phương pháp 
Chỉ số đánh giá 
K - Means ISODATA Mountain 
1 DB-I 5,3562 3,5427 2,2792 
2 Kappa 0,4561 0,5872 0,6698 
Thử nghiệm 2. Trong thử nghiệm này, nhóm tác giả sử dụng tư liệu ảnh vệ tinh 
Landsat 5 TM chụp ngày 08-11-2010 khu vực thành phố Thái Nguyên (Hình 4a). Kết 
quả xác định chỉ số thực vật NDVI được trình bày trên Hình 4b. Các đối tượng lớp phủ 
được phân loại bao gồm 6 lớp: sông ngòi, ao, hồ (lớp 1); đất trống, đất xây dựng (lớp 
2); đồng cỏ, thực vật thưa (lớp 3); cây gỗ thấp (lớp 4); rừng trồng (lớp 5) và thực vật 
dày, cây lâu năm (lớp 6). Thuật toán Mountain được sử dụng để xác định ngưỡng giá 
trị chỉ số thực vật NDVI đối với 6 lớp trên. Kết quả xác định ngưỡng giá trị NDVI 
tương ứng với các loại đối tượng lớp phủ khu vực thành phố Thái Nguyên được thể 
hiện trong Bảng 5. 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 
_____________________________________________________________________________________________________________ 
140 
 a) b) 
Hình 4. Kết quả xác định chỉ số thực vật NDVI đối với ảnh vệ tinh Landsat 
khu vực huyện Bảo Lâm (a) và thành phố Thái Nguyên (b) 
Bảng 4. Phân lớp các loại hình lớp phủ dựa trên chỉ số NDVI 
STT Tên đối tượng Giá trị NDVI Ghi chú 
1 Sông ngòi, ao hồ -1,0 < NDVI < 0,0158 
2 Đất trống, đất xây dựng 0,0159 < NDVI < 0,2071 
3 Đồng cỏ, thực vật thưa 0,2072 < NDVI < 0,3367 
4 Cây gỗ thấp 0,3368 < NDVI < 0,5281 
5 Rừng trồng 0,5282 < NDVI <0,6864 
6 Thực vật dày, cây lâu năm 0,6865 < NDVI < 1,0 
Kết quả phân loại lớp phủ đối với ảnh vệ tinh Landsat khu vực thành phố Thái 
Nguyên được trình bày trên Hình 6(a-c) và Bảng 5. Có thể nhận thấy, khi sử dụng thuật 
toán K – Means và ISODATA, một số đối tượng như sông ngòi, ao, hồ (lớp 1); đất 
trống, đất xây dựng (lớp 3) hầu như không thể phân loại được, trong đó phần lớn diện 
tích khu vực đô thị Thái Nguyên bị lẫn với đối tượng nước (Hình 6a, 6b). Những hạn 
chế này cũng được khắc phục hiệu quả khi phân loại bằng thuật toán Mountain (Hình 
6c). 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk 
_____________________________________________________________________________________________________________ 
141 
 a) b) 
 c) 
Hình 6. Kết quả phân loại lớp phủ sử dụng thuật toán K – Means (a), 
ISODATA (b), thuật toán Moutain (c) đối với ảnh Landsat 5 TM khu vực thành phố 
Thái Nguyên. 
Bảng 4. Số liệu diện tích các loại lớp phủ khu vực huyện Bảo Lâm (%) 
sau khi phân loại 
STT Loại đối tượng K-Means Iso-data Mountain 
1 Sông ngòi, ao hồ 11,220% 7,076% 4,486% 
2 Đất trống, đất xây dựng 8,928% 9,446% 11,518% 
3 Đồng cỏ, thực vật thưa 17,630% 18,666% 19,702% 
4 Cây gỗ thấp 22,214% 24,286% 25,840% 
5 Rừng trồng 20,264% 21,818% 24,409% 
6 Thực vật dày, cây lâu năm 19,743% 18,707% 14,045% 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Số 3(81) năm 2016 
_____________________________________________________________________________________________________________ 
142 
Trong thử nghiệm này, nhóm tác giả cũng so sánh giá trị các chỉ số DB-I và 
Kappa khi phân loại bằng thuật toán K – Means, ISODATA và Mountain. Kết quả 
nhận được cho thấy, giá trị chỉ số DB-I đối với kết quả phân loại bằng thuật toán 
Mountain là 2,3721 so với 4,2413 và 3,4198 khi phân loại bằng thuật toán K – Means 
và ISODATA. Trong khi đó, giá trị chỉ số Kappa khi phân loại bằng thuật toán 
Mountain, K – Means và ISODATA lần lượt là 0,7183; 0,5843 và 0,6259 (Bảng 6). 
Bảng 6. So sánh độ chính xác của kết quả phân loại 
với các thuật toán K – Means và ISODATA 
STT 
 Phương pháp 
Chỉ số đánh giá 
K - Means ISODATA Moutain 
1 DB-I 4,2413 3,4198 2,3721 
2 Kappa 0,5843 0,6259 0,7183 
4. Kết luận 
Phân tích kết quả nhận được cho thấy, ứng dụng thuật toán phân cụm Mountain 
cho kết quả phân loại lớp phủ trên ảnh vệ tinh Landsat tốt hơn nếu so với một số thuật 
toán thông dụng khác như K – Means và ISODATA. Để đánh giá độ chính xác, trong 
nghiên cứu đã thử nghiệm phân loại lớp phủ trên ảnh vệ tinh Landsat đối với hai khu 
vực khác nhau: khu vực miền núi (huyện Bảo Lâm, tỉnh Lâm Đồng) và khu vực đồng 
bằng, đô thị (thành phố Thái Nguyên, tỉnh Thái Nguyên). Kết quả so sánh các chỉ số 
DB-I và Kappa cho thấy, đối với thử nghiệm 1, giá trị đạt được khi sử dụng thuật toán 
Mountain là 2,1974 (DB-I) và 0,6732 (Kappa), so với 5,2312 và 3,7612 (DB-I), 0,4256 
và 0,5721 (Kappa) khi phân loại bằng thuật toán K-Means và ISODATA tương ứng. 
Trong khi đó, với thử nghiệm 2, giá trị các chỉ số DB-I và Kappa khi phân loại bằng 
thuật toán Mountain là 2,3721 (DB-I) và 0,7183 (Kappa), so với 4,2413 (DB-I) và 
0,5843 (Kappa) đối với K – Means; 3,4198 (DB-I) và 0,6259 (Kappa) đối với 
ISODATA. Như vậy, có thể khẳng định, phương pháp sử dụng thuật toán Mountain đã 
cải thiện đáng kể độ chính xác khi phân loại lớp phủ từ ảnh vệ tinh khi so sánh với các 
thuật toán không giám sát như K – Means và ISODATA. 
TÀI LIỆU THAM KHẢO 
1. Trịnh Lê Hùng, Mai Đình Sinh (2014), “Phát hiện và phân loại vết dầu trên biển từ 
tư liệu ảnh ENVISAT sử dụng phương pháp lọc thích nghi và Fuzzy logic”, Tạp chí 
Dầu khí, số 05, tr.49-55. 
2. Ali Asghar Torahi, Suresh Chand Rai (2011), “Land Cover Classification and Forest 
Change Analysis Using Satellite Imagery - A Case Study in Dehdez Area of Zagros 
Mountain in Iran”, Journal of Geographic Information System, 3, pp.1-11. 
TẠP CHÍ KHOA HỌC ĐHSP TPHCM Mai Đình Sinh và tgk 
_____________________________________________________________________________________________________________ 
143 
3. Davies, DL, Bouldin, D.W. (1979), “A cluster separation measure”. IEEE 
Transactions on Pattern Analysis and Machine Intelligence, Vol. 1, No2. 
4. Dunn, J. C. (1974), “Well separated clusters and optimal fuzzy partitions”, J. Cybern. 
Vol.4, pp. 95-104. 
5. Junnian Wanga, Jianxun Liu and Lanxia Liu, “A mountain means clustering 
algorithm”, Proceedings of the 7th World Congress on Intelligent Control and 
Automation, China, pp. 5045-5049. 
6. Jung W.Lee, Se0 H.Son, Soon H.Kwon (2001), “Advanced Mountain Clustering 
Method”, ©2001 IEEE, pp. 275-280. 
7. R. Geerken, B. Zaitchik, J.P. Evans (2005), “Classifying rangeland vegetation type 
and coverage from NDVI time series using Fourier Filtered Cycle Similarity”, 
International Journal of Remote Sensing, Vol. 26, No. 24, pp. 5535–5554. 
8. Rouse J.W., Hass R.H., Schell J.A., Deering D.W. (1973), “Monitoring vegetation 
systems in the Great Plains with ERTS”, In 3rd ERTS symposium, NASA SP-351 I, 
1973, pp. 309 – 317. 
9. Mai Dinh Sinh, Trinh Le Hung, Dao Khanh Hoai (2015), “Unsupervised 
Classification using Fuzzy Probability and Fuzzy Clustering for LANDSAT Satellite 
Imagery”, Nation Conference of GIS 2015, Hanoi, pp. 7-11. 
10. Miin-Shen Yang and Kuo-Lung Wu, “A modified mountain clustering algorithm”, 
THEORETICAL ADVANCES, pp. 25-38. 
11. National Aeronautics and Space Administration (NASA), LANDSAT Science data 
user’s Handbook, 270. 
12. Nishchal K. Verma, Payal Gupta, Pooja Agrawal, M. Hanmandluc, Shantaram 
Vasikarla and Yan Cui (2009), “Medical Image Segmentation Using Improved 
Mountain Clustering Approach”, Sixth International Conference on Information 
Technology: New Generations, pp. 1307-1312. 
13. Sinh Dinh Mai, Long Thanh Ngo (2015), “Interval Type-2 Fuzzy C-Means 
Clustering with Spatial Information for Land-Cover Classification”, The 7th Asian 
Conference on Intelligent Information and Database Systems (ACIIDS 2015), part I, 
Springer LNAI 9011, pp. 387-397. 
14. Veronica S. Moertini (2002), “Introduction to five data clustering algorithms”, 
INTEGRAL, Vol. 7, No. 2, pp. 87-96. 
15. Weina Wang, Yunjie Zhang, Yi Li and Xiaona Zhang (2006), “The Global Fuzzy C-
Means Clustering Algorithm”, Proceedings of the 6th World Congress on Intelligent 
Control and Automation, June 21 - 23, 2006, Dalian, China. 
16.  
(Ngày Tòa soạn nhận được bài: 12-01-2016; ngày phản biện đánh giá: 23-02-2016; 
ngày chấp nhận đăng: 17-3-2016) 

File đính kèm:

  • pdfphuong_phap_ban_giam_sat_trong_phan_loai_lop_phu_tren_anh_ve.pdf