Tích hợp Ontology với tiếp cận lý thuyết đồng thuận - Tich hop Ontology voi tiep can ly thuyet dong thuan

Tóm tắt Tích hợp Ontology với tiếp cận lý thuyết đồng thuận: ...số kết quả và hướng áp dụng của lý thuyết đồng thuận TÍCH HỢP ONTOLOGY VỚI TIẾP CẬN LÝ THUYẾT ĐỒNG THUẬN 243 cho bài toán xử lý tri thức được trình bày trong [13]. Trong phần này của bài báo, chúng tôi giới thiệu một số khái niệm cơ bản của lý thuyết đồng thuận được sử dụng cho bài toán tích hợp... thuận phải là đại diện tốt nhất cho các phương án đã được đề xuất trong hồ sơ, chúng ta phải dùng tiêu chuẩn O1 để xây dựng hàm chọn đồng thuận. - Nếu phương án hợp lý là độc lập với các phương án được đưa ra bởi các thành viên, theo nghĩa, phương án đồng thuận phải phản ánh tất cả các khía cạnh...ái niệm bất kỳ c1, c2 trên cây phân cấp, ta tính khoảng cách ngữ nghĩa giữa chúng theo thuật toán sau [7]: Đầu vào: hai khái niệm c1, c2 thuộc cây phân cấp. Đầu ra: giá trị khoảng cách ngữ nghĩa Sem_Dis (c1, c2). Thủ tục: if (c1, c2 là cùng một khái niệm) Sem_Disc(c1, c2) := 0 else if (tồn tại...
14 trang | Chia sẻ: havih72 | Lượt xem: 459 | Lượt tải: 0Free
Nội dung tài liệu Tích hợp Ontology với tiếp cận lý thuyết đồng thuận, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
trị x, 3 phần
tử có giá trị y, 1 phần tử có giá trị z. Ta viết |X| = 6.
• Người ta có thể viết tương đương X = {2 ∗ x, 3 ∗ y, z}.
• Hồ sơ X được gọi là bội của hồ sơ Y , ký hiệu X = n ∗ Y nếu Y = {x1, x2, . . . , xk} và
X = {n ∗ x1, n ∗ x2, . . . , n ∗ xk}.
• Hồ sơ X được gọi là đồng nhất nếu mọi phần tử của nó đều giống nhau, tức là X =
{n ∗ x} với n ∈ N, x ∈ U . Ngược lại n, ta nói X là không đồng nhất.
• Hồ sơ X được gọi là phân biệt được nếu các phần tử của nó là khác nhau từng đôi một.
• Hồ sơ X được gọi là chính quy nếu nó là không phân biệt được hoặc là bội của một hồ
sơ không phân biệt được.
• Tổng (∪˙) của hai hồ sơ là một hồ sơ được thành lập theo quy tắc sau: Nếu x xuất hiện
trong hồ sơ X và hồ sơ Y tương ứng n và n′ lần thì trong hồ sơ tổng, x xuất hiện n+n′
lần.
• Hiệu (-) của hai hồ sơ là một hồ sơ được thành lập theo quy tắc sau: Nếu x xuất hiện
trong hồ sơ X và hồ sơ Y tương ứng và n′ lần thì trong hồ sơ hiệu, x xuất hiện n− n′
lần nếu n > n′, xuất hiện 0 lần nếu ngược lại.
244 NGUYỄN VĂN TRUNG, PHAN BÁ TRÍ, HOÀNG HỮU HẠNH
• Hồ sơ X được gọi là con của hồ sơ Y , ký hiệu X ⊆ Y nếu mỗi phần tử trong X có số
lần xuất hiện không lớn hơn số lần xuất hiện trong hồ sơ Y .
3.1.1. Hàm khoảng cách và một số biểu thức trên hàm khoảng cách
Hàm khoảng cách d : U × U → [0, 1] được định nghĩa để đảm bảo các tính chất sau:
• Tính không âm: ∀x, y ∈ U : d (x, y) ≥ 0,
• Tính phản xạ: ∀x, y ∈ U : d (x, y) = 0⇔ x = y,
• Tính đối xứng: ∀x, y ∈ U : d (x, y) = d(y, x).
Người ta gọi (U, d) là một không gian khoảng cách và định nghĩa một số biểu thức với
hàm khoảng cách như sau:
Với X ∈∏(U), i = 1, 2:
• di (x,X) = ∑
y∈X
di(x, y), với x ∈ U .
• dit_mean (X) = 1k(k+1)
∑
x,y∈X
di (x, y), với k = |X|.
• dimin (X) = min{di (x,X) : x ∈ U}
• dimax (X) = max{di (x,X) : x ∈ U}
Trong trường hợp i = 1, chỉ số i có thể được bỏ qua, chẳng hạn ta có thể viết d(x,X)
thay cho d1(x,X).
3.1.2. Hàm chọn đồng thuận và các tiêu chuẩn cho hàm chọn đồng thuận
Hàm chọn đồng thuận C :
∏
(U) → 2U được định nghĩa trong không gian khoảng cách
(U, d) biểu diễn lựa chọn đồng thuận cho một hồ sơ xung đột.
Như vậy, với một hồ sơ xung đột X ∈ ∏(U), C(X) là một tập hợp (không lặp) chứa các
phương án đồng thuận đồng thuận của hồ sơ xung đột X; mỗi phần tử của C(X) được gọi là
một phần tử đồng thuận của hồ sơ X.
Người ta ký hiệu Con(U) là tập tất cả hàm chọn đồng thuận trong không gian khoảng
cách (U, d). Một hàm chọn đồng thuận C ∈ Con(U) được đánh giá qua các tính chất sau:
1) Tin cậy (Reliability), ký hiệu là Re, nếu và chỉ nếu C (X) 6= ∅.
2) Đồng nhất (Unanimity), ký hiệu là Un, nếu và chỉ nếu C ({n ∗ x}) = {x} với mỗi n ∈ N
và x ∈ U .
3) Đơn giản (Simplification), ký hiệu là Si, nếu và chỉ nếu
(X là bội củaY )⇒ (C (X) = C(Y )) .
4) Gần-nhất quán (Quasi-unanimity), ký hiệu là Qu, nếu và chỉ nếu
(x /∈ C (X))⇒ (∃n ∈ N : x ∈ C (X ∪ {n∗x})) .
TÍCH HỢP ONTOLOGY VỚI TIẾP CẬN LÝ THUYẾT ĐỒNG THUẬN 245
5) Nhất quán (Consistency), ký hiệu là Co, nếu và chỉ nếu
(x ∈ C (X))⇒ x ∈ C(X∪˙{x})
6) Nhất quán Condorcet (Condorcet consistency), ký hiệu là Cc, nếu và chỉ nếu
(C (X1) ∩ C (X2) 6= ∅)⇒ (C (X1∪˙X2) = C (X1) ∩ C (X2)) với mọi X1, X2 ∈
∏
(U).
7) Nhất quán tổng quát (General consistency), ký hiệu là Gc nếu và chỉ nếu
C (X1) ∩ C (X2) ⊆ C (X1∪˙X2) ⊆ C (X1) ∪ C (X2) với mọi X1, X2 ∈
∏
(U)
8) Đồng biến (Proporiton), ký hiệu là Pr, nếu và chỉ nếu
(X1 ⊆ X2 ∧ x ∈ C (X1) ∧ y ∈ C (X2))⇒ (d (x,X1) ≤ d (y,X2)) với mọi X1, X2 ∈
∏
(U).
9) Tối ưu-1 (1-Optimality), ký hiệu O1, nếu và chỉ nếu
x ∈ C (X)⇒ d (x,X) = miny∈Ud (y,X) với mọi X ∈
∏
(U).
10) Tối ưu-2 (2-Optimality), ký hiệu O2, nếu và chỉ nếu
x ∈ C (X)⇒ d2 (x,X) = miny∈Ud2 (y,X) với mọi X ∈
∏
(U).
Tuỳ theo tính chất của từng bài toán lựa chọn đồng thuận, người ta sẽ xây dựng hàm
chọn đồng thuận cụ thể nhằm thoả mãn các tiêu chuẩn trên. Hàm chọn đồng thuận càng thoả
mãn nhiều tiêu chuẩn thì càng có giá trị. Trong [13] đã chứng minh rằng không có hàm chọn
đồng thuận nào thoả mãn cả 10 tiêu chuẩn nói trên. Tuy nhiên [13] cũng đã chỉ ra một số phụ
thuộc lẫn nhau của các tiêu chuẩn này. Những phụ thuộc quan trọng nhất là:
a) (O1 ∧Re)⇔ (Pr ∧Qu ∧Re ∧ Co ∧ Si)
b) (Pr ∧Qu ∧Re)⇒ Un.
c) (O2 ∧Re)⇔ (Co ∧Qu ∧ Un ∧ Si).
Kết quả này được dùng làm cơ sở để xây dựng các hàm đồng thuận cho hai lớp bài toán
chính sau đây. Giả sử cần đưa ra phương án hợp lý từ một bộ các giải pháp được cho bởi các
thành viên (tức là cần chọn ra phương án đồng thuận từ một hồ sơ xung đột):
- Nếu phương án hợp lý phải phụ thuộc vào các phương án của các thành viên, theo nghĩa,
phương án đồng thuận phải là đại diện tốt nhất cho các phương án đã được đề xuất
trong hồ sơ, chúng ta phải dùng tiêu chuẩn O1 để xây dựng hàm chọn đồng thuận.
- Nếu phương án hợp lý là độc lập với các phương án được đưa ra bởi các thành viên,
theo nghĩa, phương án đồng thuận phải phản ánh tất cả các khía cạnh của các phương
án đã được đề xuất trong hồ sơ (ở mức có thể thoả hiệp được), chúng ta phải dùng tiêu
chuẩn O2 để xây dựng hàm chọn đồng thuận.
246 NGUYỄN VĂN TRUNG, PHAN BÁ TRÍ, HOÀNG HỮU HẠNH
3.1.3. Tính khả đồng thuận của hồ sơ xung đột
Hàm chọn đồng thuận thoả mãn tiêu chuẩn O1 (tương ứng, O2) được gọi là hàm-O1 (tương
ứng, hàm-O2). Phương án đồng thuận được xác định bằng hàm-O1 (tương ứng, hàm-O2) được
gọi là đồng thuận- O1 (tương ứng, đồng thuận O2).
Không phải từ hồ sơ xung đột nào cũng chọn ra được phương án đồng thuận nói chung
và đồng thuận O1 hay O2 nói riêng. Người ta đã chỉ ra tính khả đồng thuận đối với các hàm
đồng thuận được xây dựng theo tiêu chuẩn O1 và O2 như sau: Trong không gian khoảng cách
(U, d), hồ sơ X ∈ ∏ (U) là khả đồng thuận theo tiêu chuẩn Oi (i = 1, 2) nếu và chỉ nếu
dit_mean(X) > dimin(X).
3.2. Tích hợp ontology mức khái niệm theo tiếp cận lý thuyết đồng thuận
Định nghĩa 3.1 (Ontology) Ontology là một bộ bốn 〈C, I,R, Z〉, trong đó:
• C là tập hợp các khái niệm (lớp).
• I là tập hợp các thể hiện (instance) của các lớp.
• R là tập hợp các quan hệ nhị phân định nghĩa trên C.
• Z là tập các tiên đề, là các công thức logic bậc nhất và có thể được diễn giải dưới
dạng ràng buộc toàn vẹn hoặc các mối quan hệ giữa các thể hiện và các khái niệm, mà
không thể được biểu diễn được bằng các quan hệ trong R.
Định nghĩa 3.2 (Thế giới thực) Gọi A là một tập hữu hạn các thuộc tính. Mỗi thuộc
tính a ∈ A có một miền Va.
Với V = ∪a∈AVa, ta nói (A, V ) mô tả một thế giới thực.
Một ontology tham chiếu đến thế giới thực (A, V ) được gọi là ontology dựa trên (A, V ).
Định nghĩa 3.3 (Cấu trúc khái niệm trong ontology) Một khái niệm của ontology
dựa trên (A, V ) được định nghĩa dưới dạng bộ ba (c, Ac, V c), trong đó:
• c là tên của khái niệm,
• Ac ⊆ A là tập thuộc tính mô tả khái niệm c,
• V c = ∪a∈AcVa là miền của các thuộc tính (V c ⊆ V ).
Cặp (Ac, V c) được gọi là cấu trúc của khái niệm c.
Định nghĩa 3.4 (Quan hệ giữa các thuộc tính) Cặp thuộc tính a, b trong định nghĩa
cấu trúc của một khái niệm có thể có quan hệ sau:
• tương đương: thuộc tính a được gọi là tương đương với thuộc tính b, viết là a↔ b, nếu
a và b cùng phản ánh một đặc trưng cho các thể hiện của khái niệm. Nói cách khác,
chúng là các tên khác nhau của một đặc trưng của khái niệm. Ví dụ: ngheNghiep↔ job.
• tổng quát hơn: thuộc tính a được gọi là tổng quát hơn thuộc tính b, viết là, a → b,
khi thông tin được cho bởi thuộc tính a có chứa thông tin được cho bởi thuộc tính b.
Ví dụ: dayOfBirth→ age.
TÍCH HỢP ONTOLOGY VỚI TIẾP CẬN LÝ THUYẾT ĐỒNG THUẬN 247
• trái ngược: thuộc tính a được gọi là trái ngược với thuộc tính b, viết là a ↓ b, nếu miền
của chúng cùng là tập hợp 2 giá trị và giá trị mô tả của hai thuộc tính này cho cùng một
thể hiện là trái ngược nhau. Ví dụ: isFree ↓ isLent, với VisFree = VisLent = {true, false}
giúp mô tả, chẳng hạn, các thực thể thuộc khái niệm sách là còn rảnh (isFree) hay đã
được cho ai đó mượn rồi (isLent).
3.2.1. Phát biểu bài toán tích hợp ontology ở cấp độ khái niệm
Gọi O1,O2, . . . ,On (n ∈ N) là các ontology dựa trên (A, V ). Khái niệm c được mô tả trong
Oi là
(
c, Ai, V i
)
, i = 1, 2, . . . , n. Ta phát biểu bài toán tích hợp ontology mức khái niệm như
sau:
Cho một bộ các cặp: X =
{(
Ai, V i
)
: i = 1, 2, . . . , n
}
trong đó
(
Ai, V i
)
là cấu trúc của
khái niệm c trong ontology Oi. Cần tìm bộ tích hợp (A∗, V ∗) đại diện tốt nhất các cặp đã cho
để mô tả cấu trúc của khái niệm c.
3.2.2. Các quy tắc để xác định bộ tích hợp tối ưu (A∗, V ∗)
[13] đề xuất các tiêu chuẩn R1-R7 dưới đây để xây dựng thuật toán tìm bộ tích hợp tối
ưu (A∗, V ∗):
R1. Với mọi a, b ∈ A = ∪ni=1Ai, a ↔ b thực hiện thay thế thuộc tính a trong mọi tập hợp
Ai bởi thuộc tính b hoặc ngược lại.
R2. Nếu trong tập thuộc tính bất kỳ Ai xuất hiện đồng thời a và b mà a→ b thì có thể loại
bỏ thuộc tính b.
R3. Với mọi a, b ∈ A = ∪ni=1Ai, a ↓ b, thực hiện thay thế thuộc tính a trong mọi tập hợp Ai
bởi thuộc tính b hoặc ngược lại.
R4. Sự xuất hiện của một thuộc tính trong A∗ phải chỉ phụ thuộc vào sự xuất hiện của thuộc
tính này trong các tập hợp Ai.
R5. Một thuộc tính a xuất hiện trong A∗ nếu nó xuất hiện trong quá nửa tổng số lần xuất
hiện trong tập hợp các Ai.
R6. Tập A∗ là bằng với tập A sau khi áp dụng các quy tắc R1-R3.
R7. Với mỗi thuộc tính a ∈ A∗, miền của nó là Va (từ thế giới thực (A, V )).
Tuỳ theo tiêu chí chọn lựa tập thuộc tính của khái niệm tích hợp là “càng nhiều thuộc
tính càng tốt” hay “chỉ gồm những thuộc tính xuất hiện quá nửa”, chúng ta sẽ có các thuật
toán tương ứng thoả các tiêu chuẩn {R1-R4, R6, R7}, {R1-R5, R7}.
Chúng tôi nhận thấy: trên thực tế, không phải lúc nào miền của thuộc tính a trong các
ontology O1,O2, . . . , On cũng là giống nhau. Do đó, cần phải xác định một cách tường minh
miền cho thuộc tính này. Tiêu chuẩn R7 ở trên có thể được điều chỉnh lại như sau:
Với một thuộc tính a ∈ A∗, miền V ∗a được xác định bằng cách tìm đồng thuận từ hồ sơ
Xa =
{
V 1a , V
2
a , . . . , V
k
a
}
. Ở đây, Xa là hồ sơ xung đột thành lập từ các miền của thuộc tính
a trong các ontology O1,O2, . . . , On.
Phần còn lại của bài báo sẽ mô tả cách thức xây dựng không gian khoảng cách (U, d) và
thuật toán để tìm cấu trúc tích hợp thoả các tiêu chuẩn {R1-R4, R6, R7}.
248 NGUYỄN VĂN TRUNG, PHAN BÁ TRÍ, HOÀNG HỮU HẠNH
3.2.3. Hàm khoảng cách ngữ nghĩa giữa hai khái niệm trên cây phân cấp
Sử dụng ý tưởng từ [7] (Jike Ge và Yuhui Qiu, 2008), ta có thể tính khoảng cách ngữ nghĩa
giữa hai khái niệm c1, c2 trên cây phân cấp. Ý tưởng bắt đầu từ việc gán trọng số cho các
cạnh nối thể hiện quan hệ kế thừa trực tiếp trên cây phân cấp:
w (parent, children) = 1 +
1
2depth(child)
trong đó, depth(child) biểu thị độ sâu từ khái niệm child đến khái niệm gốc của cây phân
cấp. Với hai khái niệm bất kỳ c1, c2 trên cây phân cấp, ta tính khoảng cách ngữ nghĩa giữa
chúng theo thuật toán sau [7]:
Đầu vào: hai khái niệm c1, c2 thuộc cây phân cấp.
Đầu ra: giá trị khoảng cách ngữ nghĩa Sem_Dis (c1, c2).
Thủ tục:
if (c1, c2 là cùng một khái niệm)
Sem_Disc(c1, c2) := 0 else if (tồn tại đường đi trực tiếp từ c1 đến c2 trên cây phân cấp)
Sem_Disc(c1, c2) := w(c1, c2);
else if (tồn tại đường đi gián tiếp từ c1 đến c2 trên cây phân cấp)
{
Xác định shortestPath (c1, c2) là đường đi ngắn nhất từ c1 đến c2 trên cây phân cấp;
Sem_Disc(c1, c2) :=
∑
(ci,cj)∈shortestPath(c1,c2)
w(ci, cj);
}
else
{
Xác định cpp là khái niệm cha chung gần nhất của c1, c2 trên cây phân cấp;
Sem_Disc(c1, c2) := min {Sem_Disc(c1, cpp)}+min {Sem_Disc(c2, cpp)} ;
}
Rõ ràng, hàm Sem_Disc là chưa được chuẩn hoá. Chúng ta có thể chuẩn hoá nó để định
nghĩa một không gian khoảng cách (U, d) dựa trên cây phân cấp khái niệm như sau:
- U : tập các khái niệm của cây phân cấp khái niệm.
- d: U × U → [0, 1]
d(c1, c2) 7→ 1− 1
Sem_Disc(c1, c2) + 1
3.2.4. Thuật toán tích hợp ontology mức khái niệm dựa trên lý thuyết đồng
thuận
Trên cơ sở lý thuyết đồng thuận, chúng tôi đề xuất thuật toán xác định cấu trúc tích hợp
cho khái niệm c từ các ontology thành phần O1,O2, . . . , On như sau.
Đầu vào:
- Hồ sơ X =
{(
Ai, V i
)
, i = 1, . . . , n
}
, với
(
Ai, V i
)
là cấu trúc mô tả khái niệm c trong
ontology Oi.
TÍCH HỢP ONTOLOGY VỚI TIẾP CẬN LÝ THUYẾT ĐỒNG THUẬN 249
- Cây phân cấp khái niệm REF-TREE dùng để tham chiếu. CREF−TREE là tập các khái
niệm của cây phân cấp này.
- Không gian khoảng cách (U, d) được định nghĩa theo cây phân cấp khái niệm REF-TREE
như mô tả ở phần 3.2.3.
Đầu ra: Cặp (A∗, V ∗) đại diện tốt nhất lấy từ X để mô tả khái niệm c.
Thủ tục:
Bước 1: Đặt A∗ := ∪ni=1Ai;
Bước 2: Với mỗi cặp thuộc tính a, b ∈ A∗
• Nếu (a ↔ b) thì A∗ := A∗\{a} với điều kiện a không xuất hiện trong các mối quan hệ
với các thuộc tính khác của A∗;
• Nếu (a ↓ b) thì A∗ := A∗ \ {b} với điều kiện không xuất hiện trong các mối quan hệ với
các thuộc tính khác của A∗;
• Nếu (a→ b) thì A∗ := A∗ \ {b} với điều kiện b không xuất hiện trong các mối quan hệ
với các thuộc tính khác của A∗;
Bước 3: Với mỗi thuộc tính a ∈ A∗
{
• Đặt Xa =
{
V 1a , V
2
a , . . . , V
k
a
}
là hồ sơ chứa các miền của thuộc tính a được đặc tả trong
các cặp và V ja là các khái niệm trên cây phân cấp REF-TREE (i = 1, . . . , n; j =
1, . . . , k);
• Nếu Xa là khả đồng thuận theo tiêu chuẩn tối ưu O1 thì
{ – Xác định V ∗a là lựa chọn đồng thuận theo tiêu chuẩn tối ưu O1 trên không gian
khoảng cách (U, d);
– Gán V ∗a là miền cho thuộc tính a trong tập A∗;
}
Ngược lại thì gán A∗ := A∗ \ {a};
}
Bước 4: Với mỗi thuộc tính a từ A∗, bổ sung trở lại các thuộc tính b nếu có mối quan hệ a↔ b
hoặc a ↓ b;
Nhận xét:
- Độ phức tạp của thuật toán trên là O
(
m3
)
với m =
∣∣∪ni=1Ai∣∣ (m là số lượng thuộc tính
khác nhau lấy từ các tập hợp Ai, i = 1..n).
- Thuật toán trên chỉ mô tả việc thực hiện tích hợp các thuộc tính có miền là các khái
niệm thuộc cây phân cấp tham chiếu REF-TREE. Đối với các thuộc tính có miền không
phải là khái niệm mà là các giá trị sơ cấp (số, chuỗi), hoặc các khoảng giá trị, theo [12]
chúng ta vẫn có thể xác định miền tích hợp phù hợp cho thuộc tính bằng phương pháp
đồng thuận.
250 NGUYỄN VĂN TRUNG, PHAN BÁ TRÍ, HOÀNG HỮU HẠNH
- Thuật toán xác định cấu trúc đồng thuận cho khái niệm ở cả 2 thành phần: thuộc tính
và miền của thuộc tính. Tập thuộc tính này thoả các tiêu chuẩn R1-R4, R6, R7 ở phần
3.2.2.
Dưới đây là ví dụ đơn giản minh hoạ cho thuật toán này.
Cho thế giới thực (A, V ) được định nghĩa như sau:
• A = {cid, isTaughtBy, isF inish, isActive, sched, tkb}.
• Vcid = [1, 1000].
• VisTaughtBy = {AscProf, Prof,AssiProf,AcademicStaffMember}.
• VisF inish = {Y es,No}.
• VisActive = {Y es,No}.
• Vsched = {Mon, Tue,Wed, Thurs, Fri, Sat, Sun}.
• Vtkb = {Hai,Ba, Tu,Nam, Sau,Bay,CN}.
Mối quan hệ giữa các thuộc tính này là: {thoiKhoaBieu↔ sched, isF inish ↓ isActive}.
Các khái niệm của các ontology có tham chiếu đến cây phân cấp OREF−TREE ở Hình 1.
Trước hết, ta xây dựng không gian khoảng cách (U, d) từ cây phân cấp khái niệm này:
Trọng số của các cạnh nối trên cây phân cấp:
• w [Person,AcademicStaffMember] = 1 + 12 = 1.5
• w [AcademicStaffMember,AscProf] = 1 + 1
22
= 1.25
• w [AcademicStaffMember,Prof] = 1 + 1
22
= 1.25
• w [AcademicStaffMember,AssiProf] = 1 + 1
22
= 1.25.
Bảng mô tả cấu trúc của khái niệm course từ 5 ontology:
Ontology Cấu trúc của khái niệm course
O1 {(cid, [1, 1000]) , (isActive, VisActive) , (sched, Vsched) , (isTaughtBy,AssiProf)}
O2 {(cid, [1, 1000]) , (isF inish, VisF inish)}
O3 {(isActive, VisActive) , (tkb, VisF inish) , (cid, [1, 1000])}
O4 {(cid, [1, 1000]) , (isTaughtBy, Prof)}
O5 {(cid, [1, 1000]) , (isTaughtBy,AssiProf)}
Kết quả thực hiện thuật toán theo từng bước là như sau:
- Bước 1:
Khởi gán bộ cấu trúc tích hợp cho khái niệm course:
A∗ = {cid, isActive, sched, isTaughtBy, isF inish, tkb}
TÍCH HỢP ONTOLOGY VỚI TIẾP CẬN LÝ THUYẾT ĐỒNG THUẬN 251
- Bước 2:
Loại bỏ 2 thuộc tính isF inish và tkb. Sau bước này, ta có:
A∗ = {cid, isActive, sched, isTaughtBy}
- Bước 3:
Xét thuộc tính cid: Miền của cid được xác định theo [12] là V ∗cid = [1, 1000].
Xét thuộc tính isActive: Miền của isActive sẽ là V ∗isActive = {Y es,No}.
Xét thuộc tính sched: Miền của sched sẽ là
Vsched = {Mon, Tue,Wed, Thurs, Fri, Sat, Sun} .
Xét thuộc tính isTaughtBy. Thuộc tính này có các miền được tham chiếu từ cây phân
cấp OREF-TREE.
Lập hồ sơ xung đột XisTaughtBy = {2 ∗AssiProf, Prof}.
– d (Person, Prof) = 1115 = 0.73
– d (AcademicStaffMember,AscProf) =
– d (AcademicStaffMember, Prof) =
– d (AcademicStaffMember,AssiProf) = 59 = 0.56
– d (Prof,AssiProf) = 57 = 0.71
– d (Person,X) = 1120 = 0.55
– d (Prof,X) = 514 = 0.36
– d (AssiProf,X) = 528 = 0.18 d (AssocProf,X) =
5
21 = 0.238
– dt_mean (XisTaughtBy) = 521 = 0.238
– dmin(XisTaughtBy) = min {d(Person,X), d(AcademicStaffmember,X)} ,
– d (Prof,X) , d (AssiProf,X) , d (AscProf,X)} = 0.18 = d (AssiProf,X).
Như vậy ta có dt_mean (XisTaughtBy) > dmin (XisTaughtBy). Do đó hồ sơ X là khả đồng
thuận theo tiêu chuẩn tối ưu O1. Ta cũng xác định được, V ∗isTaughtBy = AssiProf .
- Bước 4:
Bổ sung trở lại A∗các thuộc tính isF inish và tkb. Kết quả cuối cùng, ta có cấu trúc
tích hợp để mô tả khái niệm course là như sau:
(shed, {Mon, Tue,Wed, Thurs, Fri, Sat, Sun}) , (isTaughtBy,AssiProf)}.
4. KẾT LUẬN
Bài báo đã trình bày một cách sử dụng lý thuyết đồng thuận kết hợp với độ đo tương tự
ngữ nghĩa giữa các khái niệm trên cây phân cấp khái niệm cho trước để tích hợp các ontology
có xung đột ở cấp độ khái niệm.
Trong những công trình tiếp theo, chúng tôi sẽ phân tích khả năng áp dụng tiêu chuẩn tối
ưu O2 trong bước 3 của thuật toán cũng như áp dụng kết quả của bài báo cho việc tích hợp
các ontology có xung đột ở các cấp độ khác.
252 NGUYỄN VĂN TRUNG, PHAN BÁ TRÍ, HOÀNG HỮU HẠNH
TÀI LIỆU THAM KHẢO
[1] I. Akbari, and M. Fathian, "A novel algorithm for ontology matching", Journal of In-
formation Science, v. 36, pp. 324-334, 2010
[2] J. P. Barthélemy, and M. F. Janowitz, “A formal theory of consensus", SIAM Journal
on Discrete Mathematics, vol. 4, no. 3, pp. 305-322, 1991.
[3] D. Beneventano, S. Bergamaschi, and F. Guerra, Semantic Annotation of Web Docu-
ments and Ontology evolution with the MOMIS System, 2001.
[4] S. Castano, A. Ferrara, and S. Montanelli, “H-MATCH: an Algorithm for Dynamically
Matching Ontologies in Peer-based Systems", in SWDB, pp. 231-250, September, 2003.
[5] Jérôme Euzenat and Pavel Shvaiko, Ontology matching, Second edition, Heidelberg:
Springer, 2013.
[6] Jérôme Euzenat et al, “Ontology alignment with OLA", in Proc. 3rd ISWC2004 work-
shop on Evaluation of Ontology-based tools (EON), 2004.
[7] J. Ge, and Y. Qiu, "Concept similarity matching based on semantic distance", In Se-
mantics, Knowledge and Grid, 2008. SKG’08. IEEE, pp. 380-383, December, 2008.
[8] F. Giunchiglia, P. Shvaiko, and M. Yatskevich, S-Match: an algorithm and an imple-
mentation of semantic matching, Springer Berlin Heidelberg, pp. 61-75, 2004.
[9] T. Gruber, What is an Ontology, 1993.
[10] Y. Li, Q. Zhong, J. Li, and J. Tang, “Results of ontology alignment with RiMOM", in
Proceedings of International Workshop on Ontology Matching (OM), Busan, Korea, pp.
227–235, 2007.
[11] P. Mitra and G. Wiederhold, “Resolving terminological heterogeneity in ontologies", in
Proceedings of the ECAI workshop on Ontologies and Semantic Interoperability, July,
2002.
[12] N. T. Nguyen, “Representation choice methods as the tool for solving uncertainty in
distributed temporal database systems with indeterminate valid time", In Engineering
of Intelligent Systems, Springer Berlin Heidelberg, pp. 445-454, 2002.
[13] N. T. Nguyen, Advanced Information and Knowledge Processing, Springer, pp. 1-362,
2008.
[14] Q. Umer, and D. Mundy, “Semantically intelligent semiautomated ontology integration",
in Proceedings of the World Congress on Engineering 2012 Vol II, WCE 2012, 4–6 July,
London, UK, 2012.
Ngày nhận bài 18 - 4 - 2014
Nhận lại sau sửa 28 - 8- 2014
File đính kèm:
tich_hop_ontology_voi_tiep_can_ly_thuyet_dong_thuan.pdf