Đề xuất các phương pháp tính độ tương tự đỉnh dựa trên xu hướng ứng dụng cho bài toán khuyến nghị công tác - De xuat cac phuong phap tinh do tuong tu dinh dua tren xu huong ung dung cho bai toan khuyen nghi cong tac

Tóm tắt Đề xuất các phương pháp tính độ tương tự đỉnh dựa trên xu hướng ứng dụng cho bài toán khuyến nghị công tác: ...ạng xã hội, cụ thể là mạng đồng tác giả cho các bài toán khuyến nghị trong nghiên cứu khoa học đã chứng tỏ được khả năng tiềm ẩn và ưu điểm của nó thông qua các thực nghiệm, đánh giá [3, 12, 13, 14, 16]. Tuy nhiên hầu hết các nghiên cứu này đều chưa quan tâm đến yếu tố xu hướng nghiên cứu, cũng n...ng có trọng số. Chen và đồng nghiệp cũng đã dùng độ đo này để khám phá các liên kết tiềm năng trong mạng đồng tác giả [4, 20]. Tuy nhiên, yếu tố xu hướng thì chưa được họ quan tâm trong RSS. Ở đây, ta đã đưa xu hướng cộng tác vào RSS và cải tiến RSS thành RSS+. Với RSS+ thì độ tương tự đỉnh có th...hiệm trên ĐỀ XUẤT CÁC PHƯƠNG PHÁP TÍNH ĐỘ TƯƠNG TỰ ĐỈNH DỰA TRÊN XU HƯỚNG 347 tập DBLP cho thấy các phương pháp đề xuất RSS+,MPRS,MPRS+ cho kết quả tốt hơn so với các phương pháp tương tự đỉnh phổ biến hiện nay. Bảng 2. Kết quả tiên đoán liên kết đồng tác giả trên tập thực nghiệm DBLP ...
13 trang | Chia sẻ: havih72 | Lượt xem: 375 | Lượt tải: 0
Nội dung tài liệu Đề xuất các phương pháp tính độ tương tự đỉnh dựa trên xu hướng ứng dụng cho bài toán khuyến nghị công tác, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
ờng đi
đơn từ X đến Y có “bán kính” (số đỉnh trên đường đi) nhỏ hơn hay bằng r. Như vậy
WeightOf_DirectPathp(X,Y ) được tính như sau
WeightOf_DirectPathp(X,Y ) =

k−1∏
i=1
Direct_SimMPRS(Zi, Zi+1), nếu k ≤ r,
0, ngược lại.
(3)
Tóm lại, tương tự của hai đỉnh X,Y trong mạng theo phương pháp MPRS có thể tính
như sau
SimMPRS(X,Y ) = Indirect_SimMPRS(X,Y ).
344 HUỲNH NGỌC TÍN, HOÀNG VĂN KIẾM
4.2. Tương tự đỉnh dựa trên đường đi cực đại và yếu tố xu hướng (MPRS+)
Tương tự MPRS, nhưng với MPRS+ sẽ xem xét yếu tố xu hướng cộng tác để lượng hóa
mức độ quan hệ của hai đỉnh trong mạng đồng tác giả. Độ tương tự giữa hai đỉnh bất kỳ theo
MPRS+ được tính như sau:
Gọi Direct_SimMPRS+(X,Y ) là trọng số cạnh nối giữa hai đỉnh X,Y bất kỳ. Khi đó
Direct_SimMPRS+(X,Y ) =

f(Trend)XY∑
∀Z∈NX
f(Trend)XZ
, nếu X và Y có liên kết trực tiếp
0, ngược lại
(5)
trong đó, f(Trend)XY là một hàm phụ thuộc yếu tố xu hướng cộng tác, NX là tập hợp các
đỉnh lận cận của X.
Với hàm f(Trend)XY , có thể dùng hệ số k và thông số t để đánh giá mức độ ảnh hưởng của
các quan hệ đồng tác giả dựa trên yếu tố xu hướng. Hàm f(Trend)XY có thể định nghĩa như
sau
f(Trend)XY = f(t)XY = k ∗ n1(t) + (1− k) ∗ n2(t), (6)
trong đó, k là hệ số ảnh hưởng đến xu hướng cộng tác, n1(t) cho biết số lần mà X đồng tác
giả với Y trong t năm gần đây, n2(t) cho biết số lần mà X đồng tác giả với Y trước đây hơn
t năm.
Trong thực nghiệm, ta thay đổi các tham số k và t để đánh giá hiệu năng của phương
pháp đề xuất.
4.3. Tương tự đỉnh dùng phương pháp RSS+ (cải tiến từ RSS)
Chen và đồng nghiệp đã đề xuất một phương pháp tương tự đỉnh dựa trên mức độ quan
hệ giữa hai đỉnh bất kỳ trong mạng đồng tác giả, gọi là RSS (Relation Strength Similarity)
[3]. RSS là một độ đo bất đối xứng, áp dụng cho mạng có trọng số. Chen và đồng nghiệp cũng
đã dùng độ đo này để khám phá các liên kết tiềm năng trong mạng đồng tác giả [4, 20]. Tuy
nhiên, yếu tố xu hướng thì chưa được họ quan tâm trong RSS. Ở đây, ta đã đưa xu hướng
cộng tác vào RSS và cải tiến RSS thành RSS+. Với RSS+ thì độ tương tự đỉnh có thể được
tính như sau:
Gọi Direct_SimMPRS(X,Y ) trọng số cạnh nối giữa hai đỉnh X,Y bất kỳ. Khi đó,
Direct_SimRSS+(X,Y ) =

f(Trend)XY∑
∀Z∈NX
f(Trend)XZ
, nếu X và Y có liên kết trực tiếp
0, ngược lại
(7)
trong đó, f(Trend)XY là một hàm phụ thuộc yếu tố xu hướng cộng tác, f(Trend)XY được tính
tương tự như phương pháp MPRS+, NX là tập hợp các đỉnh lận cận của X.
Trong trường hợp X và Y không có liên kết trực tiếp. Nếu trong mạng có một đường đi
đơn p từ X đến Y qua k đỉnh là Z1, Z2, Z3, ..., Zk (với Z1 là X, Zk là Y ), thì trọng số đường
đi có thể tính như sau
WeightOf_DirectPathp(X,Y ) =
k∏
i=1
Direct_SimRSS+(Zi, Zi+1). (8)
ĐỀ XUẤT CÁC PHƯƠNG PHÁP TÍNH ĐỘ TƯƠNG TỰ ĐỈNH DỰA TRÊN XU HƯỚNG 345
Trong trường hợp mạng đang xét có m đường đi đơn từ X đến Y là p1, p2, ..., pm thì khác
với phương pháp MPRS là chọn đường đi có trọng số cực đại (đường đi cộng tác có tích xác
suất cộng tác qua các đỉnh trung gian là lớn nhất). Với phương pháp RSS, cũng như RSS+
mức độ quan hệ của X và Y trong trường hợp này là tổng của các phân bố xác suất cộng tác
qua các con đường cộng tác trung gian có thể, tức Indirect_SimRSS+ có thể được tính như
sau
Indirect_SimRSS+(X,Y ) =
m∑
i=1
WeightOf_DirectPathpi(X,Y ). (9)
Tương tự như MPRS+, với những mạng có kích thước lớn ta chỉ xem xét các đường
đi đơn từ X đến Y có “bán kính” (số đỉnh trên đường đi) nhỏ hơn hay bằng r. Như vậy
WeightOf_DirectPathRSS+(X,Y ) được tính như sau
WeightOf_DirectPathp(X,Y ) =

k−1∏
i=1
Direct_SimRSS+(Zi, Zi+1), nếu k ≤ r,
0, ngược lại.
(10)
Tóm lại, độ đo RSS+ của hai đỉnh X,Y bất kỳ trong mạng có thể tính như sau
SimRSS+(X,Y ) = Direct_SimRSS+(X,Y ) + Indirect_SimRSS+(X,Y ). (11)
5. THỰC NGHIỆM VÀ ĐÁNH GIÁ
Hiện nay chưa có tập dữ liệu chuẩn để đánh giá cho bài toán khuyến nghị cộng tác. Hầu
hết các nhóm nghiên cứu đều tiến hành thực nghiệm trên tập dữ liệu do họ thu thập và xây
dựng. Tang và cộng sự thực nghiệm trên tập dữ liệu của hệ thống ArnetMiner cho bài toán
khuyến nghị cộng tác liên ngành [5]. Chen và cộng sự triển khai các thực nghiệm của họ trên
tập dữ liệu của CiteSeer cho bài toán khuyến nghị cộng tác, cũng như khám phá các liên kết
tiềm năng trên mạng đồng tác giả [2, 3, 20]. Các nhóm nghiên cứu kể trên chỉ đề cập đến số
liệu thực nghiệm rút ra như thế nào, chứ họ chưa công bố tập dữ liệu. Với tính phổ biến của
DBLP và hệ thống tìm kiếm Microsoft Academic Search, trong nghiên cứu của mình, nhóm tác
giả đã tiến hành thực nghiệm trên tập DBLP và tập dữ liệu rút trích từ website của Microsoft
Academic Search. Dữ liệu, cũng như mã nguồn sử dụng trong thực nghiệm của bài báo có thể
tham khảo và download tại trang web .
Về phương pháp đánh giá cho hệ khuyến nghị, đây là một vấn đề vẫn đang được nghiên
cứu. Đáng tin cậy nhất là khảo sát người dùng, phân tích phản hồi của người dùng thông qua
hệ thống, hoặc lấy ý kiến chuyên gia. Để làm được điều đó thì ta cần phải có hệ thống triển
khai sử dụng trên thực tế. Bên cạnh đó, một số nghiên cứu liên quan hiện nay dùng kết quả
tiên đoán liên kết đồng tác giả để đánh giá hiệu năng của các phương pháp khuyến nghị cộng
tác [2, 3, 5, 20]. Ở đây cũng dùng kết quả tiên đoán liên kết đồng tác giả để đánh giá, so sánh
hiệu năng các phương pháp đề xuất với các phương pháp khác.
5.1. Thiết lập dữ liệu thực nghiệm cho DBLP và MAS
Trong nghiên cứu này, ta sử dụng dữ liệu từ các bài báo công bố năm 2001 đến năm 2011
để tiến hành thực nghiệm. Dữ liệu 5 năm đầu (2001-2005) được dùng để xây dựng mạng huấn
346 HUỲNH NGỌC TÍN, HOÀNG VĂN KIẾM
luyện (training network). Để khách quan, ta chia mạng huấn luyện thành ba nhóm bậc khác
nhau: cao, trung bình và thấp. Những tác giả bậc cao là những tác giả có số bậc thuộc nhóm
1/3 bậc cao nhất của tất cả các bậc, những tác giả bậc thấp là những tác giả có số bậc thuộc
nhóm 1/3 bậc thấp nhất của tất cả các bậc, còn lại là những tác giả thuộc nhóm tác giả bậc
trung bình. Với mỗi loại nhóm bậc tác giả, ta chọn ngẫu nhiên 100 tác giả để tiến hành thực
nghiệm. Với mỗi tác giả, mức độ tương tự với tất cả những người còn lại trong mạng được
tính và Top−n những người tương tự nhất được trả về theo các phương pháp khác nhau. Độ
chính xác Precision cho tiên đoán liên kết đồng tác giả được tính dựa vào mạng đồng tác giả
tương lai gần (2006-2008) và mạng đồng tác giả trong tương lai xa (2009-2011).
5.2. Kết quả thực nghiệm
5.2.1. Khảo sát tham số xu hướng k và t
Trong thực nghiệm, ta ước lượng tham số k và t dựa trên kinh nghiệm và khảo sát hiệu
năng của phương pháp RSS+ khi thực nghiệm với nhiều k, t khác nhau. Lần lượt t nhận các
khoảng thời gian là 1, 2, 3, 4 năm, và k lần lượt được thực nghiệm với 0.6, 0.7, 0.8 và 0.9. Kết
quả tốt nhất thu được với k = 0.9 và t = 1 trong hầu hết các trường hợp (Bảng 1). Với việc
Bảng 1. Khảo sát hệ số k và n1(t) khi lượng hóa yếu tố xu hướngBảng 1: Khảo sát hệ số k và n1(t) khi lượng hóa yếu tố xu hướng 
RSS+ khi lượng hóa xu hướng và tiên đoán tương lai gần ([2006-2008]) 
n1(t) = 1 ([2005]) n1(t) = 2 ([2004-2005]) 
K Top 1 Top 2 Top 3 Top 4 Top 5 Top 1 Top 2 Top 3 Top 4 Top 5 
0.6 0.7200 0.6745 0.6350 0.5998 0.5673 0.7200 0.6761 0.6350 0.6023 0.5747 
0.7 0.7533 0.6878 0.6451 0.6158 0.5922 0.7333 0.6861 0.6496 0.6133 0.5922 
0.8 0.7400 0.6928 0.6596 0.6284 0.6070 0.7433 0.6945 0.6496 0.6208 0.5915 
0.9 0.7567 0.7045 0.6540 0.6225 0.5956 0.7400 0.6978 0.6440 0.6149 0.5983 
n1(t) = 3 ([2003-2005]) n1(t) = 4 ([2002-2005]) 
K Top 1 Top 2 Top 3 Top 4 Top 5 Top 1 Top 2 Top 3 Top 4 Top 5 
0.6 0.7167 0.6661 0.6283 0.5931 0.5633 0.7033 0.6494 0.6127 0.5814 0.5545 
0.7 0.7167 0.6811 0.6350 0.5973 0.5740 0.7033 0.6511 0.6138 0.5847 0.5579 
0.8 0.7200 0.6895 0.6440 0.6023 0.5734 0.7000 0.6561 0.6205 0.5898 0.5612 
0.9 0.7167 0.6878 0.6350 0.6040 0.5774 0.6933 0.6561 0.6239 0.5872 0.5606 
ước lượng các tham số k, t bằng thực nghiệm cho hàm xu hướng f(Trend), ta được kết quả tốt
nhất với k = 0.9 và t = 1. Như vậy trong các thực nghiệm kế tiếp, thì hàm xu hướng được
chọn là
f(Trend)XY = f(t)XY = 0.9 ∗ n1(1) + (1− 0.9) ∗ n2(1)
trong đó, n1(1) cho biết số lần mà X đồng tác giả với Y trong 1 năm gần đây, n2(1) cho biết
số lần mà X đồng tác giả với Y trước đây hơn 1 năm.
5.2.2. Thực nghiệm trên tập DBLP
Với việc thiết lập dữ liệu thực nghiệm được mô tả như trong mục 5.1 và hàm f(Trend)
đã chọn trong mục 5.2.1, cho phép đánh giá độ chính xác tiên đoán liên kết đồng tác giả
(Precision) với Top-1, Top-2, Top-3, Top-4, Top-5 những đỉnh tương tự nhất được trả về. Với
Top-5 những đỉnh tương tự nhất được trả về thì MPRS+, RSS+ có độ chính xác (Precision)
lần lượt là 0.61, 0.60 cho tiên đoán đồng tác giả trong tương lại gần (2006-2008) và lần lượt
là 0.33, 0.32 cho tiên đoán đồng tác giả trong tương lai xa (2009-2011). Trong khi các phương
pháp tương tự đỉnh phổ biến hiện nay cao nhất là RSS chỉ đạt 0.55 với tiên đoán tương lai
gần và 0.30 với tiên đoán tương lai xa (Bảng 2, Hình 3). Như vậy, kết quả thực nghiệm trên
ĐỀ XUẤT CÁC PHƯƠNG PHÁP TÍNH ĐỘ TƯƠNG TỰ ĐỈNH DỰA TRÊN XU HƯỚNG 347
tập DBLP cho thấy các phương pháp đề xuất RSS+,MPRS,MPRS+ cho kết quả tốt hơn
so với các phương pháp tương tự đỉnh phổ biến hiện nay.
Bảng 2. Kết quả tiên đoán liên kết đồng tác giả trên tập thực nghiệm DBLP
     
   
   
       	 
            
    
         ﬀ 
  
ﬁ ﬂ ﬃ  ! " # $ % & $
 ' ( ) * + + , - * + + . /
0 1 2  3 4 5  6     7 8 1  9 ﬃ
ﬁ ﬂ ﬃ  ! " # $ % & $
 ' * ) * + + : - * + ( ( /
0 1 2  3 4 5  6     7 8 1 ; 8
< =

(
< =

*
< =

>
< =

?
< =

@
< =

(
< =

*
< =

>
< =

?
< =

@
A B C D E F G H I J G H I K G H L M G H L J G H L N G H K O G H K K G H K P G H P M G H P O
Q R S S R T U
G H N K G H I I G H I P G H L M G H L J G H L G G H K I G H K K G H K P G H K G
V
U R W
D
S
V
U R T
G H X P G H N N G H N K G H I O G H I I G H I K G H L N G H L G G H K J G H K N
Y Z Z
G H J G G H X I G H X G G H N J G H N N G H I K G H L X G H L I G H L K G H L G
[ \ \ ]
+ ^ _ , + ^ _ + + ^ ,
@
+ ^ , * + ^ , + + ^
?
. + ^
?
+ + ^
>
_ + ^
> ?
+ ^
>
*
ﬁ ` [ \
+ ^ _ + + ^ ,
?
+ ^ , ( + ^
@
. + ^
@ @
+ ^
?
( + ^
>
@
+ ^
> ?
+ ^
>
* + ^ * :
ﬁ ` [ \ ]
+ ^ _ _ + ^ _ ( + ^ , _ + ^ ,
?
+ ^ , ( + ^
?
_ + ^
?
* + ^
>
. + ^
>
@
+ ^
> >
   
   
   
   
   
   
   
  	 











              
ﬀ
    ﬁ    	 ﬂ
ﬃ    ! "   # $   %    & 

              '
ﬀ
   ( ﬁ     ﬂ
ﬃ    ! "   # $   %   ) 
*  + , - .
/ 0 1 1 0 2 3
4 3 0 5 , 1 4 3 0 2
6 7 7
6 7 7 8
9 : 6 7
9 : 6 7 8
Hình 3. Kết quả tiên đoán liên kết đồng tác giả trên tập thực nghiệm DBLP
5.2.3. Thực nghiệm trên tập MAS
Tương tự với việc tiến hành thực nghiệm trên tập DBLP như mô tả ở trên (mục 5.2.2).
Phần này trình bày kết quả thực nghiệm trên một tập dữ liệu khác được rút trích từ trang
web của hệ thống Microsoft Academic Search (MAS). Với Top-5 những đỉnh tương tự nhất
được trả về thì MPRS+, RSS+ có độ chính xác (Precision) lần lượt là 0.64, 0.63 cho tiên
đoán đồng tác giả trong tương lai gần (2006-2008) và lần lượt là 0.38, 0.38 cho tiên đoán đồng
tác giả trong tương lai xa (2009-2011). Trong khi các phương pháp tương tự đỉnh phổ biến
hiện nay cao nhất là RSS chỉ đạt 0.58 với tiên đoán tương lai gần và 0.34 với tiên đoán tương
lai xa (bảng 3, hình 4).
Như vậy, kết quả thực nghiệm trên cả hai tập dữ liệu thực nghiệm là DBLP và MAS
(mục 5.2.2 và mục 5.2.3) đều cho thấy các phương pháp đề xuất RSS+,MPRS,MPRS+
cho kết quả tốt hơn so với các phương pháp tương tự đỉnh phổ biến hiện nay. Đặc biệt yếu tố
xu hướng cộng tác trong hai phương pháp MPRS+ và RSS+ đã giúp cải tiến đáng kể kết
quả dựa trên đánh giá tiên đoán liên kết đồng tác giả.
348 HUỲNH NGỌC TÍN, HOÀNG VĂN KIẾM
Bảng 3. Kết quả tiên đoán liên kết đồng tác giả trên tập thực nghiệm MAS
     
   
   
       	 
            
    
         ﬀ 
  
ﬁ ﬂ ﬃ  ! " # $ % & $
 ' ( ) * + + , - * + + . /
0 1 2  3 4 5  6     7 8 1  9 ﬃ
ﬁ ﬂ ﬃ  ! " # $ % & $
 ' * ) * + + : - * + ( ( /
; ! < ﬃ 3 4 5  6     7 8 1 = 8
; >

(
; >

*
; >

?
; >

@
; >

A
; >

(
; >

*
; >

?
; >

@
; >

A
B C D E F G H I J K H I J L H I M K H I M J H I M M H I L L H I N O H I N P H I N M H I N N
Q R S S R T U
H I V N H I J V H I J N H I M K H I M P H I L O H I L N H I N K H I N V H I N J
W
U R X
E
S
W
U R T
H I P H H I V L H I J K H I J V H I J L H I M J H I L O H I L J H I L N H I L H
Y Z Z
H I P L H I V P H I V M H I V [ H I J O H I M K H I M [ H I L P H I L J H I L M
\ ] ] ^
H I P V H I P L H I V O H I V J H I V L H I J N H I M V H I M N H I M H H I L O
ﬁ _ \ ]
H I P M H I V P H I V M H I V [ H I J K H I M O H I M N H I L O H I L V H I L M
ﬁ _ \ ] ^
H I P K H I P M H I P H H I V P H I V M H I J M H I M P H I M L H I M [ H I L O
   
   
   
   
   
   
   









              
ﬀ
    ﬁ     ﬂ
ﬃ    ! "   # $   %  
 & 

              '
ﬀ
   ( ﬁ     ﬂ
ﬃ    ! "   # $   %   ) 
* 
 + , - .
/ 0 1 1 0 2 3
4 3 0 5 , 1 4 3 0 2
6 7 7
6 7 7 8
9 : 6 7
9 : 6 7 8
Hình 4. Kết quả tiên đoán liên kết đồng tác giả trên tập thực nghiệm MAS
6. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Mục đích của nghiên cứu này là tập trung phát triển phương pháp mới dựa trên phân tích
mạng đồng tác giả. Các phương pháp hướng đến tiên đoán các mối quan hệ cộng tác tiềm
năng trong tương lai để khuyến nghị cho người dùng. Các phương pháp đề xuất của bài báo
dựa trên thông tin xu hướng kết hợp lý thuyết đồ thị và xác suất khi phân tích mạng đồng
tác giả. Thực nghiệm được tiến hành trên các tập dữ liệu khoa học như: DBLP, tập download
từ Microsoft Academic Search. Kết quả cho thấy các phương pháp dựa trên yếu tố xu hướng
đề xuất cho kết quả tốt hơn hẳn các phương pháp khác trong cả hai tập thực nghiệm. Với
tập DBLP, độ chính xác tiên đoán đồng tác giả trong tương lai gần với các phương pháp dựa
trên xu hướng cho Top-5 là 0.60 cho phương pháp RSS+, 0.61 cho phương pháp MPRS + .
Trong khi các phương pháp hiện tại chỉ đạt 0.55 (cao nhất) cho Top-5 với phương pháp RSS
(Bảng 2, Hình 3).
Nhằm khai thác các mối quan hệ cộng tác tiềm năng, công việc tiếp theo là cải tiến các
phương pháp hiện có dựa trên tiếp cận phân tích mạng xã hội, xem xét khai thác các mối
quan hệ trung gian khác như: quan hệ của các cơ quan, trường, viện, quốc gia. Đó là những
yếu tố ảnh hưởng đến các mối quan hệ cộng tác tiềm năng trong nghiên cứu khoa học. Hiện
nay, yếu tố nội dung vẫn chưa được xem xét, thực hiện trong bài báo này. Vì vậy, cần những
nghiên cứu đề xuất, thực nghiệm và so sánh với các phương pháp dựa trên nội dung, cũng
như các phương pháp kết hợp cả nội dung và lọc cộng tác dựa trên mạng xã hội.
Lời cảm ơn. Nghiên cứu này được tài trợ bởi Trường Đại học Công nghệ Thông tin, Đại học
Quốc gia Thành phố Hồ Chí Minh với đề tài mã số C2012-07.
ĐỀ XUẤT CÁC PHƯƠNG PHÁP TÍNH ĐỘ TƯƠNG TỰ ĐỈNH DỰA TRÊN XU HƯỚNG 349
TÀI LIỆU THAM KHẢO
[1] 
[2] J. S. Katz and B. R. Martin, What is research collaboration, Research Policy 26 (1) (1997)
1–18.
[3] H. Chen, L. Gou, X. Zhang, and C. L. Giles, CollabSeer: a search engine for collaboration
discovery, Proceedings of the 11th annual International ACM/IEEE Conference on Digital
libraries (JCDL), New York, USA, 2011 (231–240).
[4] H. Chen, L. Gou, X. Zhang, and C. L. Giles, Discovering missing links in networks using ver-
tex similarity measures, Proceedings of the 27th Annual ACM Symposium on Applied
Computing (SAC ’12), New York, USA, 2012 (138–143).
[5] J. Tang, S. Wu, J. Sun, and H. Su, Cross-domain collaboration recommendation, Proceedings
of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data
Mining (KDD ’12), New York, USA, 2012 (1285–1293).
[6] G. Adomavicius and A. Tuzhilin, Toward the next generation of recommender systems: a survey
of the state-of-the-art and possible extensions, IEEE Transactions on Knowledge and Data
Engineering 17 (6) (2005) 734–749.
[7] J. Tang, J. Zhang, L. Yao, J. Li, L. Zhang, and Z. Su, ArnetMiner: extraction and mining of
academic social networks, Proceedings of the 14th ACM SIGKDD International Conference
on Knowledge Discovery and Data Mining (KDD ’08). ACM, New York, NY, USA, 2008
(990–998).
[8] C. L. Giles, K. D. Bollacker, and S. Lawrence, CiteSeer: an automatic citation indexing system,
Proceedings of the third ACM conference on Digital libraries (DL ’98), ACM, New York,
USA, 1998 (89–98).
[9] K. Hofmann, K. Balog, T. Bogers, and M. de Rijke, Contextual factors for finding similar experts,
Journal of American Society for Information Science and Technology 61 (5) (2010) 994–
1014.
[10] K. Balog and M. de Rijke, Finding similar experts, Proceedings of the 30th Annual Interna-
tional ACM SIGIR Conference on Research and Development in Information Retrieval
(SIGIR ’07), ACM, New York, USA, 2007 (821–822).
[11] W. Tang, J. Tang, T. Lei, C. Tan, B. Gao, and T. Li, On optimization of expertise matching
with various constraints, Journal Neurocomputing 76 (1) (2012) 71–83.
[12] F. E. Walter, S. Battiston, and F. Schweitzer, A model of a trust-based recommendation system
on a social network, Journal Autonomous Agents and Multi-Agent Systems 16 (1) (2008)
57–74.
[13] I. Konstas, V. Stathopoulos, and J. M. Jose, On social networks and collaborative recommen-
dation, Proceedings of the 32nd International ACM SIGIR Conference on Research and
Development in Information Retrieval, (SIGIR ’09), ACM, New York, NY, USA, 2009
(195–202).
[14] E. Davoodi, M. Afsharchi, and K. Kianmehr, A social network-based approach to expert recom-
mendation system, Proceedings of the 7th International Conference on Hybrid Artificial
Intelligent Systems, Volume Part I, Salamanca, Spain, 2012 (91–102).
[15] S. D. Gollapalli, P. Mitra, and C. L. Giles, Similar researcher search in academic environments,
Proceedings of the 12th ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL
’12), ACM, New York, USA, 2012 (167–170).
350 HUỲNH NGỌC TÍN, HOÀNG VĂN KIẾM
[16] H. Luong, T. Huynh, S. Gauch, K. Hoang, Exploiting social networks for publication venue rec-
ommendations, Proceedings of the 4th International Conference on Knowledge Discovery
and Information Retrieval, Barcelona, Spain, 2012 (239–245).
[17] L. A. Adamic, E. Adar, Friends and neighbors on the web, Journal Social Networks 25 (3)
(2003) 211–230.
[18] G. Jeh and J. Widom, Simrank: A measure of structural-context similarity, Proceedings of
the eighth ACM SIGKDD International Conference on Knowledge Discovery and Data
Mining (KDD ’02), ACM, New York, USA, 2002 (538–543).
[19] P. Zhao, J. Han, and Y. Sun, P-rank: A comprehensive structural similarity measure over infor-
mation networks, Proceedings of the 18th ACM Conference on Information and Knowl-
edge Management (CIKM ’09), ACM, New York, USA, 2009 (553–562).
[20] H. Chen, L. Gou, X. Zhang, and C. L. Giles, Capturing missing edges in social networks using
vertex similarity, Proceedings of the sixth International Conference on Knowledge Capture
(K-CAP ’11), ACM, New York, USA, 2011 (195–196).
[21] G. R. Lopes, M. M. Moro, L. K. Wives, and J. P. M. D. Oliveira, Collaboration recommendation
on academic social networks, Proceedings of the International Conference on Advances
in Conceptual Modeling: Applications and Challenges (ER’10), Springer-Verlag, Berlin,
Heidelberg, 2010 (190–199).
Ngày nhận bài 05 - 7 - 2013
Nhận lại sau sửa ngày 25 - 11 - 2013
File đính kèm:
de_xuat_cac_phuong_phap_tinh_do_tuong_tu_dinh_dua_tren_xu_hu.pdf