Xây dựng thư viện điện tử và vấn đề số hoá tài liệu ở Việt Nam

Tóm tắt Xây dựng thư viện điện tử và vấn đề số hoá tài liệu ở Việt Nam: ... dựng và phỏt triển TVðT. Mỗi phần mềm ủều cú những ưu, nhược ủiểm riờng nhưng thụng thường một phần mềm khả dĩ phải cú cỏc module chớnh của thư viện, như: Bổ sung; Biờn mục; Quản lý Kho; Phục vụ bạn ủọc; Mục lục trực tuyến; Phõn hệ lưu hành; Quản lý tài liệu ủiện tử; Truy hồi và trỡnh bày t...ỏc tài liệu ủặc thự của thư viện, cỏc tài liệu duy nhất và cú giỏ trị lõu dài ủể trao ủổi, vớ dụ: cỏc tài liệu quý hiếm, cỏc sưu tập cú giỏ trị, khụng ở ủõu cú...; ưu tiờn số hoỏ trước hết ủối với tài liệu chưa ở ủõu số hoỏ, tài liệu tiếng hiếm, tiếng Việt,.... Song song với việc số hoỏ là việ... cụ thể của Việt Nam. Mỗi cơ quan tham gia mạng lưới số hoỏ ủều phải tuõn thủ nghiờm ngặt những chuẩn này sao cho cỏc tài liệu số hoỏ luụn ủảm bảo về mặt chất lượng cũng như về tiến ủộ thời gian; ủồng thời chỳng ủược tổ chức trong cỏc CSDL cú cấu trỳc tương hợp hoặc dễ dàng trong chuyển ủổi....

pdf6 trang | Chia sẻ: havih72 | Lượt xem: 341 | Lượt tải: 0download
Nội dung tài liệu Xây dựng thư viện điện tử và vấn đề số hoá tài liệu ở Việt Nam, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
 TẠP CHÍ THƠNG TIN VÀ TƯ LIỆU 
Journal of Information and Documentation 
ISSN 859-2929 
Số 2/2005 
No.2/2005 
Xây dựng thư viện điện tử và vấn đề số hố tài liệu ở Việt Nam 
ThS. Nguyễn Tiến ðức 
Trung tâm Thơng tin KHCN Quốc gia 
Tĩm tắt: Trình bày tiếp cận xây dựng thư viện điện tử (TVðT). Xem xét 
khía cạnh cấu trúc, hạ tầng cơ sở kỹ thuật và phát triển kho tư liệu số hố của 
TVðT. ðề cập việc tổ chức số hố tài liệu trong phạm vi Mạng lưới các tổ chức 
thơng tin KHCN ở Việt Nam. 
Phát triển từ thư viện truyền thống thành TVðT đang là xu hướng tất yếu ở tất cả 
các nước. ðể xây dựng được một TVðT theo đúng nghĩa, cần cĩ một số quan điểm thống 
nhất, cĩ cách tiếp cận đúng và lựa chọn những bước đi thích hợp. Trong bài báo này, 
chúng tơi luận bàn điều kiện để xây dựng TVðT ở Việt Nam. 
I. Tiếp cận xây dựng Thư viện điện tử 
ðể xây dựng TVðT, chúng ta cần quan tâm nhiều vấn đề mà nổi bật là 4 khía 
cạnh chủ yếu: Cấu trúc của TVðT; Hạ tầng cơ sở kỹ thuật; Kho tư liệu số hố; Các vấn 
đề bảo quản, khai thác và bản quyền. 
Dưới đây sẽ điểm qua vấn đề 1, 2 và sau đĩ tập trung vào vấn đề thứ 3. 
Cấu trúc của Thư viện điện tử 
Các TVðT đều được bố trí trên “Giao diện web”, trên đĩ, ngồi những vùng 
chung như: Giới thiệu về cơ quan, về hệ thống, về thư viện; Hướng dẫn sử dụng và các 
cơng cụ trợ giúp thì phần chủ yếu là nội dung, tức là “Tài nguyên thơng tin”. 
Phần thứ nhất của “Tài nguyên thơng tin” thơng thường là Danh mục chủ 
đề/Directory. Phần này được cấu trúc theo trình tự từ chung đến riêng, từ tổng quát đến 
chi tiết, từ ngồi vào trong theo thứ bậc, ví dụ: Mảng/vấn đề lớn; Tiếp đĩ là các mục/vấn 
đề nhỏ; Mỗi mục này lại chia nhỏ dần theo cấu trúc hình cây: Cây – cành; Cành –nhánh 
to; Nhánh to –nhánh nhỏ; Nhánh nhỏ –nhánh nhỏ hơn... Cùng với các phân chia này là 
các điểm liên kết: đảm bảo các mối quan hệ nhiều chiều giữa các nhánh cũng như giữa 
nhánh với các cành. Cách tổ chức như vậy nhằm tạo thuận tiện cho người dùng trong 
khai thác thơng tin. Thơng thường trong TVðT các xuất bản phẩm điện tử (tạp chí, bản 
tin, kỷ yếu ...) được bố trí sắp xếp theo kiểu này và để tìm kiếm tài liệu theo chủ đề ta cĩ 
thể “Click-Nháy” vào đề mục tương ứng tuần tự từ ngồi vào trong. Nếu muốn tìm/truy 
cập nhanh tới tài liệu cần phải cĩ sự hỗ trợ của Máy tìm tin/Search engine thơng qua các 
Lệnh tìm cụ thể,.... 
Trong TVðT cịn cĩ phần “Tài nguyên” thứ hai - quan trọng hơn, đĩ là các tổ hợp 
CSDL, biểu hiện Danh mục các CSDL, thường được sắp xếp theo chủ đề hoặc theo vần 
chữ cái. Người dùng cĩ thể tiếp cận tới các CSDL này để khai thác thơng tin theo các cấp 
độ khác nhau: từ thư mục tới tồn văn; khai thác riêng rẽ từng CSDL hay khai thác theo 
Nhĩm CSDL,.... Mức độ khai thác đến đâu tuỳ thuộc vào khả năng của hệ thống và đặc 
biệt là sự cho phép của cơ quan chủ quản, các lệ phí tương ứng. 
Thành phần thứ 3 trong TVðT là phần Liên kết tới các nguồn tài nguyên thơng 
tin bên ngồi. ðây là thế mạnh của TVðT. Tuy nhiên, mức độ và khả năng liên kết đến 
đâu phụ thuộc vào sự hợp tác với các cơ quan khác và việc khai thác các tầng thơng tin số 
hố đĩ cũng cĩ những khác biệt. Chẳng hạn: cĩ vùng/mảng thơng tin được khai thác tự 
do, miễn phí, nhưng cĩ những vùng/CSDL phải cĩ mật khẩu, phải trả tiền,.... 
Như vậy, TVðT khơng chỉ cĩ một hệ thống mà cĩ thể gồm nhiều hệ khác nhau. 
Tuy nhiên, các tài nguyên thơng tin, các CSDL đĩ liên kết được với nhau trong một chế 
độ phục vụ thống nhất. Tức là khi được yêu cầu, chúng xuất hiện đối với người dùng như 
thể chúng cùng trong một hệ thống. ðể tích hợp được như vậy, chúng ta phải cĩ các 
chương trình phần mềm hỗ trợ, phải áp dụng các chuẩn nhất định trong xử lý, trong quản 
trị, trong trao đổi dữ liệu cũng như phải cĩ các cơng cụ tìm kiếm (search engine), chuyển 
tải, lưu trữ thơng tin,.... 
Tĩm lại, cấu trúc của TVðT thực chất là cấu trúc của một Trang Web cĩ liên kết 
đến các nguồn tin số hố, trong đĩ quan trọng nhất là các CSDL tồn văn, được tổ chức 
theo cấu trúc cĩ khả năng đáp ứng cho việc khai thác qua chế độ mạng on-line. 
Vấn đề kỹ thuật, hạ tầng cơ sở và phần mềm TVðT 
 Một TVðT phải cĩ hạ tầng cơ sở đủ mạnh, đĩ là: 
- Mạng Intranet cĩ tốc độ kết nối nhanh với INTERNET; 
- Hệ thống máy chủ lớn thực hiện việc quản trị và các dịch vụ khác nhau: Máy 
chủ Web, Máy chủ FPT, Mail, các Máy chủ lưu, bảo trì dữ liệu; Máy chủ 
Firewall, Máy chủ cho các ứng dụng khác,.... 
- Hệ thống máy trạm để cập nhật, khai thác thơng tin; 
- Các thiết bị cơng nghệ chuyên dụng cho TVðT: mã vạch, quản lý và in thẻ, 
máy quét, máy sao CD,.... 
Về phần mềm: ðến nay, trên thế giới cĩ nhiều phần mềm phục vụ cho việc xây 
dựng và phát triển TVðT. Mỗi phần mềm đều cĩ những ưu, nhược điểm riêng nhưng 
thơng thường một phần mềm khả dĩ phải cĩ các module chính của thư viện, như: Bổ 
sung; Biên mục; Quản lý Kho; Phục vụ bạn đọc; Mục lục trực tuyến; Phân hệ lưu hành; 
Quản lý tài liệu điện tử; Truy hồi và trình bày thơng tin; Mượn liên thư viện; Quản trị hệ 
thống. 
Ở Việt Nam, trong 5-7 năm gần đây đã xây dựng, phát triển phần mềm thư viện, 
như: Libol (CTy Tinh Vân), Ilib (Cty CMC), Vebrary (Cty Lạc Việt), Elib (Cty 
VNNetsoft). Qua đánh giá, hiện tại 02 phần mềm Libol và Ilib hồn tồn cĩ thể đáp ứng 
được chức năng của một TVðT hiện đại ở Việt Nam với các cấp độ khác nhau (đến hết 
năm 2004, mỗi phần mềm này đã được vài chục thư viện ứng dụng). 
Ngồi ra, để tổ chức TVðT ta cũng cần cĩ: Phần mềm Hệ thống: Hệ điều hành và 
Hệ quản trị các CSDL; Phần mềm xuất bản điện tử, xuất bản CD/ROM. 
Theo ước tính, để trang bị các thiết bị nêu trên cũng như cĩ phần mềm TVðT và 
tạo lập nội dungTVðT ban đầu ta phải đầu tư khoảng 5-7 tỷ VND, thậm chí một số 
người cho rằng ít nhất phải đầu tư 1 triệu USD (16 tỷ VND) cho một TVðT trung bình 
của một ngành/lĩnh vực. 
II. Tạo lập và phát triển Kho tư liệu số hố- vấn đề trọng tâm trong xây dựng 
TVðT 
Phần quan trọng nhất trong TVðT chính là Kho tư liệu số hố của bản thân cơ 
quan thơng tin/thư viện chủ quản. Cĩ 3 cách để tạo lập Kho này, đĩ là: 
- Tự tiến hành số hố nguồn tư liệu trên giấy của Thư viện. Tức là chuyển tài 
liệu hiện cĩ sang dạng số bằng phương pháp quét hay nhập lại thơng tin từ bàn 
phím... ðây là hướng phải đầu tư lớn, đầu tư liên tục và tốn kém thời gian, 
tiền của, cơng sức; 
- Bổ sung/tích hợp nguồn tin điện tử thơng qua việc mua, trao đổi tài liệu điện 
tử đang được xuất bản (bản tin, tạp chí điện tử, các chế bản điện tử trước khi 
in ra trên giấy). Chúng ta đều biết: hầu hết các ấn phẩm hiện nay đều vừa xuất 
bản trên giấy vừa tồn tại dưới dạng điện tử và nếu tận dụng được nguồn này, 
ta sẽ tiết kiệm được nhiều cơng sức, thời gian; 
- Xây dựng các liên kết (tạo khả năng truy cập) đến các nguồn tài liệu trên 
INTERNET, nhất là nguồn của các cơ quan cĩ cùng diện chuyên đề bao quát. 
Tạo lập và phát triển Kho tài liệu số của riêng mỗi cơ quan thơng tin/thư viện là 
vấn đề lớn nhất trong xây dựng TVðT. Cơng việc này địi hỏi phải đầu tư lớn và liên tục. 
ðể làm tốt cơng việc này, các cơ quan xây dựng TVðT cần cĩ cách tiếp cận hợp lý, khả 
thi và kinh tế. Cụ thể là: 
1. Nhất thiết phải lập kế hoạch sát sao và ưu tiên đầu tư cho việc thu thập, xử lý 
và số hố nguồn tin cơ bản, nguồn tin tiềm năng của riêng mình. Coi đây là nhiệm vụ 
trọng tâm, thậm chí phải triển khai mạnh trước khi bắt tay vào xây dựng TVðT. 
Nếu khơng cĩ sự đi trước này, khi ta xây dựng xong hạ tầng mạng và cĩ các phần 
mềm Hệ thống, phần mềm TVðT đầy đủ nhưng đến lúc đĩ cơ quan vẫn khơng cĩ hoặc 
cĩ rất ít tài liệu số hố của bản thân chắc chắn TVðT đĩ khơng thể phát huy được hiệu 
quả; và như vậy, khơng tương xứng với kinh phí đầu tư nhiều tỷ đồng của Nhà nước. 
Trong việc lựa chọn tài liệu để số hố, ta phải ưu tiên các tài liệu đặc thù của thư 
viện, các tài liệu duy nhất và cĩ giá trị lâu dài để trao đổi, ví dụ: các tài liệu quý hiếm, các 
sưu tập cĩ giá trị, khơng ở đâu cĩ...; ưu tiên số hố trước hết đối với tài liệu chưa ở đâu số 
hố, tài liệu tiếng hiếm, tiếng Việt,.... Song song với việc số hố là việc xây dựng các 
Siêu dữ liệu đối với từng tài liệu và cập nhật tài liệu đã được số hố này vào CSDL tương 
ứng để phục vụ kịp thời cũng như làm cơ sở cho việc xây dựng TVðT sau này. 
Ngồi ra, ta cũng cần quan tâm đến chất lượng của việc số hố tài liệu cũng như 
cần sao lưu đầy đủ, kịp thời các tài liệu số hố đĩ để tránh rủi ro cũng như tránh phải làm 
đi làm lại (lãng phí cơng sức, tiền của). ðiều này phụ thuộc nhiều vào cơng tác tổ chức, 
phụ thuộc vào cán bộ thực hiện cũng như thiết bị và quy trình số hố. 
2. Phải phối hợp, tận dụng sản phẩm số hố của các cơ quan thơng tin/thư viện 
khác, nhất là của những cơ quan cĩ cùng diện chuyên đề bao quát. Trên cơ sở đĩ mới cĩ 
thể tăng nhanh “nguồn tin” của mình, tiết kiệm được thời gian, cơng sức và tiền của. 
III. Tổ chức số hố tài liệu trong phạm vi quốc gia và tiến tới Nền Cơng 
nghiệp nội dung 
Trong phạm vi quốc gia, Nhà nước cần cĩ chiến lược đầu tư và triển khai kế 
hoạch tổng thể trong việc số hố đối với các nguồn tin quan trọng, cĩ ý nghĩa lâu dài. 
Xác lập chính sách ưu tiên số hố 
Theo chúng tơi, Nhà nước ta nên cĩ chính sách ưu tiên hỗ trợ cho việc số hố đối 
với các tài liệu sau: 
Về dạng tài liệu: 
- Văn bản quy phạm pháp luật; 
- Báo cáo kết quả các nhiệm vụ KHCN (các đề tài/đề án các cấp); 
- Tài liệu điều tra cơ bản, quy hoạch, bản đồ; 
- Luận văn sau đại học; 
- Tài liệu hội nghị, hội thảo khoa học; 
- Tài liệu tiêu chuẩn, quy phạm; Tài liệu sở hữu cơng nghiệp. 
Về ngơn ngữ: ưu tiên số hố tài liệu Hán nơm, tài liệu tiếng Việt. Hạn chế số hố 
tài liệu tiếng Anh. 
Về lĩnh vực: ưu tiên số hố tài liệu KHCN những ngành mũi nhọn. 
 Xác lập và hình thành một mạng lưới các tổ chức số hố tài liệu 
Trong mạng lưới các cơ quan thơng tin, thư viện cần cĩ sự phân cơng, phối hợp 
giữa các cơ quan trong việc số hố tài liệu. 
Nguyên tắc đầu tiên trong phân cơng là cơ quan nào cĩ kho tư liệu chuyên mơn 
hố với số lượng tài liệu nhiều nhất về lĩnh vực nào thì sẽ đảm nhận số hố nguồn tư liệu 
về lĩnh vực đĩ và cơ quan này sẽ được Nhà nước hỗ trợ trong việc số hố. 
Trên cơ sở phân cơng như vậy, ta xác lập được một mạng lưới các tổ chức số hố 
tài liệu trên quy mơ lớn, hiện đại, bao quát hầu hết những dạng tài liệu, những nguồn tin 
quan trọng nhất, những tài liệu cĩ giá trị lâu dài ở tầm quốc gia. Từ đĩ hình thành mạng 
trao đổi thơng tin tồn quốc và tạo điều kiện thuận lợi cho các cơ quan TT-TV trọng điểm 
trong xây dựng và phát triển TVðT của mình. 
Nghiên cứu, lựa chọn và xác lập những chuẩn, những quy định chung trong 
việc số hố tài liệu 
Trong mạng lưới các cơ quan TT-TV tiến hành số hố cần cĩ những chuẩn cũng 
như các quy định thống nhất đối với việc số hố tài liệu. Những chuẩn này được xác định 
trên cơ sở nghiên cứu áp dụng chuẩn của nước ngồi vào điều kiện cụ thể của Việt Nam. 
Mỗi cơ quan tham gia mạng lưới số hố đều phải tuân thủ nghiêm ngặt những chuẩn này 
sao cho các tài liệu số hố luơn đảm bảo về mặt chất lượng cũng như về tiến độ thời gian; 
đồng thời chúng được tổ chức trong các CSDL cĩ cấu trúc tương hợp hoặc dễ dàng trong 
chuyển đổi. Cĩ như vậy, các tài liệu số hố đĩ mới cĩ thể phục vụ rộng rãi trong tồn 
mạng lưới và mang lại hiệu quả cao. 
Tổ chức số hố tài liệu ở quy mơ cơng nghiệp 
Hoạt động số hố ở quy mơ lớn được gọi là “Ngành cơng nghiệp nội dung” 
(CNND). Theo định nghĩa khái quát người ta coi CNND bao gồm: thu thập thơng tin; 
phân tích nội dung để phân loại, lưu trong bộ nhớ hoặc đưa lên mạng máy tính; bao gĩi 
thơng tin thành các CSDL (trên CD, DVD, ổ chứng –HDD, thiết bị lưu trữ di động 
(HDD-RAM), nhân sao và cung cấp/bán các CSDL đĩ. 
Nhiều người cho rằng, CNND là một nhánh của CNTT, vì nĩ gắn với CNTT. Sản 
phẩm của CNND là sản phẩm của CNTT, từ cơng nghiệp phần mềm, thu thập thơng tin, 
xử lý, lưu trữ thơng tin đến cung cấp thơng tin. CNND khơng chỉ liên quan đến phần 
cứng, phần mềm mà cịn liên quan đến các lĩnh vực khác như lưu trữ, sản xuất các thiết bị 
lưu trữ (vật mang tin hiện đại). 
Như vậy, nguyên vật liệu đầu vào của ngành CNND là thơng tin và đầu ra cũng là 
thơng tin. Nhưng thơng tin đầu ra là CSDL, là thơng tin cĩ cấu trúc, cĩ nội dung cụ thể và 
được bán/cung cấp cho những đối tượng cụ thể nhằm phục vụ cho một/một số hoạt động 
KT-XH nhất định. 
 Tuy nhiên, để xây dựng được một nền CNND ở tầm quốc gia cần phải: 
- Cĩ một hành lang pháp lý đủ mạnh để: một mặt, tạo điều kiện thuận lợi cho 
các tổ chức, cá nhân tìm kiếm, xử lý, số hố, bao gĩi, chuyển giao thơng tin; 
mặt khác, bảo vệ thiết thực bản quyền tác giả đối với các CSDL cũng như 
những thơng tin mà các cá nhân, tổ chức sở hữu và tất nhiên là bảo đảm bí 
mật quốc gia; 
- Cĩ sự phối hợp chặt chẽ về mặt tổ chức, liên kết, phân cơng phân mảng giữa 
các cơ quan cĩ hoạt động số hố tài liệu; 
- Cĩ lực lượng cán bộ chuyên trách thu thập, số hố, bao gĩi thơng tin (lực 
lượng này khơng phải chỉ là cán bộ thơng tin, thư viện); 
- Trang bị các thiết bị hiện đại cho các cơ sở tham gia số hố: ví dụ các máy 
quét chuyên dụng (nhanh, chất lượng cao, quét được các khổ lớn, màu sắc 
đẹp...); các USB, các máy chủ sao lưu với dung lượng lớn (hàng nghìn GB); 
các máy sao CD chuyên dụng,... 
Chắc chắn rằng, nếu tổ chức tốt ở Việt Nam ta, các sản phẩm số hố này sẽ cĩ thị 
trường khơng phải chỉ trong nước mà cả ở nước ngồi. Nền CNND sẽ hỗ trợ, cung cấp 
các nguồn tin số hố cho các TVðT và làm cho hoạt động thơng tin KHCN sơi động, hấp 
dẫn hơn, cán bộ thơng tin sẽ cĩ nhiều việc làm và thu nhập khá hơn. 
Kết luận 
Tiến tới TVðT là xu hướng tất yếu, là mong muốn của mỗi thư viện. Tuy nhiên, 
để cĩ được một TVðT hoạt động cĩ hiệu quả, phát huy được thế mạnh “thơng tin đặc 
thù” của mình, cơ quan chủ quản cần cĩ kế hoạch sát thực, lựa chọn bước đi phù hợp. 
Trong xây dựng và phát triển TVðT, việc tạo lập Kho tư liệu số hố là nhiệm vụ hàng 
đầu. Giải quyết nhiệm vụ này địi hỏi cơ quan chủ quản (cơ quan thơng tin, thư viện) phải 
cĩ chương trình thu thập, số hố tài liệu và tạo lập các CSDL một cách đầy đủ, kịp thời, 
đặc biệt là các CSDL tồn văn với các tài liệu cĩ giá trị lâu dài thuộc phạm vi bao quát 
của cơ quan. 
Tài liệu tham khảo 
1. What are digital libraries?/Donald J. Waters// CLIR, No 4, July/August 1999. 
URL:  
2. Digital libraries: Definitions, issues and challenges / Gary Cleveland // UDT 
Occasional paper #8. URL: 
3. NII, GII and 12, and IT*2 Initiatives: Implications to the digital Library 
development in the US / Ching-Chih Chen (edited). IT and global digital Library 
development. Massachsets : MicroUse information, 1999, pp 49-64. 
4. European development in digital libraries / David Raitt // Ching-Chih Chen 
(edited). IT and global digital Library development. Massachsets: MicroUse information, 
1999, pp 345-356. 
5. Cao Minh Kiểm. Thư viện số: ðịnh nghĩa và vấn đề.-Tạp chí Thơng tin & Tư liệu, 
2000, số 3, tr. 5- 11. 
6. Tạ Bá Hưng. Phát triển nội dung số ở Việt Nam: những nguyên tắc chỉ đạo .-Tạp 
chí Thơng tin & Tư liệu, 2000, số 1, tr. 2-6. 
Building up electronic libraries and digitization of documents in Vietnam 
Nguyen Tien Duc 
Journal of Information and Documentation, 2005, no. 2, pp.. 
Abstracts: Deals with the approach to building up electronic libraries; Considers 
structural aspects, technical infrastructure and digitized collections of electronic 
libraries; Mentions organization of digitizing documents within information institutions 
in the National Information System. 

File đính kèm:

  • pdfxay_dung_thu_vien_dien_tu_va_van_de_so_hoa_tai_lieu_o_viet_n.pdf