Xây dựng thư viện điện tử và vấn đề số hoá tài liệu ở Việt Nam
Tóm tắt Xây dựng thư viện điện tử và vấn đề số hoá tài liệu ở Việt Nam: ... dựng và phỏt triển TVðT. Mỗi phần mềm ủều cú những ưu, nhược ủiểm riờng nhưng thụng thường một phần mềm khả dĩ phải cú cỏc module chớnh của thư viện, như: Bổ sung; Biờn mục; Quản lý Kho; Phục vụ bạn ủọc; Mục lục trực tuyến; Phõn hệ lưu hành; Quản lý tài liệu ủiện tử; Truy hồi và trỡnh bày t...ỏc tài liệu ủặc thự của thư viện, cỏc tài liệu duy nhất và cú giỏ trị lõu dài ủể trao ủổi, vớ dụ: cỏc tài liệu quý hiếm, cỏc sưu tập cú giỏ trị, khụng ở ủõu cú...; ưu tiờn số hoỏ trước hết ủối với tài liệu chưa ở ủõu số hoỏ, tài liệu tiếng hiếm, tiếng Việt,.... Song song với việc số hoỏ là việ... cụ thể của Việt Nam. Mỗi cơ quan tham gia mạng lưới số hoỏ ủều phải tuõn thủ nghiờm ngặt những chuẩn này sao cho cỏc tài liệu số hoỏ luụn ủảm bảo về mặt chất lượng cũng như về tiến ủộ thời gian; ủồng thời chỳng ủược tổ chức trong cỏc CSDL cú cấu trỳc tương hợp hoặc dễ dàng trong chuyển ủổi....
TẠP CHÍ THƠNG TIN VÀ TƯ LIỆU Journal of Information and Documentation ISSN 859-2929 Số 2/2005 No.2/2005 Xây dựng thư viện điện tử và vấn đề số hố tài liệu ở Việt Nam ThS. Nguyễn Tiến ðức Trung tâm Thơng tin KHCN Quốc gia Tĩm tắt: Trình bày tiếp cận xây dựng thư viện điện tử (TVðT). Xem xét khía cạnh cấu trúc, hạ tầng cơ sở kỹ thuật và phát triển kho tư liệu số hố của TVðT. ðề cập việc tổ chức số hố tài liệu trong phạm vi Mạng lưới các tổ chức thơng tin KHCN ở Việt Nam. Phát triển từ thư viện truyền thống thành TVðT đang là xu hướng tất yếu ở tất cả các nước. ðể xây dựng được một TVðT theo đúng nghĩa, cần cĩ một số quan điểm thống nhất, cĩ cách tiếp cận đúng và lựa chọn những bước đi thích hợp. Trong bài báo này, chúng tơi luận bàn điều kiện để xây dựng TVðT ở Việt Nam. I. Tiếp cận xây dựng Thư viện điện tử ðể xây dựng TVðT, chúng ta cần quan tâm nhiều vấn đề mà nổi bật là 4 khía cạnh chủ yếu: Cấu trúc của TVðT; Hạ tầng cơ sở kỹ thuật; Kho tư liệu số hố; Các vấn đề bảo quản, khai thác và bản quyền. Dưới đây sẽ điểm qua vấn đề 1, 2 và sau đĩ tập trung vào vấn đề thứ 3. Cấu trúc của Thư viện điện tử Các TVðT đều được bố trí trên “Giao diện web”, trên đĩ, ngồi những vùng chung như: Giới thiệu về cơ quan, về hệ thống, về thư viện; Hướng dẫn sử dụng và các cơng cụ trợ giúp thì phần chủ yếu là nội dung, tức là “Tài nguyên thơng tin”. Phần thứ nhất của “Tài nguyên thơng tin” thơng thường là Danh mục chủ đề/Directory. Phần này được cấu trúc theo trình tự từ chung đến riêng, từ tổng quát đến chi tiết, từ ngồi vào trong theo thứ bậc, ví dụ: Mảng/vấn đề lớn; Tiếp đĩ là các mục/vấn đề nhỏ; Mỗi mục này lại chia nhỏ dần theo cấu trúc hình cây: Cây – cành; Cành –nhánh to; Nhánh to –nhánh nhỏ; Nhánh nhỏ –nhánh nhỏ hơn... Cùng với các phân chia này là các điểm liên kết: đảm bảo các mối quan hệ nhiều chiều giữa các nhánh cũng như giữa nhánh với các cành. Cách tổ chức như vậy nhằm tạo thuận tiện cho người dùng trong khai thác thơng tin. Thơng thường trong TVðT các xuất bản phẩm điện tử (tạp chí, bản tin, kỷ yếu ...) được bố trí sắp xếp theo kiểu này và để tìm kiếm tài liệu theo chủ đề ta cĩ thể “Click-Nháy” vào đề mục tương ứng tuần tự từ ngồi vào trong. Nếu muốn tìm/truy cập nhanh tới tài liệu cần phải cĩ sự hỗ trợ của Máy tìm tin/Search engine thơng qua các Lệnh tìm cụ thể,.... Trong TVðT cịn cĩ phần “Tài nguyên” thứ hai - quan trọng hơn, đĩ là các tổ hợp CSDL, biểu hiện Danh mục các CSDL, thường được sắp xếp theo chủ đề hoặc theo vần chữ cái. Người dùng cĩ thể tiếp cận tới các CSDL này để khai thác thơng tin theo các cấp độ khác nhau: từ thư mục tới tồn văn; khai thác riêng rẽ từng CSDL hay khai thác theo Nhĩm CSDL,.... Mức độ khai thác đến đâu tuỳ thuộc vào khả năng của hệ thống và đặc biệt là sự cho phép của cơ quan chủ quản, các lệ phí tương ứng. Thành phần thứ 3 trong TVðT là phần Liên kết tới các nguồn tài nguyên thơng tin bên ngồi. ðây là thế mạnh của TVðT. Tuy nhiên, mức độ và khả năng liên kết đến đâu phụ thuộc vào sự hợp tác với các cơ quan khác và việc khai thác các tầng thơng tin số hố đĩ cũng cĩ những khác biệt. Chẳng hạn: cĩ vùng/mảng thơng tin được khai thác tự do, miễn phí, nhưng cĩ những vùng/CSDL phải cĩ mật khẩu, phải trả tiền,.... Như vậy, TVðT khơng chỉ cĩ một hệ thống mà cĩ thể gồm nhiều hệ khác nhau. Tuy nhiên, các tài nguyên thơng tin, các CSDL đĩ liên kết được với nhau trong một chế độ phục vụ thống nhất. Tức là khi được yêu cầu, chúng xuất hiện đối với người dùng như thể chúng cùng trong một hệ thống. ðể tích hợp được như vậy, chúng ta phải cĩ các chương trình phần mềm hỗ trợ, phải áp dụng các chuẩn nhất định trong xử lý, trong quản trị, trong trao đổi dữ liệu cũng như phải cĩ các cơng cụ tìm kiếm (search engine), chuyển tải, lưu trữ thơng tin,.... Tĩm lại, cấu trúc của TVðT thực chất là cấu trúc của một Trang Web cĩ liên kết đến các nguồn tin số hố, trong đĩ quan trọng nhất là các CSDL tồn văn, được tổ chức theo cấu trúc cĩ khả năng đáp ứng cho việc khai thác qua chế độ mạng on-line. Vấn đề kỹ thuật, hạ tầng cơ sở và phần mềm TVðT Một TVðT phải cĩ hạ tầng cơ sở đủ mạnh, đĩ là: - Mạng Intranet cĩ tốc độ kết nối nhanh với INTERNET; - Hệ thống máy chủ lớn thực hiện việc quản trị và các dịch vụ khác nhau: Máy chủ Web, Máy chủ FPT, Mail, các Máy chủ lưu, bảo trì dữ liệu; Máy chủ Firewall, Máy chủ cho các ứng dụng khác,.... - Hệ thống máy trạm để cập nhật, khai thác thơng tin; - Các thiết bị cơng nghệ chuyên dụng cho TVðT: mã vạch, quản lý và in thẻ, máy quét, máy sao CD,.... Về phần mềm: ðến nay, trên thế giới cĩ nhiều phần mềm phục vụ cho việc xây dựng và phát triển TVðT. Mỗi phần mềm đều cĩ những ưu, nhược điểm riêng nhưng thơng thường một phần mềm khả dĩ phải cĩ các module chính của thư viện, như: Bổ sung; Biên mục; Quản lý Kho; Phục vụ bạn đọc; Mục lục trực tuyến; Phân hệ lưu hành; Quản lý tài liệu điện tử; Truy hồi và trình bày thơng tin; Mượn liên thư viện; Quản trị hệ thống. Ở Việt Nam, trong 5-7 năm gần đây đã xây dựng, phát triển phần mềm thư viện, như: Libol (CTy Tinh Vân), Ilib (Cty CMC), Vebrary (Cty Lạc Việt), Elib (Cty VNNetsoft). Qua đánh giá, hiện tại 02 phần mềm Libol và Ilib hồn tồn cĩ thể đáp ứng được chức năng của một TVðT hiện đại ở Việt Nam với các cấp độ khác nhau (đến hết năm 2004, mỗi phần mềm này đã được vài chục thư viện ứng dụng). Ngồi ra, để tổ chức TVðT ta cũng cần cĩ: Phần mềm Hệ thống: Hệ điều hành và Hệ quản trị các CSDL; Phần mềm xuất bản điện tử, xuất bản CD/ROM. Theo ước tính, để trang bị các thiết bị nêu trên cũng như cĩ phần mềm TVðT và tạo lập nội dungTVðT ban đầu ta phải đầu tư khoảng 5-7 tỷ VND, thậm chí một số người cho rằng ít nhất phải đầu tư 1 triệu USD (16 tỷ VND) cho một TVðT trung bình của một ngành/lĩnh vực. II. Tạo lập và phát triển Kho tư liệu số hố- vấn đề trọng tâm trong xây dựng TVðT Phần quan trọng nhất trong TVðT chính là Kho tư liệu số hố của bản thân cơ quan thơng tin/thư viện chủ quản. Cĩ 3 cách để tạo lập Kho này, đĩ là: - Tự tiến hành số hố nguồn tư liệu trên giấy của Thư viện. Tức là chuyển tài liệu hiện cĩ sang dạng số bằng phương pháp quét hay nhập lại thơng tin từ bàn phím... ðây là hướng phải đầu tư lớn, đầu tư liên tục và tốn kém thời gian, tiền của, cơng sức; - Bổ sung/tích hợp nguồn tin điện tử thơng qua việc mua, trao đổi tài liệu điện tử đang được xuất bản (bản tin, tạp chí điện tử, các chế bản điện tử trước khi in ra trên giấy). Chúng ta đều biết: hầu hết các ấn phẩm hiện nay đều vừa xuất bản trên giấy vừa tồn tại dưới dạng điện tử và nếu tận dụng được nguồn này, ta sẽ tiết kiệm được nhiều cơng sức, thời gian; - Xây dựng các liên kết (tạo khả năng truy cập) đến các nguồn tài liệu trên INTERNET, nhất là nguồn của các cơ quan cĩ cùng diện chuyên đề bao quát. Tạo lập và phát triển Kho tài liệu số của riêng mỗi cơ quan thơng tin/thư viện là vấn đề lớn nhất trong xây dựng TVðT. Cơng việc này địi hỏi phải đầu tư lớn và liên tục. ðể làm tốt cơng việc này, các cơ quan xây dựng TVðT cần cĩ cách tiếp cận hợp lý, khả thi và kinh tế. Cụ thể là: 1. Nhất thiết phải lập kế hoạch sát sao và ưu tiên đầu tư cho việc thu thập, xử lý và số hố nguồn tin cơ bản, nguồn tin tiềm năng của riêng mình. Coi đây là nhiệm vụ trọng tâm, thậm chí phải triển khai mạnh trước khi bắt tay vào xây dựng TVðT. Nếu khơng cĩ sự đi trước này, khi ta xây dựng xong hạ tầng mạng và cĩ các phần mềm Hệ thống, phần mềm TVðT đầy đủ nhưng đến lúc đĩ cơ quan vẫn khơng cĩ hoặc cĩ rất ít tài liệu số hố của bản thân chắc chắn TVðT đĩ khơng thể phát huy được hiệu quả; và như vậy, khơng tương xứng với kinh phí đầu tư nhiều tỷ đồng của Nhà nước. Trong việc lựa chọn tài liệu để số hố, ta phải ưu tiên các tài liệu đặc thù của thư viện, các tài liệu duy nhất và cĩ giá trị lâu dài để trao đổi, ví dụ: các tài liệu quý hiếm, các sưu tập cĩ giá trị, khơng ở đâu cĩ...; ưu tiên số hố trước hết đối với tài liệu chưa ở đâu số hố, tài liệu tiếng hiếm, tiếng Việt,.... Song song với việc số hố là việc xây dựng các Siêu dữ liệu đối với từng tài liệu và cập nhật tài liệu đã được số hố này vào CSDL tương ứng để phục vụ kịp thời cũng như làm cơ sở cho việc xây dựng TVðT sau này. Ngồi ra, ta cũng cần quan tâm đến chất lượng của việc số hố tài liệu cũng như cần sao lưu đầy đủ, kịp thời các tài liệu số hố đĩ để tránh rủi ro cũng như tránh phải làm đi làm lại (lãng phí cơng sức, tiền của). ðiều này phụ thuộc nhiều vào cơng tác tổ chức, phụ thuộc vào cán bộ thực hiện cũng như thiết bị và quy trình số hố. 2. Phải phối hợp, tận dụng sản phẩm số hố của các cơ quan thơng tin/thư viện khác, nhất là của những cơ quan cĩ cùng diện chuyên đề bao quát. Trên cơ sở đĩ mới cĩ thể tăng nhanh “nguồn tin” của mình, tiết kiệm được thời gian, cơng sức và tiền của. III. Tổ chức số hố tài liệu trong phạm vi quốc gia và tiến tới Nền Cơng nghiệp nội dung Trong phạm vi quốc gia, Nhà nước cần cĩ chiến lược đầu tư và triển khai kế hoạch tổng thể trong việc số hố đối với các nguồn tin quan trọng, cĩ ý nghĩa lâu dài. Xác lập chính sách ưu tiên số hố Theo chúng tơi, Nhà nước ta nên cĩ chính sách ưu tiên hỗ trợ cho việc số hố đối với các tài liệu sau: Về dạng tài liệu: - Văn bản quy phạm pháp luật; - Báo cáo kết quả các nhiệm vụ KHCN (các đề tài/đề án các cấp); - Tài liệu điều tra cơ bản, quy hoạch, bản đồ; - Luận văn sau đại học; - Tài liệu hội nghị, hội thảo khoa học; - Tài liệu tiêu chuẩn, quy phạm; Tài liệu sở hữu cơng nghiệp. Về ngơn ngữ: ưu tiên số hố tài liệu Hán nơm, tài liệu tiếng Việt. Hạn chế số hố tài liệu tiếng Anh. Về lĩnh vực: ưu tiên số hố tài liệu KHCN những ngành mũi nhọn. Xác lập và hình thành một mạng lưới các tổ chức số hố tài liệu Trong mạng lưới các cơ quan thơng tin, thư viện cần cĩ sự phân cơng, phối hợp giữa các cơ quan trong việc số hố tài liệu. Nguyên tắc đầu tiên trong phân cơng là cơ quan nào cĩ kho tư liệu chuyên mơn hố với số lượng tài liệu nhiều nhất về lĩnh vực nào thì sẽ đảm nhận số hố nguồn tư liệu về lĩnh vực đĩ và cơ quan này sẽ được Nhà nước hỗ trợ trong việc số hố. Trên cơ sở phân cơng như vậy, ta xác lập được một mạng lưới các tổ chức số hố tài liệu trên quy mơ lớn, hiện đại, bao quát hầu hết những dạng tài liệu, những nguồn tin quan trọng nhất, những tài liệu cĩ giá trị lâu dài ở tầm quốc gia. Từ đĩ hình thành mạng trao đổi thơng tin tồn quốc và tạo điều kiện thuận lợi cho các cơ quan TT-TV trọng điểm trong xây dựng và phát triển TVðT của mình. Nghiên cứu, lựa chọn và xác lập những chuẩn, những quy định chung trong việc số hố tài liệu Trong mạng lưới các cơ quan TT-TV tiến hành số hố cần cĩ những chuẩn cũng như các quy định thống nhất đối với việc số hố tài liệu. Những chuẩn này được xác định trên cơ sở nghiên cứu áp dụng chuẩn của nước ngồi vào điều kiện cụ thể của Việt Nam. Mỗi cơ quan tham gia mạng lưới số hố đều phải tuân thủ nghiêm ngặt những chuẩn này sao cho các tài liệu số hố luơn đảm bảo về mặt chất lượng cũng như về tiến độ thời gian; đồng thời chúng được tổ chức trong các CSDL cĩ cấu trúc tương hợp hoặc dễ dàng trong chuyển đổi. Cĩ như vậy, các tài liệu số hố đĩ mới cĩ thể phục vụ rộng rãi trong tồn mạng lưới và mang lại hiệu quả cao. Tổ chức số hố tài liệu ở quy mơ cơng nghiệp Hoạt động số hố ở quy mơ lớn được gọi là “Ngành cơng nghiệp nội dung” (CNND). Theo định nghĩa khái quát người ta coi CNND bao gồm: thu thập thơng tin; phân tích nội dung để phân loại, lưu trong bộ nhớ hoặc đưa lên mạng máy tính; bao gĩi thơng tin thành các CSDL (trên CD, DVD, ổ chứng –HDD, thiết bị lưu trữ di động (HDD-RAM), nhân sao và cung cấp/bán các CSDL đĩ. Nhiều người cho rằng, CNND là một nhánh của CNTT, vì nĩ gắn với CNTT. Sản phẩm của CNND là sản phẩm của CNTT, từ cơng nghiệp phần mềm, thu thập thơng tin, xử lý, lưu trữ thơng tin đến cung cấp thơng tin. CNND khơng chỉ liên quan đến phần cứng, phần mềm mà cịn liên quan đến các lĩnh vực khác như lưu trữ, sản xuất các thiết bị lưu trữ (vật mang tin hiện đại). Như vậy, nguyên vật liệu đầu vào của ngành CNND là thơng tin và đầu ra cũng là thơng tin. Nhưng thơng tin đầu ra là CSDL, là thơng tin cĩ cấu trúc, cĩ nội dung cụ thể và được bán/cung cấp cho những đối tượng cụ thể nhằm phục vụ cho một/một số hoạt động KT-XH nhất định. Tuy nhiên, để xây dựng được một nền CNND ở tầm quốc gia cần phải: - Cĩ một hành lang pháp lý đủ mạnh để: một mặt, tạo điều kiện thuận lợi cho các tổ chức, cá nhân tìm kiếm, xử lý, số hố, bao gĩi, chuyển giao thơng tin; mặt khác, bảo vệ thiết thực bản quyền tác giả đối với các CSDL cũng như những thơng tin mà các cá nhân, tổ chức sở hữu và tất nhiên là bảo đảm bí mật quốc gia; - Cĩ sự phối hợp chặt chẽ về mặt tổ chức, liên kết, phân cơng phân mảng giữa các cơ quan cĩ hoạt động số hố tài liệu; - Cĩ lực lượng cán bộ chuyên trách thu thập, số hố, bao gĩi thơng tin (lực lượng này khơng phải chỉ là cán bộ thơng tin, thư viện); - Trang bị các thiết bị hiện đại cho các cơ sở tham gia số hố: ví dụ các máy quét chuyên dụng (nhanh, chất lượng cao, quét được các khổ lớn, màu sắc đẹp...); các USB, các máy chủ sao lưu với dung lượng lớn (hàng nghìn GB); các máy sao CD chuyên dụng,... Chắc chắn rằng, nếu tổ chức tốt ở Việt Nam ta, các sản phẩm số hố này sẽ cĩ thị trường khơng phải chỉ trong nước mà cả ở nước ngồi. Nền CNND sẽ hỗ trợ, cung cấp các nguồn tin số hố cho các TVðT và làm cho hoạt động thơng tin KHCN sơi động, hấp dẫn hơn, cán bộ thơng tin sẽ cĩ nhiều việc làm và thu nhập khá hơn. Kết luận Tiến tới TVðT là xu hướng tất yếu, là mong muốn của mỗi thư viện. Tuy nhiên, để cĩ được một TVðT hoạt động cĩ hiệu quả, phát huy được thế mạnh “thơng tin đặc thù” của mình, cơ quan chủ quản cần cĩ kế hoạch sát thực, lựa chọn bước đi phù hợp. Trong xây dựng và phát triển TVðT, việc tạo lập Kho tư liệu số hố là nhiệm vụ hàng đầu. Giải quyết nhiệm vụ này địi hỏi cơ quan chủ quản (cơ quan thơng tin, thư viện) phải cĩ chương trình thu thập, số hố tài liệu và tạo lập các CSDL một cách đầy đủ, kịp thời, đặc biệt là các CSDL tồn văn với các tài liệu cĩ giá trị lâu dài thuộc phạm vi bao quát của cơ quan. Tài liệu tham khảo 1. What are digital libraries?/Donald J. Waters// CLIR, No 4, July/August 1999. URL: 2. Digital libraries: Definitions, issues and challenges / Gary Cleveland // UDT Occasional paper #8. URL: 3. NII, GII and 12, and IT*2 Initiatives: Implications to the digital Library development in the US / Ching-Chih Chen (edited). IT and global digital Library development. Massachsets : MicroUse information, 1999, pp 49-64. 4. European development in digital libraries / David Raitt // Ching-Chih Chen (edited). IT and global digital Library development. Massachsets: MicroUse information, 1999, pp 345-356. 5. Cao Minh Kiểm. Thư viện số: ðịnh nghĩa và vấn đề.-Tạp chí Thơng tin & Tư liệu, 2000, số 3, tr. 5- 11. 6. Tạ Bá Hưng. Phát triển nội dung số ở Việt Nam: những nguyên tắc chỉ đạo .-Tạp chí Thơng tin & Tư liệu, 2000, số 1, tr. 2-6. Building up electronic libraries and digitization of documents in Vietnam Nguyen Tien Duc Journal of Information and Documentation, 2005, no. 2, pp.. Abstracts: Deals with the approach to building up electronic libraries; Considers structural aspects, technical infrastructure and digitized collections of electronic libraries; Mentions organization of digitizing documents within information institutions in the National Information System.
File đính kèm:
- xay_dung_thu_vien_dien_tu_va_van_de_so_hoa_tai_lieu_o_viet_n.pdf