Giáo trình Kỹ thuật số hóa tài liệu

Tóm tắt Giáo trình Kỹ thuật số hóa tài liệu: ...n giải cao nhất của màn hình ở các tốc độ trên 70 Hz. Các video card tốc độ cao được thiết kế sao cho một chip CPU nằm trên chính bộ điều khiển. Các bộ điều khiển với những chip như vậy, thường do công ty S3 sản xuất, đôi khi được gọi là "bộ tăng tốc đồ hoạ" (graphics accelerator) hay "bo ...chu kỳ làm việc trên 1 triệu ảnh/ tháng, có khả năng in 135 ppm ở mức 600 dpi ($250 000) Máy in- copy - máy in chủ có kết cấu CPU, bộ xử lý ảnh mành (raster image processor- RIP), bộ nhớ hệ thống, có khả năng nối mạng và phần mềm cho phép máy photocopy số chuẩn in ảnh số - độ phân giải t... Ngoài ra, việc phân vùng có thể được làm tự động. Khi phân vùng tự động, tính chính xác có thể bị giảm. Phân vùng bằng tay đảm bảo trình tự đọc đúng, nhưng lại đòi hỏi nhiều thời gian và nhân lực, vì vậy chỉ cần áp dụng khi phân vùng tự động không nhận dạng được những vùng chữ quá nhỏ (ví d...

pdf283 trang | Chia sẻ: havih72 | Lượt xem: 216 | Lượt tải: 0download
Nội dung tài liệu Giáo trình Kỹ thuật số hóa tài liệu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
được sử dụng. Nếu rr = 10, kích thước tư 
liệu tối đa là 12,5" (1,25 x 10 = 12,5). Nếu rr = 8, tư liệu 10" sẽ vừa khít 
với khoảng mở trên phim (1,25 x 8). Ngược lại, nếu biết kích thước của 
tư liệu nguồn và độ mở của camera, ta sẽ tính được tỉ lệ thu nhỏ bằng 
cách chia một kích thước của tư liệu cho độ mở (ví dụ, chia 12" cho 1,25, 
ta được tỉ lệ thu nhỏ = 10 (12: 1,25 = 9,6 và được làm tròn lên 10). 
Tính kích thước tư liệu tối đa (chiều rộng hoặc chiều dài) trên phim 
Công thức này có thể được tối giản nếu bạn thường xuyên dùng một cỡ 
phim nhất định, biết độ mở và chuyển về đơn vị in. 
kích thước tư liệu tối đa trên phim 16mm = 0,59 x rr 
kích thước tư liệu tối đa trên phim 35mm = 1,25 x rr 
Lưu ý: Những công thức dùng khi chụp 1 tư liệu trên 1 khung. Nếu 2 
ảnh/ 1 khung thì kích thước tư liệu tối đa chỉ còn bằng một nửa. Ngoài 
ra, giữa 2 ảnh lại thường phải có một khoảng cách. Cuốn RLG 
Preservation Microfilming Handbook đưa ra *. Các kích thước RLG 
nhỏ hơn mức trung bình 1", ví dụ: đối với phim 85mm ở rr = 8, kích 
thước tối đa được đưa ra là 9. 
Bảng 2. Các kích thước tư liệu đối đa cho các phim 16mm và 35mm với 
các tỉ lệ thu nhỏ chuẩn 
RR 16mm 35mm 
8 4,7 10 
9 5,3 11,25 
10 5,9 12,5 
11 6,49 13,75 
12 7,0 15,0 
13 7,67 16,25 
14 8,3 17,5 
16 8,8 18,8 
16 9,4 20 
Chương này sẽ khảo sát một giải pháp "lai" nhằm tạo ra cả các vi phim 
gốc (microfilm masters) và ảnh số để lưu trữ và khai thác được các tư 
liệu nghiên cứu chất lượng kém. Các phương pháp của trường Đại học 
Yale (tạo ra ảnh số từ vi phim) và trường Đại học Cornell tạo ra COM 
(Computer Output Microfilm) từ các ảnh có độ phân giải cao) cũng sẽ 
được xem xét. Ngoài ra chương này còn bàn đến những vấn đề liên quan 
đến việc chuẩn bị tư liệu vi phim cho quá trình quét ảnh số. 
Biện giải cho giải pháp tạo ra cả phim và các phiên bản số 
Chương 1 và 2 đã bàn về những thuận lợi và khó khăn trong việc sử 
dụng ảnh số vào thư viện và lưu trữ. Một trong số những khó khăn lớn 
là thiếu một phương pháp được chấp nhận rộng rãi để khai thác được 
lâu dài các sưu tập ảnh số. Chỉ khi nào một phương pháp chuẩn được 
thực hiện cùng với các phương tiện kỹ thuật và giao thức chuẩn để di 
chuyển dữ liệu số hoá (xem chương 9) thì các thư viện và cơ sở lưu trữ 
mới dám thực hiện những dự án ảnh số vượt qua mức thí điểm. 
Năm 1992, uỷ ban Lưu trữ và Khai thác đã xuất bản tập báo cáo gây 
tiếng vang lớn của Don Willis mang tên "A Hybrid Systems Approach to 
Preservation of Printed Materials" (Một giải pháp hệ thống lai cho lưu 
trữ các vật liệu in). Trong báo cáo này, Willis đã biện luận hùng hồn cho 
giải pháp đồng thời tạo ra cả vi phim (để lưu trữ) và ảnh số (để khai 
thác). Tác giả bàn về những khả năng lựa chọn khác nhau để tạo ra cả 
phim lẫn tệp số, lưu ý về các ưu điểm và cân nhắc giữa chụp vào phim 
trước rồi mới quét hay quét trước rồi tạo ra phim từ ảnh số sau. Giải 
pháp tạo ra các vi phim gốc cho lưu trữ và tệp số chủ để khai thác có khả 
năng sẽ trở thành sự chọn lựa của thập niên tới, ít nhất là đối với các vật 
liệu được sử dụng rộng rãi và các vật liệu được lưu trữ để phân phối. 
Vấn đề thực sự có thể chỉ là xác định xem trường hợp nào nên sử dụng 
phương pháp "phim trước" và trường hợp nào nên "quét trước". 
Nâng cao mức chất lượng ảnh 
Cho đến nay, ta mới chỉ bàn về chất lượng ảnh dưới góc độ "bắt được 
đầy đủ thông tin" một cách phù hợp nhất với chi phí và khả năng khai 
thác. Giải pháp lai đòi hỏi phải đáp ứng được cả những yêu cầu về lưu 
trữ khi xét đến chất lượng ảnh số. Điều này hoàn toàn không thể thiếu 
trong một dự án chuyển đổi mà sau đó tư liệu nguồn có thể bị loại bỏ. 
Các nghiên cứu của Cornell và Yale 
Là hai dự án đang tiến hành, được tài trợ bởi Quỹ Tài trợ Khoa học 
nhân văn Quốc gia năm 1994, nhằm kiểm tra và đánh giá quan hệ tương 
hỗ giữa vi phim và ảnh số. 
Dự án "Từ số hoá đến COM" của Cornell 
Cornell đang tiến hành một dự án chứng minh kéo dài 2 năm về chuyển 
đổi các sách dễ hỏng thành các ảnh số 600 dpi 1-bit chất lượng cao, và 
tạo ra COM (vi phim ra từ máy tính) đáp ứng được các chuẩn lưu trữ về 
chất lượng và độ bền được xác định bởi ANSI/AIIM. 1500 tập sách được 
chọn để quét trong dự án là sách về lịch sử nông nghiệp trong thế kỷ 19 
và 20. Tất cả các sách đều được tự quét và các sản phẩm COM được 
cung cấp cho Image Graphics, Inc. của Shelton, CT. Các ảnh số được 
đưa vào khai thác trong mạng của trường Đại học Cornell. Dự án nhằm 
rút ra các đánh giá về chất lượng, chi phí, đồng thời soạn thảo một cuốn 
sách hướng dẫn về sử dụng loại sản phẩm được gọi là "raster COM" ở 
các viện nghiên cứu và hãng dịch vụ. 
Dự án "Open Book" của Yale 
Trường Đại học Yale đang tiến hành một dự án dài hạn chuyển đổi vi 
phim thành ảnh số. "Open Book" là một dự án nghiên cứu và chứng 
minh nhằm nghiên cứu các phương tiện, chi phí và lợi ích của việc số hoá 
10 000 tập sách được lưu trữ trong các thư viện - gồm các sưu tập về 
Lịch sử nước Mỹ, Lịch sử châu Âu và Lịch sử Khoa học Kinh tế Chính 
trị - đã được chụp vào vi phim theo các chuẩn RLG vào cuối thập kỷ 80. 
Trong phạm vi dự án này, vi phim của 2000 tập sách đã được quét thành 
các ảnh số 600 dpi 1-bit. Dự án đã xây dựng một hệ thống sách dẫn phục 
vụ khai thác ảnh để nghiên cứu và có thể khai thác trực tuyến trên mạng 
của trường Đại học Yale. 
Báo cáo kết hợp 
Cornell và Yale đều nhận thấy tầm quan trọng và khả năng bổ trợ cho 
nhau của hai dự án. Hai dự án đều có các điểm chung là: 
tạo ra phim và ảnh số có độ phân giải cao 
sử dụng cùng một công nghệ để sách dẫn và quản lý cơ sở dữ liệu 
tăng khả năng sử dụng các nguồn tài liệu cổ qua khai thác trực tuyến 
dữ liệu tương ứng về nội dung và chi phí, sản xuất, chất lượng- là đối 
tượng tốt cho các phân tích so sánh 
Đây là hai dự án có ý nghĩa lớn trong lưu trữ vì mục tiêu của nó là tìm 
hiểu về tình huống thích hợp để quét trước hay chụp phim trước sao cho 
đạt được cả hai mục tiêu lưu trữ và tăng cường khai thác qua công nghệ 
số. Báo cáo kết hợp của Cornell và Yale sẽ được xuất bản vào mùa thu 
1996. 
Phương pháp "phim trước" 
Phương pháp này có những ưu điểm chính là đáp ứng được cả các mục 
tiêu lưu trữ trên phim theo những tiêu chuẩn đã được xác định rõ, và 
xác định được chất lượng ảnh số để đáp ứng được các nhu cầu hiện tại 
và trong tương lai về khai thác. Tuy nhiên, cần phải luôn lưu ý rằng quét 
phim sẵn sẽ khó khăn và tốn kém hơn quét nguyên bản bằng giấy hoặc 
phim được tạo ra chỉ với mục đích số hoá. 
Ưu điểm 
có các chuẩn rõ ràng trong0 lưu trữ với vi phim 
độ phân giải ảnh cao 
việc tạo ra, quản lý và lưu giữ vi phim lưu trữ nằm trong khả năng của 
các cơ sở 
chuyển đổi được các vật liệu cỡ lớn và sách dày 
có sẵn thiết bị và sử dụng được các cơ sở dịch vụ 
phim có sẵn (không mất chi phí chuẩn bị và chụp) 
tốc độ chuyển đổi từ phim nhanh hơn từ giấy (đặc biệt là với sách dày) 
Hạn chế 
chất lượng ảnh 
- ảnh số phải chịu ảnh hưởng của nhiều công đoạn trong chuỗi số hoá 
hơn: từ giấy - phim - ảnh số - chất lượng bị giảm 2 cấp (xem các ví dụ ở 
trang sau) 
- chỉ sử dụng được phim có độ tương phản cao có thang biến đổi hẹp, 
không phù hợp với những dạng tư liệu không phải là bản văn 
- được tối thích hoá để quét bản văn, hoặc để quét ảnh minh hoạ; thường 
phải làm 2 lần để quét được cả hai 
- chất lượng phim ảnh hưởng đến chất lượng ảnh số (mật độ và rr khác 
nhau, lệch, xước, chấm bẩn, chỗ nối) - đặc biệt với các phim từ trước 
năm 1985 
- độ phân giải của máy quét phim có thể không đủ để bắt được đầy đủ 
thông tin cần thiết 
- máy quét phim có thể không hợp với rr được sử dụng - khi đó các ảnh 
số sẽ không có kích thước giống nguyên bản 
chi phí 
- các ảnh trên phim nằm lệch lạc làm chậm quá trình số hoá - thường 
xuyên phải điều chỉnh bằng tay các thiết định của quá trình quét (rr, 
ngưỡng, xén ảnh,...) 
- sự khác nhau về kích cỡ làm chậm quá trình số hoá hoặc làm giảm độ 
phân giải 
- sách dẫn phim tốn thời gian hơn sách dẫn trên tư liệu từ giấy 
- kết quả thử nghiệm của trường Đại học Yale cho thấy giá quét phim là 
0,254$/ ảnh (xem thêm thông tin về nghiên cứu thử nghiệm này ở ) 
lựa chọn để quét 
- quét từ phim: quét cuộn phim thay cho quét theo chủ đề có thể ảnh 
hưởng đến các quét định chọn lọc và chi phí để quét; các sưu tập số theo 
chủ đề có thể sẽ chậm được hoàn thành vì phải chuyển đổi những cuộn 
phim có sẵn, đặc biệt trong các dự án được chia thành nhiều phần 
(Conway, D-Lib Magazine) 
Thách thức cơ bản của phương pháp này là phải hợp tác được với các 
hãng sản xuất để phát triển các phương tiện quét phim cũ một cách hiệu 
quả và tạo ra các phim mới phù hợp với dạng số mà nó sẽ được chuyển 
đổi thành. 
Phương pháp quét trước 
Ưu điểm chính của phương pháp này là tạo ra các ảnh số chất lượng cao 
trực tiếp từ nguyên bản, sau đó tạo ra vi phim từ các ảnh đó mà chất 
lượng không bị giảm hoặc giảm dưới mức có thể nhận biết. Với các tính 
năng chỉnh sửa ảnh, các máy quét giấy ngày nay trở thành một phương 
tiện hiệu quả để quét bản văn và ảnh minh hoạ trung thực với nguyên 
bản. Nhờ vậy, cả ảnh số lẫn COM đều đạt được yêu cầu về chất lượng. 
Tuỳ vào loại tư liệu được chọn để chuyển đổi mà phương pháp quét 
trước có thể mang lại chất lượng cao - đồng thời với chi phí thấp hơn - 
để tạo ra cả phim và ảnh số. Tuy nhiên phương pháp này thể hiện mặt 
hạn chế của nó trong chuyển đổi các tư liệu cỡ lớn hoặc sách dày, đòi hỏi 
cơ sở kỹ thuật cao để xử lý ảnh (cả quét và tạo ra COM) và sự hợp tác 
với các hãng sản xuất để phát triển các chuẩn dành cho COM trong lưu 
trữ. 
Ưu điểm 
chất lượng 
- ảnh số thuộc thế hệ đầu tiên, được quét trực tiếp từ nguyên bản - chất 
lượng chỉ bị giảm 1 cấp (xem ví dụ tr.179) 
- chất lượng giảm không đáng kể qua công đoạn từ ảnh số đến COM: 
giấy - số - phim - chỉ là một cấp giảm chất lượng ảnh 
- mật độ, kích thước ảnh, vị trí ảnh và khoảng cách trên COM hoàn toàn 
không thay đổi 
- có tính năng nửa tông tinh tế nên tạo được màu xám kể cả khi quét đen 
trắng 
- tính năng xem trước cho phép điều chỉnh trước khi chuyển đổi và xử lý 
- sản phẩm bằng giấy có chất lượng cao 
chi phí 
- thời gian chuẩn bị ngắn hơn vì tư liệu có thể được quét ngay chứ không 
phải đợi hoàn chỉnh 
- có thể sách dẫn trong chính quá trình chuyển đổi 
- các thủ tục kiểm tra chất lượng đối với COM được thông suốt vì các 
vấn đề về chất lượng ảnh đã được xác định ngay từ khi bắt đầu quét0 
- quét COM: kích thước, vị trí ảnh, khoảng cách và mật độ cố định giúp 
quá trình chuyển đổi được tiến hành nhanh hơn 
- chi phí cho quét giấy ở độ phân giải cao giảm nhanh; chi phí để tạo ra 
COM thấp hơn 0,25$/ khung (2 ảnh) 
lựa chọn để chuyển đổi 
- tư liệu có thể được thu thập từ những địa điểm khác nhau, được quét ở 
những địa điểm khác nhau, sau đó ghi vào COM khi đã được hoàn chỉnh 
Hạn chế 
độ phân giải số thấp hơn độ phân giải ảnh chụp trong quá trình quét 
năng suất 
chưa có những chuẩn cần thiết cho các quy trình quét lưu trữ và tạo ra 
COM gồm các chuẩn về thư mục, sản xuất và kỹ thuật; khi ảnh số 
(không phải giấy) được ghi vào phim, nhìn chung là các yêu cầu về vi 
phim trong lưu trữ thường không được bảo đảm đầy đủ 
số lượng hãng kinh doanh COM có độ phân giải cao ít hơn số hãng quét 
phim 
quét COM: sử dụng các tỉ lệ thu nhỏ khác nhau có thể gây khó khăn cho 
việc tái tạo kích thước nguyên bản; độ phân giải thấp gây ra chất lượng 
ảnh số thấp 
Thách thức cơ bản khi sử dụng phương pháp này là phải phát triển và 
áp dụng các chuẩn về chất lượng và độ bền của ảnh, và phải thúc đẩy các 
hãng dịch vụ COM đưa ra những sản phẩm đáp ứng được những yêu 
cầu kỹ thuật này. 
Bước 1: Từ giấy đến vi 
phim 
Từ giấy đến ảnh số 
chuẩn bị thu thập đầy đủ 
bản sao đo ký tự 
nhỏ nhất "e" tạo 
ra các bảng chuẩn 
và trình tự quét 
tập hợp các tư liệu có sẵn xác 
định dpi, số bit; trình tự quét 
(không bắt buộc) chuẩn bị tài 
liệu cho cấu trúc sách 
chuyển 
đổi 
phim xem trước, khẳng định, quét; 
tạo ra các thư mục chứa tệp 
sách dẫn chuẩn bị chỉ dẫn 
về trình tự của 
sưu tập (không 
bắt buộc) 
sắp xếp các tệp 
xử lý tạo ra nhiều thế 
hệ 
tạo ra các tệp phái sinh 
QC mật độ kế, hộp 
sáng, máy đọc 
(nếu là phim 
dương bản) 
màn hình, giấy 
hậu xử 
lý 
chụp lại, QC, 
ghép nối 
quét lại, ghi vào đĩa 
liệt kê bổ sung danh 
mục 
nối với bảng danh mục (không 
bắt buộc) 
nhớ theo trình tự ngẫu nhiên trên đĩa 
Bước_2: Từ vi phim đến 
số 
Từ số đến COM 
chọn mục đích khai 
thác theo cuộn 
phim chứ không 
theo chủ đề 
mục đích lưu trữ 
chuẩn bị đánh giá chất 
lượng phim thu 
thập tài liệu để 
quét và sách dẫn 
xác định dpi, số 
bit 
kiểm tra tính thống nhất của 
dữ liệu; tạo ra các bảng chuẩn; 
xác định dpi phim, số bit; đặt 
RR; reel program; kết xuất các 
ảnh/ target để ghi chúng theo 
chiều đúng 
chuyển 
đổi 
xem trước, quét, 
khẳng định; tạo ra 
các thư mục chứa 
tệp 
ghi ảnh trực tiếp vào phim 
sách dẫn xác định "cấu trúc 
sách" từ các ảnh 
số, sau đó sắp xếp 
các tệp 
(không cần thiết) 
xử lý tạo các tệp phái 
sinh 
tạo ra một thế hệ 
QC màn hình, giấy mật độ kế, hộp sáng 
hậu xử 
lý 
quét lại, ghi vào 
đĩa 
quét lại, ghi vào COM, ghép 
nối 
liệt kê nối với bảng danh 
mục (không bắt 
buộc) 
tạo ra bản vi phim 
nhớ ngẫu nhiên trên 
đĩa 
theo trình tự 
Chương này sẽ bàn về những vấn đề trong việc duy trì khai thác các sưu 
tập ảnh số và cung cấp các nguồn tài liệu tham khảo cũng như nghiên 
cứu sâu hơn. Chúng tôi cũng cố gắng xác định những nguồn tài liệu có 
thể khai thác trực tuyến, và các URL ở đây đều có từ sau tháng 6-1996. 
Duy trì khai thác 
Đã có rất nhiều bài viết và nghiên cứu về "phục hồi" hay "di chuyển" 
các vật liệu số qua các cấu hình cứng/ mềm và các thế hệ sau này của 
công nghệ máy tính. Gần đây nhất là báo cáo RLG/CPA Task Force 
mang tên Preserving Digital Information: Final Report and 
Recommendations. Báo cáo đưa ra những khái niệm rõ ràng nhất trong 
vấn đề duy trì khai thác thông tin số. Bản báo cáo phân biệt giữa "phục 
hồi" và "di chuyển" như sau: 
Mục đích của di chuyển là để bảo vệ tính thống nhất của các đối tượng 
số và để đảm bảo khả năng khách hàng có thể gọi, hiển thị và mặt khác 
sử dụng những đối tượng đó ngay cả khi công nghệ thay đổi hàng ngày. 
Di chuyển bao gồm phục hồi, cũng là một cách lưu trữ bằng công nghệ 
số nhưng khác với di chuyển ở chỗ: phục hồi thường không tạo ra được 
một bản sao chính xác của một cơ sở dữ liệu hoặc một đối tượng thông 
tin tương tự khi phần cứng và phần mềm thay đổi và vẫn duy trì tính 
tương thích của đối tượng với thế hệ mới của công nghệ. (Task Force, 
tr.6) 
Sự phân biệt này có ý nghĩa quan trọng vì nó tập trung vào vào công 
nghệ duy trì khả năng sử dụng. Để tạo ra những bản sao chính xác từng 
bit một của thông tin số thì không khó, song đảm bảo sự bền vững của 
tính chính xác đó thì lại không đơn giản. Cho đến nay, vẫn chưa có một 
quy trình thống nhất hay một chương trình chính thức nào để di chuyển 
(và thậm chí để phục hồi) các sưu tập ảnh số. Báo cáo Task Force đề 
xuất một số bước phát triển khả năng này. Bản báo cáo kêu gọi tạo ra 
một cơ sở hạ tầng quốc gia như một hệ thống lưu trữ số để chọn và lưu 
giữ các nguồn thông tin số. Bản báo cáo cũng thúc giục sự hợp tác giữa 
"những người cầm lái" trong việc tạo ra các bộ phận của cơ sở hạ tầng 
đó, phát triển các chuẩn và quy định, và dùng đến các rào chắn pháp 
luật và kinh tế để bảo vệ thông tin số. 
Nhiều consortia và tổ chức chuyên môn đã bắt đầu tìm cách giải quyết 
các vấn đề gắn với phát triển và duy trì các sưu tập số trong thư viện. 
Các cuộc thảo luận về những mô hình khác nhau đang được tiến hành 
bởi các tổ chức như Liên minh về thông tin mạng (Coalition for 
Networked Information), Hiệp hội Thư viện nghiên cứu (Association of 
Reseach Libraries), OCLC và RLG. 
Quỹ tài trợ Andrew W. Mellon đã tài trợ cho rất nhiều dự án xuất bản 
các ấn phẩm điện tử và phát triển thư viện số như JSTOR và các dự án 
Making of America (xem tr.191) nhằm đưa ra các mô hình kinh tế trong 
việc sử dụng các nguồn tài liệu trực tuyến. Năm 1994, Thư viện Quốc hội 
đã mở Thư viện số Quốc gia, và đến tháng 5-1995 lại liên kết với 14 thư 
viện nghiên cứu và cơ sở lưu trữ lớn nhất ở Mỹ nhằm thành lập Liên 
hiệp Thư viện số Quốc gia (NDLF). Mục đích hàng đầu của Liên hiệp là 
phát triển các quá trình và các phương tiện tổ chức để phát triển một 
thư viện số tầm cỡ quốc gia, có khả năng chọn lọc, lưu trữ và đáp ứng 
được nhu cầu khai thác rộng rãi. Để đạt được các mục tiêu của NDLF, 
một tổ đặc nhiệm đã được thành lập với nhiệm vụ xác định các điều kiện 
thủ tục và kỹ thuật đặc biệt cần thiết (liên quan đến khai thác, các quyền 
hợp pháp, kinh tế và lưu trữ). Báo cáo dự thảo của tổ đặc nhiệm sắp 
được hoàn chỉnh và sẽ có hiệu lực vào giữa năm 1996 sau khi được uỷ 
ban Lưu Trữ và Khai thác thông qua. 
Trên thế giới, các tổ chức văn hoá của Australia, gồm các thư viện hàng 
đầu ở các trường đại học và quốc gia đã thảo ra "Dự luật về Lưu trữ và 
Khai thác lâu dài các Đối tượng số ở Australia" và đưa vào mạng của 
Văn phòng Lưu trữ Quốc gia. Dự luật đưa ra 7 điều cơ bản liên quan 
đến việc tạo ra thông tin số và đưa chúng vào lưu trữ và khai thác. Một 
điều đáng chú ý là giả thiết cho rằng không cần phải ghi toàn bộ thông 
tin số, và chỉ cần bỏ chi phí vào lưu trữ các vật liệu số "khi nào chúng 
được đánh giá là vẫn còn giá trị và có ý nghĩa". 
Loại bỏ nguyên bản sau khi quét 
Mặc dù thông tin số hoá là rất có ý nghĩa nhưng dự án số hoá chỉ nên 
được thực hiện trong trường hợp lưu trữ thông tin số có lợi hơn lưu trữ 
chính nguyên bản về mặt tài chính. Số hoá ipso facto đưa ra câu hỏi: liệu 
có nên thay thế hoàn toàn nguyên bản bằng phiên bản số hoá hay không. 
Liệu ảnh số có đủ điều kiện để thay thế nguyên bản và nếu có thì khi nào 
nên loại bỏ nguyên bản? 
Dự án JSTOR dựa trên giả thiết rằng phiên bản số hoá của các cuốn tạp 
chí quan trọng hoàn toàn có khả năng thay thế cho các nguyên bản phải 
lưu trữ trên giá sách. Ngày càng có nhiều cơ sở lưu trữ thương mại và 
của chính phủ đang thực hiện các dự án sao lưu số hoá các tư liệu cần 
được lưu trữ lâu dài. Liệu các ảnh số có thể thay thế nguyên bản một 
cách hiệu quả và có lợi hay không còn là câu hỏi để ngỏ, nhưng các thư 
viện vẫn nên cân nhắc đến khả năng loại bỏ nguyên bản sau khi nội dung 
nghiên cứu của chúng đã được cô đọng vào các chữ số nhị phân. 
Hình 1 giới thiệu với bạn sơ đồ lựa chọn để quyết định xem có nên loại 
bỏ nguyên bản hay không. 
Chiến lược lưu trữ trong công nghệ ảnh số 
Chiến lược này dựa trên giả thiết rằng nguyên bản không cần phải giữ 
lại và giá trị của sưu tập số được xác định bằng nội dung nghiên cứu của 
nó chứ không bị hạn chế bằng các quyết định về mặt kỹ thuật tại một 
thời điểm nào đó của chuỗi số hoá. 
Chương trình lưu trữ thông tin số bắt đầu bằng việc cân nhắc các vấn đề 
liên quan đến di chuyển: 
quét ở mức chất lượng phù hợp với nội dung thông tin của nguyên bản; 
có kiểm tra chất lượng 
sử dụng những cấu hình hệ thống tuân theo các chuẩn thông dụng 
(không độc quyền) và các cấu trúc hệ thống mở 
sử dụng các dạng ảnh và các kỹ thuật nén không mất được sử dụng rộng 
rãi 
tạo ra các bản sao lưu dễ được phục hồi khi cần (đọc được đồng thời 
bằng máy và người sử dụng) 
duy trì các điều kiện môi trường lưu trữ phù hợp 
quản lý chặt chẽ các phương tiện, sao lại dữ liệu khi cần 
di chuyển dữ liệu và siêu dữ liệu qua các thế hệ công nghệ 
dự tính trước những tiến bộ về công nghệ trong tương lai 
Bổ sung kiến thức 
ấn phẩm này có thể trở nên lỗi thời ngay cả khi nó chưa đến được tay 
bạn, vì thế những nguồn tư liệu sau đây, được chia thành 10 nhóm, có 
thể cung cấp cho bạn một nguồn tham khảo nhất định. Chúng tôi đã cố 
gắng xác định những nguồn tài liệu có thể được cập nhật dễ dàng và 
thường xuyên, do đó có thể cung cấp cho bạn những thông tin mới nhất. 

File đính kèm:

  • pdfgiao_trinh_ky_thuat_so_hoa_tai_lieu.pdf