XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ LƯU TRỮ TÀI LIỆU ĐIỆN TỬ Ở VIỆT NAM HIỆN NAY

Xem cỡ chữ

Trong nhũng năm gần đây, sự phát triển mạnh mẽ của công nghệ thông tin và các-phương tiện điện tử đã tạo tiền đê xuât hiện một loại hình tài liệu mới: tài liệu điện tử. Loại hình tài liệu này với những ưu thế của mình đă nhanh chóng phát triển tại nhiều quốc gia trên thế giới, trong nhiều ngành nghề, lĩnh vực và đặc biệt trở thành nguôn thông tin được tiếp cận một cách nhanh chóng trên toàn cầu

Sự xuất hiện của tài liệu điện tử đã đặt ra cho ngành lưu trữ nói riêng và các ngành thông tin nói chung những thách thức mới, đòi hỏi các chuyên gia phải có những nghiên cứu tìm cách quản lý, lưu trữ hô sơ tài liệu điện tử. Đặc biệt, trong giai đoạn hiện nay, tài liệu điện tử xuất hiện ngày càng nhiều thì việc nghiên cứu, tìm cách quản lý có hiệu quả loại hình tài liệu này là một vấn đề bức thiết. Do vậy, việc nghiên cứu xây dựng các giải pháp ứng dụng cho việc quản lý và lưu trữ tài liệu điện tử là vô cùng quan trọng.
1. Hiện trạng sử dụng công nghệ quản lý và lưu trữ dữ liệu


Ngày nay, với việc ứng dụng mạnh mẽ công nghệ thông tin vào công việc trong các cơ quan, tổ chức, doanh nghiệp và sự xuất hiện của tài liệu điện tử đã làm thay đổi cách thức lưu trữ và quản lý tài liệu. Khác với tài liệu truyền thống là thông tin được ghi trên các vật mang tin và con người có thể đọc trực tiếp thì đối với tài liệu điện tử, thông tin chỉ có thể khai thác, sử dụng được thông qua máy tính có chứa phần mềm tương thích.


Mặc dù được trang bị các công nghệ hiện đại vào việc quản lý tài liệu điện tử, song ở nước ta vẫn tồn tại song song cả hai dạng là lưu trữ tài liệu điện tử (mới) và tài liệu giấy (truyền thống). Đối với hệ thống lưu trữ tài liệu mới, việc áp dụng công nghệ thông tin để quản lý và lưu trữ tiện dụng cho việc khai thác, quản lý và bảo mật. Song việc đầu tư và nắm bắt công nghệ còn  một số hạn chế như : đầu tư mang tính tạm thời, thiếu giải pháp tổng thể, đội ngũ nhân lực chưa nắm bắt được công nghệ…dẫn đến việc áp dụng, chuẩn hóa các loại văn bản hồ sơ chưa thống nhất, việc quản lý và sử dụng còn nhiều hạn chế và mất nhiều thời gian để tìm kiếm thông tin. Tại các cơ quan đơn vị chưa thống nhất cách thức lưu trữ, mỗi đơn vị áp dụng một hệ thống lưu trữ, quản lý dữ liệu khác nhau dẫn đến không đồng bộ trong việc trao đổi, chia sẻ và quản lý nguồn tài nguyên chung của toàn cơ quan. Từ đó dẫn đến việc lãng phí trong đầu tư và hiệu quả sử dụng thấp.

2. Giải pháp xây dựng nhằm tối ưu hóa quá trình quản lý và lưu trữ dữ liệu

Để xây dựng hệ thống lưu trữ tài liệu điện tử thì các cơ quan, tổ chức, doanh nghiệp cần phải xây dựng một giải pháp đầu tư tổng thể, từng bước theo nhiều giai đoạn khác nhau, lập kế hoạch phát triển mở rộng hệ thống trong tương lai nhằm gia tăng hiệu suất công việc và an toàn cho hệ thống đã đầu tư cũng như việc đào tạo cho người sử dụng nắm bắt được công nghệ. Giải quyết vấn đề này, trước tiên cần phải đánh giá được nhu cầu lưu trữ liên quan tới các ứng dụng dữ liệu, cách thức cũng như vị trí truy xuất dữ liệu. Để xác định một cách chính xác nhu cầu chúng ta phải đưa ra một số tiêu chí như sau:
-    Ứng dụng nào tạo ra các tệp tin cần lưu trữ, dung lượng là bao nhiêu?
-    Ứng dụng nào chạy trên các máy chủ loại nào?
-    Vòng đời của dữ liệu (lưu trữ trong bao lâu, các cơ chế lưu trữ thế nào)?
-    Khả năng mở rộng hệ thống?
-    Mức độ an toàn của hệ thống (xây dựng hệ thống dự phòng)?
-    Mức thời gian cần để truy xuất dữ liệu (nhanh hay chậm)?
-    Truy xuất dữ liệu từ những vị trí nào?
-    Chi phí triển khai?
-    Chi phí các thành phần liên quan?
Từ các tiêu chí trên chúng mới có thể tiếp tục xây dựng các giải pháp chi tiết về phần mềm kết hợp với giải pháp phần cứng nhằm đáp ứng các tiêu chí đặt ra.
a. Giải pháp xây dựng hệ thống phần mềm quản lý
Một hệ thống quản lý dữ liệu chính xác, hiệu quả, đáp ứng nhanh chóng các nhu cầu sử dụng của người dùng càn được khảo sát kỳ lưỡng trước khi bắt tay vào xây dựng và thông thường phải bảo đảm một số yêu cầu sau:
-    Cho phép quản lý người dùng, nhóm người dùng một cách dễ dàng.
-    Có cơ chế sao lưu dữ liệu, dự phòng bảo đảm an toàn hệ thống.
-    Phân quyền truy cập: Hệ thống có khả năng phần quyền truy cập theo từng cá nhân, nhóm người sử dụng, nhóm tài liệu, mức độ bảo mật...
-    Hỗ trợ đa ngôn ngữ.
-    Quản lý tài liệu cho phép:
+ Truy cập và cập nhật thông tin mọi lúc mọi nơi.
+ Phân quyền: tạo lập, quản lý, theo dõi và xem tài liệu.
+ Dễ dàng di chuyển tài liệu.
+ Đăng nhập và đăng xuất tài liệu truy cập theo phân quyền sử dụng.
+ Quản lý tài liệu theo phiên bản (Version).
+ Quản lý lịch sử (History) của tài liệu.
-    Tìm kiếm tài liệu:
+ Khả năng tìm nội dung full-text (tìm kiếm nội dung bất kỳ trong fĩle tài liệu).
+ Tìm kiếm theo các tiêu chí lựa chọn.
+ Tìm kiếm và so sánh các tài liệu giống nhau.
+ Tìm kiếm mờ (Fuzzy search).
-    Tự động phân tích nội dung tài liệu: Hệ thống có khả năng tự động phân tích nội dung các file tài liệu đưa vào hệ thống nhằm phân loại và lưu trữ các loại tài liệu cùng loại hiệu quả. Hỗ trợ với hầu hết các loại định dạng tài liệu phổ biến hiện nay: PDF files, Microsoít Word 97-2010, Microsoft Excel 97-2010, Microsoft Povverpoint 97- 2010, RTF íĩles, Star Office/Open Offíce, HTML íiles, XML files, TXT files, Dbase...
-    Trao đổi thông tin:
+ Tích hợp tính năng web serives giúp các hệ thống khác có thể dễ dàng tương tác.
+ Tích hợp khả năng gửi nhận tin nhắn trong nội bộ người dùng.
+ Tích hợp gửi nhận email, nhằm thông báo các sự thay đổi các tài liệu dùng chung.
+ Cho phép người sử dụng chia sẻ tài liệu, thông tin và tri thức một cách hiệu quả, tiết kiệm thời gian
-    Các thông số kỹ thuật:
+ Người dùng tương tác với hệ thống qua giao diện web (giao thức HTTP).
+ Máy chủ, máy trạm:
Máy chủ cơ sở dữ liệu: Oracle / DB2/ Mysql / MS SQL/ HSQLDB/ PostgreSQ/ SAP /...
Máy chủ ứng dụng: WebLogic Server (BEA), JBoss (Red Hat), WebSphere Application Server và WebSphere Application Server Community Edition (IBM), JRun (Adobe), Apache Geronimo (Apache Software Foundation), Oracle OC4J (Oracle Corporation),Sun Java System Application Server (Sun Microsystems),    e
Application Server và GlassfiSsh Application Server,.NET Framework.
+ Máy khách (người dùng đầu cuối): Internet Explorer, Mozilla, Opera, Netscape, Firefox, Chrome, Safari...
+ Hệ điều hành: Windows Server 2003 / Windows Server 2008, Windo\vs Server 2012, AIX, Oracle Solaris, HP UNIX, Redhat, Ubutu...
b. Giải pháp xây dựng hệ thống phần cứng
Do dung lượng dữ liệu gia tăng không ngừng, yêu cầu ngày càng cao về hiệu năng truy xuất, tính ổn định và sự sẵn sàng của dữ liệu, việc lưu trữ đã và đang trở nên rất quan trọng. Lưu trữ dữ liệu không còn đơn giản là cung cấp các thiết bị lưu trữ dung lượng lớn mà còn bao gồm cả khả năng quản lý, chia sẻ cũng như sao lưu và phục hồi dữ liệu trong mọi trường hợp.
Để lưu trữ dữ liệu người ta có thể dùng nhiều thiết bị khác nhau, nhiều công nghệ khác nhau. Các kho dữ liệu có thể là dùng đĩa cứng băng từ, đĩa quang, ổ đĩa thể rắn... Tuỳ theo yêu cầu cụ thể của bai toán đặt ra mà lựa chọn công nghệ và thiết bị cho phù hợp. Theo cơ chế lưu trữ, hiện nay có một số loại hình lưu trữ dữ liệu cơ bản như:
-    DAS (Direct Attached Storage): lưu trữ dữ liệu qua các thiết bị gắn trực tiếp vào máy chủ.
-    NAS (Network Attached Storage): lưu trữ dữ liệu vào thiết bị lưu trữ thông qua mạng IP.
-    SAN (Storage Area Netvvork); lưu trữ dữ liệu qua mạng lưu trữ chuyên dụng riêng.
Mỗi loại hình lưu trữ dữ liệu có những ưu nhược điềm riêng và được dùng cho những trường hợp nhất định.

Giải pháp lưu trữ truyền thống DAS

DAS (Direct attached storage) là cơ chế lưu trữ với thiết bị gắn trực tiếp vào máy chủ. Đây được coi là công nghệ lưu trữ truyền thống được nhiều doanh nghiệp sử dụng. Với cơ chế DAS, mỗi máy chủ sẽ có một hệ thống lưu trữ và phần mềm quản lý lưu trữ riêng biệt. Ưu điểm của giải pháp DAS là khả năng dễ lắp đặt, chi phí thấp, hiệu năng cao.
Tuy nhiên, nhược điểm của DAS là khả năng mở rộng hạn chế. Thực tế DAS làm việc rất tốt với một server nhưng khi dữ liệu tăng, sô lượng máy chủ cũng tăng sẽ tạo nên những vùng dữ liệu phân tán và gián đoạn. Khi đó, nhà quản trị sẽ phải bổ sung hay thiết lập lại dung lượng, và công việc bảo trì sẽ phải thực hiện trên từng server. Điều đó sẽ làm tăng chi phí lưu trữ tổng thể cho doanh nghiệp và sẽ càng khó khăn hơn khi muốn sao lưu hay bảo vệ một hệ thống kho lưu trữ dữ liệu đang nằm rải rác và phân tán như vậy.

NAS (Network Attached Storage) là phương pháp lưu trữ dữ liệu sử dụng các thiết bị lưu trữ đặc biệt gắn liền trực tiếp vào mạng LAN như một thiết bị mạng bình thường (tương tự máy tính, switch hay router). Các thiết bị NAS cũng được gán các địa chỉ IP cố định và được người dùng truy nhập thông qua sự điều khiển của máy chủ. Trong một số trường hợp, NAS có thể được truy cập trực tiếp không cần có sự quản lý của máy chủ.


Trong môi trường đa hệ điều hành với nhiều máy chủ khác nhau, việc lưu trữ dữ liệu, sao lưu và phục hồi dữ liệu, quản lý hay áp dụng các chính sách bảo mật đều được thực hiện tập trung.


Ưu điểm cùa NAS
Khả năng mở rộng: khi người dùng cần thêm dung lượng lưu trữ, các thiết bị lưu trữ NAS mới có thể được bổ sung và lắp đặt vào mạng.
NAS cũng tăng cường khả năng chống lại sự cố cho mạng. Trong môi trưòng DAS, khi một máy chủ chứa dữ liệu không hoạt động thì toàn bộ dữ liệu đó không thể sử dụng được. Trong môi trường NAS, dữ liệu vẫn hoàn toàn có thể được truy nhập bởi người dùng. Các biện pháp chống lỗi và dự phòng tiên tiến được áp dụng để bảo đảm NAS luôn sằn sàng cung cấp dừ liệu cho người sử dụng.


Nhược điểm của NAS
Với việc sử dụng chung hạ tầng mạng với các ứng dụng khác, việc lưu trữ dừ liệu có thể ảnh hưỏTig đến hiệu năng của toàn hệ thống (làm chậm tốc độ của LAN), điều này đặc biệt đáng quan tàm khi cằn lưu trữ thường xuyên một lượng lớn dừ liệu.
Trong môi trường có các hệ cơ sở dữ liệu thì NAS không phải là giải pháp tốt vì các hệ quản trị cơ sở dữ liệu thường lưu dữ liệu dưới dạng block chứ không phải dưới dạng file nên sử dụng NAS sẽ không cho hiệu năng tốt.

Giải pháp lưu trữ SAN

SẠN (Storage Area Network) là một mạng riêng tốc đô cao dùng cho việc truyền dữ liệu giữa các máy chủ tham gia vào hệ thống lưu trữ cũng như giữa các thiết bị lưu trữ với nhau. SAN cho phép thực hiện quản lý tập trung và cung cấp khả năng chia sẻ dữ liệu và tài nguyên lưu trữ. Hầu hết mạng SAN hiện nay dựa trên công nghệ kênh cáp quang, cung cấp cho người sử dụng khả năng mở rộng, hiệu năng và tính sẵn sàng cao.
Hệ thống SAN được chia làm hai mức: mức vật lý và logic
Mức vật lý: mô tả sự liên kết các thành phần của mạng tạo ra một hệ thông lưu trữ đông nhất và có thể sừ dụng đồng thời cho nhiều ứng dụng và người dùng.
- Mức logic: bao gồm các ứng dụng, các công cụ quản lý và dịch vụ được xây dựng trên nền tảng của các thiết bị lóp vật lý, cung cấp khả năng quản lý hệ thống SAN.
Ưu điểm cùa hệ thống SAN
Có khả năng sao lưu dữ liệu với dung lượng lớn và thường xuyên mà không làm ảnh hưởng đến lưu lượng thông tin trên mạng.
SAN đặc biệt thích hợp với các ứng dụng cần tốc độ và độ trễ nhỏ ví dụ như các ứng dụng xử lý giao dịch trong ngành ngân hàng, tài chính.
Dữ liệu luôn ở mức độ sẵn sàng cao, được lưu trữ thông nhât, tập trung và co khả năng quản lý cao, có khả năng khôi phục dữ liệu nếu có xảy ra sự cố.
Có khả năng mở rộng tốt trên cả phương diện số lượng thiết bị, dung lượng hệ thống cũng như khoảng cách vật lý.
Mức độ an toàn cao do thực hiện quản lý tập trung cũng như sư dụng các công cụ hô trợ quản lý SAN.
Hỗ trợ nhiều giao thức chuẩn lưu trữ khác nhau như. Channel, ISCSI, FICON, ESCON, NAS,...
Do đó, SAN thường được sử dụng ở những trung tâm dữ liệu lớn vì mang một số đặc điểm nổi bật như: Giảm thiểu rủi ro cho dữ liệu, khả năng chia sẻ tài nguyên rất cao, khả năng phát triển dễ dàng, thông lượng lớn, hỗ trợ nhiều loại thiết bị, hỗ trợ và quản lý việc truyền dữ liệu lớn và tính an ninh dữ liệu cao.

Hơn nữa, SAN tăng cường hiệu quả hoạt động của hệ thống bằng việc hỗ trợ đồng thời nhiều hệ điều hành, máy chủ và các ứng dụng, có khả năng đáp ứng nhanh chóng với những thay đổi về yêu cầu hoạt động của một tổ chức cũng như yêu cầu kỹ thuật của hệ thống mạng.
 
3. Kết luận
Từ thực trạng, tiêu chí xây dựng hệ thống phần mềm quản lý và các giải pháp xây dựng hệ thống phần cứng ở trên, chúng ta có thê lựa chọn một giải pháp phù hợp đáp ứng đúng với nhu câu thực tế, tối ưu hoá hiệu quả đầu tư nhằm nâng cao hiệu suất công việc, dễ dàng quản lý cùng như bảo đảm an toàn cho hệ thống dữ liệu.
Hiện nay ở nước ta đã có rất nhiều cơ quan doanh nghiệp đã làm chủ được công nghệ và tiến một bước dài trong việc áp dụng công nghệ thông tin vào quản lý và lưu trữ dữ liệu, đặc biệt họ đã tạo ra các “Văn phòng không giấy tờ”, mọi tài liệu, quy trình hoạt động, trao đổi thông tin, báo cáo, phê duyệt... đã được “Online” hoá hoàn toàn, tạo hiệu quả tối đa cho công việc.

                                                                                Nguồn (Kỷ hiếu Hội thảo khoa học Quản lý tài liệu điện tử và lưu trữ điện tử) 
 

Bình luận


Mã kiểm tra


 
 

Tìm kiếm