PDG加密技術 | ||
使用數字底紋加密技術實現檔案的加密。當大批量的檔案經過數字化存儲,網絡共享使用時,我們就的考慮到檔案的安全措施比如我們可以用服務器的IP地址作為數字底紋對檔案圖像進行加密,在其他機器上無法打開閱讀這份檔案,因為檔案的IP底紋與這臺機器的IP不一致,這樣任何人非法考走這份檔案也沒有用處,檔案只要離開這臺服務器就變得無效。我們還可以使用每臺機器特殊的硬盤、CPU信息作為數字底紋進行加密,使檔案只能在這臺機器上閱讀,不能傳播。如果使用特別的用戶信息作為數字底紋對檔案加密,還可以實現檔案的復雜密級用戶管理。
由于檔案圖像是通過特殊的壓縮技術實現的,再加上一層加密底紋,被破解的可能性是非常低的,安全性遠遠高于在文本,數據庫基礎上進行的加密。
加密技術的實現為未來的檔案有償服務提供了基本條件。我們已經成功將這套技術用于圖書的版權保護技術及圖書有償服務業務。
快捷、安全的遠程瀏覽技術
文本,數據庫可以直接通過IE等通用瀏覽器實現遠程查詢瀏覽,但卻沒有專門針對圖像的遠程瀏覽技術。檔案圖像即使經過壓縮,相比文本,數據庫數據占用空間仍然較大,在低帶寬條件下傳輸有相當困難,另外瀏覽器端也必須有對應的解壓縮技術才能實現檔案的顯示。我們的檔案圖像遠程瀏覽主要需要實現邊下載邊瀏覽的流式技術,只要傳輸一部分數據就可以同步顯示,而不是等到文件全部存到本地后再打開顯示。后者對于檔案的安全是極為不利的,用戶可以輕易拷貝走其瀏覽的文件,而流式技術可以完全避免這一點。因為你的檔案在無形中已被復制了。而我們在這里采用的是真正的網絡傳輸技術,他通過單獨定義的傳輸協議,直接從服務器中讀取,不再建立臨時文件。從而使客戶端用戶無法獲得原始電子文件。
PDG系統是公司經過多年的努力,開發出的從圖像掃描、顯示、OCR到遠程傳輸等一整套成熟技術。通過將文件、檔案資料、圖書等通過掃描儀快速錄入后,使用獨有的高倍率壓縮技術存儲在光盤、硬盤或磁盤陣列中,并通過建立索引數據庫進行科學管理,各工作站或其他用戶利用局域網或互聯網查詢、閱覽、打印、下載所需資料。
大批量,低成本,高速度,保持原貌是PDG數字化加工最突出的優點, PDG資料掃描存儲系統是建立大規模數字化圖文資料庫的切實途徑。
1、高速掃描。
PDG系統掃描錄入每分鐘可掃描幾十頁,掃描的同時實現壓縮并自動命名。專業文字錄入人員的工作量一般是每天錄入2萬字左右(包括排版、改正錄入錯誤等),但不包括校對。即掃描錄入每分鐘的工作量相當于鍵盤錄入一天的工作量。
2、獨有的快速、高倍率圖象壓縮技術。
采用獨有的小波變換算法,圖象壓縮比高達1:200,在壓縮前掃描一幅B5幅面的圖像(黑白,300DPI)所需要的空間大約是1.2M,顯然不能實用,因此掃描技術中壓縮技術的質量是最關鍵和必需的。PDG技術采用最新的圖像壓縮標準,一張光盤可以存儲15000頁A4紙張的內容。插小波變換圖
3、強大的圖像處理功能。
PDG系統除掃描普通資料外,可實現糾偏、自動糾偏、去污、擦除、拼接、剪裁等預處理。尤其是對字跡不明顯、發霉等特殊資料進行特殊處理,恢復圖文資料原貌。
扣圖技術:針對圖文并貌的圖像,如檔案的紅頭文件、蓋章文件,我們通常要保留她的原貌,但是掃成彩色文件非常占用存儲空間,利用扣圖程序我們就很容易只保留彩色部分,文字部分轉化為二值圖像,從而大大節約了空間。如下文件,處理過的pdg文件比原jpg文件還要小8倍多。
4、圖像顯示清晰
PDG系統采用動態灰度算法,為掃描圖像增添彩色底紋,使顯示的效果同于甚至優于文本顯示。在遠程傳輸技術上采用多線程和邊下載邊顯示技術,界面使用了專用閱覽器,使圖像顯示更加清晰。
5、方便實用的檢索查閱
掃描方式產生的圖書由于存儲的是圖像,因而不能對內容進行檢索,這是掃描存儲最主要的缺陷。但是,我們通過建立索引數據庫,加入目次章節索引和關鍵詞等檢索點予以彌補。對這些索引數據庫同樣能夠建立相應的結構檢索、全文檢索和模糊檢索等。這些已經完全能夠滿足一般用戶的檢索要求,對于特殊用戶,可以建立更詳細的索引數據。
6、OCR識別技術
為了彌補掃描的內容不能任意剪裁利用的缺陷,我們引入了OCR技術,用戶可以隨時將感興趣的內容識別成文本形式,可以直接參照原文進行修改。對圖像和表格進行圖像剪裁則是掃描所擅長的。(插閱覽器界面圖)
7、遠程傳輸
圖書資料從紙張存儲改為數字化存儲,便于保存和網絡傳輸, PDG資料掃描存儲系統中的瀏覽器采用了多線程等技術,用戶可以用電話線在2-3秒內看完一頁,完全可以滿足閱讀的需要。
|