不清的 PDF

 

最近開始深究微型處理器(8051)這玩意, 那就找找有關的書來看

其中一本書看上去內容幾豐富, <<新概念51單片機C語言教程>>

可惜 size (133MB)大, 顯示不清....


上段是原書, 下段是經小弟處理過的.

它是 PDF 格式來. 原則上應該不會這樣糟的 ~

一般來說, "真" PDF 是由編了碼的文字所組成, 而所有內容都是 object 來.

而所謂的 假PDF 是指用 scanner 吸圖, 然後封裝成 PDF.

它相等於 zip 了的圖 (網上漫畫)

所以, 文字就以圖片的形式存在, size 唔大就大鬼了 ~ ~"

另一方面, 可恨的是 PDF 沒有圖像處理的 Filter -___-

如直接調整 "對比度" "銳度" 之類的功能, 所這書真是雞肋來 .....

幸好, 我找到 Linux 上的一件神器, 並成功修復此書 ^^

它就是 ImageMagick

有人可能會問我何不 OCR 它呢 ??

那真是一言難盡了, 因為我用 OmniPage, 丹青 等強悍的軟件去認字,

確認率只有 70% 多些, 實在不能接受 ...
 


 

相關內容:

圖像神器 ImageMagick

 

Creative Commons license icon Creative Commons license icon