LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 1451|回复: 0

用xpdf转换pdf文件

[复制链接]
发表于 2003-12-9 07:37:17 | 显示全部楼层 |阅读模式
今天(2003年11月20日)我又学到了新的一招,就是用xpdf的pdftotext把中文的PDF文件转化成text文件的方法.本来我用pdftotext来直接转化,不能成功,被迫去下载acrobatreader for linux的英文版,然后再安装它的中文字体包,可是,先不说adobe的安装脚本有多么难用,奇怪的是它在装了字体包后依然拒绝显示中文PDF,(现在这问题解决了,好象是因为我没有在自己的家目录下解压的原因,谁有办法解决这问题吗?,反正我现在在家目录下安装,倒是成功了--2003年12月1日)难道我只能回到windows中打开acrobatreader,然后一块块选中文本逐行转化成文字吗?
然后我想到了wine,呒,用wine可以运行windows版的acrobatreader,然后选出文字,可是又不能直接剪贴到linux的任何一个文本编辑器上,还要再用wine运行一下windows的记事本程序,在记事本里粘贴,然后转化字体,再贴到kword,再贴到gedit(文本编辑器中,我的第二选择--第一选择是emacs),难道我就不能在这件事上和windows说再见了吗?
在第n次阅读xpdf的man手册后,我找到了方法,在man xpdfrc后,我看到了textEncoding选项,它默认是Latin1,而这个选项控制了pdftotext的输出字体,很好,我只要改掉它不就行了?
经过常识,我在xpdfrc的最后加上
textEncoding        EUC-CN
然后用命令
pdftotext  xxxxx.pdf   xxxxx.txt
成功转化中文的PDF文件.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表