pdf2txt 3.1汉化版是一款功能强大的虚拟打印机技术,用户可以从任意程序中创建PDF/PS文档,以及BMP、TIFF、PNG、GIF、PCX等多种光栅图像。还可以从OCR中抽取pdf的文本内容,是一款非常不错的文档管理软件,需要的朋友可以下载!
软件功能
兼容Windows 95/98 / ME / NT / 2000 / XP / 2000 / Vista / 7。
在批次PDF转换成纯文本。
支持多语言文本,包括英语,法语,德语,意大利语,简体中文,中国传统,捷克语,丹麦语,荷兰语,日本、韩国、挪威、波兰、葡萄牙语、俄语、西班牙语、瑞典语,泰国等等。
支持PDF格式版本1.8。
不需要第三方软件PDF。
支持拖放操作。
支持命令行和通配符操作。
从密码保护PDF文件中提取文本。
提取隐藏的图像替代文本从PDF。
自动对齐文本列在表中
从PDF文件中提取文本并保存为HTML。
提取PDF文本描述(标题、主题、作者、关键词、创造者,生产商,创建日期,等等)。
将HTML转换成三种,微软的Word(DOC)TXT和HTML,和RTF TXT和HTML。(需要安装微软Office软件)
软件特色
打开PDF文件:打开PDF文件,另存为文本文件。
自动打开结果文件:如果选择此菜单,文本文件将在创建后自动打开。
输出AS简单HTML:如果选择此菜单,输出是简单的HTML文件,而不是TEXT文件,简单的HTML文件只能保留原始的TEXT和坐标信息,因此可以很方便地分析TEXT信息。
格式输出文本:如果选择此菜单,输出文本文件将保留原始页面布局,这对于Table-PDF文件非常有用。
自动将空格添加到文本文件中:如果生成的文本文件不包含空格,则可以设置此选项,然后生成的文本文件将包含空格,因此不建议在大多数情况下设置此选项。
自动删除空行:此选项将从生成的文本文件中删除空白行。
获取PDF文档摘要:此选项将从PDF文件中读取文档摘要并写入文本文件。
设置缩放比例:从PDF文件中提取文本时,可以指定缩放比例,默认值为100%。
设置所有者/用户密码:如果您的PDF文件已加密,则此选项将自动解密PDF文件。
使用说明
将 PDF 文件放到程序文件夹内,编辑名为 run.bat 的批处理文件,在 命令行输入:pdftotext test.pdf test.txt 保存后运行 run.bat 就完成转换了
还有一种最简单的方法是,将要转换的PDF文件拖到 pdftotext.exe 上面就能完成转换,无需命令行(推荐)