读书人

是否能用C++写一个将PDF转换成文字?该

发布时间: 2012-06-25 18:37:39 作者: rapoo

是否能用C++写一个将PDF转换成文字?
看到网络上的pdftoWord,都是将PFD剪成图片,然后放到word里面

我现在想写一个软件,能够讲pdf里的文字抽取出来,像我们打字一样复制到word里面

用户可以转换之后,对需要的文字进行复制,修改等操作

请问这个想法是否能实现?如果能,应该怎么实现?

[解决办法]
就是OCR啊
[解决办法]
这个分两种情况了。一种PDF就是以文字形式保存的,这样的容易做出来。第二种就是PDF以图片形式保存的,这样从图片中提取文字是比较困难的
[解决办法]
楼上加1
[解决办法]

探讨

引用:
这个分两种情况了。一种PDF就是以文字形式保存的,这样的容易做出来。第二种就是PDF以图片形式保存的,这样从图片中提取文字是比较困难的

基本是第二种了,就是把一本书扫描出来的那种

读书人网 >C++

热点推荐