找回密码
 注册
搜索
热搜: 超星 读书 找书
楼主: Gossudar

[【外语类】] Dasha扫描OCR之图书(20071020)

[复制链接]
 楼主| 发表于 2007-10-30 22:57:58 | 显示全部楼层
引用第18楼哲人王于2007-10-30 19:46发表的 :
PDG转成的PDF文件应该使用箭头的选择键,但选择的是“图像区域”。


——但现在的问题就是“箭头的选择键”无法选择“图像区域”。Dasha可以找本PDG转成的PDF试试,先OCR其中的一页,存储,再打开OCR其他页面,看能不能用”带箭头的选择键”选择“图像区域”。

看样子,你不重装XP,也得重装Acrobat啦,同情,看图,昨天Dasha偷的吵醒似乎电子化不久的(SS号=11762280)臧棣编的那本《里尔克诗选》,随便翻一页转成的PDF:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2007-10-30 23:13:23 | 显示全部楼层
呵呵,看了还是没说清楚自己的意思。OCR了的这一页用“带箭头的选择键”选择里面的文本自己没问题,但试试能不能再去同一书其他没OCR过的图像页里使用“带箭头的选择键”。
回复

使用道具 举报

发表于 2007-10-30 23:18:22 | 显示全部楼层
或者打开过OCR了的PDF文件后,再同时打开一个PDG转成而没有OCR过的PDF,看能不能使用“带箭头的选择键”选择某一区域的图像?
回复

使用道具 举报

 楼主| 发表于 2007-10-30 23:20:59 | 显示全部楼层
能。

附图是没有OCR的。附件是《少女之歌》未OCR,后面的Orpheus的解读OCR啦,你下载看看。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2007-10-30 23:21:01 | 显示全部楼层
更干脆一些,选择OCR过的文本边上非文字的噪音点,能不能使用“带箭头的选择键”选择某一区域?
回复

使用道具 举报

发表于 2007-10-30 23:23:41 | 显示全部楼层
呵呵,如果还可以,那就是V的Acrobat要重装,NND,没改过什么设置啊。
回复

使用道具 举报

发表于 2007-10-30 23:31:04 | 显示全部楼层
OCR过的文本使用箭头选择键没问题,但第一次OCR过之后,就再也无法在图像文件里使用箭头选择键,但奇怪的是在封面彩页上可以用,一走到黑白页面马上不能用。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2007-10-30 23:33:06 | 显示全部楼层
OCR过的文本使用箭头选择键没问题,但第一次OCR过之后,就再也无法在图像文件里使用箭头选择键,但奇怪的是在封面彩页上可以用,一走到黑白页面马上不能用。
回复

使用道具 举报

发表于 2007-10-30 23:40:34 | 显示全部楼层
咦,奇怪,你发过的这个文件没有问题,无论在图像页还是双层PDF页都可以使用“箭头选择键”。V发一页文件Dasha试试。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

 楼主| 发表于 2007-10-30 23:45:47 | 显示全部楼层
确实,你那页PDF无法选取,但将之另存为图片,再用Acrobat8转成PDF没有问题。你用什么软件转成PDF的,是老马的软件??
回复

使用道具 举报

发表于 2007-10-30 23:49:43 | 显示全部楼层
《物性论 TEST 》放在vivo.oicp.net的FTP里,封面彩页可以用“箭头选择键”,其他黑白页无法使用,OCR过的第一卷第一页又可以用“箭头选择键”,Dasha下载过去看看。
回复

使用道具 举报

发表于 2007-10-30 23:56:21 | 显示全部楼层
查了一下属性,不能用“箭头选择键”的几本书是FreePic2Pdf转成的文件。,但也有Distiller转成的文件,依然无法使用“箭头选择键”。
回复

使用道具 举报

发表于 2007-10-30 23:58:14 | 显示全部楼层
小心啊,最初V可以在图像文件上使用“箭头选择键”,折腾了几次就不行了,莫非自动更改了什么设置?
回复

使用道具 举报

 楼主| 发表于 2007-10-31 00:27:01 | 显示全部楼层
引用第31楼哲人王于2007-10-30 23:56发表的 :
查了一下属性,不能用“箭头选择键”的几本书是FreePic2Pdf转成的文件。,但也有Distiller转成的文件,依然无法使用“箭头选择键”。
FreePic2Pdf的只有到“软件交流”里找“老马”马大侠(strnghrs)啦。Dasha将你FTP上的下载后,费劲用Acrobat8又OCR一次、保存、再打开,则功能又正常啦。

NND,Dasha都这配置啦,放1080P的MKV流畅自如,转你那个435页的PDF折腾得要死

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2007-10-31 00:47:58 | 显示全部楼层
2G内存,牛啊,不过Acrobat的OCR功能确实很差,汉王文本王OCR起来非常快速畅,可惜不能和原始文件合并做成所谓的双层PDF之类。

算了,不管它,反正不大影响正常使用,可能是Acrobat的一点小bug吧。
回复

使用道具 举报

发表于 2007-10-31 00:56:38 | 显示全部楼层
干嘛全部OCR这本书?那个庞大无比的10000册电子图书馆里有这本书的电子文件,但版式被改得莫名其妙,也偶尔有错别字。读下来觉得这本书很有意思,一世纪的人都有了如此智慧,为什么2000年后当今还有无量数蠢货。洋洋洒洒7000多行的哲学论文全部用拉丁诗律写,不得不佩服。
回复

使用道具 举报

发表于 2007-10-31 01:26:52 | 显示全部楼层
测试了两本书,都用FreePic2Pdf转换,但一本书可以使用选择键,另一本书则不行。大概和原始的图像文件格式有关。
回复

使用道具 举报

发表于 2007-10-31 01:37:25 | 显示全部楼层
V兄能否具体一点,我转化的文件都不能需选择。
回复

使用道具 举报

发表于 2007-10-31 02:25:18 | 显示全部楼层
呵呵,不大好讲啊,V的JPG有两种来源,一种是以前从DSR下载的PDG用老马的软件转成的,一种是不能下载PDG后用咨询设法搞到的有水印的JPG,前一种制作的PDF无法使用“箭头选择键”,但后一种可以,令人遗憾的尺寸奇大,400页的书有130M。
回复

使用道具 举报

发表于 2007-10-31 10:51:10 | 显示全部楼层
经测试,用FreePic2PDF缺省参数转换出来的PDF,用Acrobat Proffesional 8简体中文版进行中文OCR,没有发现任何问题。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-5-18 08:11 , Processed in 0.500935 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表