找回密码
 注册
搜索
热搜: 超星 读书 找书
楼主: haveyoume

[原创其它♡] 关于“金豆留住记忆”电子书制作活动---制作过程问题专贴 【程序0.07,可以导出】

[复制链接]
发表于 2009-12-18 23:29:21 | 显示全部楼层
引用第59楼stonewang于2009-12-18 23:02发表的 :
  支持****年**月**日格式。

  请问killl版:

  1、公元前的如何处理?
.......


这个是个问题:(

另外不符合的或者违规的,是不是应该加上一个字段,就是是否违规,一般留空这个字段,如果有违规的,或者重复的,就在里面写上一个y或者其他的什么字符,以示区别,以后我们再次整理的时候,就可以直接跳过做标记的记录。
回复

使用道具 举报

发表于 2009-12-18 23:58:25 | 显示全部楼层
killl说得极是。相关原则在整理前必须明确下来,以免重复劳动。
回复

使用道具 举报

发表于 2009-12-19 01:45:52 | 显示全部楼层
引用第58楼killl于2009-12-18 22:51发表的 :


一切可以商量,按照整理时最简单的方法来。

如何最省事就如何做。
.......

感谢kill版主如此体谅。

6月21日的数据不知道为什么提取保存后有错误,所有内容都在一个字段里。请大侠给看看是什么原因。谢谢。
原帖地址:http://readfree.net/bbs/read.php?tid=4617927

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

 楼主| 发表于 2009-12-19 09:03:53 | 显示全部楼层
引用第61楼stonewang于2009-12-18 23:58发表的 :
  killl说得极是。相关原则在整理前必须明确下来,以免重复劳动。

我的原则也是这样,因此,请大家多反馈,一起商量解决
回复

使用道具 举报

发表于 2009-12-19 12:20:59 | 显示全部楼层
引用第62楼shunu于2009-12-19 01:45发表的 :


感谢kill版主如此体谅。

6月21日的数据不知道为什么提取保存后有错误,所有内容都在一个字段里。请大侠给看看是什么原因。谢谢。
.......
]


一些html标签的问题,过滤掉就行了。试试新版
回复

使用道具 举报

发表于 2009-12-19 14:27:12 | 显示全部楼层
试过了,不错。。。。。。
回复

使用道具 举报

发表于 2009-12-19 15:57:21 | 显示全部楼层
感觉一条条的复制粘贴太麻烦了,所以自己在kill斑竹生成的xls文件的基础上做了一个excel宏,可以大大简化操作,放上来给大家共享吧。

1.打开excel,将安全设置中宏的安全性设置为中。
2.双击打开下载的文件edit.xla
3.在弹出的安全警告中选运行宏。
4.在菜单中会多出一栏“金豆电子书”,点击“执行操作”,即可自动生成需要总结的两个栏,别且复制粘贴好了一定的内容;做完工作以后点击“复原菜单”,即可还原回原来菜单。

这样是不是简化了不少操作呢?
当然还是需要人工校阅的,希望大家用了以后多提意见。。。。。。。。。


附件到76楼下载。。。。。
回复

使用道具 举报

发表于 2009-12-19 16:16:36 | 显示全部楼层
引用第66楼ever__f于2009-12-19 15:57发表的 :
感觉一条条的复制粘贴太麻烦了,所以自己在kill斑竹生成的xls文件的基础上做了一个excel宏,可以大大简化操作,放上来给大家共享吧。

1.打开excel,将安全设置中宏的安全性设置为中。
2.双击打开下载的文件edit.xla
3.在弹出的安全警告中选运行宏。
.......
正在使用,很方便,感谢。
回复

使用道具 举报

发表于 2009-12-19 16:29:38 | 显示全部楼层
就是日期格式还没有转换,不知道excel里面的函数能不能转换中文的日期到规定的日期格式,如果没有我只能再写一个菜单项了。。。。。
回复

使用道具 举报

发表于 2009-12-19 16:48:55 | 显示全部楼层
还有繁体字的问题,用不用转换为简体。。。。。。。
回复

使用道具 举报

发表于 2009-12-19 16:56:11 | 显示全部楼层
图片注释和内容放一起吗?
回复

使用道具 举报

 楼主| 发表于 2009-12-19 16:57:09 | 显示全部楼层
引用第69楼ever__f于2009-12-19 16:48发表的 :
还有繁体字的问题,用不用转换为简体。。。。。。。
只是把整理的内容转为简体即可
回复

使用道具 举报

发表于 2009-12-20 07:44:09 | 显示全部楼层
引用第64楼killl于2009-12-19 12:20发表的 :

]


一些html标签的问题,过滤掉就行了。试试新版
新版将问题解决了,谢谢kill版主。
回复

使用道具 举报

发表于 2009-12-20 07:49:05 | 显示全部楼层
引用第66楼ever__f于2009-12-19 15:57发表的 :
感觉一条条的复制粘贴太麻烦了,所以自己在kill斑竹生成的xls文件的基础上做了一个excel宏,可以大大简化操作,放上来给大家共享吧。

1.打开excel,将安全设置中宏的安全性设置为中。
2.双击打开下载的文件edit.xla
3.在弹出的安全警告中选运行宏。
.......

非常方便,谢谢ever__f兄!

但是提取出来的内容有多余的,比如:
“哲学家萨特诞生<br /></b><br />萨特与西蒙娜-德-波伏娃 让-保尔-萨特”
“我国政府释放第一批日本战犯<br />铃木启久等8名侵华日本战犯,在正义的审判面前低头认”
“维和部队在索马里丑行暴露<br />抱着孩子的尸体走向坟墓,该片获1992年最佳新闻照片”
只要<br /></前面的部分就够了,<br />后面的部分是不需要的。有没有可能再改善一下呢?谢谢。
回复

使用道具 举报

发表于 2009-12-20 10:11:58 | 显示全部楼层
引用第73楼shunu于2009-12-20 07:49发表的 :


非常方便,谢谢ever__f兄!

但是提取出来的内容有多余的,比如:
.......


那个只能是预提取,需要自己重新构造,但是我们一定要统一的就是,字段的先后顺序

到底哪些字段放到哪些位置?加入qq群确定一下吧?


要不ever_f的xla修改一下,第一个放时间、第二个放简介,其他的就按照程序的设定来吧

这样最后的excel统一了一下格式。

然后我们再商量最后的电子书格式。
回复

使用道具 举报

发表于 2009-12-20 10:12:59 | 显示全部楼层
引用第73楼shunu于2009-12-20 07:49发表的 :


非常方便,谢谢ever__f兄!

但是提取出来的内容有多余的,比如:
.......
我也注意到这个问题了,准备再加一个菜单项,处理后面有br的,把br及以后内容全部删除。。。
回复

使用道具 举报

发表于 2009-12-20 10:15:13 | 显示全部楼层
引用第74楼killl于2009-12-20 10:11发表的 :



那个只能是预提取,需要自己重新构造,但是我们一定要统一的就是,字段的先后顺序

.......


我提取的思路是:找到内容部分的第一个“年”字,然后找到之后的第一个“日”字,根据这两个位置找出时间;然后在“日”字以后的位置50字作为找出事件概述的来源,然后前面的逗号、冒号、破折号等等都去掉了,再把后面的句号及其以后的部分也去掉了。
当然这只能提取格式规范的,格式不规范的就只能手工处理了。。。

至于后面br的问题和时间的格式,还在做。。。
先放上来一个半成品,按kill斑竹的意思改过了,br的问题基本解决了,时间的问题我还在求助。。。。。。。

使用方法就是打开下载的xls,点击“开始编辑”就会预处理提取一些,这和昨天发的那个的是一样的,然后手工处理一下太离谱的,不用管br,然后点击“收尾”,即可把br及以后的部分去掉。。。

下面准备在“收尾”里面把日期格式也处理掉。。。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

发表于 2009-12-20 10:40:02 | 显示全部楼层
关于时间的问题我求助在了问答版,期待解答。。。。。
http://readfree.net/bbs/read.php?tid=4847700
回复

使用道具 举报

发表于 2009-12-20 10:40:53 | 显示全部楼层
引用第76楼ever__f于2009-12-20 10:15发表的 :



我提取的思路是:找到内容部分的第一个“年”字,然后找到之后的第一个“日”字,根据这两个位置找出时间;然后在“日”字以后的位置50字作为找出事件概述的来源,然后前面的逗号、冒号、破折号等等都去掉了,再把后面的句号及其以后的部分也去掉了。
当然这只能提取格式规范的,格式不规范的就只能手工处理了。。。
.......

时间我在29楼给出了一个公式,可以参考一下
回复

使用道具 举报

发表于 2009-12-20 13:48:18 | 显示全部楼层
给出最新的VBA版本,“收尾”可以转换日期了,现在还只能转换公元后的,至于公元前等斑竹标准,不过提醒大家,在使用“收尾”以前必须保证日期栏里面的格式为“1872年9月2日”样式,即只能有:“年、月、日”3个中文汉字,切它们之间必须为数字。。。。。


到76楼下载。。。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-5-6 13:59 , Processed in 0.445291 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表