金庸江湖论坛

 找回密码
 注册江湖
查看: 9254|回复: 37

老版金庸文字版征求意见

[复制链接]
发表于 2006-6-26 12:25 | 显示全部楼层 |阅读模式
最近一段时间对老版的金庸图片进行了分析,可以用计算机对里面的文字进行识别。但是老版的金庸图片是繁体文字,而且是香港排版中间又穿插图片,所以在识别上命中率较低,现征求大家的意见,是否有必要做成文字版本的老版金庸。如果有需要的化将采用先用计算机识别后与原图片分段给朋友门下载,大家校验好后回传给我或者是负责这事情的版主,合并后做成电子书供大家浏览。如果有意向的话请报名。先提醒一下,这个工作相当繁重。人多的话就可以比较快的完成。
发表于 2006-6-26 12:42 | 显示全部楼层

这个太繁重了

估计吃不销

 楼主| 发表于 2006-6-26 13:35 | 显示全部楼层
如果几十人的话就可以考虑,我用计算机识别可以到50%以上。然后校稿后就可以发布了。
发表于 2006-6-26 16:14 | 显示全部楼层
什么意思啊,太专业,听不懂。
发表于 2006-6-26 16:16 | 显示全部楼层
如果一定要做,可以先拿《书剑》和《倚天》实验——这两部书大部分都有文字版,缺的只是全书的一小部分。能把这两部的文字版补齐已经很不简单了。
发表于 2006-6-26 18:37 | 显示全部楼层

这也难啊

上次看着图片打天龙旧版,6000字左右,把我眼睛弄得掉水了


 楼主| 发表于 2006-6-26 18:38 | 显示全部楼层

寒雪牵魂箫你们上次应该没有用识别软件,完全采用手打当然累啊。

《书剑》和《倚天》都有缺少的那一部分的图片吗?有的话就可以做。但是要有朋友参与校验稿件啊!如果朋友们参与的兴趣不大那就算了。象下面的天龙的一段已经是比较好的了。有很多字都识别不出。其实打字是比较少的,最后面的是新版的,对比后COPY文字过来可以解决很多地方的错误。其实也可以考虑采用连载的形式在本网站上发表。这样对提高侠友们的积极性有一定的好处。同时又可以加大浏览量。




练武厅上一位五十馀岁的老者居中而坐,右手捻? 翩A神情甚是得意。他左右两侧站? l名男女弟子。各人均是凝神观看场中二人相斗。西边一排锦垫椅子,坐? Q馀位宾客,

练武厅东坐着二人。上首是个四十左右的中年道姑,铁青着脸,嘴唇紧闭。下首是个五
十余岁的老者,右手捻着长须,神情甚是得意。两人的座位相距一丈有余,身后各站着二十余名男女弟子。西边一排椅子上坐着十余位宾客。

发表于 2006-6-26 18:41 | 显示全部楼层

需要招募义务会员

人力足够应该可行

 楼主| 发表于 2006-6-26 18:48 | 显示全部楼层

总注册侠友数: 9127 人

在QQ群里面也有100多人如果大家愿意的话就可以做了。有一个计算机识别的基础应该可以减少很多工作量

发表于 2006-6-27 16:00 | 显示全部楼层
楼主用的什么识别软件呀?能识别50%不错了。但是还是觉得图片比较有收藏意义。当然我也响应做成文字版。
 楼主| 发表于 2006-6-27 19:20 | 显示全部楼层

兄弟啊!要组织一下人马进行这样有意义的工作啊。图片版在世界杯完成后就有下载。但是从观看的意义是讲还是EXE或者TXT的电子书好看。图片版必须在1280*1024的分辩率下看才可以看得舒服。最好是19 或者17 的液晶才好。

发表于 2006-6-28 10:53 | 显示全部楼层
先看看图片版吧,如果要做文字版,我也报名参加的。不过我打字速度那个,就,嘿嘿。
发表于 2006-6-29 13:49 | 显示全部楼层

主要是组织人员很困难

毕竟这个工作很枯燥很辛苦,靠的是种兴趣

发表于 2006-6-29 23:04 | 显示全部楼层
???????????什么啊?????????可不可以说的明白一点啊!!!!!!!!!!!看我懂啊~~~~~~~~~~~~
发表于 2006-7-1 11:49 | 显示全部楼层

我估计了一下

工作量最少的是《书剑恩仇录》——文字版仅缺第七、八集(相当于书剑全书篇幅的四分之一)。以第七集为例,需要录入55叶(110页)。

如果有11人,每人分5叶(10页)工作量也还可以——别说你有识别软件,就是敲字也不是不可以(可以把网上三联版的文字先复制下来再改字)。

当然,必须要有人分担。如果愿意参加的超过十个,就可以立即开始。

您需要登录后才可以回帖 登录 | 注册江湖

本版积分规则

Archiver|手机版|Sitemap| 金庸江湖

hanxueqianhunxiao@qq.com

Copyright © 2004-2024 www.jyjh.cn All Right Reserved. Powered by Discuz! X3.4

GMT+8, 2024-11-25 01:24 , Processed in 0.040519 second(s), 14 queries , Gzip On.

返回顶部