重生之乘风而起 第745章 争论
第745章 争论
这可以解决仿古书籍录入时的排版问题,以及打印和印刷出版问题!
辜老也看出了这套标准的价值,却又不免担心:“要是我们占用了太多的码位,会不会引来纠纷啊?”
“这个辜老就放心吧。”周至都乐了:“不是每个民族都是中华民族,这么说吧——全世界所有文字符算一石,我华夏独占八斗。”
辜老也笑了:“这开讨论会呢,肘子你严肃点!”
其实周至真不是开玩笑,因为直到两千零五年,Unicode的第十万个字符被引入成为标准之一。
而直到二零二零年,Unicode13.0,一共才收录十四万三千多个字符。
当然现在有了周至的干预,第一版的Unicode,光汉字字符周至就打算给它塞七八万进去。
国际标准化组织里边中国想要发挥作用有点困难,但是统一码联盟就不一样了,就连缴纳会费的个人都能够发挥作用。
只要周至能够干预它,让这个标准的1.0版,在WIN95发行之前就推出来,然后被微软采用,信息时代的汉字编码标准之争,就得提前划上句号了。
说起来微软本身并不是不想用Unicode,恰恰相反,老比对这事儿很上心,只是实在等不到它出来,最终不得不选择ISO/IEC 10646而已。
主要原因就是Unicode虽然好,但是属于非官方组织搞的东西,大家都缺乏一种急迫感,否则也不至于到了2020年,GBK都扩展到七万多汉字了,而Unicode还依旧有无数的汉字码位空着。
周至觉得,这种急迫感,中国可以给。
“肘子……肘子?”辜老的声音传来。
“啊?什么?”周至这才回过神来,一脸懵。
“刚刚李教授讲了那么多困难,你有没有什么意见?”
“李教授说,现在GB13000即将出台,而采集七万汉字,工作量会非常的巨大,他说你说的东西有价值,但是现在执行起来也不能操之过急。”
“其实如果GB体系对多八位同意扩展的话,也能够解决码位容量的问题,更大的方便,是解决将来升级后的兼容问题。”
“还有就是实际应用的问题,大字库的使用场景到底还是有限的,我们还是要先解决有没有的问题,再解决好不好的问题。”
“这个说法我不同意。”周至很直白:“因为与GB对标的,说到底还是ISO/IEC 10646,这个体系本身就是存在缺陷的,除了占着一个国际标准化组织的名头之外,远比Unicode的理念落后。”
“哪怕是我们将来有了GB13000,甚至将之扩展为码位更多的GB标准,那最终得到的,也只是一个地方标准,是我们关起门来自己造出的一个东西,除了在国内强制推行以外,在世界其它地区是难以被接受的。”
“如果我们的新编码能够得到Unicode组织的认可,那么我们的大字库就会成为全世界绝大多数计算机软硬件产商倾向使用的标准,而且不仅仅是为我国大陆服务,还能够在台岛,港岛,澳京,新家坡各个使用中文汉字的地区推广应用。”
“至于先解决有没有的问题,再解决好不好的问题,这话我同意。”周至据理力争:“但是有没有的问题,我们在推出GB2312的时候就已经解决了。”
“我和李教授的分歧,其实就在他认为还没到解决好不好的时候,而我认为,已经到了!”
“肘子伱没有从事过这方面的工作,对于其中的困难可能认识不足。”李红江说道:“就拿那么多的汉字来说,光建立栅格数位字就是一件烦难的工作。”
“还好吧?”周至说道:“一天一百字,一年就是三万六千五百字,两年不就七万多字了?”
“哪里有那么容易,这里边涉及到字体设计,比重高低,中宫收放,制作点阵,上机输入,整理编码……”
“这些很难?”周至奇怪:“可我和我同学,已经用一年多的时间,做出四万字的稿纸了啊?”
“什么?”李红江惊讶得都站起了身来:“你?和你同学?!”
辜幼文招了招手,一名参会学生从会议室角落里拖着一个拖车过来,从上面搬下一个纸箱打开,放到李红江的面前。
“这是肘子这次带来的,小李你看看,合不合用。”
“这是……这是……”李红江看着箱子上面按照笔画部首标注的排序区间和字码列表,打开之后,入眼是一张张工整的手工书写四字体标准字,做上面那一个,就是这个汉子的标准点阵字,剩下三个分别是黑体,宋体,仿宋体。
“你们做了多少了?”李红江嘴唇都有些哆嗦:“肘子你刚刚说……四万?”
“对,到目前为止,已经做到了四万一千零三十三个,汉字十三结构和标准部件,以及简化汉字,我们全做完了,然后《康熙字典》,也做了一半。”
“现在只需要一个类似机读卡的程序,将这些扫到信息系统里,我们就有了一个四万多字的基线版本。”
“不管我们使用GB还是用Unicode,我们都可以通过编码将这些点阵字纳入码位,构成一个新的大字库。”
“那GB标准的扩容就迫在眉睫,GB13000还未推广,就已经落后了……”李红江的话语里,充满了苦涩的味道。
“刚刚李教授所说的困难,我觉得都是不难解决的。”周至说道:“关键是我们有没有决心和态度。”
“如果有决心,那么我们不管使用何种标准,都得将华夏大字库考虑进去,哪怕是现在暂时做不到,也要给将来的扩张留够余地。”
“建库不难,编码也不难,难的是标准的制定。只要制定好了大字库的标准,一切工作以容纳全体汉字展开,着这个前提下摸索思路和方法,我个人觉得,其意义远大于现在的GB13000。”
“GB13000,还是处在头痛医头脚痛医脚,先搞一个能用的用着的思路上,这个思路本身,就是有问题的。”
“我们的目标应该一开始就落在构建全世界都能够通用的,可兼容的,可扩展的,具备海量码位的华夏大字库上,并且如ASCII吗一样,力争使其成为唯一国际通用标准。”
“至于即将推出的GB13000,甚至更之前的GB2312,只是这个大字库在不同应用场景下的子集而已,将来我们还可以定义出几个子集,分别满足普通用户,政府机关,专业出版社,大型图书馆使用,达到效率优化和成本缩减的兼顾。”
这可以解决仿古书籍录入时的排版问题,以及打印和印刷出版问题!
辜老也看出了这套标准的价值,却又不免担心:“要是我们占用了太多的码位,会不会引来纠纷啊?”
“这个辜老就放心吧。”周至都乐了:“不是每个民族都是中华民族,这么说吧——全世界所有文字符算一石,我华夏独占八斗。”
辜老也笑了:“这开讨论会呢,肘子你严肃点!”
其实周至真不是开玩笑,因为直到两千零五年,Unicode的第十万个字符被引入成为标准之一。
而直到二零二零年,Unicode13.0,一共才收录十四万三千多个字符。
当然现在有了周至的干预,第一版的Unicode,光汉字字符周至就打算给它塞七八万进去。
国际标准化组织里边中国想要发挥作用有点困难,但是统一码联盟就不一样了,就连缴纳会费的个人都能够发挥作用。
只要周至能够干预它,让这个标准的1.0版,在WIN95发行之前就推出来,然后被微软采用,信息时代的汉字编码标准之争,就得提前划上句号了。
说起来微软本身并不是不想用Unicode,恰恰相反,老比对这事儿很上心,只是实在等不到它出来,最终不得不选择ISO/IEC 10646而已。
主要原因就是Unicode虽然好,但是属于非官方组织搞的东西,大家都缺乏一种急迫感,否则也不至于到了2020年,GBK都扩展到七万多汉字了,而Unicode还依旧有无数的汉字码位空着。
周至觉得,这种急迫感,中国可以给。
“肘子……肘子?”辜老的声音传来。
“啊?什么?”周至这才回过神来,一脸懵。
“刚刚李教授讲了那么多困难,你有没有什么意见?”
“李教授说,现在GB13000即将出台,而采集七万汉字,工作量会非常的巨大,他说你说的东西有价值,但是现在执行起来也不能操之过急。”
“其实如果GB体系对多八位同意扩展的话,也能够解决码位容量的问题,更大的方便,是解决将来升级后的兼容问题。”
“还有就是实际应用的问题,大字库的使用场景到底还是有限的,我们还是要先解决有没有的问题,再解决好不好的问题。”
“这个说法我不同意。”周至很直白:“因为与GB对标的,说到底还是ISO/IEC 10646,这个体系本身就是存在缺陷的,除了占着一个国际标准化组织的名头之外,远比Unicode的理念落后。”
“哪怕是我们将来有了GB13000,甚至将之扩展为码位更多的GB标准,那最终得到的,也只是一个地方标准,是我们关起门来自己造出的一个东西,除了在国内强制推行以外,在世界其它地区是难以被接受的。”
“如果我们的新编码能够得到Unicode组织的认可,那么我们的大字库就会成为全世界绝大多数计算机软硬件产商倾向使用的标准,而且不仅仅是为我国大陆服务,还能够在台岛,港岛,澳京,新家坡各个使用中文汉字的地区推广应用。”
“至于先解决有没有的问题,再解决好不好的问题,这话我同意。”周至据理力争:“但是有没有的问题,我们在推出GB2312的时候就已经解决了。”
“我和李教授的分歧,其实就在他认为还没到解决好不好的时候,而我认为,已经到了!”
“肘子伱没有从事过这方面的工作,对于其中的困难可能认识不足。”李红江说道:“就拿那么多的汉字来说,光建立栅格数位字就是一件烦难的工作。”
“还好吧?”周至说道:“一天一百字,一年就是三万六千五百字,两年不就七万多字了?”
“哪里有那么容易,这里边涉及到字体设计,比重高低,中宫收放,制作点阵,上机输入,整理编码……”
“这些很难?”周至奇怪:“可我和我同学,已经用一年多的时间,做出四万字的稿纸了啊?”
“什么?”李红江惊讶得都站起了身来:“你?和你同学?!”
辜幼文招了招手,一名参会学生从会议室角落里拖着一个拖车过来,从上面搬下一个纸箱打开,放到李红江的面前。
“这是肘子这次带来的,小李你看看,合不合用。”
“这是……这是……”李红江看着箱子上面按照笔画部首标注的排序区间和字码列表,打开之后,入眼是一张张工整的手工书写四字体标准字,做上面那一个,就是这个汉子的标准点阵字,剩下三个分别是黑体,宋体,仿宋体。
“你们做了多少了?”李红江嘴唇都有些哆嗦:“肘子你刚刚说……四万?”
“对,到目前为止,已经做到了四万一千零三十三个,汉字十三结构和标准部件,以及简化汉字,我们全做完了,然后《康熙字典》,也做了一半。”
“现在只需要一个类似机读卡的程序,将这些扫到信息系统里,我们就有了一个四万多字的基线版本。”
“不管我们使用GB还是用Unicode,我们都可以通过编码将这些点阵字纳入码位,构成一个新的大字库。”
“那GB标准的扩容就迫在眉睫,GB13000还未推广,就已经落后了……”李红江的话语里,充满了苦涩的味道。
“刚刚李教授所说的困难,我觉得都是不难解决的。”周至说道:“关键是我们有没有决心和态度。”
“如果有决心,那么我们不管使用何种标准,都得将华夏大字库考虑进去,哪怕是现在暂时做不到,也要给将来的扩张留够余地。”
“建库不难,编码也不难,难的是标准的制定。只要制定好了大字库的标准,一切工作以容纳全体汉字展开,着这个前提下摸索思路和方法,我个人觉得,其意义远大于现在的GB13000。”
“GB13000,还是处在头痛医头脚痛医脚,先搞一个能用的用着的思路上,这个思路本身,就是有问题的。”
“我们的目标应该一开始就落在构建全世界都能够通用的,可兼容的,可扩展的,具备海量码位的华夏大字库上,并且如ASCII吗一样,力争使其成为唯一国际通用标准。”
“至于即将推出的GB13000,甚至更之前的GB2312,只是这个大字库在不同应用场景下的子集而已,将来我们还可以定义出几个子集,分别满足普通用户,政府机关,专业出版社,大型图书馆使用,达到效率优化和成本缩减的兼顾。”