重生之乘风而起 第741章 新字库
热门推荐:
玄学王妃美又飒,禁欲皇叔折了腰
宝可梦:奇迹世界
凡人修仙:缘起极西之地
原神:在黑暗中苏醒
阿拉德的不正经救世主
墓碑雕刻师
高武:镇压魔窟,我成最年轻战神
年代:从知青下乡开始躺赢
借尸还魂!娇俏小神棍回京杀疯了
第741章 新字库
说起这些,周至都不禁感慨:“所以说树挪死人挪活,什么时候让关叔也出来得了。”
“他?”关妈不禁冷笑:“他在夹川还能当大男人,出来怕是不习惯!”
“大男人做不成就做耙耳朵嘛,大丈夫能屈能伸,哪里存在呢?”
“你就光会胡说八道。”关妈笑道:“连你叔的玩笑也乱开!”
“什么是耙耳朵?”付霞问道:“猪耳朵卤过头了,不好吃啊?”
“哈哈哈哈……”周至和关妈都捧腹大笑,关妈笑得眼泪都要出来了:“我就喜欢看你的节目,就是爱看这样的效果哈哈哈哈……”
第二天一早,周至来到了蜀大中文系。
小会议室里边已经坐了一圈的人,见到周至进来,绝大多数人都露出了惊讶莫名的神色。
这……这特么就是个高中生,有资格参加这样的多学科联动会议?!
“肘子坐这儿来。”辜幼文对周至招手:“听说里高考考得不错?”
真是高中生!辜老已经很久没有参加类似的会议了,现在会上第一句话,居然是关心这孩子高考不错?
“辜老好。”周至赶紧坐下。
“人齐了我们就开始。”辜开来说着对边上一名胖大老者说道:“要不老王伱来开个头?”
老者笑眯眯地道:“今天请大家过来呢,是应中文系辜主任的邀请,讨论一个小朋友的提议。大家先听听看,听完介绍,我们再做详细讨论。”
“周至同学,解铃还须系铃人系铃人,还是你先说说想法吧。”
“周至,这是我们学校计算机系的麦明川麦主任。”辜老介绍道。
“好,那我先说说我设想的这个《中华大字库》的思路。”
会议室里顿时传出“嗡”的一声,所有人心里的第一个反应就是——少年人你好大的口气!当真不知道天高地厚了!
倒是麦主任先将手举起来,将会场秩序重新控制住:“大家先别急着讨论,我们会给大家留够讨论的时间。我们先让周至同学说说他的想法。”
与会的大多数人,都露出了以为深长的笑容,虽然麦主任今天带着大家过来了,想必昨天就和辜主任进行过讨论,然而直到现在都没有任何的表态,却支着这个少年上台,那意思很明白——我来是来给你面子的,如果你一定要让这孩子出丑,那我也管不着。
周至却毫不怯场,手里连个稿子都没有:“想来大家都知道,我们目前在使用的GB 2312字库,是我国第一个简体中文字符集的国家标准,于1980年,由中国国家标准总局发布,1981年5月1日实施。”
“它的准确全称,是叫做《信息交换用汉字编码字符集基本集》,其中规定了6763个汉字,以及682个非汉字图形。”
“与西方文字不同,汉字是表意文字,成千上万的不同含义需要成千上万的不同汉字来表示。西方文字主要是拼音文字,通过几十个字母的组合就可以变出成千上万的单词。在计算机里面,西方文字只需要给几十个字母编码就够了,而每一个汉字都要一个编码才行。”
“随着时代的进步和发展,GB2312已经满足不了应用的需要,比如‘镕’字现在是高频率使用字,而 GB 2312却没有为它编码,因而政府、新闻、出版、印刷等行业和部门,在使用中感到十分不便。”
“所以说,随着信息技术的发展,GB2312的6763个汉字,已经不能再满足人们使用要求。”
“而对于蜀大中文系,历史系,图书馆这些单位来说,六千多个汉字,更是难以满足信息数字化的需要。”
“最近,国际标准化组织下属编码字符集工作组,研制了一套新的编码字符集标准,叫做ISO/IEC 10646。”
会议室里又是一阵惊呼。
之前说的那些都是实际情况介绍,只要是稍微有点兴趣的人,翻翻资料,都能够说得出来。
可是ISO/IEC 10646国际标准则是国际标准化组织刚刚提出来的,而且到现在都只颁布了一部分,这孩子已经接触到前沿信息了。
周至继续说道:“这是一个针对多文种处理的编码字符集标准,目的是对世界上的所有文字统一编码,以实现世界上所有文字在计算机上的统一处理。”
“理论上以此为基础,我们能构建出一个在信息技术工程上通用的多八位编码字符集,搭建出一个多文种的基本编码体系结构。”
会议室里已经有人忍不住举起了手来,打断了周至的发言:“周至同学,你是从哪里知道我们国家正在根据ISO/IEC10646标准,准备搭建多文种基本编码体系结构的?”
“推测啊,”周至说道:“既然GB2312已经不敷使用,自然就需要拓展;正好ISO/IEC 10646国际标准化字符集已经出台,给了汉字内码相当大的拓展空间,因此我们自然就可以根据这个制定出扩展规范,最终得到扩展后的字库了,难道不是吗?”
“呃……”那人想了一下,还真就是这个逻辑思路。
麦主任介绍道:“这是我们系的李红江教授,同时他也是国家信息技术编码字符集工作组成员。”
李红江说道:“我承认,肘子你说的一切都对,但你可能还不知道吧?这个事情,我们国家已经在紧锣密鼓地展开了。”
“新的字库,便是如你所说,将基于通用多八位编码字符集,适应16/32位操作系统,一共扩展到23940个码位,收录21003个汉字。称为GB 13000,很快就会推出了,到时候,就能够解决汉字输入的绝大多数问题。”
这个消息会议室里很多人都是第一次知道,大家都兴奋异常,不由得鼓起掌来。
李红江这才笑道:“作为一名高中生,能够找到我们国家在信息技术方面的一个痛点,并且做了一定的研究,甚至提出了和国家相契合的解决思路,这已经很不容易了。”
说完对麦主任轻松地笑道:“所以说,少年强则中国强,像周至同学这样的,是我们信息产业的希望啊!”
话虽是这样说,其实意思也很明白,那就是这些问题国家都已经考虑过了,新编码马上就要出来了,就不劳你一个高中毕业生来操这份心了。
周至一直静静地等待李红江说完,然后才说道:“两万一千个汉字,就能够解决问题了吗?”
“两万一千零三个!”李红江强调道:“从六千多个扩展到两万一千零三个,扩展了三倍多,这是多大的成就和进步?”
书名:你是我老婆?请证明
推荐语:上学第一天,学校就给我发了个老婆?我不信!(单女主,校园狗粮日常文…)
说起这些,周至都不禁感慨:“所以说树挪死人挪活,什么时候让关叔也出来得了。”
“他?”关妈不禁冷笑:“他在夹川还能当大男人,出来怕是不习惯!”
“大男人做不成就做耙耳朵嘛,大丈夫能屈能伸,哪里存在呢?”
“你就光会胡说八道。”关妈笑道:“连你叔的玩笑也乱开!”
“什么是耙耳朵?”付霞问道:“猪耳朵卤过头了,不好吃啊?”
“哈哈哈哈……”周至和关妈都捧腹大笑,关妈笑得眼泪都要出来了:“我就喜欢看你的节目,就是爱看这样的效果哈哈哈哈……”
第二天一早,周至来到了蜀大中文系。
小会议室里边已经坐了一圈的人,见到周至进来,绝大多数人都露出了惊讶莫名的神色。
这……这特么就是个高中生,有资格参加这样的多学科联动会议?!
“肘子坐这儿来。”辜幼文对周至招手:“听说里高考考得不错?”
真是高中生!辜老已经很久没有参加类似的会议了,现在会上第一句话,居然是关心这孩子高考不错?
“辜老好。”周至赶紧坐下。
“人齐了我们就开始。”辜开来说着对边上一名胖大老者说道:“要不老王伱来开个头?”
老者笑眯眯地道:“今天请大家过来呢,是应中文系辜主任的邀请,讨论一个小朋友的提议。大家先听听看,听完介绍,我们再做详细讨论。”
“周至同学,解铃还须系铃人系铃人,还是你先说说想法吧。”
“周至,这是我们学校计算机系的麦明川麦主任。”辜老介绍道。
“好,那我先说说我设想的这个《中华大字库》的思路。”
会议室里顿时传出“嗡”的一声,所有人心里的第一个反应就是——少年人你好大的口气!当真不知道天高地厚了!
倒是麦主任先将手举起来,将会场秩序重新控制住:“大家先别急着讨论,我们会给大家留够讨论的时间。我们先让周至同学说说他的想法。”
与会的大多数人,都露出了以为深长的笑容,虽然麦主任今天带着大家过来了,想必昨天就和辜主任进行过讨论,然而直到现在都没有任何的表态,却支着这个少年上台,那意思很明白——我来是来给你面子的,如果你一定要让这孩子出丑,那我也管不着。
周至却毫不怯场,手里连个稿子都没有:“想来大家都知道,我们目前在使用的GB 2312字库,是我国第一个简体中文字符集的国家标准,于1980年,由中国国家标准总局发布,1981年5月1日实施。”
“它的准确全称,是叫做《信息交换用汉字编码字符集基本集》,其中规定了6763个汉字,以及682个非汉字图形。”
“与西方文字不同,汉字是表意文字,成千上万的不同含义需要成千上万的不同汉字来表示。西方文字主要是拼音文字,通过几十个字母的组合就可以变出成千上万的单词。在计算机里面,西方文字只需要给几十个字母编码就够了,而每一个汉字都要一个编码才行。”
“随着时代的进步和发展,GB2312已经满足不了应用的需要,比如‘镕’字现在是高频率使用字,而 GB 2312却没有为它编码,因而政府、新闻、出版、印刷等行业和部门,在使用中感到十分不便。”
“所以说,随着信息技术的发展,GB2312的6763个汉字,已经不能再满足人们使用要求。”
“而对于蜀大中文系,历史系,图书馆这些单位来说,六千多个汉字,更是难以满足信息数字化的需要。”
“最近,国际标准化组织下属编码字符集工作组,研制了一套新的编码字符集标准,叫做ISO/IEC 10646。”
会议室里又是一阵惊呼。
之前说的那些都是实际情况介绍,只要是稍微有点兴趣的人,翻翻资料,都能够说得出来。
可是ISO/IEC 10646国际标准则是国际标准化组织刚刚提出来的,而且到现在都只颁布了一部分,这孩子已经接触到前沿信息了。
周至继续说道:“这是一个针对多文种处理的编码字符集标准,目的是对世界上的所有文字统一编码,以实现世界上所有文字在计算机上的统一处理。”
“理论上以此为基础,我们能构建出一个在信息技术工程上通用的多八位编码字符集,搭建出一个多文种的基本编码体系结构。”
会议室里已经有人忍不住举起了手来,打断了周至的发言:“周至同学,你是从哪里知道我们国家正在根据ISO/IEC10646标准,准备搭建多文种基本编码体系结构的?”
“推测啊,”周至说道:“既然GB2312已经不敷使用,自然就需要拓展;正好ISO/IEC 10646国际标准化字符集已经出台,给了汉字内码相当大的拓展空间,因此我们自然就可以根据这个制定出扩展规范,最终得到扩展后的字库了,难道不是吗?”
“呃……”那人想了一下,还真就是这个逻辑思路。
麦主任介绍道:“这是我们系的李红江教授,同时他也是国家信息技术编码字符集工作组成员。”
李红江说道:“我承认,肘子你说的一切都对,但你可能还不知道吧?这个事情,我们国家已经在紧锣密鼓地展开了。”
“新的字库,便是如你所说,将基于通用多八位编码字符集,适应16/32位操作系统,一共扩展到23940个码位,收录21003个汉字。称为GB 13000,很快就会推出了,到时候,就能够解决汉字输入的绝大多数问题。”
这个消息会议室里很多人都是第一次知道,大家都兴奋异常,不由得鼓起掌来。
李红江这才笑道:“作为一名高中生,能够找到我们国家在信息技术方面的一个痛点,并且做了一定的研究,甚至提出了和国家相契合的解决思路,这已经很不容易了。”
说完对麦主任轻松地笑道:“所以说,少年强则中国强,像周至同学这样的,是我们信息产业的希望啊!”
话虽是这样说,其实意思也很明白,那就是这些问题国家都已经考虑过了,新编码马上就要出来了,就不劳你一个高中毕业生来操这份心了。
周至一直静静地等待李红江说完,然后才说道:“两万一千个汉字,就能够解决问题了吗?”
“两万一千零三个!”李红江强调道:“从六千多个扩展到两万一千零三个,扩展了三倍多,这是多大的成就和进步?”
书名:你是我老婆?请证明
推荐语:上学第一天,学校就给我发了个老婆?我不信!(单女主,校园狗粮日常文…)