[Z]九成中国人拼音输入 五笔字型输入法败因解析
作者:asky 日期:2006-04-23
五笔字型发明人王永民观点再遭质疑,两专家全面解析———
来源: 北京科技报 (11/09 16:07)
编者按:
本报10月19日发表《拼音输入会让汉字灭亡吗》一文,介绍了部分专家对五笔字型发明人王永民先生提出的“拼音输入使汉字形神俱灭”的不同看法,以及王永民先生本人的回应。近日,两位研究中文输入的权威专家致函本报,力驳王氏之说,全面阐述了拼音输入成为汉字输入主流的内在原因,将讨论推向深入。特此刊出,以飨读者。
上海一项调查表明,在数百万计算机用户中,使用拼音输入者占被调查者的95%以上
上世纪七八十年代,一个巨大的难题落到了中国人的肩上,如何解决世界上使用人口最多的古老文字———汉字,与当代高科技的精灵———计算机所发生的划时代的激烈碰撞。就此引发了一场全民“编码潮”,一时间,发明迭起,形码、音码、音形码不下千种,形成了“万码奔腾”的局面。
有的媒体把某个编码方案誉为“中国的第五大发明”;把某个设计喻为攻克了“汉字的哥德巴赫猜想”,是“当代的仓颉”。这些赞誉固然有失偏颇,却从一个侧面反映了上述碰撞的激烈程度,中国人期盼有一种简便的汉字输入方法。
三十年过去了,中国人跟其他地球人一起进入了二十一世纪。计算机应用普及了,计算机的神秘色彩被剥落了,而且从白头老翁到中小学生,从老教授到农民,从企业CEO 到卖菜大姐,无不用手机发送短信。手机的普及速度远远超过了计算机。今天,两亿多中国人平均每天发送短信超过一亿条。
汉字输入的普及脱下了“汉字编码”的神秘外衣。数以万计的汉字是由五个基本笔画或由五百多个基础部件构建而成。动听的单音节汉字,可以用26个罗马字母表述声、韵组合。手机用户发短信用的最多的是拼音输入。近年上海市有关部门的调查统计表明,数以百万计的计算机用户主要也是使用拼音输入,占被调查者的95%以上。所以我们才说拼音输入是汉字输入的主流方式。
我们在打“腹稿”时,大脑语言区用无声语言进行思维
根据我国心理学家建立的汉字键盘输入认知模型,计算机用户或手机用户从待输入的(文本方式、声音方式或者腹稿方式)源文稿到输入击键动作的完成,中间需要在人脑中完成三个信息加工过程:知觉加工(眼睛看文本或者耳朵听口述内容)、认知加工和动作加工。这三个阶段通常是串行进行的。
多数计算机用户和手机用户是“想着打”,他们的待输入源文稿是“腹稿”,这个“腹稿”是用户在大脑语言区用无声语言进行思维形成的,如用拼音输入,则无需任何感觉器官而直接成音表象,完成知觉加工;如用形码输入,需将“腹稿”的音表象转换成形表象,这种转换需要付出额外脑力开销和时间开销,既费心又费时,在知觉加工阶段,“想着打”者很自然地不愿将音表象转换成形表象。
进入认知加工阶段后,拼音输入者由音表象进行音素结构分析再取音码;形码输入者由形表象进行字形结构分析再取形码。音素结构分析因与思维所用的内部语言代码属于同一信息加工通道,因而比汉字字形分析跨通道加工的心理负荷小得多。
根据上述分析,我们认为,以“想着打”为主的广大计算机用户和手机用户用拼音输入是合理的。
有人误认为拼音同音字多、输入速度慢,形码重码少、输入速度快。事实恰恰相反。在上世纪九十年代由权威部门主持的多次汉字输入比赛中,连续文本(文章)竞赛均由拼音输入夺冠,离散文本(孤立字)竞赛则形码占优。后一情境对大多数普通用户其实意义不大。
虽然形码输入可以避免方言的困扰,但是拼音输入能够成为主流输入方式,除得益于和小学语言教育背景相一致,掌握拼音输入不需经过专业培训;还得益于软件和硬件技术的进步,使拼音输入方式对不同方言的兼容度大为提高。
拼音输入软件实现多项重大技术改进,多数形码的技术含量要苍白得多
汉语是大字符集对小音节集。字符集小则6763字,大则27484字,甚至更大。汉语音节不标声调为413个,标上四声也只有1300多个。上世纪八十年代处在“字输入”阶段,拼音输入同音字太多只能靠边站;形码重码字少,输入快,受到人们追捧,形码发明人名利双收,形码打字员供不应求,形码培训班遍布全国。
九十年代进入“字为基础,词为主导,智能处理”时期,汉语拼音的同音词并不多,丑小鸭变成白天鹅,拼音输入实用化,为非打字员的计算机用户普遍采用。此阶段某些形码发明者以“字有量,词无限”为论据,抵制词输入发展,播下了某些形码的技术越来越落后的种子。
九十年代末至二十一世纪初,汉字键盘输入的软愦谓肟焖俜⒄故逼凇V悄蹵BC、微软拼音、狂拼、青月亮上下文关联等输入软件,采用了汉语专家系统模型、马尔科夫链统计模型、海量模块配匹、最优评价函数、模糊控制模型等技术,不断巩固了汉语拼音输入的阵地。相比之下,多数形码的技术含量要苍白得多。
拼音输入之所以得到普及并成为汉字输入主流,既是广大用户群的选择,也是一群虽未经组织,但矢志不渝的专业和业余科研人员不懈努力的结果,而不是哪个“发明家”的功劳。
形码要争取更大的用户群,必须提升技术含量,而不是用诋毁拼音输入
八十年代,公司招聘文员的条件是“熟练使用五笔字型”;如今,公司招聘文员的条件是“熟练使用办公软件”。使用形码的优秀打字员虽不再是热门就业者,但在某些部门仍被视为至宝。拼音输入并不万能,读不出音的字就不会输了。
从95到XP,Windows一直内藏着一种编码规范的形码———“郑码”。据调查,该形码的用户数量却寥寥。然而,在北京昌平区某公司的机房内,一百多名使用“郑码”的高级蓝领,正在快速有序地为国家图书馆录入各种古籍和宋代以来的地方志。郑码系统具有符合国家标准内码的70195个汉字编码,具有宋、仿宋、楷、黑体符合国际标准的超大字符集曲线字库和完善的造字工具,并具有自动校对、版式自动还原等功能,从技术上满足了古籍数字化的要求。这是一项功在千秋的文字工程,是拼音输入望尘莫及的。
北京市的另一家公司用编码规范的“表形码”对九万余汉字进行了分类分级处理,研发了收集47000余汉字的《康熙字典》多媒体版。在这些领域,还是形码的天下。形码要争取更大的用户群,还必须遵循教育部门有关语言文字规范,通过提升技术含量,而不是用诋毁拼音输入方法,才能奏效。
笔者认为无论用哪种方法,将汉字输入到计算机,都是保护了汉字和它所承载的古老文明和当代文化。汉字文件的数字化不仅不会使汉字消亡,而且将促使汉字更快地走向世界。
关于“拼音输入法的错误率是字形输入法的9倍”、“常用拼音输入提笔忘字”、“音码能使汉字形神俱灭”、“裹胁着汉字在拼音化道路的迷途上前行”、“销蚀了运用汉字能力”等热门话题,中国语文现代化学会会长苏培成教授近期将在《光明日报》信息版上发表的文章作了深刻分析,本文不再赘述。
作者简介:
陈一凡,北京信息工程学院教授,中国中文信息学会汉字编码委员会委员,国家“九五”《信息技术通用键盘汉字输入通用要求》第一起草人。
韩布新,理学博士,中国科学院心理研究所科研处处长,中国心理学会副秘书长,国家自然科学基金项目“汉字键盘输入编码的认知过程分析”主持人。
来源: 北京科技报 (11/09 16:07)
编者按:
本报10月19日发表《拼音输入会让汉字灭亡吗》一文,介绍了部分专家对五笔字型发明人王永民先生提出的“拼音输入使汉字形神俱灭”的不同看法,以及王永民先生本人的回应。近日,两位研究中文输入的权威专家致函本报,力驳王氏之说,全面阐述了拼音输入成为汉字输入主流的内在原因,将讨论推向深入。特此刊出,以飨读者。
上海一项调查表明,在数百万计算机用户中,使用拼音输入者占被调查者的95%以上
上世纪七八十年代,一个巨大的难题落到了中国人的肩上,如何解决世界上使用人口最多的古老文字———汉字,与当代高科技的精灵———计算机所发生的划时代的激烈碰撞。就此引发了一场全民“编码潮”,一时间,发明迭起,形码、音码、音形码不下千种,形成了“万码奔腾”的局面。
有的媒体把某个编码方案誉为“中国的第五大发明”;把某个设计喻为攻克了“汉字的哥德巴赫猜想”,是“当代的仓颉”。这些赞誉固然有失偏颇,却从一个侧面反映了上述碰撞的激烈程度,中国人期盼有一种简便的汉字输入方法。
三十年过去了,中国人跟其他地球人一起进入了二十一世纪。计算机应用普及了,计算机的神秘色彩被剥落了,而且从白头老翁到中小学生,从老教授到农民,从企业CEO 到卖菜大姐,无不用手机发送短信。手机的普及速度远远超过了计算机。今天,两亿多中国人平均每天发送短信超过一亿条。
汉字输入的普及脱下了“汉字编码”的神秘外衣。数以万计的汉字是由五个基本笔画或由五百多个基础部件构建而成。动听的单音节汉字,可以用26个罗马字母表述声、韵组合。手机用户发短信用的最多的是拼音输入。近年上海市有关部门的调查统计表明,数以百万计的计算机用户主要也是使用拼音输入,占被调查者的95%以上。所以我们才说拼音输入是汉字输入的主流方式。
我们在打“腹稿”时,大脑语言区用无声语言进行思维
根据我国心理学家建立的汉字键盘输入认知模型,计算机用户或手机用户从待输入的(文本方式、声音方式或者腹稿方式)源文稿到输入击键动作的完成,中间需要在人脑中完成三个信息加工过程:知觉加工(眼睛看文本或者耳朵听口述内容)、认知加工和动作加工。这三个阶段通常是串行进行的。
多数计算机用户和手机用户是“想着打”,他们的待输入源文稿是“腹稿”,这个“腹稿”是用户在大脑语言区用无声语言进行思维形成的,如用拼音输入,则无需任何感觉器官而直接成音表象,完成知觉加工;如用形码输入,需将“腹稿”的音表象转换成形表象,这种转换需要付出额外脑力开销和时间开销,既费心又费时,在知觉加工阶段,“想着打”者很自然地不愿将音表象转换成形表象。
进入认知加工阶段后,拼音输入者由音表象进行音素结构分析再取音码;形码输入者由形表象进行字形结构分析再取形码。音素结构分析因与思维所用的内部语言代码属于同一信息加工通道,因而比汉字字形分析跨通道加工的心理负荷小得多。
根据上述分析,我们认为,以“想着打”为主的广大计算机用户和手机用户用拼音输入是合理的。
有人误认为拼音同音字多、输入速度慢,形码重码少、输入速度快。事实恰恰相反。在上世纪九十年代由权威部门主持的多次汉字输入比赛中,连续文本(文章)竞赛均由拼音输入夺冠,离散文本(孤立字)竞赛则形码占优。后一情境对大多数普通用户其实意义不大。
虽然形码输入可以避免方言的困扰,但是拼音输入能够成为主流输入方式,除得益于和小学语言教育背景相一致,掌握拼音输入不需经过专业培训;还得益于软件和硬件技术的进步,使拼音输入方式对不同方言的兼容度大为提高。
拼音输入软件实现多项重大技术改进,多数形码的技术含量要苍白得多
汉语是大字符集对小音节集。字符集小则6763字,大则27484字,甚至更大。汉语音节不标声调为413个,标上四声也只有1300多个。上世纪八十年代处在“字输入”阶段,拼音输入同音字太多只能靠边站;形码重码字少,输入快,受到人们追捧,形码发明人名利双收,形码打字员供不应求,形码培训班遍布全国。
九十年代进入“字为基础,词为主导,智能处理”时期,汉语拼音的同音词并不多,丑小鸭变成白天鹅,拼音输入实用化,为非打字员的计算机用户普遍采用。此阶段某些形码发明者以“字有量,词无限”为论据,抵制词输入发展,播下了某些形码的技术越来越落后的种子。
九十年代末至二十一世纪初,汉字键盘输入的软愦谓肟焖俜⒄故逼凇V悄蹵BC、微软拼音、狂拼、青月亮上下文关联等输入软件,采用了汉语专家系统模型、马尔科夫链统计模型、海量模块配匹、最优评价函数、模糊控制模型等技术,不断巩固了汉语拼音输入的阵地。相比之下,多数形码的技术含量要苍白得多。
拼音输入之所以得到普及并成为汉字输入主流,既是广大用户群的选择,也是一群虽未经组织,但矢志不渝的专业和业余科研人员不懈努力的结果,而不是哪个“发明家”的功劳。
形码要争取更大的用户群,必须提升技术含量,而不是用诋毁拼音输入
八十年代,公司招聘文员的条件是“熟练使用五笔字型”;如今,公司招聘文员的条件是“熟练使用办公软件”。使用形码的优秀打字员虽不再是热门就业者,但在某些部门仍被视为至宝。拼音输入并不万能,读不出音的字就不会输了。
从95到XP,Windows一直内藏着一种编码规范的形码———“郑码”。据调查,该形码的用户数量却寥寥。然而,在北京昌平区某公司的机房内,一百多名使用“郑码”的高级蓝领,正在快速有序地为国家图书馆录入各种古籍和宋代以来的地方志。郑码系统具有符合国家标准内码的70195个汉字编码,具有宋、仿宋、楷、黑体符合国际标准的超大字符集曲线字库和完善的造字工具,并具有自动校对、版式自动还原等功能,从技术上满足了古籍数字化的要求。这是一项功在千秋的文字工程,是拼音输入望尘莫及的。
北京市的另一家公司用编码规范的“表形码”对九万余汉字进行了分类分级处理,研发了收集47000余汉字的《康熙字典》多媒体版。在这些领域,还是形码的天下。形码要争取更大的用户群,还必须遵循教育部门有关语言文字规范,通过提升技术含量,而不是用诋毁拼音输入方法,才能奏效。
笔者认为无论用哪种方法,将汉字输入到计算机,都是保护了汉字和它所承载的古老文明和当代文化。汉字文件的数字化不仅不会使汉字消亡,而且将促使汉字更快地走向世界。
关于“拼音输入法的错误率是字形输入法的9倍”、“常用拼音输入提笔忘字”、“音码能使汉字形神俱灭”、“裹胁着汉字在拼音化道路的迷途上前行”、“销蚀了运用汉字能力”等热门话题,中国语文现代化学会会长苏培成教授近期将在《光明日报》信息版上发表的文章作了深刻分析,本文不再赘述。
作者简介:
陈一凡,北京信息工程学院教授,中国中文信息学会汉字编码委员会委员,国家“九五”《信息技术通用键盘汉字输入通用要求》第一起草人。
韩布新,理学博士,中国科学院心理研究所科研处处长,中国心理学会副秘书长,国家自然科学基金项目“汉字键盘输入编码的认知过程分析”主持人。
评论: 0 | 引用: 6 | 查看次数: 4935
发表评论
你没有权限发表评论!