官方“汉字全息字典”上线 可检索汉字字形历史演变过程
撰文: 崔德兴
出版:更新:
日前,国家语言文字工作委员会基础资源建设项目“通用汉字全息数据库建设”的标志性成果“汉字全息资源应用系统”正式启动上线。负责人介绍,透过该系统,用户可搜索汉字字意、字音,甚至历代辞书对该字的释义,及其在一些常用古籍文献中被使用的情况。
项目由北京师范大学中国文字整理与规范研究中心、汉字研究与现代应用实验室负责实施。据介绍,该项目旨在运用现代中文讯息处理技术,构建一个具有多维关联关系、科学系统、高效实用的汉字全息数据库。项目主持人、北京师范大学教授王立军表示,从中小学基础教育领域到汉字研究的专业人士,系统可以满足不同人士的需要。
本期上线的系统涵盖字符集4种,其中常用字集3500字,通用规范字8105字,古籍印刷字16490字,全字符集81722字;还有辞书20种,古籍文献60种,历代字形图415675个。其中包括大量的图形讯息资源和文本讯息资源,分别来自古文字拓片、文字编、规范字表、编码字符集、历代辞书、经典文献、中小学语文教材等,涵盖了古今各个时期文字的形、音、义、用、码五大方面的重要讯息。
显示常用古籍文献中的句子
此外,系统选取历代具有代表性的辞书,并选择最优的版本作为搭建框架的基础素材,包括《尔雅》、《说文》、《康熙字典》、《新华字典》、《通用规范汉字字典》等,搜索时会显示历代辞书的释义。而在每个字的“用例”一栏,系统选取具有代表性的传世文献作为古籍用例的来源,包括“十三经”、“二十五史”、“二十二子”等三大典籍系统,提取汉字在这些文献中的使用例句,供研究者参考使用。