一种汉字与所有语言文字的互通互识技术方法与流程

文档序号:19424630发布日期:2019-12-17 15:03阅读:708来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种汉字与所有语言文字的互通互识技术方法与流程
1.
技术领域
本发明涉及汉字与各种语言的互通互识领域,尤其涉及一宗应用在中文与各种语言互通互识系统中的中文与所有语言文字直接互通互识的实现方法。2.
背景技术
:文字为人类表现思想、发展生活交流之工具,中国历史悠久,文字巨多,为说汉语的人类通用。汉字使用人数目前世界第一,传承中国5000年文化增强中华各民族的向心力和凝聚力。汉字所传播的文化精髓,增强了各民族间的认同感,是历史上各民族文化交流方面的黏合剂。中华泱泱大国之所以分久必合,其重要原因之一就是汉字承载的文化始终是各民族所共同认同的。汉字是联合国官方文字之一,所有文件必须翻译成汉字存档,随着中国国力日渐增强,学习汉语\汉字的外国人日渐增多。随着中国在世界所拥有的历史地位,中华名族的精髓——汉字,也应当成为世界通用语言。然而要想使汉字文化推广的更快更广,就需要借助当今的高科技,建立一套中文汉字与世界各国语言文字互通互识系统,该系统要将每个汉字采集到该系统的数据库中,然后汉字学习者用能够连接互联网的终端访问该系统的数据库,数据库中的信息被反馈到终端上,学习者从而根据世界各种语言文字查询汉字字形或者根据汉字字形查询对应的世界各种语言文字,要想建立这套中文汉字互通互识世界各种语言文字系统,就需要一套行之有效的方法。3.技术实现要素:本发明的目的在于克服现有技术中的不足而提供的一种应用在中文与各种语言互通互识系统中的中文与所有语言文字直接互通互识的实现方法。一种中文直接互通互识所有语言文字的系统实现方法,其特征在于:包括根据所有语言文字互通互识汉字字形的方法和根据汉字字形查询对应所有语言文字的方法。所述的根据所有语言文字互通互识汉字书字形的方法包括以下步骤:步骤1)、建立汉字字形对应所有语言文字的数据映射:把所有的所有语言文字翻译写成汉字字形,将写好的汉字字形扫描成电子版,每一个字生成一个图片,保存成以相对应的所有语言文字命名的jpeg格式图片文件,jpeg格式图片文件与对应的汉字一对一映射,建立数据库。步骤2)、实现网络服务,提供汉字与所有语言文字的互通互识功能:在与互联网相连接的硬件上安装具有汉字互通互识所有语言文字功能的汉字文本输入框,供用户输入汉字,所述的汉字文本输入框与存放有jpeg格式图片文件的数据库相连接,用户在汉字文本输入框上选择所有语言文字互通互识功能,后台服务根据汉字从所有语言文字与汉字字形图片映射的数据库中查询所有语言文字对应的图片,并传输到客户端,然后在客户端上显示出来,供用户查看、使用;所述的根据汉字互通互识对应所有语言文字的方法包括以下步骤:步骤1)、建立汉字字形特征字串数据库;把所有的所有语言文字编译写成对应的汉字,将写好的汉字扫描成电子版,每个字生成一张图片,保存成以相对应的所有语言文字命名的jpeg格式图片文件,分别对每个图片文件进行处理,生成对应的特征字串,特征字串的生成方法如下:第一步,图像读取;将以上生成的以相对应的所有语言文字命名的jpeg格式的原始图片读取到图片处理软件中;第二步,颜色处理;在图片处理软件中对第一步添加进来的图片进行处理,完全生成“白底黑字”,所述的“白底黑字”是字体本身为黑色,字体以外的背景为白色;第三步,切割处理;通过图片处理软件处理第二步得到的图片,字外的空余部分被水平、竖直的切割掉,字体的最外侧的边缘与图片的边缘重合;第四步,压缩处理;对第三步处理后得到的图片进行压缩处理,得到一个标准大小尺寸的图片;第五步,生成特征字串;对第四步处理后得到的图片的各个像素点进行扫描,以黑色为1,以白色为0,得到一个64位的字串,所有的汉字字形全部按照上述方法处理后得到的字串与图片、所有语言文字翻译一对一映射,建立字据库;步骤2)、汉字字形识别的实现方法和算法:第一步,取像:在互联网连接的硬件设备上安装具有拍照功能的汉字识别软件,所述的与互联网相连接的设备具有拍照功能,用硬件设备对需要识别的汉字进行拍照取像,拍照获得的图像大小设置为固定大小,在照相时,需要确保拍照获得的图片中只有需要识别的单个汉字字形。第二步,处理:根据步骤1)中“建立汉字字形特征字串”中的图片处理的方法对第一步中生成的图片进行处理,得到此图片中汉字字形的特征字串。第三步,比较:把第二步中计算出的需要识别的汉字字形特征字串上传到服务端,与数据库中的所有字串进行比较,找到与需要识别汉字字形的特征字串相似度最高的字串。第四步,显示:根据第三步找到与需要识别汉字字形的特征字串相似度最高的字串后,根据字串可以从数据库中查找到与该字串对应的图片、所有语言文字翻译,后台通过互联网把这些图片、所有语言文字翻译传输到与互联网相连接的硬件上安装的软件上,通过软件的界面显示出这些图片、所有语言文字翻译,供用户对比、学习、使用。所述的根据汉字字形互通互识对应所有语言文字的方法步骤中1)中第四步生成标准大小尺寸图片的图片尺寸大小为8*8,单位为毫米。所述的根据汉字字形互通互识对应所有语言文字的方法步骤中2)的第一步中拍照获得的图片大小设置为固定尺寸大小为800*600,单位为毫米。所述的根据汉字字形互通互识对应所有语言文字的方法步骤中2)的第一步中所述互联网相连接的硬件为带有拍照功能的电脑。所述的根据汉字字形互通互识对应所有语言文字的方法步骤中2)的第一步中所述互联网相连接的硬件为带有拍照功能的智能手机、智能手表等其他智能设备。本发明具有独创性,应用本发明将汉字字形采用高科技信息化,每个汉字用摄像记录、输入汉字数据库中,每个汉字都有与之相对应的所有语言文字翻译,应用本方法建立的中文互通互识所有语言文字系统,供所有语言文字使用者根据汉字直通所有语言文字的写法,以及供所有语言文字学习者看到某个汉字后,即刻互通互识到对应的所有语言文字,特别是在用汉字字形互通互识对应所有语言文字时,应用本发明建立的中文互通互识所有语言文字系统对汉字字形的识别准确度达到了99%以上,有利于人们们认识和学习中文,有利于汉字在全世界范围的推广、使用4.附图说明通过参照附图更详细地描述本发明的示例性实施例,本发明的以上和其它方面及优点将变得更加易于清楚,在附图中:图1:本发明所采用的设计方法流程图;图2为本发明实施例中的图片。图3为本发明实施例中的图片。图4为本发明实施例中的图片。5.具体实施方式在下文中,现在将参照附图更充分地描述本发明,在附图中示出了各种实施例。然而,本发明可以以许多不同的形式来实施,且不应该解释为局限于在此阐述的实施例。相反,提供这些实施例使得本公开将是彻底和完全的,并将本发明的范围充分地传达给本领域技术人员。在下文中,将参照附图更详细地描述本发明的示例性实施例。实施例:如图1所示,一种中文互通互识越南文系统实现方法,包括根据汉字互通互识越南文的方法和根据越南文互通互识对应的汉字的方法;所述的根据汉字互通互识越南文的方法包括以下步骤:步骤1)建立汉字字形与对应越南文的数据映射:把所有的越南文写成汉字字形,将写好的汉字字形扫描成电子版,每个字生成一张图片,保存成以相对应得越南文命名的peg格式图片文件,peg格式图片文件与对应的越南文一对一映射,存放到数据库中;汉字与相对应的越南文命名的peg格式图片文件,示例如下:汉字越南命名的汉字字形图片汉汉.jp字字.jp字字.jp形形.jp步骤2)、实现网络服务,提供查询功能:在与互联网相连接的手机上安装具有查询功能汉字文本输入框的手机软件,供用户输入汉字,所述的汉字文本输入框与存放有peg格式图片文件的数据库相连接,用户在汉字文本输入框上选择越南文互通互识功能,后台服务根据汉字与汉字字形图片映射的数据库中查询出越南文对应的图片并传输到客户端,然后在客户端上显示出来,供用户查看学习;所述的根据汉字字形查询对应越南文的方法包括以下步骤:步骤1)、建立字形字形特征字串数据库;把所有的越南文写成汉字字形,将写好的汉字字形扫描成电子版,每个字生成一张图片,保存成以相对应的越南文命名的peg格式图片文件,分别对每个图片文件进行处理,生成对应的特征字串,特征字串的生成方法如下:第一步,图像读取:将以上生成的以相对应的越南文命名的peg格式的原始图片读取到图片处理软件中,以“明”为例,读取的原始图片如图2所示第二步,颜色处理:在图片处理软件中对第一步添加进来的图片进行处理,完全生成“白(0xffffff)底黑(0x000000)字”,所述的“白底黑字”是字体本身为黑色,字体以外的背景为白色,处理后的图片如图3所示第三部,切割处理:通过图片处理软件处理第二步得到的图片,把字外的空余部分水平、竖直的切割掉,字体上、下、左、右四个方向最外侧的边缘与图片的边缘重合;处理后的图片如图4所示;第四步,压缩处理:对第三步处理后得到的图片的各个像素点进行压缩处理,得到一个8*8的图片;第五步,生成特征字串:对第四步处理后得到的图片的各个像素点进行扫描,以黑色为1,以白色为0,可以得到一个64位的字串,对”明“字的汉字字形处理后得到的字串为:0000001100000100000100001000101011111110000101000010001000100100将处理后得到的字串与图片、汉字、拼音、越南文翻译一对一映射,存储到数据库中;步骤2)、汉字字形识别的实现方法及算法:第一步:取像:在与互联网连接的智能手机上安装具有拍照功能的汉字识别软件,所述的与互联网相连接的智能手机具有拍照功能,用智能相机对需要识别的汉字字形进行拍照取像,拍照时打开智能手机上的闪光灯,从而避免相对图片上有阴影,影响图片质量,拍照获得的图片大小设置为800*600,在照相时,需要确保拍照获得的图片只有需要识别的单个汉字字形;第二步:处理:根据步骤1)中“建立汉字字形特征字串”中的图片处理的方法对第一步中生成的图片进行处理,得到此图片中汉字字形的特征字串;第三步:比较:把第二步中计算出的需要识别的汉字字形的特征字串上传到服务端,与数据库中的所有字串进行比较,找到与需要识别汉字字形的特征字串相似度最高的字串,相似度比较算法如下表所示:第四步:显示:根据第三步找到与需要识别汉字字形的特征字串相似度最高的字串后,根据字串可以从数据库中查找到与该字串对应的图片汉字、拼音和越南文,后台通过互联网把这些图片、汉字、拼音、和越南文,供用户对比、学习使用。经过测试,根据上述算法,针对汉字字形的识别,准确度达到了99%以上。以上所述仅为本发明的实施例而已,并不用于限制本发明。本发明可以有各种合适的更改和变化。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
完整全部详细技术资料下载
当前第1页 1  2 
相关技术
  • 一种汉字与日语的互通互识技术...
  • 一种汉字与越南语的互通互识技...
  • 一种汉字与行书的互通互识技术...
  • 一种汉字与意大利语的互通互识...
  • 一种汉字与英语的互通互识技术...
  • 一种汉字与波斯语的互通互识技...
  • 一种汉字与俄语的互通互识技术...
  • 一种汉字与葡萄牙语的互通互识...
  • 一种汉字与孟加拉语的互通互识...
  • 一种汉字与法语的互通互识技术...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

PHP网站源码同乐SEO按天收费布吉网站制作观澜SEO按天收费龙岗企业网站改版永湖高端网站设计塘坑外贸网站建设坂田优秀网站设计西乡SEO按天扣费坂田网站改版坂田网站优化东莞品牌网站设计南澳阿里店铺运营塘坑网站优化按天收费观澜关键词排名爱联阿里店铺托管民治关键词按天计费盐田网络广告推广大运阿里店铺托管福永seo优化双龙标王西乡营销型网站建设西乡百度竞价龙华SEO按天收费荷坳网络推广深圳关键词排名大芬英文网站建设大鹏网站建设宝安外贸网站制作坑梓网站推广工具西乡网站推广方案歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化