四川凉山彝语阿都话语音资源库建设与运用研究

发表时间:2021/4/26   来源:《文化研究》2021年5月下   作者:王成平 孙某姑
[导读] 目前利用信息化手段保存、传承四川凉山彝语阿都话是目前最为有效、极具价值的保护方式。论文研究按语言调查规范标准化制定《彝语阿都话语音调查文本》,运用语料库、MySQL、Web程序等技术完成凉山彝语阿都话基础语音资源库的建设及基于声学参数库的阿都话元音的分析研究。

四川成都西南民族大学民族语言文字信息处理重点实验室    王成平 孙某姑   610041

摘 要:目前利用信息化手段保存、传承四川凉山彝语阿都话是目前最为有效、极具价值的保护方式。论文研究按语言调查规范标准化制定《彝语阿都话语音调查文本》,运用语料库、MySQL、Web程序等技术完成凉山彝语阿都话基础语音资源库的建设及基于声学参数库的阿都话元音的分析研究。
关键词:彝语;阿都话;语音资源库;声学参数库;元音分析
        1.前言
        彝语北部方言是彝语六大方言之一,彝语阿都话属彝语北部方言南部次方言的东部土语据相关统计截至2010年彝语阿都话使用区人口约为60多万人,阿都话中保存着较多古彝语词汇,仍留存着复元音复辅音的语音特征,词汇表达较为丰富。目前彝语阿都话基础语言工程建设研究尚处于初级阶段,全面性的描写和展示彝语阿都话的原始面貌是彝语方言及其信息化研究的核心要点之一。

图1  彝语阿都话方言分布图
        国内著名民族语言学专家沙马拉毅教授曾谈道:“保护和传承彝语文是我们这代人的历史使命,不能让一种语言消失后再想复活它。”通过语言田野调查对民族语言文化资源进行记录,有效保存、保护处于濒危边缘的阿都话尤为重要,同时建立语音资源库,为研究阿都话提供新的研究方视野。论文开展四川凉山彝语阿都话语音资源库的建设与研究,主要参考、借鉴语言学、应用语言学、实验语音学、语料库等学科视角,对阿都话进行多维度的研究、展示与分析研究。
        2.语音数据采集整理
        2.1 调查文本制定
        论文研究完成的《四川凉山彝语阿都话语音调查文本》主要参考《中国语言资源有声数据库调查手册(汉语方言)》、《中国语言资源调查手册-民族语言(藏缅语族)》以及借鉴《语言调查语料记录与立档规范》;彝语阿都话的语音资源库调查选取进行田野调查的字、词、句、短语、故事等有声语音资源整理进行收集,分析和归纳调查中存在的语音现象。


        调查文本的词汇按照自然词汇层面选词是根据阿都地区所独有的自然环境和农牧业产物进行的选词,如:土豆、荞麦、锄头、耕犁等;根据阿都地区彝族群体的人文文化进行服饰、家具、配饰、农具等多角度的选词,并结合彝族群体的日常生活习惯和文化交流用语,进行了语句和词汇的选定;故事文本选取的内容包括:神话传说、寓言故事、民间类故事等。
        2.2语音数据收集整理
        语音资源数据采集记录是对语言调查并完成采集记录的过程,将采用前期准备的工作要求准则,进行数据的的录入,然后进行语音片段剪切。完成编码、标注和入库。


        3.彝语阿都话基础语音资源库建设与管理
        彝语阿都话基础语音资源库是通过彝语言文字信息化技术结合计算机科学共同制定的一个交互型语音类资源库,其语音数据数字化,其实质是语音数据进行数字化加工并投入资源库使用管理的过程。彝语阿都话的语音数据材料将以实地的语言调查采集获取到的原始采集语音数据为准,加以语音的切分,完成数据的分类归档,完善架构设计,如图1所示:

        3.1 语音资源库规模架构制定
        阿都话语音资源库,采用全局管理模式对整个系统进行科学的布局和管理,通过用户权限的分类限制有效保护数据安全,同时考虑到系统的扩展性,完成数据交互的连接任务,其流程如图2所示:

        2.3语音资源库系统架构
        彝语阿都话语音资源库通过数据库设计方案的架构设定为两个部分:资源库前台和资源库后台。前台进行管理和设计主要实现语音资源库的语音的播放试听、语音标注信息查询、阿都话视频的观览、语音和视频的上传下载等功能。后台设计管理主要用于管理人员的对语音视频的目录、数据信息以及管理员功能权限的控制等功能。
        语音资源库采用自上而下、从总体到局部的管理运行模式。从首页到影像资源再到语音资源的分布结构等都可以进行语音和影像的分类检索,同时可以进行会员管理,进行数据的上传。

        通过系统化的分类,有助于直观的分类界面为资源库管理控制庞大数据量带来方便,实现科学化的管理策略。
        2.4语音库前后台系统规划设计
        彝语阿都话基础语音资源库前台系统主页面包括以下部分:主页上端:主要汇集彝族风格元素的Logo图、搜索引擎、会员注册/登陆、首页导航以及影像资源的定时轮换图。主页底端:包括页面的开发商版权和商标等信息、后台开发技术工作人员的联系方式和其他信息等。
        语音资源库的网页首页是资源库的门户,突出以下几个功能。
        其一,语音资源的检索是数据库建设的核心功能。通过检索,可以在最短时间内查询到需要获取的语音情况,可高效完成数据查询。

        其三,附加信息的查看。通过该模块,可以了解语音数据和影像数据的基础说明。
        语音资源库网页端后台系统规划涉及以下几个内容,其中有目录管理、数据管理、会员管理、上传信息管理和管理员设置,在信息化背景下的民族语言文字的数字化建设,科学的部署和分配数据资源有着重要意义。
        2.5系统开发重点难点分析
        (1)资源库访问
        阿都话语音资源库的是基于交互使用的数据资源库,阿都话语音资源库会员用户登陆本地链接地址为: http://localhost/adu/indeph*p,阿都话语音资源库管理员登陆本地链接地址为: http://localhost/adu/admin/indeph*p,可将资源库依托外挂网站挂载,实现数据上传,互联网客户端的访问。
        (2)检索功能。
        实现全局分类检索功能,利用MySQL中的全文搜索match against命令,通过数据表,利用相关的命令函数标识字段,结合创建索引命令实现索引的处理。
        (3)数据上传、下载
        数据资源的上传即管理员将数据文件进行上传服务,通过上传功能将数据上传到服务器端。实现对函数数组中数据的值的验证。
        (4)PDO技术分析
        PDO是PHP中一个比较重要的扩展功能,激活过程便是编写php.ini文件,并添加扩展任务命令,完成跨平台的数据迁徙。
        4.基于语料库的彝语阿都话声学参数库建设与元音分析
        4.1声学参数库建设
        论文研究主要参照“少数民族语音声学参数数据库”的规范参数标准和要求,完成声学参数库的建立,流程思路如6图所示:

        阿都话语音参数库以阿都话的单音节词、多音节字共同组成,在参数库中单音节词在数量上所占比例较大(63%),主要使用单音节词进行数据分析,其提取数据较为可靠;同时每个词都用国际音标标注,并标注准确的汉译文;经过系统化甄选,选取76个字词(包括48个单音节词和28个双音节词)组建成“阿都话语音参数库”的数据来源。
        4.2彝语阿都话的元音实验分析
        语音学(Phonetics)是通过实验手段对人类发出具有规律性和现实意义的声音信号进行实验分析研究的学科,彝语阿都话语音数据(声学)特征分析将充分运用到Praat的主要功能是对阿都话的语音、声音信号等数据进行提取和分析,如图7所示:

        利用Praat提取阿都话词首短元音基础的数据和语音参数,建立语音声学参数资源库,阿都话元音声学参数列表,包含如元音时长、元音强度及共振峰频率等参数数值。通过对元音两个共振峰的位置和刻度进行对比分析,清晰客观的总结分析出元音第一、第二共振峰(F1、F2)的数据分布情况。该现象粗略地说明,相对于较大,舌头位置较靠后,且圆唇度也较高。在现代语音分析学上经常以元音F1和F2的元音数值来描写任何一个元音的音色;经过语音系统性的分析和实验分析统计,发现在阿都话中元音总共13个,包括舌面音8个,其中前不圆唇3个,后不圆唇1个,圆唇4个,分别为[i ]、[e]、[a]、[?]、[?]、[u]、[o]、[ u];舌尖元音2个,分别是[?]、[?];根据实际标注中遇到的情况,总结出复合元音3个[ua]、[ue]、[ui];不存在舒唇元音和元音辅音化的情况。
此外,在阿都话元音系统中,[i ]、[?]、[u]、[o]、[?]、[ua]、[ue]、[ui]为松元音,[e]、[a]、[?]、[ u]、[?]为紧元音,下为彝语阿都话元音音系表:



        以下表格为阿都话元音为基准的例字词表:


        论文研究针对彝语阿都话当中的10个单元音所选的词汇的共振峰F1值和F2值及两者的差值,然后对音高(AV)的数值进行统计和归纳,详细情况如下表所示:


        通过运用办公软件Excel,完成数据的提取和统计,并利用得出的第一二共振峰数值计算出V值,并描绘出基于V值的元音格局图。
        根据石锋、时秀娟等实验语音学专家的相关研究显示,V值可以对应元音的舌位高低。这种划分为后续的语音格局图绘制提供数据方面的参考。经过对实验数据的整合分析处理后,以F2值为纵轴,以F1为横轴作图,得到彝语阿都话的单元音格局图。以下数据表和图示为彝语阿都话的V值表和彝语阿都话的元音格局:


        论文研究通过对四川凉山彝语阿都话的单元音([a],[o],[e],[i],[u],[u?],[?],[??],[?],[?])的组成词汇进行了声学统计分析,其过程主要参考元音共振峰(F1、F2)的频率、音强、音高、声学图等,从而进一步的探索到彝语阿都话元音发音生理机制。
        从元音发音时长为探入点进行分析,元音[i]的发音时长最长,而元音[u]时长则最短。元音[a]的开口度则最大,接着是[o]、[e]等,[i]的开口度最小。在元音第一共振峰的均值当中,元音[a]的发音处于最圆唇状态,舌位的共振腔越靠后,而元音[i]则最靠前。论文对目前彝语阿都话语音共振峰数据中已经出现的频率相对较多的[a]、[o]、[e]、[i]、[?]、[u]、[u]、[?]、[?]、[.]等10个元音,通过对囊括10个元音的大量的语音数据进行数据信息提取和实验分析,完成四川凉山彝语阿都话的声学分析,同时语音参数提取将为语音格局的建立和数据实验分析提供了丰富的数据信息,为彝语方言实验语音学研究提供了语料基础和数据分析探索。
        5结语
        习近平总书记曾指出:五十六个民族不断交流交往交融,形成多元一统的中华民族。中华文明历史悠久,是世界上唯一没有中断、发展至今的文明,党中央重视少数民族文化遗产的保护传承。[人民网.2019.习近平:要重视少数民族文化遗产的保护传承.[N].人民日报,2019-7-16.]为民族语言文化走向国际化、信息化提供了有力的支持。因此建设彝语方言语音资源数据库,从而真实记录彝语方言的面貌与现状,利用信息化手段尽量完整的保存和保护彝族方言资源,论文研究按语言调查规范标准化制定《四川凉山彝语阿都话语音调查文本》,运用语料库、MySQL、Web程序等技术完成彝语阿都话基础语音资源库的建设,同时针对彝语方言研究,从信息化领域结合实验语音分析,完成了彝语阿都话的元音分析,方便了四川凉山彝语阿都话研究工作者对语料的检索,提高语料使用效率和共享的有效途径,为其他彝语方言资源库建设的提供了一个可参考的解决方案。
参考文献:
1.王成平.2010.彝语元音松紧对立的声学参数分析[J].科技创新导报,(27):220-222.
2.潘正云.2001.彝语阿都话唇软颚复辅音声母比较研究[J].民族语文,(02):17-22.
3.沙马拉毅.2011.彝文信息处理技术三十年发展历程与展望[J].中文信息学报,25(06):170-174.
4.马丽,吉吉伍果,王晓涵.2015.保护彝族阿都方言,传承地域文化[J].商,(51):110.
5.李宇明.2010.论中国语言资源有声数据库的建设[J].中国语文,(04):356-363+384.
6.黄成龙.2016.当代中国少数民族语言资源调查[J].黔南民族师范学院学报,36(05):25-30.
7.王成平.2011.彝文信息处理技术的发展历程评述[J].人民论坛,(08):210-211.
8.石锋,冉启斌,王萍.2010.论语音格局[J].南开语言学刊,(01):1-14+185.
9.于荷云.2018.PHP 7.0+MySQL网站开发全程实例[D],北京:清华大学出版社,7-81.
10.人民网.2019.习近平:要重视少数民族文化遗产的保护传承.[N].人民日报,2019-7-16.
11.阿依努尔·努尔太.2012.维吾尔语元音格局研究[D].乌鲁木齐:新疆大学.
12.人物.沙马拉毅访谈:不能让一种语言消失后再想复活它.(2019-02-12)宁蒗人民政府视窗[EB/OL].
13.陈嘉猷.2001.三个少数民族语音声学参数数据库(光盘版)介绍[C]. 中国中文信息学会.新世纪的现代语音学——第五届全国现代语音学学术会议论文集.中国中文信息学会:中国中文信息学会,101-105.
14.王成平.彝语言语料资源数据库的设计与共享的实现[J].中文信息学报,2016(1):129-132.
15.Chengping Wang. Research on Design and Sharing of Yi Language Corpus Resources Database Based on Syntactic Rules [J]. Solid State Technology ,2020(5): 10618-10629.
16.王成平.彝语言文字信息技术的开发与应用发展研究.四川民族研究(第一辑)[M],2019:148-158.
作者简介:王成平(1979-),男,彝族,博士,副教授,主要研究方向:彝语言信息处理;孙某姑(1986-),男,彝族,硕士研究生,四川省雅安市名山区政府办、西南民族大学2017级民族语言文字信息处理专业硕士研究生;项目基金:教育部人文社会科学研究项目(17YJA740051)、四川省社科规划项目(SC20B130)、西南民族大学中央高校基本科研业务费专项资金项目(2016NGJPY07)的研究成果。

投稿 打印文章 转寄朋友 留言编辑 收藏文章
您可能感兴趣的其他文章
•   博物馆陈列布展的科学化设计探析
•   探讨旅游经济与文化产业融合发展模式
•   基于博物馆陈列展览的思想性与观赏性探...
•   基于就业导向的中职酒店服务于管理教学...
•   探讨美术类短视频在新媒体平台中的传播
•   浅谈在《依托爱国主义教育基地,培养小...
•   如何在全域旅游时代下推动科普
•   加强非遗活化,力促乡村振兴——广州市...
•   浅谈中职学生朗读能力的现状与对策
•   济南市考古研究所藏宋代金耳饰赏析
•   基层群众文化活动中存在的问题及对策探...
•   线上教学在中职民间工艺美术课程中开展...
•   泰山《药师七佛阁记》碑碑阴疏文浅析
•   浅谈广播电视导演必备的艺术修养
•   高中英语教学实践中对学生文化意识的培...
•   用心管理-----做好初中毕业班班主...
更多>>
  站长推荐 更多>>
  • · 新加坡国立大学教授郑永年:中国崛...
  • · 一张照片突然刷爆朋友圈!黑天鹅已...
  • · 2019年,是大破之年,也是大立...
  • · 任泽平:认清中美贸易摩擦升级真相...
  • · 中国的生存法则变了!你再不懂就彻...
  • · 那场82年前的失败,藏着吾国吾民...
  • · 叶檀:华为何为?(与任正非对谈纪...
  • · 中兴高管爆料!这是一场任正非渴盼...
  期刊推荐
1/1
  原创来稿文章 更多>>
  • · 眼 神
  • · 我的前世今生
  • ·
  • · 守望
  • · 这一年
  • · 梁家河
  • · 这个世界会好吗?
  • · 此去经年
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址:
 

PHP网站源码大理关键词按天计费报价常德营销型网站建设抚州网站制作宜昌网络广告推广哪家好泉州网络推广哪家好阜阳网站优化软件报价通辽企业网站改版价格自贡关键词排名包年推广安顺网站seo优化多少钱广东百度网站优化排名价格海口网站优化排名哪家好坪地网站推广推荐沧州设计网站多少钱邵阳seo网站优化报价金昌关键词按天扣费推荐清远优秀网站设计多少钱南阳SEO按天收费哪家好飞来峡设计网站吴忠网站建设设计公司怒江建站报价永湖阿里店铺运营推荐鄂州百搜标王价格汉中企业网站改版报价肇庆网站优化按天收费哪家好丹竹头外贸网站建设推荐鹤壁模板制作飞来峡模板网站建设价格坂田营销网站哪家好凉山关键词按天扣费报价本溪模板制作公司歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化