当前位置: 首页 - 研究人员 - 专职研究人员 - 正文

饶高琦 助理研究员

时间:2019-09-06 来源: 发布人:


个人简介

本人主要从事计算语言学、数字人文和语言规划方面的学术研究与工作 。近五年来在国内核心期刊与国际会议上发表论文16篇。其中作为BCC大规模在线语料库系统的文献《大数据背景下BCC语料库的研制》被引近两百次。参与BCC大规模在线语料库系统建设,被教育部科技司评为“改革开放40周年高校科技创新成就”,系第二完成人。发起并组织中介语作文句法错误检测技术评测,并举行3届,产生广泛影响。长年参编国家语委年度《语言文字生活状况报告绿皮书》和《语言文字事业发展报告白皮书》。在《光明日报》《科技日报》等报刊发表科普文章20篇创办并运营语言学科普公众号汉语堂(在2019年夏的语言文字类领域全国排名第11),产生了较大的社会影响。


研究方向:计算语言学、语言规划学、数字人文


联系方式:raogaoqi@blcu.edu.cn



教育经历


2016/08 至今:北京语言大学,对外汉语研究中心,助理研究员

2013/09 – 2016/07: 北京语言大学,语言政策与标准研究所,语言学与应用语言学专业,语言规划与计算语言学方向,文学博士

2010/09 – 2013/07: 北京语言大学,信息科学学院,计算机应用技术专业,语言信息处理方向,工学硕士

2006/09 – 2010/07: 山东建筑大学,外国语学院,日耳曼语言文学专业,文学学士


科研项目

语言信息处理技术评测的规划与设计研究(YB135-90) | 国家语委信息化专项 | 主持

中介语句法错误自动检测技术评测研究 | 北语校级项目 | 主持

汉语国际传播资源与推送平台研究、开发与应用(16JJD740004) | 教育部人文社科重点研究基地重大项目 | 子课题负责人

大数据背景下汉语语块数据库建设与应用研究(16AYY007) | 国家社科基金重点项目 | 参与

0到3岁儿童语料库建设 | 国家社科基金重点项目 | 参与

现代汉语历时数据库建设 | 北京语言大学校级科研项目 | 主持


科研成果

学术发表

Gaoqi Rao, Qi Gong, Baolin Zhang, Endong Xun. Overview of NLPTEA-2018 Share Task Chinese Grammatical Error Diagnosis. 2018. Proceedings of the 5th Workshop on Natural Language Processing Techniques for Educational Applications(NLPTEA-2018), pages 42-51, Melbourne, Australia.

Gaoqi Rao, Lung-hao Lee. NLP for Chinese Writing: Evaluation of Chinese, 2018. Proceedings of the 1st Workshop on the Belt and Road Language Resources and Evaluation, pages 48-52, Miyazaki, Japan.

Gaoqi Rao, Baolin Zhang, Endong Xun. IJCNLP-2017 Task 1: Chinese Grammatical Error Diagnosis. 2017. Proceedings of the 8th International Joint Conference on Natural Language Processing, Shared Tasks, pages 1–8, Taipei, China.

饶高琦、李宇明. 基于词汇聚类方法的现代汉语分期与分期体系构建[J],中文信息学报,2017(6):18-24

饶高琦、李宇明. 基于词频逆文档频统计的词汇时间分布层次[C],第十八届汉语词汇语义学国际研讨会,2017, 中国:乐山

Gaoqi RAO, Meng DAI, Endong XUN. Study on the Effectiveness of the Regulations for Chinese Words with Variant Forms Based on a Long-Span Diachronic Corpus, [C] Chinese Lexical Semantics, Springer LNAI: 728-742.

Lung-hao LEE, Gaoqi RAO, Liang-chih YU, Endong XUN, Baolin ZHANG, Li-ping Chang. Overview of NLP-TEA 2016 Shared Task for Chinese Grammatical Error Diagnosis, 2016, Proceedings of COLING-26, pages 40-48, Osaka, Japan.

饶高琦、李宇明. 基于70年报刊语料的现代汉语历时稳态词抽取与考察,中文信息学报,2016(6):49-58

饶高琦. 时代精神:基于战后七十年报刊语料和隐含主题模型的历史热词提取,语言规划学研究,2016(2):40-58

饶高琦. 基于计算方法的语言规范效力检测初探——以异形词整理工作为例,语言战略研究,2016(6):55-63

荀恩东、饶高琦、臧娇娇、肖晓悦. 大数据背景下BCC语料库的研制.语料库语言学,2016,3(01):93-109+118.

Gaoqi RAO, Endong XUN. Words and Characters in Official Newspapers since the Foundation of PRC: Guizhou Daily and People’s Daily as Examples, International Journal of Knowledge and Language Processing (IJKLP), 2015, 6(2):23-33.

虞宁翌、饶高琦、荀恩东. 文言信息的自动抽取:基于统计和规则的尝试(指导毕设),中文信息学报,2015(6):127-134+140

饶高琦、于东、荀恩东. 基于自然标注信息和隐含主题模型的无监督文本特征抽取,中文信息学报,2015(6):141-149

荀恩东、饶高琦、谢佳莉、黄志娥. 现代汉语词汇历时检索系统的建设与应用[J]. 中文信息学报, 2015,(3):169-176

于东、饶高琦、唐共波、荀恩东复杂科技术语构词中的语素化(第二作者),中国科技术语 2015(2) :15-20

荀恩东、饶高琦、臧娇娇. 大数据视角下的语言实证工具:北语汉语语料库系统BCC,第十一届北京市语言学学会年会(北京)

饶高琦、于东、荀恩东. 基于自然标注信息和隐含主题模型的无监督文本特征抽取,全国计算语言学学术会议CCL2014(武汉)

饶高琦. 汉语词性信息对句法分析的贡献,第22届国际中文语言学年会既第26届北美中文语言学年会IACL22-NACCL26,大会宣读

Zhi-e HUANG, Endong XUN, Gaoqi RAO. Chinese Natural Chunk Research based on Natural Annotations in Massive Scale Corpora -- Exploring Work on Natural Chunk Recognition using Explicit Boundary Indicator ,Lecture Notes in Artificial Intelligence,Vol.8202 (第三作者)

荀恩东、黄志娥、饶高琦、谢佳莉. Perl——自然语言处理利器,1-4章,清华出版社(北京),ISBN9787302341208

饶高琦、荀恩东. 现代汉语词汇历时检索系统:基于长时间跨度语料库的词汇历时信息研究与应用,第十四届汉语词汇语义学研讨会CLSW-2013,评为优秀论文

Gaoqi RAO, Chi Xiu, Endong XUN. Chinese Word Segmentation Oriented Natural Annotation in Large Scale Corpora (大规模语料库中面向中文分词的自然标注信息研究),  Acta Scientiarum Naturalium Universitatis Pekinensis, 2013, 49(1):140-146.

Gaoqi RAO, Endong XUN. Word Boundary Information and Chinese Word Segmentation (词边界信息与中文分词). Int. J. of Asian Lang. Proc.,(亚洲语言处理进展) 2012, 22(1): 15-32.


咨政启智

让网络激发语言热情[N]. 光明日报,2019-04-06(08)

语言智能和语言教育不应“相杀”[N]. 光明日报,2018-12-27(022)

用科学的学习方式提升公民语言能力[N]. 光明日报,2018-08-13(010)

语言智能的文艺范,影响不简单[N]. 光明日报,2018-06-25(011).

汉源术语“出海”只是第一步[N]. 光明日报,2018-05-25(002).

表情包毁不了语言[N]. 光明日报,2018-05-03(011).

谷歌“造人”成功不是最惨失业潮的开始[N]. 科技日报,2018-05-18(007).

语言学应成为独立的学科[N]. 科技日报,2018-03-23(007).

完善AI课程体系是关键[N]. 科技日报,2018-03-19(008).

老外汉语好不好,AI能说了算?[N]. 科技日报,2018-03-02(007).

打造影视巨作,别忽视语言[N]. 科技日报,2018-02-23(007).

别把你的大脑当搜索框[N]. 科技日报,2018-01-19(007).

人工智能+法律:加出来效率,减不掉人性[N]. 科技日报,2018-01-05(007).

流行语折射科技新活力[N]. 科技日报,2017-12-22(005).

好好说话,既是小目标,也是正能量[N]. 科技日报,2017-07-28(008).

人才位移助力“学术走出去”[N]. 中国社会科学报,2017-03-03(006).

钢铁为舟,语言亦为舟[N]. 光明日报,2017-02-12(012).


饶高琦. 语言文字规范化、标准化、信息化[M]// 国家语言文字工作委员会. 中国语言文字事业发展报告,北京: 商务印书馆, 2018-06-01

饶高琦. 语言文字信息化建设[M]//国家语言文字工作委员会. 中国语言文字事业发展报告,北京: 商务印书馆, 2017-06-01

饶高琦. 语言文字类微信公众号[M]//教育部语言文字信息管理司. 中国语言生活状况报告,北京: 商务印书馆, 2017-05-01


获奖信息

饶高琦(2/6),BCC大规模在线语料库系统,国家教育部,改革开放40年高校科技创新成就奖,2018(荀恩东,饶高琦,于东,王诚文,王贵荣,陆梦烨)


其他信息

2018年入选北语青年英才培育计划