个人简介
副研究员,硕士研究生导师。主要从事计算语言学、数字人文和语言规划方面的学术研究与工作 。近五年来在国内核心期刊与国际会议上发表论文二十余篇。是北京语言大学重大工程国际中文智慧教育核心研发人员。参与BCC大规模在线语料库系统建设,被教育部科技司评为“改革开放40周年高校科技创新成就”,第二完成人。发起并组织中介语作文句法错误检测技术评测,产生广泛影响。长年参编国家语委年度《语言文字生活状况报告绿皮书》和《语言文字事业发展报告白皮书》。起草行业标准两部。在《光明日报》《科技日报》等报刊发表科普文章20篇创办并运营语言学科普公众号汉语堂,产生了较大的社会影响。
研究方向:计算语言学、语言规划学、数字人文
联系方式:raogaoqi@blcu.edu.cn
教育经历
2013/09 – 2016/07: 北京语言大学,语言政策与标准研究所,语言学与应用语言学专业,语言规划与计算语言学方向,文学博士
2010/09 – 2013/07: 北京语言大学,信息科学学院,计算机应用技术专业,语言信息处理方向,工学硕士
2006/09 – 2010/07: 山东建筑大学,外国语学院,日耳曼语言文学专业,文学学士
科研项目
语言信息处理技术评测的规划与设计研究(YB135-90) | 国家语委信息化专项 | 主持
中介语句法错误自动检测技术评测研究 | 北语校级项目 | 主持
汉语国际传播资源与推送平台研究、开发与应用(16JJD740004) | 教育部人文社科重点研究基地重大项目 | 子课题负责人
大数据背景下汉语语块数据库建设与应用研究(16AYY007) | 国家社科基金重点项目 | 参与
0到3岁儿童语料库建设 | 国家社科基金重点项目 | 参与
现代汉语历时数据库建设 | 北京语言大学校级科研项目 | 主持
科研成果
学术发表
Gaoqi Rao, Qi Gong, Baolin Zhang, Endong Xun. Overview of NLPTEA-2018 Share Task Chinese Grammatical Error Diagnosis. 2018. Proceedings of the 5th Workshop on Natural Language Processing Techniques for Educational Applications(NLPTEA-2018), pages 42-51, Melbourne, Australia.
Gaoqi Rao, Lung-hao Lee. NLP for Chinese Writing: Evaluation of Chinese, 2018. Proceedings of the 1st Workshop on the Belt and Road Language Resources and Evaluation, pages 48-52, Miyazaki, Japan.
Gaoqi Rao, Baolin Zhang, Endong Xun. IJCNLP-2017 Task 1: Chinese Grammatical Error Diagnosis. 2017. Proceedings of the 8th International Joint Conference on Natural Language Processing, Shared Tasks, pages 1–8, Taipei, China.
饶高琦、李宇明. 基于词汇聚类方法的现代汉语分期与分期体系构建[J],中文信息学报,2017(6):18-24
饶高琦、李宇明. 基于词频逆文档频统计的词汇时间分布层次[C],第十八届汉语词汇语义学国际研讨会,2017, 中国:乐山
Gaoqi RAO, Meng DAI, Endong XUN. Study on the Effectiveness of the Regulations for Chinese Words with Variant Forms Based on a Long-Span Diachronic Corpus, [C] Chinese Lexical Semantics, Springer LNAI: 728-742.
Lung-hao LEE, Gaoqi RAO, Liang-chih YU, Endong XUN, Baolin ZHANG, Li-ping Chang. Overview of NLP-TEA 2016 Shared Task for Chinese Grammatical Error Diagnosis, 2016, Proceedings of COLING-26, pages 40-48, Osaka, Japan.
饶高琦、李宇明. 基于70年报刊语料的现代汉语历时稳态词抽取与考察,中文信息学报,2016(6):49-58
饶高琦. 时代精神:基于战后七十年报刊语料和隐含主题模型的历史热词提取,语言规划学研究,2016(2):40-58
饶高琦. 基于计算方法的语言规范效力检测初探——以异形词整理工作为例,语言战略研究,2016(6):55-63
荀恩东、饶高琦、臧娇娇、肖晓悦. 大数据背景下BCC语料库的研制.语料库语言学,2016,3(01):93-109+118.
Gaoqi RAO, Endong XUN. Words and Characters in Official Newspapers since the Foundation of PRC: Guizhou Daily and People’s Daily as Examples, International Journal of Knowledge and Language Processing (IJKLP), 2015, 6(2):23-33.
虞宁翌、饶高琦、荀恩东. 文言信息的自动抽取:基于统计和规则的尝试(指导毕设),中文信息学报,2015(6):127-134+140
饶高琦、于东、荀恩东. 基于自然标注信息和隐含主题模型的无监督文本特征抽取,中文信息学报,2015(6):141-149
荀恩东、饶高琦、谢佳莉、黄志娥. 现代汉语词汇历时检索系统的建设与应用[J]. 中文信息学报, 2015,(3):169-176
于东、饶高琦、唐共波、荀恩东复杂科技术语构词中的语素化(第二作者),中国科技术语 2015(2) :15-20
荀恩东、饶高琦、臧娇娇. 大数据视角下的语言实证工具:北语汉语语料库系统BCC,第十一届北京市语言学学会年会(北京)
饶高琦、于东、荀恩东. 基于自然标注信息和隐含主题模型的无监督文本特征抽取,全国计算语言学学术会议CCL2014(武汉)
饶高琦. 汉语词性信息对句法分析的贡献,第22届国际中文语言学年会既第26届北美中文语言学年会IACL22-NACCL26,大会宣读
Zhi-e HUANG, Endong XUN, Gaoqi RAO. Chinese Natural Chunk Research based on Natural Annotations in Massive Scale Corpora -- Exploring Work on Natural Chunk Recognition using Explicit Boundary Indicator ,Lecture Notes in Artificial Intelligence,Vol.8202 (第三作者)
荀恩东、黄志娥、饶高琦、谢佳莉. Perl——自然语言处理利器,1-4章,清华出版社(北京),ISBN:9787302341208
饶高琦、荀恩东. 现代汉语词汇历时检索系统:基于长时间跨度语料库的词汇历时信息研究与应用,第十四届汉语词汇语义学研讨会CLSW-2013,评为优秀论文
Gaoqi RAO, Chi Xiu, Endong XUN. Chinese Word Segmentation Oriented Natural Annotation in Large Scale Corpora (大规模语料库中面向中文分词的自然标注信息研究), Acta Scientiarum Naturalium Universitatis Pekinensis, 2013, 49(1):140-146.
Gaoqi RAO, Endong XUN. Word Boundary Information and Chinese Word Segmentation (词边界信息与中文分词). Int. J. of Asian Lang. Proc.,(亚洲语言处理进展) 2012, 22(1): 15-32.
咨政启智
让网络激发语言热情[N]. 光明日报,2019-04-06(08)
语言智能和语言教育不应“相杀”[N]. 光明日报,2018-12-27(022)
用科学的学习方式提升公民语言能力[N]. 光明日报,2018-08-13(010)
语言智能的文艺范,影响不简单[N]. 光明日报,2018-06-25(011).
汉源术语“出海”只是第一步[N]. 光明日报,2018-05-25(002).
表情包毁不了语言[N]. 光明日报,2018-05-03(011).
谷歌“造人”成功不是最惨失业潮的开始[N]. 科技日报,2018-05-18(007).
语言学应成为独立的学科[N]. 科技日报,2018-03-23(007).
完善AI课程体系是关键[N]. 科技日报,2018-03-19(008).
老外汉语好不好,AI能说了算?[N]. 科技日报,2018-03-02(007).
打造影视巨作,别忽视语言[N]. 科技日报,2018-02-23(007).
别把你的大脑当搜索框[N]. 科技日报,2018-01-19(007).
人工智能+法律:加出来效率,减不掉人性[N]. 科技日报,2018-01-05(007).
流行语折射科技新活力[N]. 科技日报,2017-12-22(005).
好好说话,既是小目标,也是正能量[N]. 科技日报,2017-07-28(008).
人才位移助力“学术走出去”[N]. 中国社会科学报,2017-03-03(006).
钢铁为舟,语言亦为舟[N]. 光明日报,2017-02-12(012).
饶高琦. 语言文字规范化、标准化、信息化[M]// 国家语言文字工作委员会. 中国语言文字事业发展报告,北京: 商务印书馆, 2018-06-01
饶高琦. 语言文字信息化建设[M]//国家语言文字工作委员会. 中国语言文字事业发展报告,北京: 商务印书馆, 2017-06-01
饶高琦. 语言文字类微信公众号[M]//教育部语言文字信息管理司. 中国语言生活状况报告,北京: 商务印书馆, 2017-05-01
获奖信息
饶高琦(2/6),BCC大规模在线语料库系统,国家教育部,改革开放40年高校科技创新成就奖,2018(荀恩东,饶高琦,于东,王诚文,王贵荣,陆梦烨)
其他信息
2018年入选北语青年英才培育计划