极简 - 排版样式 · 不繁简历

不繁简历

极简

研究概述

人工智能领域高级研究员，专注于自然语言处理与大规模语言模型研究。在 ACL、EMNLP、NeurIPS 等顶会发表论文 15 篇，Google Scholar 引用 2000+。拥有多项发明专利，具备从基础研究到产品落地的全链路经验。

工作经历

中国科学院计算技术研究所中国科学院计算技术研究所

2022-07 - 至今

高级研究员|智能信息处理实验室

主持国家自然科学基金面上项目「大规模预训练语言模型的高效微调方法研究」
带领 8 人研究团队完成大模型知识蒸馏与压缩技术攻关，模型推理速度提升 4 倍
与华为、百度等企业开展产学研合作，推动研究成果产业化落地

NLPLLM

微软亚洲研究院微软亚洲研究院

2019-08 - 2022-06

研究员|自然语言计算组

参与预训练语言模型 UniLM 系列的研发工作，成果发表于 NeurIPS 2020
提出基于对比学习的文本表示方法，在多项 NLU 基准上取得 SOTA 效果
负责机器翻译质量评估子方向，开发自动评估工具被内部广泛使用

预训练模型对比学习

科研项目

大规模语言模型高效微调研究中科院计算所

2023-01 - 至今

项目负责人

提出参数高效微调新范式 AdaptFormer，仅需 2% 额外参数即可匹配全量微调效果
开发开源微调工具包，GitHub Star 3000+，被 50+ 机构采用
相关成果发表于 ACL 2024 和 EMNLP 2023，累计引用 300+

PEFT微调

多语言低资源翻译系统微软亚洲研究院

2020-03 - 2022-03

核心研究员

设计跨语言迁移学习框架，在低资源语言翻译任务上 BLEU 值提升 8 个百分点
构建包含 100+ 语言对的多语言平行语料库，支撑多项下游任务研究
成果集成至 Microsoft Translator，服务全球用户

机器翻译多语言

知识增强对话系统微软亚洲研究院

2019-08 - 2020-06

参与研究员

提出知识图谱与对话生成融合的新模型架构 KG-Dialog
在 Wizard-of-Wikipedia 基准上取得当时最佳效果
论文发表于 ACL 2020，引用 200+

知识图谱对话系统

学术成果与荣誉

ACL 2024 Outstanding Paper Awardpaper

2024

中科院院长优秀奖honor

2023

国家自然科学基金面上项目 (主持)other

2023

NeurIPS 2020 Spotlight Paperpaper

2020

发明专利：「基于知识蒸馏的模型压缩方法」(ZL202310xxxxx.x)patent

2023

发明专利：「多语言翻译中的跨语言迁移方法」(ZL202110xxxxx.x)patent

2021

教育经历

中国科学技术大学计算机科学与技术学院计算机科学与技术博士

2015-09 - 2019-07

研究方向：自然语言处理。博士论文获校优秀博士论文。

优博论文

中国科学技术大学少年班学院计算机科学与技术本科GPA: 3.9/4.3

2011-09 - 2015-06

郭沫若奖学金

技术技能

Python

9/10

精通 Python，深度使用 PyTorch/Transformers

深度学习

9/10

Transformer、BERT、GPT 系列模型训练与调优

NLP

9/10

文本分类、序列标注、机器翻译、文本生成

分布式训练

8/10

DeepSpeed、FSDP、Megatron-LM

C++

6/10

了解 CUDA 编程和模型推理优化