主持国家自然科学基金面上项目「大规模预训练语言模型的高效微调方法研究」
带领 8 人研究团队完成大模型知识蒸馏与压缩技术攻关,模型推理速度提升 4 倍
与华为、百度等企业开展产学研合作,推动研究成果产业化落地
参与预训练语言模型 UniLM 系列的研发工作,成果发表于 NeurIPS 2020
提出基于对比学习的文本表示方法,在多项 NLU 基准上取得 SOTA 效果
负责机器翻译质量评估子方向,开发自动评估工具被内部广泛使用
提出参数高效微调新范式 AdaptFormer,仅需 2% 额外参数即可匹配全量微调效果
开发开源微调工具包,GitHub Star 3000+,被 50+ 机构采用
相关成果发表于 ACL 2024 和 EMNLP 2023,累计引用 300+
设计跨语言迁移学习框架,在低资源语言翻译任务上 BLEU 值提升 8 个百分点
构建包含 100+ 语言对的多语言平行语料库,支撑多项下游任务研究
成果集成至 Microsoft Translator,服务全球用户
提出知识图谱与对话生成融合的新模型架构 KG-Dialog
在 Wizard-of-Wikipedia 基准上取得当时最佳效果
论文发表于 ACL 2020,引用 200+