不繁简历
陈明远
高级研究员
13955667788 / chenmingyuan@example.com / 北京
https://github.com/chenmingyuan / https://chenmingyuan.ai
/ 1990-08 / 在职
汉族 / 中共党员 / 安徽

研究概述

人工智能领域高级研究员,专注于自然语言处理与大规模语言模型研究。在 ACL、EMNLP、NeurIPS 等顶会发表论文 15 篇,Google Scholar 引用 2000+。拥有多项发明专利,具备从基础研究到产品落地的全链路经验。

工作经历

中国科学院计算技术研究所中国科学院计算技术研究所
2022-07 - 至今
高级研究员|智能信息处理实验室
  1. 主持国家自然科学基金面上项目「大规模预训练语言模型的高效微调方法研究」

  2. 带领 8 人研究团队完成大模型知识蒸馏与压缩技术攻关,模型推理速度提升 4 倍

  3. 与华为、百度等企业开展产学研合作,推动研究成果产业化落地

NLPLLM
微软亚洲研究院微软亚洲研究院
2019-08 - 2022-06
研究员|自然语言计算组
  1. 参与预训练语言模型 UniLM 系列的研发工作,成果发表于 NeurIPS 2020

  2. 提出基于对比学习的文本表示方法,在多项 NLU 基准上取得 SOTA 效果

  3. 负责机器翻译质量评估子方向,开发自动评估工具被内部广泛使用

预训练模型对比学习

科研项目

大规模语言模型高效微调研究中科院计算所
2023-01 - 至今
项目负责人
  1. 提出参数高效微调新范式 AdaptFormer,仅需 2% 额外参数即可匹配全量微调效果

  2. 开发开源微调工具包,GitHub Star 3000+,被 50+ 机构采用

  3. 相关成果发表于 ACL 2024 和 EMNLP 2023,累计引用 300+

PEFT微调
多语言低资源翻译系统微软亚洲研究院
2020-03 - 2022-03
核心研究员
  1. 设计跨语言迁移学习框架,在低资源语言翻译任务上 BLEU 值提升 8 个百分点

  2. 构建包含 100+ 语言对的多语言平行语料库,支撑多项下游任务研究

  3. 成果集成至 Microsoft Translator,服务全球用户

机器翻译多语言
知识增强对话系统微软亚洲研究院
2019-08 - 2020-06
参与研究员
  1. 提出知识图谱与对话生成融合的新模型架构 KG-Dialog

  2. 在 Wizard-of-Wikipedia 基准上取得当时最佳效果

  3. 论文发表于 ACL 2020,引用 200+

知识图谱对话系统

学术成果与荣誉

ACL 2024 Outstanding Paper Awardpaper
2024
中科院院长优秀奖honor
2023
国家自然科学基金面上项目 (主持)other
2023
NeurIPS 2020 Spotlight Paperpaper
2020
发明专利:「基于知识蒸馏的模型压缩方法」(ZL202310xxxxx.x)patent
2023
发明专利:「多语言翻译中的跨语言迁移方法」(ZL202110xxxxx.x)patent
2021

教育经历

中国科学技术大学计算机科学与技术学院计算机科学与技术博士
2015-09 - 2019-07

研究方向:自然语言处理。博士论文获校优秀博士论文。

优博论文
中国科学技术大学少年班学院计算机科学与技术本科GPA: 3.9/4.3
2011-09 - 2015-06
郭沫若奖学金

技术技能

Python
9/10
精通 Python,深度使用 PyTorch/Transformers
深度学习
9/10
Transformer、BERT、GPT 系列模型训练与调优
NLP
9/10
文本分类、序列标注、机器翻译、文本生成
分布式训练
8/10
DeepSpeed、FSDP、Megatron-LM
C++
6/10
了解 CUDA 编程和模型推理优化