人员队伍

undefined

俞凯

职位:研究员

电子邮箱:kai.yu@cs.sjtu.edu.cn

电话:34207864

研究方向:

    人工智能/机器学习

简介:

    苏州思必驰信息科技有限公司首席科学家;上海交通大学计算机科学与工程系研究员;上海交通大学苏州人工智能研究院执行院长。
 
研究方向:

  • 概率图模型、深度学习、迁移学习、强化学习
  • 统计语音信号处理、语音识别、说话人识别、音频事件分析、语音合成
  • 自然语言处理、语言模型、语义理解、问答
  • 对话管理、交互控制、人机混合智能
 
教育背景:
2002年-2006年获剑桥大学工程系博士学位
1999年-2002年获清华大学自动化系硕士学位
1994年-1999年获清华大学自动化系学士学位
 
工作经历:
2012年-至今于上海交通大学担任计算机系特别研究员
2007年-至今于思必驰公司担任首席科学家
2006年-2012年于剑桥大学担任高级研究助理

社会任职:
Senior Member of IEEE
Member of IEEE Speech and Language Processing Technical Committee
中国人工智能产业发展联盟学术和知识产权组组长
中国语音产业联盟技术工作组副组长
中国计算机学会语音对话及听觉专业组副主任
中国声学学会语音语言、听觉及音乐分会执委会委员
 
学术出版:
1、Xu, X. , Dinkel, H. , Wu, M. , & Yu, K. . (2021). Audio Caption in a Car Setting with a Sentence-Level Loss. 2021 12th International Symposium on Chinese Spoken Language Processing (ISCSLP).
 
2、Wang, S. , Y Yang, Y Qian, & Yu, K. . (2021). Revisiting the Statistics Pooling Layer in Deep Speaker Embedding Learning. 2021 12th International Symposium on Chinese Spoken Language Processing (ISCSLP).
 
3、Du, C. , Han, B. , Wang, S. , Qian, Y. , & Yu, K. . (2021). SynAug: Synthesis-Based Data Augmentation for Text-Dependent Speaker Verification. ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE.
 
4、Xu, X. , Dinkel, H. , Wu, M. , Xie, Z. , & Yu, K. . (2021). Investigating Local and Global Information for Automated Audio Captioning with Transfer Learning.
 
5、Xu , X. , Dinkel, H. , Wu, M. , & Yu, K. . (2021). Text-to-audio grounding: building correspondence between captions and sound events.
 
6、Dinkel, H. , Wang, S. , Xu, X. , Wu, M. , & Yu, K. . (2021). Voice activity detection in the wild: a data-driven approach using teacher-student training. IEEE/ACM Transactions on Audio, Speech, and Language Processing, PP(99), 1-1.
 
7、H Dinkel, Wu, M. , & Yu, K. . (2021). Towards duration robust weakly supervised sound event detection. IEEE/ACM Transactions on Audio, Speech, and Language Processing.
 
8、Dinkel, H. , & Yu, K. . (2020). Duration Robust Weakly Supervised Sound Event Detection. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE.
 
9、Du, C. , & Yu, K. . (2020). Speaker Augmentation for Low Resource Speech Recognition. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE.
 
10、Yang, Y. , Wang, S. , Gong, X. , Qian, Y. , & K Yu. (2020). Text Adaptation for Speaker Verification with Speaker-Text Factorized Embeddings. ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE.

科研项目:

国家重点研发计划项目,大数据驱动的自然语言理解、问答和翻译
国家自然科学基金优秀青年科学基金,人机口语对话系统
国家自然科学基金面上项目,基于深度学习的鲁棒口语理解研究
上海市科学技术委员会国际科技合作基金项目,可扩展并具有自适应能力的自然口语对话机器人
欧盟第七框架ICT项目,Probabilistic Adaptive Real-Time Learning And Natural Conversational Engine (PARLANCE)
上海交通大学-思必驰智能人机交互联合实验室

获奖情况:
人才计划:
青年****,中组部
优秀青年科学基金,国家自然科学基金委
****,上海市教委
机构奖励:
2018 中国计算机学会 “青竹奖”
2017 中国计算机学会 “杰出演讲者”
2016 《科学中国人》年度人物
2015 上海市 “IT新锐奖”
2014 “吴文俊人工智能科技进步奖”
优秀论文奖:
ISCSLP Best Paper Award 2016
International Speech Communication Association (ISCA) Computer Speech and Language 2008-2012 Best Paper Award
InterSpeech Best Paper Award 2010
IEEE Spoken Language Technology Best Paper Award 2010