阿里巴巴通义千问语音大模型招实习-职责包含发表高水平论文-JieYingAI捷鹰AI

知乎原帖：

我们是通义千问语音大模型组，隶属于阿里巴巴通义实验室。我们组的目标是致力于让音频成为LLM交互的核心，实现任何音频输入和任何音频输出的智能LLM，目前我们组的代表工作如Qwen-Audio, Qwen2-Audio。

我们目前需要招聘端到端音频生成的同学，包括语音生成，高表现力语音生成，歌声生成等，招聘岗位包括实习生，正式校招以及社招。

岗位: 端到端音频生成

职责: 探索研究端到端低延时高变现力的语音和音频生成，跟进学术最前沿的语音合成的技术，发表高水平学术文章，参与Qwen-Audio核心项目。

我们可以提供非常丰富的计算资源，然后来的同学我这边会亲自带，希望同学有踏实的基础和较好的Coding能力，具有一定的语音生成的背景。

关于我个人，我于去年博士毕业于清华大学交叉信息研究院，在ICML, NeurlPS, ICLR, KDD等会议上发表文章10余篇，目前Citation 1000+ 。请详见我主页: Tsinghua - Jin Xu - Jin Xu (jxu-thu.github.io)

有兴趣的同学，麻烦直接联系我的邮箱: jxu3425@gmail.com，此文章长期有效。

【轻松参会】为所有CCF收录会议与期刊设立投稿交流群，后台回复会议名/期刊名即可进群。公众号文章会发布近期截稿会议、转投会议推荐、录用率趋势、录用分数分析等重要信息，同时会发布最新的CS/AI招聘招生信息。

版权声明 1 本网站名称：捷鹰AI导航
2 本站永久网址：www.jieyingai.com
3 本站原创内容转载请注明出处，付费内容未经本站授权禁止转载二次发布
4 本站所有内容禁止用于任何非法用途！部分文章、素材、资源软件来自网络，仅供大家学习与参考。如有侵权，请联系站长QQ:1392478547进行删除处理
5 本站投稿禁止发布任何违法内容，如发现将立即封号处理，欢迎举报监督
6 本站附件资源、教程等内容如因时效原因失效或不可用，请联系留言或联系站长及时更新

THE END