知乎原帖:
我们是通义千问语音大模型组,隶属于阿里巴巴通义实验室。我们组的目标是致力于让音频成为LLM交互的核心,实现任何音频输入和任何音频输出的智能LLM,目前我们组的代表工作如Qwen-Audio, Qwen2-Audio。
我们目前需要招聘端到端音频生成的同学,包括语音生成,高表现力语音生成,歌声生成等,招聘岗位包括实习生,正式校招以及社招。
岗位: 端到端音频生成
职责: 探索研究端到端低延时高变现力的语音和音频生成,跟进学术最前沿的语音合成的技术,发表高水平学术文章,参与Qwen-Audio核心项目。
我们可以提供非常丰富的计算资源,然后来的同学我这边会亲自带,希望同学有踏实的基础和较好的Coding能力,具有一定的语音生成的背景。
关于我个人,我于去年博士毕业于清华大学交叉信息研究院,在ICML, NeurlPS, ICLR, KDD等会议上发表文章10余篇,目前Citation 1000+ 。请详见我主页: Tsinghua - Jin Xu - Jin Xu (jxu-thu.github.io)
有兴趣的同学,麻烦直接联系我的邮箱: jxu3425@gmail.com,此文章长期有效。
【轻松参会】为所有CCF收录会议与期刊设立投稿交流群,后台回复会议名/期刊名即可进群。公众号文章会发布近期截稿会议、转投会议推荐、录用率趋势、录用分数分析等重要信息,同时会发布最新的CS/AI招聘招生信息。
© 版权声明
THE END