Whisper: OpenAI Whisper自动语音识别(ASR)模型的高性能推理OpenAI Whisper-JieYingAI捷鹰AI

Whisper: OpenAI Whisper自动语音识别(ASR)模型的高性能推理OpenAI Whisper

Whisper: OpenAI Whisper自动语音识别(ASR)模型的高性能推理OpenAI Whisper

11240

1年前更新

Whisper: OpenAI Whisper自动语音识别(ASR)模型的高性能推理特点：

最高5倍提速，whisper 加入苹果引擎ANE支持！OpenAI 开源 ASR 模型加入了ANE支持，M1芯片可提速3倍，M2芯片可提速5倍。ggerganov 大神的 whisper.cpp 项目越来越强悍了，目前只支持 encoder，但是性能已经很强了。有了这样一个轻量级的模型实现，就可以轻松地将它集成到不同的平台和应用程序中。

特点

无依赖的纯C/ c++实现
苹果硅一流公民-优化通过ARM NEON，加速框架和核心ML
AVX intrinsic支持x86架构
VSX intrinsic支持POWER体系结构
混合F16 / F32精度
内存使用率低(Flash注意)
运行时内存分配为零
运行在CPU上
c风格的API

支持平台
Mac OS (Intel and Arm)
iOS
Android
Linux / FreeBSD
WebAssembly
Windows (MSVC and MinGW]
Raspberry Pi

Whisper1

Whisper2

模型的整个实现包含在2个源文件中:

张量运算：ggml.c/ggml.h
Transformer 推理：whisper.h/whsiper.cpp

实现细节

核心张量操作是用C语言实现的(ggml.h / ggml.c)
Transformer 模型和高级C风格API是用c++实现的(whisper.h / whisper.cpp)
在main.cpp中演示了样例的使用
在stream.cpp中演示了来自麦克风的实时音频转录样本
example文件夹中还有其他各种示例

地址

GitHub: https://github.com/ggerganov/whisper.cpp

© 版权声明

版权声明 1 本网站名称：捷鹰AI导航
2 本站永久网址：www.jieyingai.com
3 本站原创内容转载请注明出处，付费内容未经本站授权禁止转载二次发布
4 本站所有内容禁止用于任何非法用途！部分文章、素材、资源软件来自网络，仅供大家学习与参考。如有侵权，请联系站长QQ:1392478547进行删除处理
5 本站投稿禁止发布任何违法内容，如发现将立即封号处理，欢迎举报监督
6 本站附件资源、教程等内容如因时效原因失效或不可用，请联系留言或联系站长及时更新

THE END

LLM大语言模型默认分类

喜欢就支持一下吧

相关推荐

评论共1条

来说点什么吧！

提交

暂无评论内容