切换风格

默认晚霞 雪山 粉色心情 伦敦 花卉 绿野仙踪 加州 白云 星空 薰衣草 城市 简约黑色 简约米色 龙珠
回复 0

3968

主题

3970

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
13180
Constme-Whisper(离线语音识别) v1.12[复制链接]
发表于 2024-5-9 11:22:34 | 显示全部楼层 |阅读模式
Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。
Constme-Whisper可以在Windows上使用,支持高性能GPGPU处理,可以利用GPU加速处理。
本体是个启动器,需要结合一个语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相对的速度也更慢。
软件特点
基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯C++实现,除了基本的操作系统组件外,没有运行时依赖关系
比OpenAI的实现快得多。
混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT
内置性能探查器,用于测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis除外), 以及大多数在Windows上运行的音频捕获设备(除了一些专业设备,它们只实现ASIO API)。
用于音频捕获的语音活动检测。
易于使用的 COM 样式 API,nuget 上提供的惯用 C# 包装器
提供预构建的二进制文件
软件截图
Constme-Whisper(离线语音识别) v1.12
更新日志
更新了文档和 GUI 中的模型源 URL
可靠性增强,麦克风捕获不太可能转换到“停滞”状态并丢弃音频
下载地址
需要不低于Win8.1的64位Windows
文件main.exe为命令行调用工具

11223323564[下载].rar
11223443105[下载].rar
11223438953[下载].rar

112233idk08yv3izvbyik3.jpg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|不懂 ( 粤ICP备14042591号-1 )|网站地图

GMT+8, 2024-11-28 02:55 , Processed in 0.099596 second(s), 29 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

返回顶部