Constme-Whisper(离线语音识别) v1.12

久别 · 发表于 2024-5-9 11:22:34

Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。
Constme-Whisper可以在Windows上使用，支持高性能GPGPU处理，可以利用GPU加速处理。
本体是个启动器，需要结合一个语言识别模型文件（ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large）使用，模型越大，效果越好，但相对的速度也更慢。
软件特点
基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯C++实现，除了基本的操作系统组件外，没有运行时依赖关系
比OpenAI的实现快得多。
混合 F16 / F32 精度：Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT
内置性能探查器，用于测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础，支持大多数音频和视频格式（Ogg Vorbis除外），以及大多数在Windows上运行的音频捕获设备（除了一些专业设备，它们只实现ASIO API）。
用于音频捕获的语音活动检测。
易于使用的 COM 样式 API，nuget 上提供的惯用 C# 包装器
提供预构建的二进制文件
软件截图
Constme-Whisper(离线语音识别) v1.12
更新日志
更新了文档和 GUI 中的模型源 URL
可靠性增强，麦克风捕获不太可能转换到“停滞”状态并丢弃音频
下载地址
需要不低于Win8.1的64位Windows
文件main.exe为命令行调用工具

11223323564[下载].rar

11223443105[下载].rar

11223438953[下载].rar