CapsWriter Offline是一款支持无限时长的PC端语音输入和字幕转录工具,具备离线识别、低延迟、高准确率等特点。它通过按下大写锁定键开始录音,并在松开后将识别结果输入到电脑中,同时支持将音频或视频文件转换成SRT字幕文件。
视频解析
注意事项:
目前使用的模型是 Paraformer 非流式模型,即录完再转,因此录音时间越长,上屏延迟越大。主流性能的 Windows 笔记本,RTF 大约 0.06,即大约每10s 录音需 0.6s 转录时长。
当用户安装了 FFmpeg 时,会以 mp3 格式保存录音;当用户没有装 FFmpeg 时,会以 wav 格式保存录音
默认的快捷键是 caps lock,你可以打开 core_client.py 进行修改
MacOS 无法监测到 caps lock 按键,可改为 right shift 按键
修改配置
你可以打开 core_server.py ,在开头部分有注释,指导你修改服务端的端口,默认是 6006
你可以打开 core_client.py ,在开头部分有注释,指导你修改客户端的:
连接的地址和端口,默认是 127.0.0.1 和 6006
键盘快捷键
是否要保存录音文件
要移除识别结果末尾的哪些标点,(如果你想把问号也删除掉,可以在这边加上)

Ai说话实时转文字,Ai同步语音转录工具
这款工具是一个实时语音转文字的应用程序,可以在本地运行,支持Windows 10和Windows 7操作系统。
使用这个工具可以直接说话,无需打字,对那些经常需要打字进行聊天的朋友来说非常方便。
使用准备和系统要求
在使用这个工具之前,需要准备一台装有Windows操作系统的电脑和一个可正常工作的麦克风,以便进行语音输入。
该工具的模型文件大小为1.1GB,主程序分为两个版本:
需要注意的是,Windows 7系统只能作为客户端使用该工具,因此如果想要使用这个工具,必须使用Windows 10系统。
如果您的电脑是Windows 7系统,则需要另外一台安装有Windows 10系统的电脑作为服务端。
CapsWriter-Offline-Windows-64bit.zip:适用于Windows 10系统。
CapsWriter-Offline-Windows-32bit-Client.zip:适用于Windows 7系统。