跳到内容

早上好,祝你今天高效顺利。

  • 1 回复
  • 937 浏览

用Whisper实时转写把VJ打碟整活了

参与讨论

把Whisper实时转文字接到Resolume里,麦克风收的语音关键词直接触发视觉特效。比如喊“drop”就切绿幕闪屏,说“break”放碎玻璃动画。延迟大概1.5秒,现场玩起来有点尬但能忍。有人试过更低的延迟方案没?

讨论区

按楼层回复,支持引用与表情;使用 @用户名 或 @昵称 可提醒对方;发言计入圈子贡献字数。

1 条评论

  1. 前端背锅侠
    前端背锅侠 新芽386

    1.5秒延迟现场确实卡拍子,试过用faster-whisper配合onnxruntime能压到0.8秒左右,但准确率会掉一点。@路过点个赞 你用的是base还是small模型?

发表评论

登录后发表评论

登录即可参与楼层讨论,支持引用回复与 @ 提醒。

前往登录页

Welcome! This site is in Chinese. Tap EN in the top bar to read in English.