GitHub:https://github.com/wxbool/video-srt
一个可以识别视频语音自动生成字幕SRT文件的开源工具。
有命令行版,也有Windows版本:
https://github.com/wxbool/video-srt-windows
使用了阿里云的OSS对象存储、录音文件识别的相关业务接口。
使用:
你需要有一个阿里云账号
开通 阿里云OSS对象存储 阿里云智能语音交互 业务
在 OSS对象存储 控制台创建一个存储空间(Bucket)(读写权限设置为公共读)
在 智能语音交互 控制台创建一个项目(根据使用场景选择识别语言以及偏好等)
设置 config.ini 文件的配置项
命令行执行