埃里克·伯纳德森(Erik Bernhardsson)@Bernhardsson这个@modal_labs演示应用程序使用OpenAi的Whisper语音到文本模型在〜1分钟/情节中并行转录播客。查看:modal.com/docs/guide/whi…21:38 PM- 2022年11月28日
在9月下旬,OpenAI公开发布了令人震惊的良好演讲对文本AI模型。此后不久,我开始使用它来制作播客的转录工具。我是一个大型播客听众(大概每周10个小时),我很想听听您在工具上的任何反馈。
modal-labs-whisper-pod-transcriber-fastapi-app.modal.run
这是一些显示其工作原理的视频。
Video showing the transcription of Serial season 2 episode 1 in just 62 seconds
Video showing how to go from a transcript segment back to the original audio
如果您对技术细节感兴趣,则可以read more in a blog post。
这仅使用.py
代码构建。没有yaml,c ++,dockerfile,没有这样的东西,只有python。