A collection of 2 posts
Ultravox 是一种新型多模态 LLM,可以理解文本和人类语音,而无需单独的音频语音识别 (ASR) 阶段。
本文分享一个由 AI 驱动的音频转录和分析工具,它是我使用几个 Python 文件,利用来自领先 AI 供应商的 API构建的。