Youka 提供不同的方法来匹配卡拉 OK 曲目中的歌词和音乐,这些方法被称为同步模型。 主要有两种类型:转录和对齐。
- 转录模型会聆听歌曲,并尝试使用类似语音识别的技术,像人一样写下歌词。 然而,它们写下的歌词可能并不完全准确。
- 对齐模型需要您提供歌词。 然后,它们会尝试将这些歌词与歌曲进行匹配。 如果您提供的歌词与歌曲不完全匹配(比如缺少副歌部分),那么部分时间可能会有些偏差。
以下是尤卡使用的型号:
- AudioShakeAI(转录):这是首选,其工作原理是先写下歌词,然后将歌词与音乐进行匹配。 只有按次付费用户或试用版用户才能使用,而且可能需要长达 10 分钟的工作时间。
- AudioShakeAI(对齐):接下来,它会将您提供的歌词与音乐进行匹配。 如果歌词有误,时间可能会不完美。 这也需要长达 5 分钟的时间。
- Wav2Vec2(对齐):这是第三个选项,工作原理与 AudioShakeAI 相似,但支持几乎所有语言。 它的速度更快,通常可在 30 秒内完成。
- 耳语(转录):这是第四个选项,也是先听音乐写下歌词,然后再同步。 歌词可能不准确,但时间应该没问题,最多需要 2 分钟完成。