开发者社区> 问答> 正文

想问下阿里语音AI中format和save_wav这俩参数是什么意思?

问题一: 你好我是android开发,我们集成在nuisdk的时候,对tts参数初始化,
object["format"] = "opus"
object["save_wav"] = "true",
想问下阿里语音AI中format和save_wav这俩参数是什么意思?
问题二: 那android这边format设置成什么比较好,我们AudioTrack播放器设置的是ENCODING_PCM_16BIT
27da598776f0c9507f8256b28b5ff710.png
语音合成的话,设置音频格式是用encode_type参数吧,我看默认就是pcm,播放器如果是ENCODING_PCM_16BIT的话用这个值就行吗

展开
收起
乐天香橙派 2023-09-12 12:54:19 53 0
2 条回答
写回答
取消 提交回答
  • 2000元阿里云代金券免费领取,2核4G云服务器仅664元/3年,新老用户都有优惠,立即抢购>>>

    问题一:format和save_wav这两个参数是阿里语音AI中的TTS(文本到语音)服务的配置参数。

    • format参数指定了生成的语音文件格式。"opus"表示生成的语音文件以Opus格式保存。Opus是一种高效的音频编码格式,能够在较低的比特率下提供较好的音质。您可以根据自己的需求选择合适的音频格式。

    • save_wav参数用于控制是否将生成的语音文件保存为WAV格式。如果设置为"true",则会将生成的语音文件保存为WAV格式;如果设置为"false",则不保存为WAV格式。WAV是一种无损音频格式,保留了原始音频数据的完整性。

    问题二:对于Android端的语音合成,确实可以使用encode_type参数来设置音频格式。默认值为"pcm",表示生成的音频数据采用PCM格式。如果您的AudioTrack播放器使用的是ENCODING_PCM_16BIT编码格式,那么与"pcm"相对应的就是PCM 16位。

    简而言之,如果您的播放器使用的是ENCODING_PCM_16BIT编码格式,且希望与语音合成生成的音频格式保持一致,可以将encode_type参数设置为"pcm"。

    2023-09-12 14:03:50
    赞同 展开评论 打赏
  • 2000元阿里云代金券免费领取,2核4G云服务器仅664元/3年,新老用户都有优惠,立即抢购>>>

    针对问题一的回答:format是合成音频的格式,save_wav是是否保存音频
    针对问题二的回答: 可以的,PCM—此回答来自钉群“阿里语音AI【6群】”

    2023-09-12 12:58:27
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据AI一体化的解读 立即下载
当搜索遇见AI 立即下载
释放算力潜能,加速 AI 应用构建 立即下载
http://www.vxiaotou.com