Appearance
語音/文本轉(zhuǎn)換 ?
組件概述 ?
語音/文本轉(zhuǎn)換組件提供語音與文本之間的雙向轉(zhuǎn)換功能,支持將文本轉(zhuǎn)換為語音文件或?qū)⒁纛l文件轉(zhuǎn)換為可編輯的文本內(nèi)容。
配置說明 ?
語音/文本轉(zhuǎn)換服務(wù)URL ?
- 作用:指定語音/文本轉(zhuǎn)換服務(wù)的API接口地址
- 示例:
https://your-audio-text-api-endpoint.com
操作類型 ?
選擇語音與文本的轉(zhuǎn)換方向:
文本轉(zhuǎn)語音 ?
將文本內(nèi)容轉(zhuǎn)換為語音文件
- 文本內(nèi)容:輸入要轉(zhuǎn)換為語音的文本,支持使用變量
{{variables.varName}} - 語音類型(可選):指定語音合成的聲音類型
- 示例:
zh-CN-XiaoxiaoNeural,en-US-JennyNeural
- 示例:
- 語速(可選):設(shè)置語音播放速度,默認(rèn)值為
1.0
語音轉(zhuǎn)文本 ?
將音頻文件轉(zhuǎn)換為文本內(nèi)容
- 音頻文件選擇:手動(dòng)上傳音頻文件
- 音頻文件路徑(可選):通過路徑指定音頻文件
- 示例:
/path/to/audio.mp3或@audioPath
- 示例:
- 音頻base64變量名(可選):通過變量傳遞base64編碼的音頻數(shù)據(jù)
- 示例:
audioData或@audioDataVariable
- 示例:
- 語言(可選):指定音頻的語言類型
- 示例:
zh-CN,en-US
- 示例:
數(shù)據(jù)輸出 ?
分配給變量 ?
將轉(zhuǎn)換結(jié)果保存到變量中
- 變量名稱:指定存儲(chǔ)轉(zhuǎn)換結(jié)果的變量名稱
插入表格 ?
將轉(zhuǎn)換結(jié)果插入到表中
- 選擇列:指定插入轉(zhuǎn)換結(jié)果的表格列
使用說明 ?
- 文本轉(zhuǎn)語音:將文本內(nèi)容轉(zhuǎn)換為語音文件,支持多種語音類型和語速調(diào)節(jié)
- 語音轉(zhuǎn)文本:將音頻文件轉(zhuǎn)換為文本內(nèi)容,支持多種音頻格式和語言識(shí)別
- 優(yōu)先級(jí):手動(dòng)上傳 > 文件路徑 > base64變量
- 支持的音頻格式:MP3、WAV、M4A、FLAC、AAC
應(yīng)用場景 ?
- 語音提示和播報(bào)系統(tǒng)
- 會(huì)議錄音轉(zhuǎn)文字記錄
- 語音指令識(shí)別處理
- 多媒體內(nèi)容自動(dòng)化處理
注意事項(xiàng) ?
- 確保語音轉(zhuǎn)換服務(wù)正常運(yùn)行
- 音頻質(zhì)量直接影響語音識(shí)別準(zhǔn)確率
- 長文本轉(zhuǎn)語音時(shí)注意服務(wù)的時(shí)間限制
- 建議對(duì)重要語音識(shí)別結(jié)果進(jìn)行人工校對(duì)
MakAgent在線文檔