连接到网络并启用音频
系统在线。终端已准备好接收您的输入。您也可以附加视觉数据(图像)。
使用扩散网络从文本输入编码视觉表示。
等待数据...
使用AI生成人声和器乐音乐。输入流派和歌词。
处理外部信息块(PDF、Word、TXT)。