远程服务未登录
DIGITAL HUMAN LIBRARY
正在读取模板
数字人管理
管理用于 LatentSync 1.5 合成的竖版口播模板。
已有数字人
D:\AutoVideo\digital-human正在读取数字人模板
添加数字人
不符合要求的视频会直接拒绝
H.264
竖版 720×1280 至 2160×3840
3 至 60 秒
MP4 / MOV
上传后会自动检查编码、方向、分辨率和时长。通过后将保存到数字人目录,并自动选为视频生成模板。
VOICE LIBRARY
正在读取音色
音色管理
管理用于 IndexTTS2 音频生成的参考音色。
已有音色
D:\AutoVideo\voices正在读取音色
添加音色
上传后自动校验并标准化
WAV / MP3 / M4A / FLAC
3 至 60 秒
最大 100 MB
输出 24 kHz 单声道 WAV
音频通过校验后会保存到音色目录,并自动设为音频生成所用音色。
原始口播文案
Original Script改写文案
Rewritten Script标题和话题生成的标题
根据上一页改写文案,生成可直接发布的标题和话题。
音频区域
IndexTTS2
音频生成:IndexTTS2
待生成音频
视频区域
LatentSync 1.5
数字人合成:LatentSync 1.5
待合成视频
04 · FunASR + Remotion
字幕与动效
沿用数字人母版和确认文案,校准语音时间戳后生成商业化信息动效。
上游素材
自动继承第 3 步输出
字幕以确认文案为准,FunASR 仅负责定位每句话出现的时间。
预览检查
先检查 5 张关键帧,再播放最终视频关键帧将在这里显示
等待生成字幕动效视频
输出将保存在当前音频项目文件夹
05 · Browser Publisher
发布平台
自动上传并填写发布信息,停在最终发布按钮前等待确认。
发布内容
自动继承第 4 步最终视频和标题话题
需要扫码、验证码或安全验证时会暂停。系统不会绕过验证,也不会未经确认直接发布。
发布队列
每个平台独立准备、确认和重试
等待准备发布
浏览器会以可见窗口打开各平台创作中心