开源 Video-Materials-AutoGEN-Workstation,一款短视频创作自动化工具,自动策划、生成文案、TTS配音、图像生成、字幕生成

开源 Video-Materials-AutoGEN-Workstation,一款短视频创作自动化工具,自动策划、生成文案、TTS配音、图像生成、字幕生成

开始使用 软件下载

  • 介绍

一个集内容策划、AI文案自动生成、TTS 批量自动配音、(AI)图片素材合成、ASR自动提取语言字幕脚本、AI自由创作于一体的(短视频)生成工作站。方便管理每期的视频项目。

  • 支持按模板批量生成视频项目,脚本、图片素材(AI)、字幕和音频一键齐备。
  • Gemini + TTS合成,既能改写脚本又能直接输出(带情绪的)配音。
  • 图文分轨管理,可在前端随时替换图片、字幕或音频并预览结果。

开源地址:https://github.com/Norsico/Video-Materials-AutoGEN-Workstation

    二、特性介绍

    项目总览:以卡片形式管理批量项目,显示输出目录、创建时间及删除动作,便于快速定位。

    文案生成:结构化展示场景脚本,可复制单条或整段文案,左侧勾选联动右侧提示词。

    字幕获取: 需配合我的另一个项目(n8n-http-tools): 开源地址:n8n-http-tools

    TTS 合成:支持单条与批量两种模式,输入合成文本与情感提示即可生成语音。

    图片生成:集中管理角色描述、场景描述等提示词,勾选后即可批量复制到绘图任务。

    立绘/背景等生成:提供提示词输入、参考图上传、宽高比设置与历史记录,方便随时复用素材。

    逆向接口实现ASR自动提取剪辑需要的字幕文件:在TTS合成界面下方,有“字幕生成”功能,点击下方的按钮可以打开字幕生成工具。此部分代码由其它作者开源。

    常用提示词与自由创作:收藏高频提示词并一键复制,同时提供自由创作面板进行自定义绘制。

    三、快速使用

    1. 复制 env.example.yaml 为 env.yaml,填入自己的 Gemini Key、Base URL、模型、TTS Key 与提示词等配置,否则无法调用接口。
    2. (可选)在 env.yaml 中设置 Default-Project-Root,用于存放自动生成的脚本、音频与图片文件。
    3. 安装依赖:npm install。
    4. 启动服务:npm start 或直接双击 start.bat,默认访问地址为 http://localhost:8765。

    关注公众号:

    发表回复