ArcReel
Health Pass
- License — License: AGPL-3.0
- Description — Repository has a description
- Active repo — Last push 0 days ago
- Community trust — 88 GitHub stars
Code Pass
- Code scan — Scanned 12 files during light audit, no dangerous patterns found
Permissions Pass
- Permissions — No dangerous permissions requested
No AI report is available for this listing yet.
AI Agent 驱动的开源视频生成工作台 — 小说→角色/场景/道具设计→剧本→分镜图→视频,跨镜头角色与场景一致 | Open-source AI video workspace powered by AI Agents, Nano Banana 2 & Veo 3.1 / Grok / Seedance
ArcReel
开源 AI 视频生成工作台 — 从小说到短视频,全程 AI Agent 驱动
Open-source AI Video Generation Workspace — Novel to Short Video, Powered by AI Agents
核心能力
🤖 AI Agent 工作流基于 Claude Agent SDK,编排 Skill + 聚焦 Subagent 多智能体协作,自动完成从剧本创作到视频合成的完整流水线 |
🎨 多供应商图像生成支持 Gemini、火山方舟、Grok 三大图像供应商,角色设计图确保角色一致性,线索追踪保证道具/场景跨镜连贯 |
🎬 多供应商视频生成支持 Veo 3.1、Seedance、Grok 三大视频供应商,全局/项目级可切换 |
⚡ 异步任务队列RPM 速率限制 + Image/Video 独立并发通道,lease-based 调度,支持断点续传 |
🖥️ 可视化工作台Web UI 管理项目、预览素材、版本回滚、实时 SSE 任务追踪,内置 AI 助手 |
工作流程
graph TD
A["📖 上传小说"] --> B["📝 AI Agent 生成分镜剧本"]
B --> C["👤 生成角色设计图"]
B --> D["🔑 生成线索设计图"]
C --> E["🖼️ 生成分镜图片"]
D --> E
E --> F["🎬 生成视频片段"]
F --> G["🎞️ FFmpeg 合成最终视频"]
F --> H["📦 导出剪映草稿"]
功能特性
- 完整生产流水线 — 小说 → 剧本 → 角色设计 → 分镜图片 → 视频片段 → 成片,一键编排
- 多智能体架构 — 编排 Skill 检测项目状态并自动调度聚焦 Subagent,每个 Subagent 独立完成一项任务后返回摘要
- 多图片供应商 — 支持 Gemini (Nano Banana 2)、火山方舟 (Seedream 5)、Grok 三大图片生成后端,全局/项目级可切换
- 多视频供应商 — 支持 Gemini (Veo 3.1)、火山方舟 (Seedance 1.5 Pro)、Grok (xAI) 三大视频生成后端,全局/项目级可切换
- 多文本供应商 — 支持 Gemini、火山方舟、Grok 文本生成后端,剧本生成/概述/风格分析等文本任务统一调度
- 两种内容模式 — 说书模式(narration)按朗读节奏拆分片段,剧集动画模式(drama)按场景/对话结构组织
- 渐进式分集规划 — 人机协作切分长篇小说:peek 脚本探测切分点上下文 → Agent 建议自然断点 → 用户确认 → 物理切分为单集文件,按需制作、无需一次规划全部集数
- 风格参考图 — 上传一张风格图,AI 自动分析生成风格描述,后续所有内容生成(角色/线索/分镜)统一使用该风格,确保全项目视觉一致
- 角色一致性 — AI 先生成角色设计图,后续所有分镜和视频均参考该设计
- 场景连贯 — 分镜图自动参考上一张生成,确保相邻场景画面衔接自然
- 线索追踪 — 关键道具、场景元素标记为"线索",跨镜头保持视觉连贯
- 版本历史 — 每次重新生成自动保存历史版本,支持一键回滚
- 多供应商费用追踪 — 图片/视频/文本生成全部纳入费用计算与使用记录,按供应商分策略计费(Gemini 按分辨率×时长 USD、火山方舟按 token 用量 CNY、Grok 按秒 USD),不同币种分别统计
- 用户认证 — JWT 登录 + API Key 认证双模式,支持外部平台集成
- OpenClaw 集成 — 提供 AgentSkill 定义文件与同步对话端点,可通过 OpenClaw 等外部 AI Agent 平台调用 ArcReel 能力
- 剪映草稿导出 — 按集导出为剪映(JianYing)草稿 ZIP,解压即可在剪映桌面版中二次编辑(调节奏、加字幕、转场、配音),说书模式自动附带字幕轨,支持剪映 5.x / 6+(操作指南)
- 项目导入/导出 — 整个项目打包归档,方便备份和迁移
- 竖屏优化 — 默认 9:16 比例,适合短视频平台发布
快速开始
默认部署(SQLite)
# 1. 克隆项目
git clone https://github.com/ArcReel/ArcReel.git
cd ArcReel/deploy
# 2. 配置环境变量
cp .env.example .env
# 3. 启动服务
docker compose up -d
# 访问 http://localhost:1241
生产部署(PostgreSQL)
cd ArcReel/deploy/production
# 配置环境变量(需设置 POSTGRES_PASSWORD)
cp .env.example .env
docker compose up -d
首次启动后,前往 设置页(/settings)完成以下配置即可开始使用:
- ArcReel 智能体 — 配置 Anthropic API Key(驱动 AI 助手)
- AI 生图/生视频 — 配置至少一个供应商的 API Key(Gemini / 火山方舟 / Grok)
交流群
扫码加入飞书交流群,获取帮助和最新动态:
供应商支持
ArcReel 通过统一的 ImageBackend / VideoBackend 协议,支持多个图片和视频生成供应商,可在全局或项目级别切换:
图片供应商
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | Nano Banana 2 (gemini-3.1-flash-image-preview), Nano Banana Pro (gemini-3-pro-image-preview) | 文生图、图生图(多参考图) | 按分辨率查表 (USD) |
| 火山方舟 | Seedream 5、Seedream 5 Lite、Seedream 4.5、Seedream 4 | 文生图、图生图 | 按张计费 (CNY) |
| Grok (xAI) | grok-imagine-image, grok-imagine-image-pro | 文生图、图生图 | 按张计费 (USD) |
视频供应商
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | veo-3.1-generate, veo-3.1-fast-generate | 文生视频、图生视频、视频延展、负面提示词 | 按分辨率 × 时长查表 (USD) |
| 火山方舟 | Seedance 1.5 Pro | 文生视频、图生视频、音频生成、种子控制、离线推理 | 按 token 用量 (CNY) |
| Grok (xAI) | grok-imagine-video | 文生视频、图生视频 | 按秒计费 (USD) |
文本供应商
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | gemini-3-flash-preview(默认) | 文本生成、结构化输出、视觉理解 | 按 token 用量 (USD) |
| 火山方舟 | doubao-seed-2-0-lite-260215(默认) | 文本生成、结构化输出、视觉理解 | 按 token 用量 (CNY) |
| Grok (xAI) | grok-4-1-fast-reasoning(默认) | 文本生成、结构化输出、视觉理解 | 按 token 用量 (USD) |
供应商选择优先级:项目级设置 > 全局默认。切换供应商时通用设置(分辨率、宽高比、音频等)直接沿用,供应商特有参数保留。
AI 助手架构
ArcReel 的 AI 助手基于 Claude Agent SDK 构建,采用编排 Skill + 聚焦 Subagent 的多智能体架构:
flowchart TD
User["用户对话"] --> Main["主 Agent"]
Main --> MW["manga-workflow<br/>编排 Skill"]
MW -->|"状态检测"| PJ["读取 project.json<br/>+ 文件系统"]
MW -->|"dispatch"| SA1["analyze-characters-clues<br/>全局角色/线索提取"]
MW -->|"dispatch"| SA2["split-narration-segments<br/>说书模式片段拆分"]
MW -->|"dispatch"| SA3["normalize-drama-script<br/>剧集动画规范化"]
MW -->|"dispatch"| SA4["create-episode-script<br/>JSON 剧本生成"]
MW -->|"dispatch"| SA5["资产生成 Subagent<br/>角色/线索/分镜/视频"]
SA1 -->|"摘要"| Main
SA4 -->|"摘要"| Main
Main -->|"展示结果<br/>等待确认"| User
核心设计原则:
- 编排 Skill(manga-workflow) — 具备状态检测能力,自动判断项目当前阶段(角色设计 / 分集规划 / 预处理 / 剧本生成 / 资产生成),dispatch 对应的 Subagent,支持从任意阶段进入和中断恢复
- 聚焦 Subagent — 每个 Subagent 只完成一项任务后返回,小说原文等大量上下文留在 Subagent 内部,主 Agent 只收到精炼摘要,保护上下文空间
- Skill vs Subagent 边界 — Skill 负责确定性脚本执行(API 调用、文件生成),Subagent 负责需要推理分析的任务(角色提取、剧本规范化)
- 阶段间确认 — 每个 Subagent 返回后,主 Agent 向用户展示结果摘要并等待确认,确认后才进入下一阶段
OpenClaw 集成
ArcReel 支持通过 OpenClaw 等外部 AI Agent 平台调用,实现自然语言驱动的视频创作:
- 在 ArcReel 设置页生成 API Key(
arc-前缀) - 在 OpenClaw 中加载 ArcReel 的 Skill 定义(访问
http://your-domain/skill.md自动获取) - 通过 OpenClaw 对话即可创建项目、生成剧本、制作视频
技术实现:API Key 认证(Bearer Token)+ 同步 Agent 对话端点(POST /api/v1/agent/chat),内部对接 SSE 流式助手并收集完整响应返回。
使用方式
通过 Web UI 工作台完成所有操作:
- 项目管理 — 创建项目、上传小说、管理多剧集
- AI 助手 — 内置 AI 助手,对话式引导完成剧本创作、角色设计、分集规划等
- 分集规划 — 长篇小说渐进式切分:peek 探测 → Agent 建议断点 → 用户确认 → 物理切分
- 风格参考图 — 上传风格图 → AI 自动分析生成风格描述 → 统一应用到所有图片生成
- 素材预览 — 角色图、分镜图、视频片段全屏预览
- 任务监控 — 实时查看生成任务进度(SSE 推送)
- 版本管理 — 每次重新生成自动保存历史,支持一键回滚
- 费用统计 — 按供应商、按任务类型精确统计 API 调用费用
- 参数配置 — 供应商管理、API Key、模型选择、速率限制等均可在页面配置
技术架构
flowchart TB
subgraph UI["Web UI — React 19"]
U1["项目管理"] ~~~ U2["素材预览"] ~~~ U3["AI 助手"] ~~~ U4["任务监控"]
end
subgraph Server["FastAPI Server"]
S1["REST API<br/>路由分发"] ~~~ S2["Agent Runtime<br/>Claude Agent SDK"]
S3["SSE Stream<br/>实时状态推送"] ~~~ S4["Auth<br/>JWT + API Key"]
end
subgraph Core["Core Library"]
C1["VideoBackend 抽象层<br/>Gemini · 火山方舟 · Grok"] ~~~ C2["ImageBackend 抽象层<br/>Gemini · 火山方舟 · Grok"]
C5["TextBackend 抽象层<br/>Gemini · 火山方舟 · Grok"] ~~~ C3["GenerationQueue<br/>RPM 限速 · Image/Video 通道"]
C4["ProjectManager<br/>文件系统 + 版本管理"]
end
subgraph Data["数据层"]
D1["SQLAlchemy 2.0 Async ORM"] ~~~ D2["SQLite / PostgreSQL"]
D3["Alembic 迁移"] ~~~ D4["UsageTracker<br/>多供应商费用追踪"]
end
UI --> Server --> Core --> Data
技术栈
| 层级 | 技术 |
|---|---|
| 前端 | React 19, TypeScript, Tailwind CSS 4, wouter, zustand, Framer Motion, Vite |
| 后端 | FastAPI, Python 3.12+, uvicorn, Pydantic 2 |
| AI 智能体 | Claude Agent SDK (Skill + Subagent 多智能体架构) |
| 图像生成 | Gemini Nano Banana 2 (google-genai), 火山方舟 Seedream 5 (volcengine-python-sdk[ark]), Grok (xai-sdk) |
| 视频生成 | Gemini Veo 3.1 (google-genai), 火山方舟 Seedance 1.5 (volcengine-python-sdk[ark]), Grok (xai-sdk) |
| 文本生成 | Gemini (google-genai), 火山方舟 (volcengine-python-sdk[ark]), Grok (xai-sdk) |
| 媒体处理 | FFmpeg, Pillow |
| ORM & 数据库 | SQLAlchemy 2.0 (async), Alembic, aiosqlite, asyncpg — SQLite (默认) / PostgreSQL (生产) |
| 认证 | JWT (pyjwt), API Key (SHA-256 哈希), Argon2 密码哈希 (pwdlib) |
| 部署 | Docker, Docker Compose(deploy/ 默认, deploy/production/ 含 PostgreSQL) |
文档
- 📖 完整入门教程 — 从零开始的手把手指南
- 📦 剪映草稿导出指南 — 将视频片段导入剪映桌面版进行二次编辑
- 💰 Google GenAI 费用说明 — Gemini 图像 / Veo 视频生成费用参考
- 💰 火山方舟费用说明 — 火山方舟图片 / 视频生成费用参考
贡献
欢迎贡献代码、报告 Bug 或提出功能建议!
本地开发环境
# 前置要求:Python 3.12+, Node.js 20+, uv, pnpm, ffmpeg
# 安装依赖
uv sync
cd frontend && pnpm install && cd ..
# 初始化数据库
uv run alembic upgrade head
# 启动后端 (终端 1)
uv run uvicorn server.app:app --reload --port 1241
# 启动前端 (终端 2)
cd frontend && pnpm dev
# 访问 http://localhost:5173
运行测试
# 后端测试
python -m pytest
# 前端类型检查 + 测试
cd frontend && pnpm check
许可证
如果觉得项目有用,请给个 ⭐ Star 支持一下!
Reviews (0)
Sign in to leave a review.
Leave a reviewNo results found