carocut
agent
Gecti
Health Gecti
- License — License: NOASSERTION
- Description — Repository has a description
- Active repo — Last push 0 days ago
- Community trust — 28 GitHub stars
Code Gecti
- Code scan — Scanned 12 files during light audit, no dangerous patterns found
Permissions Gecti
- Permissions — No dangerous permissions requested
Bu listing icin henuz AI raporu yok.
Multi-Agent 的视频制作助手,基于 OpenCode AI SDK 和 Remotion 构建。
README.md
CaroCut
AI 驱动的视频制作工作流系统,基于 OpenCode AI SDK 和 Remotion 构建。
简介
CaroCut 是端到端的自动化视频生产平台。通过多 Agent 协作(orchestrator + planner/media/builder/reviewer),将原始素材(PDF、图片、文本)转化为专业视频。

核心特性:
- 多 Agent 协作:5 个专业 Agent,12 个 Skill,职责隔离
- 8 步标准工作流:素材分析 → 策划 → 脚本润色 → 视觉素材 → 音频素材 → 资产管道 → 组件实现 → 预览渲染
- 自动化环境初始化:Bootstrap 一次,多项目共享 Remotion 模板和浏览器(session 创建时自动兜底)
- Remotion 驱动:React 组件编程式生成视频,逐帧精确控制
- 断点续做:
progress.yaml状态持久化,支持中断恢复和增量修改
案例:
- 从极简主义到极繁主义 - 日式网页为何如此花哨?
- 【论文讲解】Bézier Splatting for Fast and Differentiable Vector Graphics Rendering
调度架构
┌─────────┐
│ User │
└────┬────┘
│ request / confirm
▼
┌───────────────────┐
│ Orchestrator │
│ │
│ · 读取进度状态 │
│ · 调度 subagent │
│ · 验证产出物 │
│ · 更新 progress │
└──┬────┬────┬───┬──┘
│ │ │ │
dispatch │ │ │ │ callback
┌───────────────┘ │ │ └───────────────┐
│ ┌──────────┘ └──────────┐ │
▼ ▼ ▼ ▼
┌─────────┐ ┌─────────┐ ┌─────────┐ ┌──────────┐
│ Planner │ │ Media │ │ Builder │ │ Reviewer │
│ │ │ │ │ │ │ │
│ step 1 │ │ step 3 │ │ step 6 │ │ step 8 │
│ step 2 │ │ step 4 │ │ step 7 │ │ │
│ │ │ step 5 │ │ │ │ │
└─────────┘ └─────────┘ └─────────┘ └──────────┘
╔═══════════╗ ╔═══════════╗ ╔════════════════╗ ╔══════════╗
║ Planning ║ ║Enhancement║ ║Implementation ║ ║ Delivery ║
╚═══════════╝ ╚═══════════╝ ╚════════════════╝ ╚══════════╝
──────────────────── 数据流向 ────────────────────
Planner ──manifests/──▶ Media ──raws/──▶ Builder ──project/──▶ Reviewer
↑ │
│ revision_request │
└──────────── Orchestrator ◀───────────────┘
快速开始
环境要求
- macOS / Linux(不支持 Windows,需用 WSL2)
- Node.js >= 18, Python >= 3.9, uv(Python 包管理), ffmpeg
- API 密钥:
- 必需:PEXELS_API_KEY
- 可选:PIXABAY_API_KEY, CARO_LLM_API_KEY, FREESOUND_API_KEY
安装与启动
git clone <repository-url>
cd carocut/
cp .env_example .env # 配置 API 密钥
# Python 环境(使用 uv 管理)
uv venv
source .venv/bin/activate # macOS/Linux
uv pip install -r requirements.txt
# Node.js 依赖
pnpm install
# OpenCode 配置
cp opencode-template.json opencode.json # 编辑配置 API 密钥和模型
# Bootstrap:全局环境初始化(首次运行)
python .opencode/scripts/bootstrap.py
Bootstrap 会执行:
- 环境检查(Node.js、Python、ffmpeg、API keys)
- Remotion 模板缓存准备(~700MB,所有项目共享)
- Chrome headless shell 下载
启动需要两个终端(重要:在 venv 下执行):
# 激活虚拟环境(如未激活)
source .venv/bin/activate # macOS/Linux
# 终端 1:启动 OpenCode 后端(启用 Web 搜索)
OPENCODE_ENABLE_EXA=1 opencode serve --port 4096 --cors http://localhost:3000 --print-logs
# 终端 2:启动前端
pnpm dev # 访问 http://localhost:3000
启动工作流
在 OpenCode 界面输入 /carocut,系统自动执行完整视频制作流水线。
架构概览
用户输入素材 → Orchestrator → Planner / Media / Builder / Reviewer → 最终视频
| 阶段 | 步骤 | Agent | 描述 |
|---|---|---|---|
| Planning | step-1, 2 | planner | 素材分析、制作策划 |
| Enhancement | step-3, 4, 5 | media | 脚本润色、视觉素材、音频素材 |
| Implementation | step-6, 7 | builder | 资产管道、组件实现 |
| Delivery | step-8 | reviewer | 预览审查、最终渲染 |
项目结构
carocut/
├── app/ # Next.js 应用(页面 + API 路由)
├── components/ # React 组件
├── lib/ # 工具函数(studio-manager 等)
├── .opencode/
│ ├── agents/ # 5 个 Agent 定义
│ ├── commands/ # /carocut 命令
│ └── skills/ # 12 个 Skill 定义
├── raws/ # 原始素材(images/ + audio/)
├── workspaces/ # 运行时工作空间
├── server.ts # Next.js + Remotion Studio 代理服务器
├── opencode-template.json # OpenCode 配置模板
└── requirements.txt # Python 依赖
文档
许可证
MIT License。详见 LICENSE。
Remotion 许可证:Remotion 为源码可见项目,个人/非营利/≤3 人公司免费,超 3 人公司商用需购买 Remotion License。详见 THIRD-PARTY-NOTICES。
致谢
Remotion · OpenCode SDK · Pexels · Pixabay · Freesound
Yorumlar (0)
Yorum birakmak icin giris yap.
Yorum birakSonuc bulunamadi