5款支持文字指令剪辑的视频cli工具测评
下面给你 **5款真正支持“文字指令 / 自然语言”剪辑的视频 CLI 工具**,全部可以本地部署、命令行操作、适合批量/自动化流程,我按上手难度、中文支持、实际效果做一次完整测评(2026-04 最新)。 --- ## 1. FunClip(阿里开源,最稳中文CLI) **项目**:https://gitcode.com/GitHub_Trending/fu/FunClip **核心**:语音转文字 → 文本编辑 → 自动剪视频,**中文最强、最稳定** ### 能力 - ✅ CLI + Gradio,支持纯命令行 - ✅ 达摩院Paraformer-Large:中文识别 **95.8%**,时间戳误差 ±0.3s - ✅ LLM 文字指令:`“只保留讲AI伦理的部分”` - ✅ 说话人分离(CAM++):`“只留张三的镜头”` - ✅ 热词增强:专业术语识别率 +40% ### 示例(CLI) ```bash funclip --input input.mp4 --text "保留所有关于大模型的段落" --output out.mp4 ``` ### 测评结论 - **优点**:中文天花板、本地离线、可批量、稳定不崩 - **缺点**:模型约 2GB,首次下载慢 - **适合**:口播/课程/访谈批量粗剪、生产环境首选 --- ## 2. AutoCut(李沐开源,极简CLI) **项目**:https://github.com/mli/autocut **核心**:Whisper 转写 → 删句子 → 自动剪辑,**最极简、易部署** ### 能力 - ✅ 纯 CLI,一行命令搞定 - ✅ 多语言(中文可用,准确率略低于FunClip) - ✅ 自动删静音/口误/重复 - ✅ 文本指令:`--exclude "嗯、然后、那个"` ### 示例 ```bash autocut input.mp4 --text "删除所有停顿和口误" -o out.mp4 ``` ### 测评结论 - **优点**:安装极简(pip install)、速度快、适合快速粗剪 - **缺点**:中文识别一般、无说话人分离、LLM能力弱 - **适合**:个人UP主、快速去水词、批量处理短内容 --- ## 3. CutClaw(湾区大学+北交大,音乐驱动+文字指令) **项目**:https://github.com/GVC-Lab/CutClaw **核心**:**音乐驱动剪辑 + 自然语言指令**,卡点最强、电影感最高 ### 能力 - ✅ CLI + 多智能体系统 - ✅ 文字指令:`“剪成30s旅行Vlog,节奏轻快,日落镜头放结尾”` - ✅ 自动音乐卡点:识别节拍/重拍/副歌,画面精准对齐 - ✅ 智能构图:自动裁成 9:16/16:9,保留主体 ### 示例 ```bash cutclaw --input raw.mp4 --bgm bgm.mp3 --prompt "30s快剪,卡点,突出风景" --output vlog.mp4 ``` ### 测评结论 - **优点**:音画同步天花板、成片质量高、支持长素材(几小时) - **缺点**:配置高(建议 RTX 3090+)、中文指令理解一般、部署稍复杂 - **适合**:Vlog/旅拍/短视频批量生产、追求电影感 --- ## 4. video-use(browser-use 团队,对话式CLI) **项目**:https://github.com/browser-use/video-use **核心**:**LLM 对话式剪辑**,把素材丢进去,用自然语言“聊”出成片 ### 能力 - ✅ 纯 CLI,支持多轮对话 - ✅ 文字指令:`“剪成1分钟产品介绍,开头放logo,中间放功能演示,结尾加联系方式”` - ✅ 自动素材筛选、转场、字幕、BGM推荐 - ✅ 支持图片/视频混合素材 ### 示例 ```bash video-use --folder ./assets --prompt "1min产品视频,专业简洁风格" ``` ### 测评结论 - **优点**:指令自由度最高、全自动、无需手动选片段 - **缺点**:依赖 Claude/GPT-4(需API Key)、成本高、中文一般、不可离线 - **适合**:快速原型、批量生成不同风格版本、不想动手的懒人 --- ## 5. Voce(videocut,轻量LLM剪辑CLI) **项目**:https://github.com/0xFANGO/voce-over-skills **核心**:**轻量、可扩展、技能化CLI**,把剪辑做成“技能指令” ### 能力 - ✅ 纯 CLI,无UI,适合脚本集成 - ✅ 预设技能:`剪口播、去静音、加字幕、批量转码` - ✅ 文字指令:`“保留精彩片段,去掉重复和停顿”` - ✅ 基于FFmpeg,速度快、资源占用低 ### 示例 ```bash voce run 剪口播 --input input.mp4 --output clean.mp4 ``` ### 测评结论 - **优点**:极轻量(依赖少)、速度快、易集成到脚本、可自定义技能 - **缺点**:LLM能力弱、中文支持一般、复杂指令理解差 - **适合**:服务器/流水线集成、批量预处理、轻量自动化 --- ## 5款对比总表(一眼选) | 工具 | 中文 | 离线 | LLM指令 | 速度 | 上手难度 | 最佳场景 | |---|---|---|---|---|---|---| | FunClip | ★★★★★ | ✅ | ★★★★ | 中 | 中 | 口播/课程/访谈 | | AutoCut | ★★★☆ | ✅ | ★★☆ | 快 | ★★ | 快速去水词、粗剪 | | CutClaw | ★★☆ | ✅ | ★★★★ | 慢 | 难 | Vlog/卡点/电影感 | | video-use | ★★☆ | ❌ | ★★★★★ | 中 | 中 | 对话式全自动 | | Voce | ★★☆ | ✅ | ★★☆ | 极快 | ★ | 服务器批量预处理 | --- ## 最终推荐 - **中文生产首选**:**FunClip**(稳、准、离线、可批量) - **个人快速粗剪**:**AutoCut**(极简、快、pip安装) - **短视频/Vlog卡点**:**CutClaw**(音乐驱动、成片质感最好) --- 。



