openclaw 网盘下载
OpenClaw

技能详情(站内镜像,无评论)

首页 > 技能库 > AI Video Pro

Professional AI video generation with cinematic prompt optimization, auto-detection of optimal generation backends (ComfyUI/LumaAI/Runway/Replicate/DALL-E),...

媒体与内容

许可证:MIT-0

MIT-0 ·免费使用、修改和重新分发。无需归因。

版本:v0.1.0

统计:⭐ 0 · 147 · 0 current installs · 0 all-time installs

0

安装量(当前) 0

🛡 VirusTotal :良性 · OpenClaw :良性

Package:aaalenwow/ai-video-pro

安全扫描(ClawHub)

  • VirusTotal :良性
  • OpenClaw :良性

OpenClaw 评估

The skill's code, declared requirements, and runtime instructions are largely consistent with a multi-backend AI video generation and publishing tool, but there are a few non-critical mismatches and operational risks to be aware of before installing.

目的

Name/description matches the requested binaries (ffmpeg, python) and provider API keys. Requesting LumaAI/Runway/Replicate/OpenAI keys is expected for an agent that can choose between those backends. The presence of platform publishing mappings (Weibo/Xiaohongshu/Douyin) aligns with the stated multi-platform publishing feature.

说明范围

SKILL.md explicitly instructs the agent to run environment detection, dependency installation, provider calls, a local preview server, and publishing. The included scripts implement those behaviors. The scripts read environment variables to discover configured providers and may clone/install local tools. They do not appear to read or exfiltrate unrelated system files. One mismatch: SKILL.md and code claim 'zero persistence' for credentials (en…

安装机制

There is no registry install spec, but the package includes helper install scripts (install_deps.py) that run system package managers (apt/brew/winget), pip installs, and git clone from GitHub (ComfyUI). Cloning from GitHub and pip installing are expected for tooling setup; these operations require network access and (on Linux) sudo for apt. Nothing in the scripts uses obscure download hosts or URL shorteners.

证书

The required env vars (LUMAAI_API_KEY, RUNWAY_API_KEY, REPLICATE_API_TOKEN, OPENAI_API_KEY) are proportionate to a multi-backend video generator. The code also references additional optional env vars (WEIBO_ACCESS_TOKEN, XHS_COOKIE, DOUYIN_ACCESS_TOKEN, cloud provider keys) which are not required but used for publishing/cloud uploads. The presence of XHS_COOKIE (cookie-based publishing) is noted in SKILL.md as TOS-sensitive; users should only …

持久

always:false and disable-model-invocation:false (normal). The skill stores project metadata locally under .ai-video-pro/projects.json (expected for project management). It does not request persistent modification of other skills or system-wide config. Installer scripts may run system package installs which require elevated privileges (sudo) on some platforms — the SKILL.md says it will ask for consent prior to installing.

综合结论

This package appears coherent with its stated purpose, but take these precautions before installing: - Source provenance: There is no homepage or known publisher link. If you don't already trust the author, consider running in an isolated VM or container. - Credentials: Only supply API keys you are willing to expose to the skill's runtime environment. Prefer limited-scope or test tokens. Do not paste long-lived admin secrets. - Xiaohongshu coo…

安装(复制给龙虾 AI)

将下方整段复制到龙虾中文库对话中,由龙虾按 SKILL.md 完成安装。

请把本段交给龙虾中文库(龙虾 AI)执行:为本机安装 OpenClaw 技能「AI Video Pro」。简介:Professional AI video generation with cinematic prompt optimization, auto-detec…。
请 fetch 以下地址读取 SKILL.md 并按文档完成安装:https://raw.githubusercontent.com/openclaw/skills/refs/heads/main/skills/aaalenwow/ai-video-pro/SKILL.md
(来源:yingzhi8.cn 技能库)

SKILL.md

打开原始 SKILL.md(GitHub raw)

---
name: ai-video-pro
description: Professional AI video generation with cinematic prompt optimization, auto-detection of optimal generation backends (ComfyUI/LumaAI/Runway/Replicate/DALL-E), and multi-platform publishing to Chinese social platforms (Weibo, Xiaohongshu, Douyin). Analyzes camera language, character dynamics, hit-impact feel, facial expressions, and mecha motion. Beta stage - not for production use.
user-invocable: true
metadata: {"openclaw":{"requires":{"env":["LUMAAI_API_KEY","RUNWAY_API_KEY","REPLICATE_API_TOKEN","OPENAI_API_KEY"],"anyBins":["python3","python"],"bins":["ffmpeg"]},"primaryEnv":"LUMAAI_API_KEY","stage":"beta","version":"0.1.0"}}
---

This skill generates professional AI videos with cinematic-quality prompt engineering. It transforms casual user descriptions into film-industry-grade prompts, auto-detects the best available video generation backend, and supports publishing to Chinese social platforms (Weibo, Xiaohongshu, Douyin).

**⚠️ BETA 测试阶段** — 本技能包正在测试中,请勿用于生产环境。

用户提供视频概念、场景描述或创意简报,本技能将优化提示词、选择最佳生成方案、生产视频,并可选择发布到多个平台。

---

## Phase 1: 镜头语言提示词优化引擎

当用户描述想要创建的视频时,在调用任何视频生成 API 之前,必须先执行以下影视级分析流程:

### 1.1 场景分解

将用户描述拆解为结构化的影视元素:

- **镜头类型 (Shot Type)**: 特写(ECU)、近景(CU)、中景(MS)、全景(FS)、远景(WS)、大远景(EWS)、鸟瞰、仰拍、荷兰角、过肩镜头
- **运镜方式 (Camera Movement)**: 固定、横摇(Pan)、纵摇(Tilt)、推轨(Dolly)、跟拍(Tracking)、摇臂(Crane)、手持、斯坦尼康、甩镜(Whip Pan)、变焦拉伸(Rack Focus)
- **灯光设计 (Lighting)**: 主光、补光、轮廓光、伦勃朗光、蝴蝶光、劈裂光、剪影、明暗对比、黄金时刻、霓虹光、体积光
- **色彩分级 (Color Grading)**: 青橙对比、去饱和、高对比、柔和色调、单色、暖色调、冷色调、胶片模拟
- **时间控制 (Temporal)**: 慢动作、延时摄影、正常速度、变速、定格

### 1.2 角色动态分析

对于涉及角色的场景,必须明确建模以下要素:

- **空间关系**: 角色相对位置、距离、朝向
- **动作动态**: 冲击力、动量、加速度(对战斗/动作场景至关重要)
- **打击感 (Hit/Impact Feel)**:
  - 打击的重量感和力度反馈
  - 反应时间和节奏感
  - 冲击形变效果(身体弯曲、衣物飘动)
  - 粒子效果(火花、碎片、冲击波)
  - 画面震动等同效果
- **面部表情渐变**: 镜头时间内的微表情序列变化(如:惊讶 → 坚定 → 胜利)
- **身体语言**: 姿态转换、手势弧线、重心转移
- **机甲/机器人运动**: 关节铰接运动、液压运动、质量惯性、变形序列

### 1.3 缺失元素检测

在最终确定提示词之前,主动检查并向用户询问缺失的关键元素:

**必须询问(如未指定):**
- 画面比例?(16:9 横屏, 9:16 竖屏适用于抖音, 1:1 方形适用于小红书)
- 目标时长?(3秒/5秒/10秒,取决于生成后端)
- 视觉风格?(写实、动漫、3D渲染、水彩、油画)

**动作场景必须询问(如未指定):**
- 打击/冲击力度级别?(轻触、重击、影视夸张)
- 是否需要反应特效?(火花、碎片、冲击波、慢动作冲击)
- 被击中角色的状态变化?(倒退、倒地、防御姿态)
- 角色受伤效果?(划痕、破损、变形)
- 场景的情感弧线是什么?

**角色场景必须询问(如未指定):**
- 镜头起止的面部表情分别是什么?
- 角色的服装以及运动中服装如何交互?
- 角色之间是否有眼神交流?

### 1.4 Provider 适配输出

不同视频生成 API 对 prompt 风格的响应不同,优化后的镜头语言 prompt 需要适配:

- **LumaAI (Dream Machine)**: 偏好自然语言嵌入镜头指令,如 "camera slowly pans", "in the style of"。单次最长5秒
- **Runway Gen-3/Gen-4**: 结构化 prompt 效果更好,分离镜头/主体/风格描述。支持图生视频
- **DALL-E + FFmpeg 管线**: 先生成关键帧图片再插值,适合保持风格一致性
- **Replicate (各模型)**: 按模型调整。Stable Video Diffusion 偏好简洁描述,AnimateDiff 偏好 LoRA 风格标签
- **ComfyUI (本地)**: 基于节点的工作流,需指定 checkpoint + scheduler + sampler

向用户同时展示原始描述和优化后的 prompt,供确认或修改。

---

## Phase 2: 环境自动探测与最优后端选择

在生成视频之前,执行环境检测流程:

### 2.1 环境检测

运行检测脚本:
```bash
python3 scripts/env_detect.py
```

检测内容:
1. **GPU**: NVIDIA (CUDA) / AMD (ROCm) / Apple Silicon (MPS) / 仅CPU
2. **显存**: 可用 GPU 显存(决定本地模型可行性)
3. **已安装工具**: ffmpeg、ComfyUI、Python 包 (torch, diffusers 等)
4. **可用 API 密钥**: 哪些 Provider 凭证已配置
5. **网络**: 互联网连通性、API 端点可达性
6. **磁盘空间**: 可用空间(模型下载需要)

### 2.2 后端选择优先级(最小代价优先)

| 优先级 | 后端 | 条件 | 成本 | 质量 |
|--------|------|------|------|------|
| 1 | ComfyUI 本地 | NVIDIA GPU 8GB+ VRAM | 免费 | 高 |
| 2 | Replicate 免费层 | API Key | 免费(有限) | 中 |
| 3 | LumaAI 免费层 | API Key | 免费(有限) | 高 |
| 4 | Runway 试用额度 | API Key | 免费试用 | 极高 |
| 5 | LumaAI 付费 | API Key + 计费 | ~¥3.5/视频 | 高 |
| 6 | Runway 付费 | API Key + 计费 | ~¥7/视频 | 极高 |
| 7 | DALL-E + FFmpeg | OpenAI Key | ~¥0.5/帧 | 中 |

向用户展示推荐方案及预估成本,获得确认后再继续。

### 2.3 自动安装

如果选定后端需要尚未安装的工具,提供自动安装:
```bash
python3 scripts/install_deps.py --backend <selected_backend>
```

支持安装:
- **ffmpeg**: winget (Windows) / brew (macOS) / apt (Linux)
- **ComfyUI**: git clone + pip install
- **Python 依赖包**: pip install API 客户端库

**始终在安装前征得用户确认。**

---

## Phase 3: 视频生成与预览

### 3.1 生成执行

1. 向用户展示优化后的 prompt 供审批
2. 通过 `scripts/provider_manager.py` 调用选定的 Provider API
3. 展示进度(异步 API 轮询状态)
4. 下载生成的视频到本地工作目录

### 3.2 在线预览

启动本地预览服务器:
```bash
python3 scripts/preview_server.py --file <video_path> --port 8765
```

预览功能:
- 带播放控制的视频播放器
- 逐帧导航
- 多版本并列对比(如果有多次生成)

预览地址: `http://localhost:8765`

### 3.3 迭代优化

如果用户希望修改:
- 基于反馈修改 prompt
- 使用相同或不同的 Provider 重新生成
- 支持图生视频优化(上传关键帧)

---

## Phase 4: 多平台发布

### 4.1 平台规格适配

发布前自动转码至平台要求:

| 平台 | 最大分辨率 | 最大时长 | 最大文件 | 推荐比例 | 格式 |
|------|-----------|---------|---------|---------|------|
| 微博 | 1080p | 15分钟 | 500MB | 16:9, 9:16 | MP4 (H.264) |
| 小红书 | 1080p | 15分钟 | 100MB | 3:4, 1:1, 9:16 | MP4 (H.264) |
| 抖音 | 1080p | 15分钟 | 128MB | 9:16 | MP4 (H.264) |
| 云存储 | 不限 | 不限 | 不限 | 不限 | 不限 |

### 4.2 发布流程

```bash
python3 scripts/publish.py --platform <platform> --mode <draft|publish> --file <video_path>
```

- **草稿模式 (draft)**: 准备元数据和转码,不上传。生成发布就绪的打包文件
- **发布模式 (publish)**: 上传到指定平台(需要平台凭证)
- **云存储模式 (cloud)**: 上传到配置的云存储 (S3/OSS/COS) 并返回分享链接

### 4.3 版本管理

在本地 `.ai-video-pro/projects.json` 维护项目清单:
- 记录所有生成的视频及元数据
- 标记为草稿或已发布
- 记录各平台接收的版本
- 支持更新版本重新发布

---

## 凭证安全

### 环境变量配置

**视频生成(至少配置一个):**
- `LUMAAI_API_KEY` — LumaAI Dream Machine API
- `RUNWAY_API_KEY` — Runway Gen-3/Gen-4 API
- `REPLICATE_API_TOKEN` — Replicate API
- `OPENAI_API_KEY` — OpenAI DALL-E(用于关键帧生成)

**平台发布(可选):**
- `WEIBO_ACCESS_TOKEN` — 微博开放平台
- `XHS_COOKIE` — 小红书会话(无官方 API,注意 TOS 风险)
- `DOUYIN_ACCESS_TOKEN` — 抖音开放平台

**安全原则:**
- 所有凭证仅通过环境变量读取,零持久化
- 不记录、不打印、不缓存任何密钥值
- 首次使用时通过最小化测试调用验证密钥有效性
- 如果缺少凭证,引导用户逐步完成设置

### OpenClaw 凭证集成

在 `openclaw.json` 中配置:
```json
{
  "skills": {
    "entries": {
      "ai-video-pro": {
        "apiKey": { "source": "env", "name": "LUMAAI_API_KEY" }
      }
    }
  }
}
```

---

## 错误处理

- 无 API 密钥 → 引导用户逐步设置
- Provider 失败 → 自动降级到下一优先级 Provider
- ffmpeg 缺失 → 提供自动安装
- 网络不可用 → 明确说明哪些操作需要网络
- 视频生成失败 → 展示错误、建议修改 prompt、提供切换 Provider 的选项
- 平台发布失败 → 保存发布就绪的本地包,提供手动上传指引