openclaw 网盘下载
OpenClaw

技能详情(站内镜像,无评论)

首页 > 技能库 > 一个功能强大的屏幕浏览、OCR识别和屏幕分析技能包,专为AI助手设计

此技能应被用于任何需要捕获屏幕截图、分析屏幕内容或处理屏幕图像的任务。包括:使用Python PIL库捕获整个屏幕或特定区域的截图;保存截图到指定位置;分析截图中的文字内容(支持中英文OCR识别);对截图进行基本图像处理(裁剪、旋转、调整大小)。当用户提到"屏幕截图"、"截屏"、"查看屏幕"或需要分析屏幕上的内容...

开发与 DevOps

许可证:MIT-0

MIT-0 ·免费使用、修改和重新分发。无需归因。

版本:v1.0.0

统计:⭐ 0 · 157 · 1 current installs · 1 all-time installs

0

安装量(当前) 1

🛡 VirusTotal :可疑 · OpenClaw :可疑

Package:datappt8/screen-capture-hub

安全扫描(ClawHub)

  • VirusTotal :可疑
  • OpenClaw :可疑

OpenClaw 评估

The skill's code and instructions match its stated purpose (screen capture and OCR) but include an automated installer that downloads and executes a Windows .exe and other behaviors that warrant caution before installing.

目的

Name/description, SKILL.md, README and included scripts consistently implement screen capture, OCR and basic image analysis. Requested Python libraries (Pillow, pyautogui, pytesseract, OpenCV, numpy) and reference to Tesseract OCR are appropriate and expected for the described functionality.

说明范围

SKILL.md instructs the agent to run local Python scripts to capture the screen, save images, and perform OCR/analysis — these are within scope. However the runtime instructions also call out a one‑click installer (python scripts/setup.py) and an install script that will download and run a Tesseract installer; these steps cause network activity and execution of an external binary beyond simple local script execution.

安装机制

There is no platform install spec in the package manifest, but scripts/install_tesseract.py programmatically downloads a Windows installer EXE (primary URL: digi.bib.uni-mannheim.de, fallback to a GitHub releases download URL) and runs it silently. Downloading and executing an external installer is a high-risk action — even if the URLs appear related to UB‑Mannheim Tesseract builds, it requires the user to trust external binaries and grants th…

证书

The skill does not request environment variables, credentials, or config paths unrelated to its purpose. Dependency checks inspect common Program Files paths and call tesseract commands; this is proportional to locating a locally installed Tesseract binary. No secrets or unrelated tokens are requested.

持久

Skill flags show no forced persistence (always: false) and normal autonomous invocation is allowed. The only persistent effect the package may request is installing Tesseract system‑wide (writes to Program Files), which requires administrative privileges on Windows. The skill does not modify other skills or system agent configs.

安装(复制给龙虾 AI)

将下方整段复制到龙虾中文库对话中,由龙虾按 SKILL.md 完成安装。

请把本段交给龙虾中文库(龙虾 AI)执行:为本机安装 OpenClaw 技能「一个功能强大的屏幕浏览、OCR识别和屏幕分析技能包,专为AI助手设计」。简介:此技能应被用于任何需要捕获屏幕截图、分析屏幕内容或处理屏幕图像的任务。包括:使用Python PIL库捕获整个屏幕或特定区域的截图;保存截图到指定位置;分析截…。
请 fetch 以下地址读取 SKILL.md 并按文档完成安装:https://raw.githubusercontent.com/openclaw/skills/refs/heads/main/skills/datappt8/screen-capture-hub/SKILL.md
(来源:yingzhi8.cn 技能库)

SKILL.md

打开原始 SKILL.md(GitHub raw)

---
name: openclaw-screen-viewer
displayName: OPENCLAW(龙虾)-屏幕查看器
description: 此技能应被用于任何需要捕获屏幕截图、分析屏幕内容或处理屏幕图像的任务。包括:使用Python PIL库捕获整个屏幕或特定区域的截图;保存截图到指定位置;分析截图中的文字内容(支持中英文OCR识别);对截图进行基本图像处理(裁剪、旋转、调整大小)。当用户提到"屏幕截图"、"截屏"、"查看屏幕"或需要分析屏幕上的内容时,使用此技能。
version: 1.0.0
author: CodeBuddy User
license: MIT
keywords:
  - 屏幕截图
  - OCR识别
  - 文字提取
  - 屏幕分析
  - 图像处理
  - 中文识别
  - openclaw
categories:
  - 图像处理
  - OCR
  - 屏幕工具
  - AI助手
---

# OPENCLAW(龙虾)-屏幕查看器

## 概述

此技能提供了使用Python进行屏幕截图和图像处理的功能。它依赖于Pillow (PIL) 和pyautogui库来捕获屏幕内容,并可选择性地使用pytesseract进行OCR文字识别。

## 安装依赖

### 方法1:一键安装(推荐)
```bash
python scripts/setup.py
```

### 方法2:手动安装

**必需依赖**(基础功能):
```bash
pip install pillow pyautogui
```

**可选依赖**(OCR功能):
```bash
pip install pytesseract
```

**Tesseract OCR引擎**(OCR功能必需):
- Windows: 运行 `python scripts/install_tesseract.py` 自动安装
- Windows (手动): 从 https://github.com/UB-Mannheim/tesseract/wiki 下载安装
- macOS: `brew install tesseract`
- Linux: `sudo apt-get install tesseract-ocr`

**可选依赖**(高级分析功能):
```bash
pip install opencv-python numpy
```

### 验证安装
```bash
# 检查所有依赖
python scripts/dependency_check.py

# 测试截图功能
python scripts/test_screenshot.py

# 测试OCR功能
python scripts/test_ocr.py

# 运行所有示例
python examples/run_examples.py
```

## 使用方法

### 基本屏幕截图

使用`scripts/screenshot.py`脚本捕获整个屏幕:

```python
python scripts/screenshot.py --output screenshot.png
```

捕获特定区域:
```python
python scripts/screenshot.py --output screenshot.png --region "100,100,500,500"
```

### 文字识别

使用`scripts/ocr_screenshot.py`脚本捕获屏幕并识别文字:

```python
python scripts/ocr_screenshot.py --output screenshot.png --text-output text.txt
```

### 分析屏幕内容

使用`scripts/analyze_screen.py`脚本进行更复杂的分析:

```python
python scripts/analyze_screen.py --task find_text --text "搜索词"
```

## 工作流程

当用户请求屏幕相关操作时:

1. **确定需求** - 明确用户需要的是截图、文字识别还是其他分析
2. **选择脚本** - 根据需求选择合适的脚本
3. **设置参数** - 配置输出路径、区域等参数
4. **执行脚本** - 运行相应的Python脚本
5. **处理结果** - 将结果展示给用户或进行进一步分析

## 常见任务

### 任务1:快速截图
- 使用:`scripts/screenshot.py`
- 参数:`--output` 指定输出文件路径
- 示例:捕获整个屏幕并保存为当前目录的screenshot.png

### 任务2:区域截图
- 使用:`scripts/screenshot.py`
- 参数:`--region "x1,y1,x2,y2"`
- 示例:捕获屏幕左上角500x500像素区域

### 任务3:屏幕文字提取
- 使用:`scripts/ocr_screenshot.py`
- 参数:`--text-output` 指定文本输出文件
- 示例:捕获屏幕并提取所有文字保存到text.txt

### 任务4:查找特定内容
- 使用:`scripts/analyze_screen.py`
- 参数:`--task find_text --text "搜索内容"`
- 示例:在屏幕上查找特定文字并高亮显示

## 注意事项

1. **权限**:某些应用程序可能需要管理员权限才能捕获其窗口内容
2. **性能**:高分辨率屏幕截图可能需要较多内存
3. **OCR准确性**:文字识别准确性受字体、背景、分辨率影响
4. **多显示器**:脚本默认捕获主显示器,多显示器环境需要特殊处理

## 故障排除

如果截图失败:
1. 检查Python库是否正确安装
2. 确认有足够的权限
3. 尝试降低分辨率或捕获特定区域

如果OCR识别不准确:
1. 确保Tesseract正确安装
2. 尝试预处理图像(二值化、去噪)
3. 指定语言参数(如`--lang chi_sim`用于简体中文)