让 AI 智能体调整窗口大小并完成截图

Metaphor Projects
应用
29 Apr, 2026

屏幕自动化要让人放心，结果就必须可见、可重复。在这个简短演示中，AI 智能体使用 OverRec 屏幕技能找到一个浏览器窗口，将其调整到精确矩形，并在无需手动拖拽的情况下截取干净的截图。

演示内容

目标是一个打开 Hermes Agent 网站的 Chrome 窗口。智能体运行在终端中，并且可以使用 overrec-screen 技能；这个技能封装了 OverRec 的窗口工具。

工作流很简单：

确认 OverRec 可用
找到目标窗口
将窗口移动并调整到精确位置
截取该精确区域的截图
将截图复制到指定输出路径

整个过程不需要手动摆放窗口。

第一步：让智能体执行屏幕任务

给智能体的任务可以像这样：

Use overrec-screen skill to resize the Hermes Agent window to 800x600
and take a screenshot.

关键点在于，指令描述的是期望结果，而不是每一个底层命令。技能会给智能体一种可靠方式，将这个请求转换为窗口操作。

第二步：找到窗口

智能体首先搜索匹配的窗口标题：

OverRec.exe cli window hermes

如果没有找到精确标题，它会扩大搜索范围，列出可见窗口：

OverRec.exe cli window --all hermes
OverRec.exe cli window edge
OverRec.exe cli window

在演示中，Hermes Agent 页面打开在 Google Chrome 中，OverRec 返回了它的窗口 ID。智能体拿到这个 ID 后，就可以直接控制该窗口。

第三步：将浏览器吸附到精确矩形

智能体将 Chrome 窗口吸附到位置 150,150，尺寸为 800x600：

OverRec.exe cli snap --windowid 264604 --location 150,150 --size 800x600

OverRec 会在需要时还原窗口，移动它，调整尺寸，并将其置于前台。结果是每次都出现在同一位置的可预测浏览器框架。

这种可重复性适用于：

文档截图
UI 对比图片
需要视觉确认的智能体工作流
需要每次显示同一区域的错误报告

第四步：截取截图

窗口定位完成后，智能体使用 OverRec 截取同一个矩形区域：

OverRec.exe cli screenshot --location 150,150 --size 800x600 --output "C:\Users\HP\storage\screenshots\overrec\hermes_agent.png" --no-clipboard

截图会直接写入磁盘，因此工作流不依赖剪贴板，也不需要手动保存。

为什么这对 AI 工作流有用

AI 智能体可以推理任务，但桌面截图只有在屏幕状态受控时才真正有用。如果浏览器半截在屏幕外、被其他应用遮住，或每次尺寸都有轻微差异，截图就会变得嘈杂。

OverRec 为智能体提供确定性的屏幕控制：

通过标题找到窗口
将窗口放到精确坐标
将窗口调整为精确尺寸
截取所需的精确区域

这会把“给这个应用截图”从脆弱的视觉任务，变成可重复的自动化步骤。

核心模式

对于任意窗口，模式都是：

OverRec.exe cli window <search text>
OverRec.exe cli snap --windowid <ID> --location <X,Y> --size <WIDTH>x<HEIGHT>
OverRec.exe cli screenshot --location <X,Y> --size <WIDTH>x<HEIGHT> --output "<file>"

当你想手动绘制矩形时，使用图形界面。当你想在脚本、终端或 AI 智能体中获得相同结果时，使用 CLI。

从 Microsoft Store 下载 OverRec。

Tags :

通过 Infini Alchemy 轻松学习词汇

Metaphor Projects
应用
01 Dec, 2025

你是否正在寻找一款既有趣又能帮助你学习新词汇的游戏？不用再找了！Infini Alchemy 是一款富有创意的炼金术游戏，你可以将水、火、土、气等基本元素组合起来，发现一个充满新物品的广阔世界。游戏玩法简单直观。你可以拖放元素，将它们相互组合，看看能创造出什么新奇有趣的东西。但这里有个魔法：每次你创造一个新元素时，应用程序都会朗读其名称。随着游戏的进行，

如何将 ChatGPT 响应中的公式复制到 Word

Metaphor Projects
应用
20 Dec, 2025

将 ChatGPT 响应中的公式复制到 Word，只需 3 步：将 ChatGPT 响应复制为 markdown（保留 LaTeX 公式）在 Word 中选择公式并插入为方程在 Word 数学编辑器中转换 LaTeX 公式步骤 1：复制为 Markdown 格式（含 LaTeX）第一步，你需要 Selection Copilot，一个 Chrome 扩展程序

通过炼金术掌握 KET 词汇：全新学习冒险

Metaphor Projects
应用
21 Dec, 2025

Infini Alchemy 是一款创新的网页游戏，它将词汇学习转变为一场引人入胜的炼金术冒险。通过拖放元素来制作新物品，玩家在应用程序朗读每个创作物时自然地吸收新词汇。这种游戏化的方法让语言学习感觉不像学习，更像是探索，非常适合想要以互动、难忘的方式建立英语词汇量的学习者。一本新的炼金术书籍已经来到 Infini Alchemy——KET 词汇炼金术书 —— 这是一个全面的集合，包含

GPU 加速实时视频效果

Metaphor Projects
应用
21 Dec, 2025

Sub Dimension Camera 现已提供 GPU 渲染功能。此功能消除了录制后等待视频"渲染"的需要。你现在可以实时预览和捕获复杂的艺术滤镜。通过使用 WebGPU，应用程序将视觉处理从手机的主处理器卸载到专用图形硬件。这使得性能更流畅、发热更少，并在长时间使用期间提高电池效率。对于不支持 WebGPU 的设备，我们仍然有渲染所有效果的备用模式（但速度较慢）。 Sub Dimens

以不同方式看世界：Sub Dimension 的相机特效

Metaphor Projects
应用
05 Apr, 2026

相机记录瞬间，特效将其升华为艺术。 Sub Dimension 内置丰富的实时视觉特效，可在取景器中即时呈现——所见即所得，无论拍照还是录像皆如此。以下介绍部分特效及其能为你的画面带来的效果。ASCII 艺术将任何场景转化为字符网格。ASCII 特效将亮度值映射为文字符号，营造出复古终端美感，

Metaphor Projects
应用
14 Apr, 2026

你精心搭建了完美的工作流：左边代码编辑器，右边浏览器，底部终端。然后重启电脑，又花了五分钟把窗口一个个拖回原位——差不多，但就是不够准。 OverRec 解决了这个问题。手动拖拽窗口的局限用鼠标拖拽窗口本来就不精确。你瞄准第 960 像素，落点却是 963。你把窗口调到"看起来差不多"，却在一秒后发现那道缝隙。日常使用无所谓，但对于录屏、文档截图或需要重复使用的工作区布局

如何用 OverRec 截取 YouTube 视频帧（或任意视频网站）

Metaphor Projects
应用
13 May, 2026

你正在观看教程、产品演示或直播，想要截取一帧干净的视频画面——没有浏览器工具栏、标签栏，没有任何干扰。以下是使用 OverRec 的两种方法。方法一：在视频上绘制矩形，然后复用坐标适合任何设备的最精确方法。使用 OverRec 的图形界面绘制一个精确覆盖视频播放

使用 OverRec 将任意屏幕区域录制为 GIF 或 MP4

Metaphor Projects
应用
11 Jun, 2026

屏幕录制通常需要做出妥协：要么录制整个显示器，之后再裁剪；要么每次都重新调整录屏工具的区域选择框。OverRec 现在可以直接录制你绘制的精确矩形，并沿用截图和窗口定位功能中已有的像素级精确工作流。你可以从 OverRec 工具栏进行交互式录制，也可以通过命令行自动执行定时录制。输出格式支持动态 GIF 和 H.264 MP4。从图形界面录制精确区域可视化录制流程非常简

让 AI 智能体调整窗口大小并完成截图

演示内容

第一步：让智能体执行屏幕任务

第二步：找到窗口

第三步：将浏览器吸附到精确矩形

第四步：截取截图

为什么这对 AI 工作流有用

核心模式

Tags :

Share :

Related Posts

通过 Infini Alchemy 轻松学习词汇

如何将 ChatGPT 响应中的公式复制到 Word

通过炼金术掌握 KET 词汇：全新学习冒险

GPU 加速实时视频效果

以不同方式看世界：Sub Dimension 的相机特效

将任意窗口精确定位到指定位置和尺寸

如何用 OverRec 截取 YouTube 视频帧（或任意视频网站）

使用 OverRec 将任意屏幕区域录制为 GIF 或 MP4

Move Any Window to an Exact Position and Size

Mueve Cualquier Ventana a una Posición y Tamaño Exactos

Let an AI Agent Resize a Window and Take the Screenshot

Deja que un Agente de IA Redimensione una Ventana y Tome la Captura

Cómo capturar un fotograma de YouTube (o cualquier sitio de vídeo) con OverRec

How to Screenshot a YouTube Video (or Any Video Site) with OverRec

Record Any Screen Region to GIF or MP4 with OverRec

Graba cualquier región de la pantalla en GIF o MP4 con OverRec