Skill v1.0.1
currentAutomated scan89/100+2 new
version: "1.0.1" name: browser-cdp description: "Use this skill when you need to control a Chrome browser via CDP (Chrome DevTools Protocol) to reuse existing login sessions. Covers: launching Chrome in debug mode, opening URLs, waiting for page load, evaluating JavaScript, taking snapshots, and extracting auth tokens. Trigger phrases: browser automation, CDP, agent-browser, 浏览器操作, 操作浏览器, Chrome CDP, 复用登录态, extract token from browser." metadata: openclaw: requires: bins:
- agent-browser
source: https://github.com/worldwonderer/oh-story-claudecode
Browser CDP 操作工具
通过 CDP 协议控制 Chrome,复用已有登录态,执行浏览器自动化操作。
前置条件
- macOS / Linux / Windows(实验性),已安装 Google Chrome
- Node.js 12+
agent-browser已安装:npm install -g agent-browser
⚠️ 首次启动会 kill 用户的常规 Chrome。 在启动前必须征求用户同意(见下方"启动流程"),否则用户可能丢失未保存的标签页/草稿。
启动流程(skill-mode 强制步骤)
第一步:探测当前状态(无副作用)
node {SKILL_DIR}/scripts/setup-cdp-chrome.js 9222 --detect-only
输出形如:
CDP_STATUS=ready # 已就绪,可直接复用CDP_URL=http://127.0.0.1:9222/json/versionBROWSER=Chrome/148.0.7778.168
或:
CDP_STATUS=needs-setupCHROME_RUNNING=yes # 用户有 Chrome 在跑,启动会杀掉CHROME_PID_COUNT=3
第二步:根据探测结果分支
CDP_STATUS=ready→ 直接使用agent-browser --cdp 9222 ...,不要运行 setup。CDP_STATUS=needs-setup且CHROME_RUNNING=no→ 安全启动:
``bash node {SKILL_DIR}/scripts/setup-cdp-chrome.js 9222 --yes ``
CDP_STATUS=needs-setup且CHROME_RUNNING=yes→ 先用 AskUserQuestion 工具向用户确认:告知会杀掉 N 个 Chrome 进程、可能丢失未保存工作;用户同意后再带--yes启动;用户拒绝则放弃这次自动化。
为什么不能直接 `--yes`: 脚本在非 TTY(即 skill 模式 / Bash 工具)下,如果检测到 Chrome 在跑而没有 --yes,会以退出码 3 报 NEEDS_CONSENT: ... 并中止,不会静默杀进程。这是有意的兜底——但 skill 流程仍应先问用户,而不是看到 3 就盲传 --yes。
启动脚本选项
| 选项 | 说明 | |
|---|---|---|
--detect-only | 只探测,不修改任何状态(skill 用) | |
--yes | 已征得同意,跳过交互提示 | |
--reset | 启动前清空 ~/chrome-debug-profile(登录失效时用) | |
--profile <name> | 使用非 Default 的 Chrome profile(如 "Profile 1") | |
--dry-run | 打印将执行的步骤,不执行 |
退出码:0 成功 / 1 通用错误 / 2 用户拒绝(TTY)/ 3 需同意但缺 --yes。
常用操作
打开页面并等待加载
agent-browser --cdp 9222 open "<URL>"agent-browser --cdp 9222 wait 3000
提取页面文本
agent-browser --cdp 9222 eval 'document.body.innerText.substring(0, 8000)'
提取 Auth Token
agent-browser --cdp 9222 eval 'localStorage.getItem("token") || document.cookie'
复杂 JS(含引号 / $ / 反引号)
shell 转义容易出错,用以下两种方式之一:
# 1) base64 包裹agent-browser --cdp 9222 eval -b "$(echo -n "document.querySelectorAll('a').length" | base64)"# 2) heredoc + --stdincat <<'EOF' | agent-browser --cdp 9222 eval --stdinconst links = document.querySelectorAll('a');links.length;EOF
页面交互(snapshot 拿元素引用)
agent-browser --cdp 9222 snapshot -i # 仅交互元素agent-browser --cdp 9222 click "<CSS or @e1>"agent-browser --cdp 9222 type "<sel>" "<text>"
停止 / 清理
- 关掉 debug Chrome 窗口即可(或
pkill -9 -x 'Google Chrome'/taskkill /F /IM chrome.exe)。 - 登录态失效:
node {SKILL_DIR}/scripts/setup-cdp-chrome.js 9222 --reset --yes(注意--yes同样需要先问用户)。
常见问题
| 问题 | 解决方案 | |
|---|---|---|
NEEDS_CONSENT + 退出码 3 | 用 AskUserQuestion 询问用户是否允许杀掉 Chrome,同意后加 --yes 重跑 | |
| CDP 端口未监听 | --detect-only 再确认;端口被占用则换端口 | |
| 页面跳转到登录页 | snapshot -i 找登录按钮并操作 | |
eval 返回 null | 检查 localStorage key 名;含引号的 JS 用 eval -b 或 --stdin | |
| 登录态过期 | setup-cdp-chrome.js 9222 --reset --yes 重新拷贝 | |
| 有多个 Chrome profile | --profile "Profile 1" 指定 | |
| Chrome 不会启动(30s 超时) | 试 --reset;检查端口冲突;查看 ~/chrome-debug-profile/ 是否损坏 |