OpenClaw 04:文件管理 —— AI 翻你文件夹的能力

OpenClaw 文件管理四大能力实测:智能搜索、批量处理、自动整理、磁盘清理。记录了实际使用效果和踩到的坑。

上篇把 Gateway 跑顺了。这篇聊一个我一直想试的功能:让 AI 翻我的文件夹。

运维干了十几年,文件管理是个无底洞。截图、配置文件、日志、客户文档、发票、合同——名字乱、格式杂、散得到处都是。每次找东西都要靠记忆翻半天。OpenClaw 号称能访问本地文件,我花了一个下午把这四个能力都试了一遍。

智能搜索:找东西终于不用记文件名了

传统的 find 或 Spotlight 搜的是文件名。问题是:你会给文件起规范的名字吗?我不会。截屏2026-05-07.pngfinal-v3-really-final.docx——这些名字一年后谁记得住。

OpenClaw 的搜索是读内容的。你说”找一份里面提到跑步机的发票”,它真的会打开图片做 OCR,然后匹配”跑步机”三个字。

我拿自己电脑上的一个杂乱的文件夹试了一下,里面大概 200 多个文件:技术文档、截图、PDF 合同、一堆 Excel 表格。

几个测试:

  • “找所有包含 cluster-admin 的 YAML 文件” → 5 秒找到 3 个。用了两个多月都没整理过 RBAC 配置,它直接翻出来了。
  • “查出所有发票图片里的总金额” → 12 张发票图片,OCR 识别出了 10 张的金额。两张拍得太糊,没识别出来。
  • “找去年 12 月的文件” → 按修改时间筛出来,混了一堆系统自动生成的东西,不太干净。

说实话,语义搜索比想象中好用。但前提是你的文件本身是可读的——手写的扫描件、太糊的截图,它也救不了。

几个用起来的小技巧:

  1. 描述内容,别描述文件名——“包含数据库连接信息的配置文件” 比 “application.yml” 更容易找到
  2. 告诉它大概位置——/.kube/、/Documents/contracts,缩小范围能快不少
  3. 加排序条件——“最近修改的 5 个包含 error 的日志文件”

批量处理:100 份文档,两分钟

这是让我决定写这篇的原因。

以前整理客户合同信息,要从几十份 Word 文档里提取公司名、联系人、电话、邮箱,复制粘贴到 Excel。一个人干一下午。OpenClaw 做这件事用了大概 3 分钟,准确率还行。

我试了几个场景:

提取合同关键字段。 15 份 PDF 合同扔到一个文件夹,让它”提取每份合同里的甲方公司名、金额、签订日期,整理成表格”。金额字段有一份识别错了——合同的金额栏里同时写了大小写,它取了小写。其他的都对。

合并散落的配置片段。 K8s 集群迁移之后,有些 ConfigMap 的 YAML 散在各个文件夹里。让它”收集所有 configmap-*.yaml 文件,按命名空间分类,合并到一个文件中”。这个跑得很干净,因为 YAML 是纯文本,没有识别问题。

OCR 名片提取。 去年参加一个技术大会,拍了 30 多张名片的照片,一直没整理。让它提取姓名、公司、职位、手机、邮箱,输出 CSV。30 张里 24 张全对,3 张部分字段错误,3 张完全识别不了——全是设计得太花的名片,文字压在图案上。结论:名片越素 OCR 越准。

跑完批量处理后,我会让它自己检查一遍:

检查生成的表格,指出可能有识别错误的行。

它会列出”金额异常”、“电话号码位数不对”的项。这个自查能力省了一轮人工校对的时间。

自动整理:给下载文件夹建管家

我 Mac 的 Downloads 文件夹是个黑洞。500 多个文件,什么都有。每次翻东西都要眼睛扫一遍列表。

让 OpenClaw 整理:

按文件类型把 Downloads 文件夹整理分类,图片放 images/,PDF 和文档放 documents/,安装包放 packages/,其他的放 others/。不认识的格式不要乱放。

跑完大概两分钟。结果:

  • images/ — 93 个文件(截图为主)
  • documents/ — 67 个(PDF、Word、Excel)
  • packages/ — 12 个(dmg、pkg)
  • others/ — 剩下的

整理完多出来 15G 空间。主要是重复下载了几个安装包和大尺寸的录屏文件,它删重复文件的时候我都没意识到有重复的。

但有个问题:它把一些 微信文件 开头的随机名字图片按类型分进了 images/。这些都是别人微信发过来的东西,名字没有意义。我让它再做一步:

把 images/ 里以”微信文件”开头的图片打开看一下内容,用里面包含的文字重命名。

这一步它确实做到了——发票改名成 发票-XXX公司-05月.png 这样的格式,合同改名成 合同-供应商名.pdf。有个别图片纯表情包,它诚实地说”无法根据内容命名”,留了原名。这个行为比硬造一个名字好。

磁盘清理:换个思路清空间

我的 Mac 是 500G 硬盘,经常 85% 以上。以前用 DaisyDisk 看占用,但看完也不知道哪些能删——担心删错。

OpenClaw 的思路不太一样:先分析,再建议,让你确认后才动手。

实际跑了一遍:

  1. 它找到 80G 缓存文件(Chrome 占了 25G,npm 缓存 15G 我是没想到的)
  2. 找到了 120 组重复文件,主要是同一张截图存了好几份,同样的 dmg 安装包下了好几次
  3. 列出了超过 1G 的大文件——几个虚拟机的 vmdk 镜像,占了大头,但不敢动

最终清掉了 65G:缓存 + 重复文件 + 30 天前的临时文件。

这东西和 DaisyDisk 的区别是:DaisyDisk 告诉你”这个文件夹很大”,OpenClaw 告诉你”这里面哪些是能删的,哪些不能碰”。它知道 npm cache 可以清,知道 ~/Library/Caches 里什么东西安全。这个判断力比磁盘分析工具高一个层次。

但也不是完全放心。清之前我让它把要删的文件列成清单,自己过了一遍——这是必须的。

几个安全策略我定死了:

  1. 分析 → 列表 → 确认 → 删除,中间少一步就停
  2. ~/Documents/Important~/Projects 标为保护区,绝对不动
  3. 删文件先进废纸篓,不直接 rm

整体感觉

试完之后,文件管理是我觉得 OpenClaw 目前最实用的能力。比聊天有用,比 Skills 安装更直接。

语义搜索和批量处理是真的省时间。磁盘清理比手动搞安全。自动整理是好用,但需要你描述清楚规则——“整理一下”这种模糊指令它会翻车,得说清楚按什么规则、分哪些类。

和在线 AI 比,最大的区别是它真的能读你硬盘上的文件。ChatGPT 网页版做不到这一点。这是本地 Agent 的核心价值——不是一个聊天窗口,是一个能碰你文件的工具。

但有一点要清醒:它做的操作是读取文件内容然后通过 API 发给模型处理。如果你的文档里有敏感信息,要考虑这一点。发票、合同、客户数据——这些我都是在断网环境里测试的,没走云端 API。

下一步

文件管理搞定了。接下来我打算自己写运维场景的 Skills——日志分析、告警通知、K8s 集群查询。不是装社区 Skill,是自己写。

系列文章和进度在 OpenClaw 运维 Agent