少女祈祷中...

告别云端隐私焦虑!PhoneClaw:把 Gemma 4 塞进 iPhone 的纯本地 AI Agent 深度体验

在大模型技术狂飙突进的今天,AI Agent(智能体)已经开始深度介入我们的日常工作流。然而,绝大多数 Agent 都极度依赖云端 API,这不仅带来了持续的订阅成本,更让人对个人隐私(如日历、日程、健康数据等)的安全性捏一把汗。

近期,GitHub 上一个名为 PhoneClaw 的开源项目引起了广泛关注。它另辟蹊径,主打完全离线、不联网、不上传的私人端侧 Agent 理念。今天我们就来深度拆解一下这款能把 Google Gemma 4 真正跑在 iPhone 上的神奇工具。


🛠️ 核心亮点:真正的端侧隐私边界

传统的手机端 AI 助手大多只是个 “云端套壳”,而 PhoneClaw 实现了端侧推理与本地 Skill(技能)调用的完全闭环

  • 绝对的隐私安全:聊天内容、拍摄的图片以及读取的系统数据,默认全部在设备端本地处理,绝不上传到任何第三方服务器。
  • 多模态实时交互(LIVE 模式):支持语音随时打断的自然对话,并且可以开启摄像头,让本地模型 “看到什么说什么”。
  • 基于文件的 Skill 系统:极具扩展性!每一项核心能力都对应一个独立的 Markdown 配置文件(SKILL.md),开发者或高级用户无需重新编译 App 就能直接编写和分发新技能。

💡 内置原生 Skill:用自然语言操控 iPhone

PhoneClaw 的强大之处在于它能通过自然语言直接调度 iOS 的原生能力。得益于跨轮 KV Cache 复用等优化,连续追问时的响应速度极快。目前它已内置了以下实用技能:

1. 智能日程与忙闲分析

你可以直接对它说:“帮我看看这周忙不忙?” 或是 “明天下午两点在高科技园区约了个会,帮我加到日历。” 模型会自动读取或创建日历事件,并为你提供下一步的行动建议。

2. 本地健康数据管理

支持在本地读取 iOS HealthKit 的 9 项核心指标(包括步数、心率、睡眠、活动能量、心率变异性等)。你可以让它“汇总一下我这周的睡眠质量”,它会在本地生成趋势摘要和关键指标说明,数据绝不离网。

3. 日常效率工具

  • 提醒事项“提醒我今晚八点发给老板那份文件”,准时唤起系统通知。
  • 通讯录管理:支持联系人的查询、保存与按手机号自动去重。
  • 系统剪贴板:读写快照,可作为多步复杂任务的数据中转。
  • 全语种翻译:自动识别源语言并进行任意语种互译。

🚀 性能组合拳:从端侧到「Mac 远程推理」

为了适配不同机型的硬件限制,项目在架构设计上非常灵活,主要提供了以下几种模型组合:

模型方案适用场景与机型推荐部署建议
Gemma 4 E2B轻量款。适合日常聊天、翻译、单轮查询。A16 及以上机型即可流畅运行。兼容性最好,支持 CPU / GPU 自由切换。
Gemma 4 E4B完整款。具备复杂的多轮工具对话与 Agent 规划能力。推荐 iPhone 15 Pro 及以上。性能最强,多轮对话更稳定。
MiniCPM-V 4.6多模态款。支持拍照问答以及 LIVE 模式下的摄像头实时识别。推荐 A17 Pro 及以上。视觉交互体验极佳。

💡 硬核外挂:Mac 远程推理(PhoneClaw Gateway)
如果你觉得手机本地跑重模型发热或吃力,项目还提供了一个常驻 Mac 端的服务端组件。在同一局域网下,iPhone 可以一键配对 Mac,把重度推理任务转交给 Mac 上的 Ollama 或本地 CLI 执行,而手机端依然保留原生的操作体验与 Skill 系统!


🛠️ 快速上手与编译指南

如果你想亲自部署体验,项目目前支持 TestFlight 测试,同时也完全开源支持源码构建。

源码构建环境要求

  • 环境:macOS + Xcode 16+ / iOS 17+ / CocoaPods
  • 硬件:iPhone 真机 + 个人 Apple ID

部署三步走

  1. 克隆并安装依赖
    1
    2
    3
    git clone [https://github.com/kellyvv/phoneclaw.git](https://github.com/kellyvv/phoneclaw.git)
    cd phoneclaw
    pod install
  2. 打开工程
    使用 Xcode 打开 PhoneClaw.xcworkspace(切记不要直接打开 xcodeproj)。
  3. 签名与运行
    在 Target 的 Signing & Capabilities 中配置你自己的 Team 和唯一的 Bundle Identifier,连接真机按 ⌘R 编译即可。

🌟 部署小贴士:工程默认采用 “空壳安装” 模式,App 首次跑起来后,直接在手机端的「模型设置」里按需下载对应的 .litertlm 模型文件即可,国内用户还贴心地支持了 ModelScope 镜像加速,无需梯子也能高速下载。


🗺️ 未来展望:通往真正的离线 Phone Agent

翻看项目的后续计划(Roadmap),PhoneClaw 的野心不止于此。它正在向着 “多个本地模型协同工作” 的本地大统领架构演进:

  • 更多原生 API 拓展:文件目录操作、照片库深度检索、备忘录读写等。
  • 跨 App 自动化:利用 App Intents、Shortcuts 以及剪贴板中转,将多步跨应用操作压缩成一条自然语言命令。
  • 多模型协作:引入更小的参数提取模型与更强的规划模型组合。

如果你也对端侧 AI、隐私安全以及智能体感兴趣,不妨去为这个优秀的开源项目点个 Star 关注一下!

👉 项目地址kellyvv/PhoneClaw

说些什么吧!

valine