PokeClaw:基于 Gemma 4 的纯本地安卓 AI 控制器,你的口袋专属智能管家
现在的手机语音助手虽然叫“智能助理”,但大多是写死在系统里的固定程序。你让它定个闹钟还行,但如果你让它“根据我妈刚才发来的微信语境自动回一条”,它基本就傻眼了。而且,目前那些聪明的 AI 代理(Agent)几乎都需要全程联网调用云端 API,这不仅意味着每月高昂的账单,更让人担心私密聊天记录被上传泄露的风险。
今天我要给大家介绍一个极具革命性的开源黑科技——PokeClaw。这里的“Poke”是 Pocket(口袋)的缩写,寓意装在口袋里的 AI。它是首款完全在安卓设备本地运行、能自主控制你手机的 AI 应用。它没有云端,不需要任何 API 密钥,直接靠本地的 Gemma 4 大模型驱动,绝对是 Local LLM(本地大语言模型)玩家不可错过的神仙项目!
项目介绍
PokeClaw 是一款前沿的开源安卓自动化代理应用。不同于传统依赖固定指令的脚本工具,PokeClaw 就像是一个装在你手机里的“本地版 ChatGPT”。
它利用设备端运行的 Gemma 4 大模型,赋予了手机真正意义上的“视觉与理解能力”。它可以实时读取你的屏幕上下文,理解当前正在发生的对话,并自主决定接下来该执行什么操作。目前它虽然还在早期快速迭代阶段,但已经向我们展示了“完全断网、纯本地驱动手机自动回复与操作”的惊人潜力。

功能特色
作为本地 AI 控制领域的先驱,PokeClaw 的特性非常硬核:
| 功能模块 | 具体表现 | 实用价值 |
|---|---|---|
| 纯本地设备端推理 | 搭载最新的本地 Gemma 4 模型,无需任何云端服务器支持。 | 零成本且绝对隐私! 不需要填写 API 密钥,不用担心断网,所有屏幕数据和聊天记录绝不离开你的手机。 |
| 视觉与语境理解 | 不是呆板的代码指令,而是通过读取屏幕内容(如对话上下文)来生成回复。 | 能够像真人一样理解对方的意图,从而做出得体、连贯的自然语言回应。 |
| 应用内自主控制 | (以 WhatsApp 为例)支持自动打开应用、搜索联系人、输入文本并发送。 | 彻底解放双手。你只需下达指令,它会自动完成跨应用的完整操作流。 |
| 后台智能监听与回复 | 可针对特定联系人开启监听,收到消息后自动读取并生成回复发送。 | 堪称“自动回消息外挂”,再也不用担心错过重要对象的突发信息。 |
| 任务闭环与无缝切回 | (v0.4.0 新增)执行完“发送消息”等任务后,会自动返回 PokeClaw 界面。 | 避免用户被卡在目标应用里,随时确认任务是否顺利完成,体验更加丝滑。 |
使用说明
因为 PokeClaw 完全依赖手机本地算力运行大模型,所以对安卓手机的性能(特别是运行内存)有一定要求。如果你想尝鲜,可以按以下步骤操作:
1. 安装与授权
前往项目的 GitHub Releases 页面下载最新的 APK 安装包。安装后,为了让 AI 能够“看”到屏幕并“点击”按钮,你需要根据软件提示,在系统设置中授予它“无障碍服务(Accessibility)”和“屏幕录制/截取”等底层权限。
2. 体验自动回复(监控模式)
在主界面点击对应的功能卡片,准确输入你要监控的联系人姓名(必须与聊天软件里显示的名称完全一致),然后点击开始。PokeClaw 就会在后台静默运行。当该联系人发来消息时,它会读取上下文,用 Gemma 4 思考出合适的回复,并自动模拟点击发出去。
3. 指令驱动(主动发送)
你也可以直接给它下达任务,比如输入“给某某发送一条问候信息”。PokeClaw 会自动调起聊天软件,找到该联系人,打字并发送,然后乖乖退回后台,整个过程就像一个隐形的手指在帮你操作。
项目链接
随着本地端模型的越来越聪明,这种“设备端 AI 管家”必将是未来的大趋势。如果你想提前感受未来,赶紧去 GitHub 围观这个项目吧:
- GitHub 项目主页: https://github.com/agents-io/PokeClaw
- 温馨提示: 目前项目处于高度活跃的开发期,功能主要针对某些特定应用(如 WhatsApp)进行了适配测试。期待未来开发者能解锁更多 App 的控制权!






