零成本落地:在普通手机上跑通谷歌最强 Gemma 4 原生多模态大模型
很多同学以为想折腾本地大模型,非得配一台动辄万元的桌面级大显存 PC。其实随着模型架构的迭代,手机端的算力早已今非昔比。 今天分享的是如何在一台普通手机上,离线跑通谷歌 DeepMind 最新发布的开源旗舰模型 —— Gemma 4。得益于其专门针对移动端优化的轻量化版本(E2B/E4B),内存占用被死死压在了 1.5GB 以下。更硬核的是,它支持原生多模态,在完全切断网络的飞行模式下,依然能流畅实现拍照识物、写前端代码和逻辑推理。 本篇教程将分别针对 Android 和 iOS 双平台,手把手带你完成本地部署。 一、 Android 安卓端部署实操哪怕是配置较低的老款安卓机,按照以下优化参数配置,也能获得相当可观的生成速度。 1. 环境搭建 前往 Google Play 或通过下载站获取支持本地推理的客户端 APK 并安装。 (1)、Google应用商店下载:【点击前往】 (2)、下载安卓APK安装包:【点击下载】或【备用下载】 首次进入应用,点击 Get Started 并通过基础权限认证。 2. 模型下载(Model Hub) 点击左上角菜单进入 Model H ...
显存自由:本地部署 Qwen3.6-35B-A3B 终极无审查多模态大模型
对于喜欢折腾本地大模型的同学来说,官方开源模型虽然聪明,但往往带有层层安全限制,稍微涉及敏感或激进的长文本指令,就会高频触发“抱歉,我无法回答”。 今天分享的 Qwen3.6-35B-A3B Uncensored HauhauCS Aggressive 则是目前社区热度极高的硬核“越狱版”模型。它彻底移除了系统提示词限制与输出过滤。更难得的是,由于采用了 MoE(专家混合架构),虽然总参数高达 35B,但每次运行仅激活约 3B 参数,配合 GGUF 量化,最低 6G/8G 显存 的主流游戏显卡就能流畅跑起来。 本文将手把手带你在本地用 llama.cpp 搭建这套无审查、带多模态视觉(Vision)能力的私有 AI 中心。 一、 核心文件准备在部署之前,我们需要下载对应的模型量化文件与高效的后端推理引擎: 大模型下载:前往 Hugging Face 仓库 搜索并下载 Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 的 GGUF 版本。 模型下载【huggingface 下载】、【网盘打包下载】 24G 显存(如 RTX 40 ...
零成本搭建:用 OpenClaw 将 GPT 大模型免费接入 QQ/微信/Telegram/飞书
想要让 AI 机器人直接在你的常用聊天软件里打工,实现自动回复、智能助理或自动化日常事务,但又不想折腾复杂的 API Key 或者承担高昂的 Token 费用? 开源神器 OpenClaw 正好能完美解决这个痛点。它支持将强大的 GPT 模型免 API 密钥直接对接至 QQ、Telegram、飞书以及 macOS 端的个人微信。本篇教程将手把手带你完成全平台低门槛部署,打造属于你的全能私有 AI 助手。 一、 环境准备与 OpenClaw 安装在正式对接各大社交平台之前,我们需要先在本地完成 OpenClaw 的安装与初始化。 1. 权限配置(Windows 用户必看)如果你使用的是 Windows 系统,首次安装务必先打开 PowerShell 终端,依次执行以下两行命令以解锁运行权限,否则后续的安装脚本可能会直接闪退: 12Set-ExecutionPolicy RemoteSigned -Scope CurrentUserSet-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass 2. 一键安装命令权限设置完成后,根据 ...
告别断连:Cloudflare Zero Trust 终极配置指南(升级 MASQUE 协议)
很多同学在日常使用 Cloudflare WARP 时,经常会遇到“一直卡在连接中”或直接报错断开的情况。这通常是因为传统的 WireGuard 协议流量特征明显,容易受到部分网络运营商的干扰或封锁。 其实,Cloudflare 早已在 Zero Trust(零信任)生态中支持了更高效、更具抗封锁能力的 MASQUE 协议。经过实测,切换到 MASQUE 协议后,不仅连接瞬间恢复,网络速度相比 WireGuard 几乎能提升接近 1 倍,轻松喂饱千兆宽带。 本文将手把手带你白嫖 Cloudflare Zero Trust 的 50 个免费独立席位,并完美开启 MASQUE 隐藏线路。 一、 注册 Cloudflare Zero Trust 免费套餐 登录官网:前往 Cloudflare 官网 注册或登录你的账户。 进入 Zero Trust:在左侧控制台菜单中,点击进入 Zero Trust。首次进入点击“开始使用”。 创建团队名称:自定义一个唯一的 Team Name(团队名称),这会作为你日后客户端登录的唯一凭证。 选择免费方案:套餐选择 0 元免费版(Free Plan) ...
playtranslate 一款专为安卓打造的实时屏幕翻译应用,让普通玩家跳过语言障碍直接享受剧情。
一款专为安卓打造的实时屏幕翻译应用,既能帮语言学习者啃生肉游戏,也能让普通玩家跳过语言障碍直接享受剧情。 Github地址 https://github.com/dominostars/playtranslate 项目功能特性核心翻译能力 一键截屏翻译:点击悬浮按钮,自动识别游戏画面文字并翻译 自动翻译模式:监测对话变化,新文本出现时自动翻译,全程不用手动操作 悬浮词典:把悬浮镜头拖到任意单词上,立刻显示释义 注音辅助:日文显示假名、中文显示拼音,实时标注在原文上方 进阶玩法 物理按键映射:给掌机设备设置按住预览键,按住看翻译/注音,松手恢复原文,完全不影响游戏节奏 双屏适配:支持 Ayn Thor 这类双屏安卓掌机,也支持普通手机的分屏模式,一边游戏一边看翻译 区域裁剪:只翻译对话框、字幕条或你自己框选的任意区域,避开 UI 干扰 学习向功能 Anki 制卡:一键导出句子到 AnkiDroid,包含原文、译文、单词列表、目标词汇和截图,自带主流牌组预设模板 全程离线:OCR 识别和基础翻译不联网,可选下载本地模型实现完全离线 使用方式安装步骤 去 Re ...
别让 AI 限制了你的想象力!2026 年 Claude Code 必装的 10 大神级 Skill 清单
如果装了 Claude Code 却不知道怎么加 Skill,那它顶多算个会写代码的聊天机器人。真正的硬核玩家,早就把自己的终端拉满了各种扩展。 今天给各位“云股东”和极客朋友们盘点 2026 年社区最火的 10 个必装神级 Skill。从底层构建到自动化质检,直接给你的 AI 编码工作流叠满 Buff。 全流程自动化缝合怪:Superpowers 核心痛点: 每次切任务都要换提示词?开发、头脑风暴、TDD(测试驱动开发)不能一气呵成? 极客解析: 这个 Skill 组合了 20 多个原子级能力。无论是前期方案 Brainstorming 还是中期的 TDD 循环,它能全流程丝滑覆盖,目前公认最好用、最全能的基础扩展。 健忘症特效药:Planning with Files 核心痛点: 对话拉得太长,一旦执行 /compact 瘦身或者上下文一压缩,AI 就把之前的全局规划忘得一干二净。 极客解析: 它最大的亮点就是把规划直接写进文件。即便上下文被压缩或者任务中断,Claude 重启后读一下文件,立马无缝找回状态,绝不丢状态。 拯救程序员审美:UI UX Pro Max 核心痛点: ...
别只用来改 Bug!盘点 Claude Code 5 个超高人气热门 Skills(附官方原名)
很多人把 Claude Code 装好之后,就只把它当成一个“高级聊天框”,顶多让它写写简单的逻辑、修修小 Bug。如果你也这么用,那就真的把这个神级工具用矮了。 Claude Code 真正的威力,在于其强大的生态扩展能力。今天给大家盘点 5 个目前社区里人气极高的“神级 Skills”。每个工具我都附带了官方英文原名,大家可以直接在后台搜索、一键安装,让你的 AI 自动化工作流直接起飞。 全能文档阅读解析器:doc-reader在日常开发中,我们经常需要查阅各种第三方的 PDF 说明书、Word 需求文档或者长篇大论的架构设计书。频繁在阅读器和终端之间切换,极其打断思路。 核心功能: 允许 Claude 直接在终端里读取、解析和消化 PDF、Word 等多格式文档。 极客玩法: 把新项目的开发手册丢给它,直接让它基于文档里的最新规范去写代码,再也不用担心 AI 因为“知识库过期”而胡言乱语。 全局代码重构大师:code-refactor当项目跑了几个月,代码变得像“屎山”一样臃肿,想重构却又怕牵一发动全身?把这个脏活累活交给专业工具。 核心功能: 自动化全局代码重构。它能智 ...
别只当聊天工具!解锁 Claude Code 长期开发的 6 个隐藏外挂
很多人刚上手 Claude Code,习惯把它当成一个“加强版的 Terminal 聊天框”——敲个需求,看它写段代码,然后修修补补。如果你也这么用,那就真的亏大了。 要把 Claude Code 真正变成一个能长期并肩作战的 AI 开发搭档,甚至无缝嵌入你的自动化工作流,你必须得榨干它这 6 个隐藏的高阶核心能力。 1. 项目记忆芯片:/init新项目拉下来,别上来就直接提需求。先敲一行: 1/init 这个命令会让 Claude Code 自动在项目根目录生成一个 CLAUDE.md 文件。它就像是给 AI 准备的“项目说明书”,会自动记录你当前项目的技术栈、核心架构、代码规范以及常用命令。 💡 老司机心得: 之后每次启动,Claude 都会先读这个文件。这意味着它天然带了“项目记忆”,再也不会写出违反你项目规范的魔幻代码了。 2. 运筹帷幄:Plan Mode遇到复杂的重构或者大功能开发,直接让它写代码很容易翻车。正确的姿势是先切到规划模式: 操作: 先让 Claude 帮你全盘读取项目架构,拆解开发方案。 核心: 压榨它去判断潜在的破坏性风险和依赖冲突。 执行: 方案 ...
零 Tokens 消耗!Hermes Agent 官方 WebUI 落地:本地联动 Gemma 4 并无缝接入微信
如果你想打造一个完全运行在本地、不需要掏一分钱 API Key 账单、且能直接通过微信随时随地交互的 AI 自动化助理,这套全开源组合就是目前的终极解法:Hermes Agent + 官方 WebUI + Ollama + Gemma 4。 它的核心爽点非常直接:数据 100% 本地化、隐私完全自主可控、没有 Token 焦虑,并且具备真正的 Agent 执行力。 今天这篇指南就带大家从底层环境到微信端对接,把这套赛博助理彻底跑起来。 🛠️ 一、底层基石:部署本地大模型(Ollama + Gemma 4)首先,我们需要为 Agent 准备好本地的“大脑”。 前往 Ollama 官方网站 下载并安装对应系统的最新版客户端。 安装完成后,打开终端,一键拉取 Google 最新的主力开源模型: 1ollama run gemma4 (注:如果你的电脑显存极大,也可以根据需求选择 26B 或 31B 的更大参数版本。) ⚠️ 极客避坑:获取关键的局域网 IPHermes Agent 在后续对接时,无法直接通过 127.0.0.1 访问本地的 Ollama。我们需要获取真实的局域网 ...
彻底告别 Token 焦虑!Claude Code + Ollama 本地最强开发 Agent 落地指南
最近 AI 开发圈被 Anthropic 推出的 Claude Code 刷屏了。 和大家熟知的 ChatGPT 网页端、Cursor 或 VS Code 插件不同,Claude Code 可能是目前最接近“真正 AI 程序员”的终端工具。它不只是在对话框里给你吐几行代码,而是可以直接读取你的本地项目结构、修改文件、在你的终端执行命令,甚至能自己跑测试并根据报错死磕 Bug。它是一个真正的命令行开发 Agent。 但爽快的代价是昂贵的 Claude API 账单。尤其在面对大型项目或多轮 Agent 迭代时,那长上下文的 Token 消耗速度简直是在“烧钱”。 今天这篇博文就带大家空手套白狼:利用开源工具 CC Switch,直接用 Ollama 本地模型接管 Claude Code,实现 100% 免费、免翻墙的本地 AI 程序员体验! 🛠️ 一、前置环境与工具链准备在开始折腾之前,请确保你的系统里已经安装了基础的 git。 1. 安装 Claude Code 官方终端版首先,把官方的客户端拉下来: 官方获取通道:【点击前往】或 【备用下载】 2. 安装 Ollama 并准备 ...










