最近 AI 开发圈被 Anthropic 推出的 Claude Code 刷屏了。

和大家熟知的 ChatGPT 网页端、Cursor 或 VS Code 插件不同,Claude Code 可能是目前最接近“真正 AI 程序员”的终端工具。它不只是在对话框里给你吐几行代码,而是可以直接读取你的本地项目结构、修改文件、在你的终端执行命令,甚至能自己跑测试并根据报错死磕 Bug。它是一个真正的命令行开发 Agent。

但爽快的代价是昂贵的 Claude API 账单。尤其在面对大型项目或多轮 Agent 迭代时,那长上下文的 Token 消耗速度简直是在“烧钱”。

今天这篇博文就带大家空手套白狼:利用开源工具 CC Switch,直接用 Ollama 本地模型接管 Claude Code,实现 100% 免费、免翻墙的本地 AI 程序员体验!


🛠️ 一、前置环境与工具链准备

在开始折腾之前,请确保你的系统里已经安装了基础的 git

1. 安装 Claude Code 官方终端版

首先,把官方的客户端拉下来:

2. 安装 Ollama 并准备本地大脑

前往 Ollama 官方网站 下载并安装最新客户端。 根据你自己的显卡显存大小,对号入座拉取对应的开源大模型底座:


🚀 二、核心桥接:利用 CC Switch 欺骗外壳

因为 Claude Code 默认只认官方的 API 接口,我们需要一个“中间人”来做请求转发。这就是最近社区大火的开源工具 CC Switch

  1. 下载工具: 前往 CC Switch 开源仓库【点击前往】 或 【打包下载】获取最新打包好的程序。
  2. 配置转发层: 打开 CC Switch,严格按照以下参数进行配置:
    • 请求地址(Endpoint): http://127.0.0.1:11434/v1
    • API 格式: 选择 OpenAI Chat Completions
    • 认证字段(Auth Header): 必须选择 ANTHROPIC_API_KEY(让外壳以为在走官方通道)

⚠️ 关键一步:魔改 Claude Code 配置文件

为了让 Claude Code 能在前端正常显示和选择我们转发过去本地模型,必须在它的自定义配置文件末尾强制注入注册表命令。

打开 Claude Code 的配置文件,在末尾加入这行 JSON 映射:

1
"inferenceModels"="[\"haiku\",\"sonnet\",\"opus\"]"

保存并重启服务,CC Switch 就会强行把本地的 Qwen 或 DeepSeek 伪装成 Sonnet 注入到客户端里运行。


💻 三、实测体验:从“聊天盒子”到“赛博打工人”

合体成功后,你在终端里给它一句指令,就能直观感受到 Agent 的恐怖执行力:

测试指令: “帮我生成一个赛博朋克风格的个人主页网站。”

  • 传统 AI 的做法: 给你吐出一堆 HTML 和 CSS 代码,让你自己复制去建文件。
  • Claude Code + Ollama 的做法: 1. 自动在当前目录下分析 package.json 或直接新建临时目录。 2. 自动创建 index.htmlstyle.css 并且写好动态特效脚本。 3. 自动在终端里拉起一个轻量本地服务器。 4. 自动运行并把访问链接丢给你。

这种 AI + IDE + Terminal 三位一体的自动化闭环,才是未来开发工具的终极形态。


🛑 极客复盘:本地模型的底层短板

虽然白嫖很爽,但在实际高强度的重工业项目测试中,本地模型相比顶级的 Claude 3.5 Sonnet 依然存在明显的代差:

  1. 逻辑混乱与死循环: 项目结构一旦复杂(超过十个文件联动),本地模型很容易在多轮 Agent 推理中迷失,出现“改错文件”或“在同一个 Bug 里死循环盲目修改”的现象。
  2. Vision 多模态阵亡: 现阶段 Claude Code 的这套配置链路对图片多模态的支持非常不完整。虽然 Ollama 里的模型支持 Vision,但由于桥接层和客户端本身偏向纯代码流,你丢给它前端 UI 截图时,它经常会抓瞎报错。

📝 总结

本地化的大模型在“绝对智商”上虽然距离闭源大厂还有一段距离,但 Claude Code + Ollama 的组合,完美证明了当开源模型的低成本遇到强悍的外壳 Agent 架构时,能爆发出多么惊人的生产力。对于小型脚本编写、本地 VPS 运维、Docker 部署等场景,这套免费方案已经完全够用。

你用本地显卡调教这套“赛博程序员”时翻车了吗?哪个本地模型的配合度最高?欢迎在评论区留下你的硬核折腾心得!