微信AI生态要来了

2026 年 6 月,距离腾讯内部启动微信 AI 智能体项目整整一年。

2026 年 6 月 2 日,有媒体报道:腾讯正在测试一款内嵌于微信的 AI 智能体原型,最快当月启动合规审批流程,之后将对小范围用户灰度测试,随后逐步全量上线。

根据此前其他媒体的报道,微信 AI 智能体项目是腾讯内部最高优先级的绝密项目,从 2025 年上半年启动至今刚好一年。


去年的伏笔

2025 年 1 月 13 日,腾讯召开 2024 年度员工大会。Pony 首次透露微信将推出 AI 智能体。

再到今年年初的2025年度员工大会,他的表态依然谨慎而克制。

针对微信生态的智能化,马化腾明确表示:“AI 全家桶未必是大家都喜欢的”。他强调,微信将继续坚持”去中心化”原则,以兼顾用户需求和隐私安全的方式来规划微信的智能化。

与此同时,他也释放了一个关键信号——微信 AI 正在开发中了。


一个动作,唤出一个 AI

微信 AI 智能体的交互设计极简——在微信主界面右滑,即可唤出一个对话界面

没有新增的 Tab,没有臃肿的设置页,不需要学习新操作。就是一个简单的滑动动作,你就进入了微信 AI。

在这个对话界面里,你可以用自然语言输入指令。比如:

“帮我找到附近人均 100 以内的川菜店,订两人位。”

“推荐几个适合周末去玩的周边目的地。”

“帮我叫一辆车去浦东机场。”

你不需要打开某个小程序,不需要在小程序里搜索,不需要一步步筛选。你的指令会被智能体理解,然后由它自动调度微信生态内对应的小程序来完成整个服务链路——从搜索、比价到下单、支付,全程无需人工干预。

这就是微信 AI 的核心形态:聊天。

但不同于你日常的聊天,这个聊天窗口连接的是微信内数百万个小程序。


微信不做全家桶,但会做一个AI生态

马化腾在员工大会上的表态,看似矛盾,实则指向同一条路线。

“全家桶未必喜欢”,意味着微信不会像一些竞争对手那样,把 AI 功能粗暴地塞进每一个模块——不在搜索里加 AI 摘要,不在通讯录里加 AI 推荐,不在朋友圈里加 AI 滤镜。微信的智能化,选择了一个集中的、非侵入的方式:一个右滑,一个对话窗口。

这种方式既尊重了去中心化理念————AI 只是一个可选的入口,用户不需要它时完全可以不用——又避免了功能碎片化。

元宝 或者 微信Clawdbot 已经在微信里以”好友”的身份存在了一段时间,可以解析文章、解读文档、分析图片。但微信 AI 智能体是另一回事——它不是聊天机器人,它是服务编排者

两者的关系,更像是”大脑”和”手脚”:元宝负责理解和分析,智能体负责调用和服务。或者说,微信 AI 智能体,可能是腾讯元宝能力在微信生态内的终极形态。


开发者也来了:一键接入,让小程序成为AI的手脚

产品故事讲完了,我们再看另一面:供给侧。

6月8日,微信开发者公众号发布了一则面向开发者的公告——《关于开发者接入微信AI生态的指引》。这意味着,数百万小程序正被正式邀请成为微信AI的”手脚”。也意味着,之前都属于传言的微信AI,正式被官方平台官宣落地。

开发者可以在「小程序管理后台-AI能力」中主动授权接入,平台提供了两种模式:

自动模式几乎是零门槛——授权平台在提审时读取小程序源码,无需额外开发,平台将自动分析你的业务功能并生成可供AI调用的接口。对大多数小程序来说,这几乎是”开一下就行”。

开发模式则面向有定制化需求的团队。开发者基于自家小程序的业务特性,将功能抽象为原子接口原子组件,封装成SKILL供微信AI调用。原子接口是最小的执行单元,封装单一业务功能;原子组件是界面元素;SKILL则是三者的有机组合。

两种模式并不互斥,可以同时开启。自动模式让小白开发者也能一键接入,开发模式让美团、京东这样的巨头可以保持自己的服务逻辑和体验差异化。

目前已经看到京东、美团、携程、滴滴、猫眼率先宣布接入。


最后的思考

微信AI生态的推出,将是微信自视频号推出6年来最大的交互变革。

回顾微信的发展,每一次重大升级都改变了一个行业:公众号改变了信息分发,小程序改变了 APP 生态,视频号改变了短视频格局。而 AI生态,也会是很大的一次。

这大概就是”超级智能助手”的终极形态:不需要记住它叫什么,它就在你手里,随时可用。

正好Apple的Siri AI今天也正式亮相,但国内用户暂时还用不了,对我们来说更接近的可能还是微信AI生态。

10年前,微信小程序开始内测的时候,我写了这篇文章https://mp.weixin.qq.com/s/2LDko87D5h9mMtcfQXGT6w 现在回头看,当时的判断基本都对了。

期待微信AI生态给我们带来更多生活上便利,让现在需要点击很多步的操作,都变成一个个自然语言输入,几秒内完成。

《关于开发者接入微信AI生态的指引》

WWDC26 观后感:苹果把AI塞进了每一个角落

今天凌晨的WWDC26算是近年来最让人期待的一届了。原因很简单————苹果终于把Apple Intelligence画了两年多的”大饼”端上了桌,而主角就是全新升级的 Siri AI。

不过看完整个主题演讲,我最大的感受是:这是一场”AI大于设计”的发布会。


Liquid Glass 的”微调”:iOS 27 设计上的小修小补

如果说去年 iOS 26 是苹果自 iOS 7 以来最大的一次视觉革新(Liquid Glass 液态玻璃),那 iOS 27 就是在这块基石上的精细化打磨

整体来看,iOS 27 并没有带来设计语言上的重大变化。Liquid Glass 的核心视觉风格——半透明、动态反射、光影自适应——基本保持不变。但这次苹果加入了一个非常实用的新特性:全局透明度滑块。

以前 Liquid Glass 的磨砂透明效果是”一刀切”的,喜欢通透感的用户和偏好传统 UI 的用户没法两全。iOS 27 在设置里提供了一个滑动条,用户可以自由调节各 App 中 Liquid Glass 材质的通透程度。从几乎不透明到高度半透明,完全取决于个人审美。

除此之外,iOS 27 还带来了一些细节优化:

  • App 启动速度提升了约 30%
  • 更小的转角半径,系统动画更流畅
  • 全新的 Liquid Glass 材质风格图标

这些改进让 Liquid Glass 从”尝鲜”走向”可用”,但确实不再是一个颠覆性的设计变革。设计的天花板已经在 iOS 26 封顶了,iOS 27 是在做减法而不是加法。


真正的重头戏:Siri AI 的全面重生

如果说 Liquid Glass 是”锦上添花”,那 Siri AI 就是 WWDC26 绝对的”C 位”。

这次 Siri 发生了颠覆性的蜕变:它不再只是一个悬浮在屏幕上的”语音弹窗”,而是被重塑为一个独立的、全天候在线的 AI 聊天应用

独立 App 形态

全新的 Siri 拥有独立的聊天机器人界面——聊天气泡、文字输入框、语音/文字自由切换、历史会话回溯、对话置顶搜索。唤醒 Siri 后,灵动岛会实时显示交互状态。你可以像使用 ChatGPT 一样跟它进行多轮连续对话,它会记住上下文并做关联推理。

基于 Gemini 模型的”大脑”

Siri AI 的核心引擎是苹果与谷歌合作定制的 Gemini 模型,这直接拉高了 Siri 的认知上限。发布会上演示的核心能力可以归纳为五大方向:

能力说明
个人上下文理解能调用你的邮件、信息、日历、行程等个人数据来回答问题
屏幕感知能”看懂”当前屏幕上的内容,并基于此执行任务
跨 App 操作能跨越多个应用自主执行任务
图像理解分析图片内容、解读照片中的场景和文字
广泛世界知识联网搜索、生成图片/邮件/笔记等

个人数据上下文:Siri 真正”认识”你了

这是我最期待的功能。新版 Siri 能够主动读取并理解你的邮件、短信、日历、文件等个人数据。比如你问”朋友推荐的餐厅叫什么?”,Siri 能直接从你的聊天记录里找到答案。这种深度整合 Apple 生态的能力,是其他 AI 助手目前很难做到的。

屏幕感知:Siri 终于”看见”了

Siri 现在能识别当前屏幕上正在显示的内容。比如你在地图上看到一个地址,Siri 可以直接帮你保存到通讯录;或者识别照片中的具体地点,并结合朋友发来的地址信息规划路线。

跨 App 操作:Agent能力的雏形

发布会上,Siri 可以一句话触发多个 App 的连续操作:找餐厅 → 查地图位置 → 设日历提醒 → 发消息通知朋友。这种”一句话跑通多步流程”的能力,就是所谓的代理式(Agent)操作

但说实话,目前的跨 App 操作还比较有限。演示中的场景都是精心设计的”理想情况”,在真实使用中,能否像豆包手机或一些安卓 AI 助手那样真正实现自由的代理操作,还有待观察。苹果这次迈出了第一步,但距离”完全体”还有距离。


Apple Intelligence 2.0:开放生态的野心

除了 Siri 本身的升级,WWDC26 还有一个重大消息:iOS 27 引入了”Extensions”机制,允许第三方 AI 模型接入系统级 Siri。

用户可以选择安装 Claude、Gemini、ChatGPT 等主流 AI 聊天机器人扩展作为 Siri 的 AI 引擎。这意味着苹果终于意识到,单靠自家模型打天下是不够的,开放生态才是未来。

这也是苹果首次在系统层面拥抱第三方 AI 模型,战略意义不言而喻。


最大的遗憾:国行用户暂时用不了

这是整场发布会最大的”意难平”。

苹果在发布会上明确宣布:在中国大陆,Siri AI 和其他 Apple Intelligence 新功能因需配合监管要求,暂不提供。

这意味着:

  • 国行 iPhone 用户在 iOS 27 中体验不到全新的 Siri AI
  • Apple Intelligence 2.0 的第三方 AI 扩展也无法使用
  • 之前 iOS 26 上被锁定的原生 Apple Intelligence 功能依然不可用
  • 国行用户能用的,大概还是调休闹钟

Craig Federighi 在发布会尾声专门对此作了说明,但难掩遗憾。

说实话,从技术角度看,Siri AI 确实是 Apple Intelligence 发布以来最彻底的一次兑现。但对国内用户来说,这波 AI 翻身似乎又一次和自己无关。希望与国内 AI 公司的合作尽快落地吧。


与安卓 AI 助手的对比

维度iOS 27 Siri AI安卓 AI 助手(豆包等)
独立 App✅ 首次推出✅ 已有
多轮对话✅ 支持✅ 支持
屏幕感知✅ 支持✅ 已实现
跨 App 操作✅ 支持(有限场景)✅ 已实现
第三方 AI 接入✅ Claude/Gemini/ChatGPT✅ 开放生态
中文原生优化❌ Gemini 打底✅ 豆包等国产模型
国内生态整合❌ 国行不可用✅ 微信/小程序等

客观来说,国内 AI 助手在中文场景和生态整合上有优势,但 Siri AI 在 Apple 生态的深度整合、多模态能力和全球 AI 模型的前沿性上,确实有了质的飞跃。


总结

iOS 27 的设计层面属于小修小补,Liquid Glass 更加成熟但不再颠覆。真正的重头戏是 Siri AI ——从”语音助手”到”AI 智能体”,从”弹窗工具”到”独立应用”,这十五年来 Siri 经历的最大一次重构

虽然目前的 AI 能力(个人数据上下文 + 屏幕感知 + 有限跨 App 操作)还远未达到”完全体”,离豆包手机那种深度代理操作仍有差距,但这已经足够让人期待未来了。

至于国行用户?别急,再等等吧。

我做了个 Coding Agent 用量统计 App

时间进入到 2026 年 5 月,软件工程领域已经全面引入 Coding Agent,目前一线生产力用得最多的是 Claude Code、Codex、OpenCode。我之前也介绍过我自己现在在本地编程的场景是通过 VS Code 使用 Claude Code 和 Codex。

想知道编程一共用了多少Token

我到底用了多少 token?花了多少钱?(虽然基本都是Coding Plan,但如果按原价看,会感觉赚了)

我还经常想知道「某个项目到底吃了多少 token」。但三个 Agent 各自存数据,散落在硬盘的不同角落。写个脚本统计?能用,但太折腾了。每次想看数据都得重新跑。

所以我做了 TokenScope

TokenScope 是一个 macOS 原生应用。SwiftUI 写的,零外部依赖。

核心思路就一句话:把常用的 Coding Agent 的用量数据拉到一起,统一展示。

它目前支持三个数据源:Claude Code、Codex、OpenCode。原理也不复杂——这些工具在本地都会留下 session 日志,TokenScope 直接读这些日志,解析 token 用量,然后汇总。

不需要 API key,装上就能用。基本功能也不需要联网。

Dashboard:一眼看清用量

打开 App 第一个看到的就是 Dashboard。

图片

最上面是几个关键数字:总会话数、总 token 数、输入 token、输出 token、费用估算(美元)。

下面按来源拆开。Claude Code 用了多少,Codex 用了多少,OpenCode 用了多少。点一下就能筛选。

再往下是柱状图。按天展示 token 消耗,不同颜色代表不同模型。鼠标悬停能看到每天的详细拆解:用了哪些模型,每个模型花了多少钱。

还可以按月展开,看到每个月的总 token、费用、消息数。点开就是每一天的数据。

筛选器很灵活。按日期、来源、模型、token 类型,想怎么看就怎么看。

我每次打开 App 第一件事就是看这个柱状图。哪天用得多,哪天用得少,一眼就能看出来。

Plan额度追踪:不用再切多个网页查看了

这是我自己用得最多的功能。

图片

Claude Code、Codex、Z.ai 三个来源的配额和使用量,实时展示。进度条直接告诉你还剩多少。重置倒计时也有。

以前用着用着突然到 limit,或者就是隔一会儿去刷一下各家的 Usage 页面看看剩余额度。现在随时在 TokenScope 看一眼进度条就心里有数了。

还有费用统计。今天花了多少,最近 30 天花了多少。

如果你有多个 Codex 账号——比如工作账号和个人账号分开——TokenScope 支持多账号切换。OAuth 登录,直接在 App 里搞定。

会话浏览:每条消息的 token 都能查

所有 Coding Agent 的会话都在一个列表里。按时间、来源、项目、消息数、token 数、费用,想怎么排就怎么排。

图片

搜索也方便。想找某个项目的会话,搜项目名就行。

双击一个会话,能看到完整的对话记录。每条消息的 token 拆解都在:输入多少、输出多少、缓存读取多少、缓存创建多少、消耗多少费用。

能看到哪些对话特别费 token。有时候一个复杂任务,Agent 反复尝试,token 就蹭蹭涨。看到具体数字之后,我会更有意识地控制对话长度和 prompt 质量。

价格管理:20+ 模型定价内置

我在 TokenScope 内置了 20 多个模型的定价数据。Anthropic 全系、OpenAI 全系、GLM 全系都有。

所以每个视图都带费用估算。从 Dashboard 到会话详情,token 数旁边永远跟着一个美元数字。

觉得内置价格不准?可以自己覆盖,改成你使用的 API 的实际价格。

几个技术细节

数据存在本地。第一次打开会扫描所有日志文件,之后有缓存,秒开。后台自动刷新新数据。

API key 存在 macOS Keychain 里。这点我很在意,密码类的东西不应该明文存在配置文件里。

纯 Swift 实现,零外部依赖。最低支持 macOS 14。


下载地址:https://github.com/aooyoo/TokenScope/releases 

目前仅支持 M 芯片的 Mac 电脑

这个项目还在持续开发中。感兴趣的话,或者有什么功能建议,欢迎告诉我。

DeepSeek-V4 技术解析:架构革新与 Coding Agent 后训练优化

本文首发于公众号:未来科技

DeepSeek 团队近期发布的 DeepSeek-V4 系列(包括 1.6T 参数的 Pro 版与 284B 参数的 Flash 版)将开源大模型的能力边界推向了百万 token 上下文时代。这份技术报告中最值得深入探讨的,一是其在模型架构层面对长上下文效率瓶颈的系统性突破,二是其在后训练阶段为 Coding Agent 场景所做的针对性优化。本文围绕这两条主线展开。


一、模型架构的创新

DeepSeek-V4 在保留 DeepSeek-V3 的 MoE 框架与 MTP(Multi-Token Prediction)的基础上,引入了三项关键的架构升级:混合注意力机制(CSA + HCA)、流形约束超连接(mHC)以及 Muon 优化器。这三者共同构成了 V4 系列在效率与稳定性上的护城河。

1.1 混合注意力:CSA 与 HCA 的协同

长上下文场景下,注意力机制的二次复杂度是绕不开的瓶颈。V4 没有选择单一路线,而是设计了两种压缩注意力机制并以交错方式部署。

Compressed Sparse Attention(CSA) 走的是”先压缩、再稀疏”的路线。它首先用一个 token 级压缩器将每  个 token 的 KV 缓存合并为一条 entry(V4 中 ),随后通过一个轻量级的 Lightning Indexer 计算压缩 KV 块与 query 的相关性分数,并通过 top-k 选择器(Pro 版选 1024 条)保留最相关的压缩块进行核心注意力计算。值得注意的是,CSA 使用的是 Multi-Query Attention 形式,且 query 的 latent 向量在 indexer 与主注意力之间共享,进一步压缩了计算量。此外,由于 query 的输出维度  较大,V4 还引入了 grouped output projection——先将  个头分成  组,每组先投影到中间维度 ,再合并为最终输出,避免了出口投影成为新的瓶颈。

Heavily Compressed Attention(HCA) 则走极致压缩路线,将每  个 token 合并为一条 entry,但放弃稀疏选择,对所有压缩后的 entry 执行 dense attention。由于压缩比足够大,dense 形式的开销也已被摊薄。

CSA 与 HCA 在 Transformer 层之间交错部署:CSA 保留了局部精细度但有 top-k 上限,HCA 提供了全局视野但分辨率较粗,两者形成互补。再叠加几个工程细节——RoPE 仅作用于最后 64 维并对核心注意力输出施加  位置的逆向 RoPE 以恢复相对位置关系;额外的滑动窗口分支()补偿压缩带来的局部信息损失;可学习的 attention sink logit 允许查询头将总注意力分数压低至接近 0。

效率收益是惊人的。在 1M token 上下文下,V4-Pro 的单 token 推理 FLOPs 仅为 V3.2 的 27%、KV 缓存仅为 10%;V4-Flash 更进一步降至 10% 与 7%。配合 RoPE 维度用 BF16、其余维度用 FP8 的混合存储格式,以及 Lightning Indexer 内部的 FP4 计算,V4 的 KV 缓存在 1M 场景下被压到了 BF16 GQA8 基线的约 2%。

1.2 Manifold-Constrained Hyper-Connections(mHC)

残差连接是 Transformer 信号传递的”高速公路”。Hyper-Connections(HC)通过将残差流的宽度从  扩展到 (V4 中 )提供了一个独立于 hidden size 的扩展轴,但实测中堆叠多层 HC 会出现数值不稳定。

V4 提出的 mHC 的核心思想是将残差变换矩阵  约束在双随机矩阵流形(Birkhoff polytope)上,即满足行和列之和均为 1 且元素非负。这一约束保证了 ,使残差变换是非扩张的(non-expansive),前向与反向传播的数值稳定性都得到加强;同时双随机矩阵集合在乘法下封闭,深层堆叠依然稳定。具体实现上,未约束的原始矩阵  先经过指数变换确保正性,然后用 Sinkhorn-Knopp 算法做 20 次行列交替归一化收敛到流形上;输入与输出映射 、 则用 Sigmoid 限制非负有界。

这种约束同时解决了 HC 的稳定性问题,又保留了它独立于 hidden size 提供额外容量的优势。

1.3 Muon 优化器

V4 在大部分模块上将 AdamW 替换为 Muon——这是 Muon 第一次被用在万亿参数 MoE 模型的全规模训练上。Muon 的关键步骤是对动量矩阵做近似正交化(通过 Newton-Schulz 迭代),其更新方向接近  的形式,相当于把奇异值都拉到 1 附近。V4 采用了两阶段混合 Newton-Schulz 迭代:前 8 步用激进系数  快速逼近,后 2 步用稳健系数  精确收敛到 1。AdamW 仅保留给 embedding、prediction head、RMSNorm 权重以及 mHC 的静态偏置和门控因子。

Muon 与 ZeRO 的兼容性是工程难点——ZeRO 假设元素级优化器允许参数矩阵切片更新,而 Muon 需要完整梯度矩阵做正交化。V4 的解法是 dense 参数用背包算法做矩阵级分桶分配,MoE 参数则按专家粒度展平、跨 rank 均匀分配;MoE 梯度同步还用了随机舍入到 BF16 + 两阶段 all-to-all + 本地 FP32 求和的方案,把通信量减半的同时维持了数值稳健性。

1.4 训练稳定性的实战经验

万亿参数 MoE 训练的不稳定性几乎是普遍现象。V4 报告了两个有效但理论尚未完全清晰的技巧:

  • Anticipatory Routing(前瞻路由):在第  步用当前参数  做特征计算,但路由索引用  的历史参数提前算好。这一解耦打破了”路由异常 → 专家失衡 → outlier 放大 → 路由更异常”的恶性循环。仅在检测到 loss spike 时触发,平时关闭,整体开销控制在约 20%。
  • SwiGLU Clamping:将 SwiGLU 线性分量截断到 、门控分量上界设为 10。简单直接,但实测能消除大量 outlier。

二、Post-Training 阶段针对 Coding Agent 的优化

V4 的后训练流水线整体采用”专家培养 → 统一蒸馏”两阶段范式:先针对数学、代码、agent、指令跟随等不同领域分别训练专家模型(SFT + GRPO 强化学习),再通过多教师 On-Policy Distillation(OPD)将能力合并到统一模型中。这一节聚焦其中与 Coding Agent 直接相关的优化。

2.1 三档推理预算与 Coding 场景的适配

V4 同时提供 Non-think、Think High、Think Max 三种推理模式,每种模式在 RL 训练时使用不同的长度惩罚和上下文窗口,使得同一模型可以根据任务难度选择”思考预算”。对于 coding agent 这种本质上需要长链路推理与多步工具调用的场景,Think Max 模式额外注入一段系统提示,明确要求模型穷尽推理、压力测试逻辑、显式记录所有中间步骤与被否定的假设。从评测结果看,Terminal Bench 2.0 上从 None 模式的 59.1 提升到 Max 模式的 67.9,说明这种推理预算的弹性对 agent 任务有显著收益。

2.2 新的 Tool-Call Schema 与交错思维管理

V4 用一套基于 <|DSML|> 特殊 token 的 XML 风格调用格式替代了传统的 JSON 调用约定。文中明确指出,XML 格式可以有效缓解转义失败、减少工具调用错误——这在长链路 coding agent 中尤其关键,因为单一调用错误会让整条轨迹失败。

更重要的是 Interleaved Thinking 的管理策略升级。V3.2 在每个新用户回合到来时会丢弃之前所有的思考链,每次都要从头重建上下文。V4 利用百万 token 上下文窗口,在 Tool-Calling 场景下完整保留所有回合(包括跨用户消息的)思考内容,让模型在长 horizon 的 agentic 任务中维持累积的、连贯的推理脉络;只在不涉及工具的纯对话场景沿用旧的丢弃策略。对 coding agent 来说,这意味着模型在调试一个长达数十个步骤的修复流程时,不必每次重新理解项目结构与已尝试的方案。

2.3 全词表 OPD:让代码专家的能力无损迁移

OPD 的目标是让学生模型  在自己生成的轨迹上学习多个教师专家(包括 coding 专家)的输出分布,目标函数是加权反向 KL:

以往工作通常将这个 KL 退化为 token 级估计并塞进 RL 框架,但这会带来高方差和训练不稳定。V4 坚持全词表 logit 蒸馏——保留完整 logit 分布做反向 KL,梯度估计更稳,教师知识保留更忠实。

这背后的工程支撑相当扎实:超过十个万亿级教师模型的权重被 offload 到分布式存储按需 ZeRO 式加载;为避免  词表的 logit 物化爆显存,V4 只缓存教师最后一层 hidden state 到中央 buffer,训练时按需通过 prediction head 重建 logits;训练样本按教师索引排序,保证每个 mini-batch 至多一个 prediction head 驻留 GPU。最终 KL 散度由专门的 TileLang kernel 计算。

对 coding agent 而言,这意味着代码专家通过强化学习获得的细粒度能力(错误处理、API 调用习惯、重构判断)能够以接近无损的形式融合进统一模型,而不是被 token 级近似稀释掉。

2.4 RL Rollout 的长上下文与容错支撑

Coding agent 的训练 rollout 经常涉及 50 万 token 以上的长轨迹,且单次 rollout 可能需要数百次工具调用。V4 在基础设施上做了几项关键优化:

FP4 量化集成到 rollout:rollout 与所有 inference-only 前向(包括教师与参考模型)直接使用原生 FP4 权重,而训练步骤用 FP4→FP8 无损反量化模拟,复用现有 FP8 mixed-precision 框架。这显著降低了 rollout 阶段的显存占用与采样延迟。

Token 粒度 Write-Ahead Log 容错:每生成一个 token 立即追加到该请求的 WAL。被抢占时暂停推理引擎、保存 KV 缓存;恢复时基于持久化的 WAL 与 KV 缓存继续解码;即使硬件错误也能通过 WAL 重建 KV 缓存继续。从头重生成会引入长度偏差(短响应更容易在中断中存活,导致模型偏向短输出),WAL 机制从数学上保证了正确性。

DSec 沙箱平台:为 coding agent 的执行环境提供了四种执行底座(Function Call、Container、microVM、fullVM)的统一接口。Container 用 EROFS 按需加载基础镜像,microVM 用 overlaybd 实现快照链,单集群可管理数十万并发沙箱实例。轨迹日志支持抢占恢复时的客户端快进——已完成的命令直接重放缓存结果,避免非幂等操作的重复执行(这在涉及文件系统、网络请求的 coding agent 中至关重要)。

2.5 Coding 评测:从基准到真实研发任务

V4-Pro 在 Codeforces 上拿到 3206 Elo(人类排名约第 23 位),LiveCodeBench Pass@1 达 93.5,是首个在编程竞赛上对标 GPT-5.4 的开源模型。SWE Verified 80.6、SWE Multilingual 76.2、Terminal Bench 2.0 67.9(其 Verified 子集约 72.0),与 K2.6、GLM-5.1 处于同一梯队。

但更值得关注的是 DeepSeek 团队自建的 R&D Coding Benchmark——从 50+ 内部工程师收集 200 个真实任务,覆盖 PyTorch、CUDA、Rust、C++ 跨技术栈的功能开发、bug 修复、重构、诊断,经过质量筛选保留 30 个评测任务。在这个更接近真实工程的基准上:

模型Pass Rate
Haiku 4.513%
Sonnet 4.547%
DeepSeek-V4-Pro-Max67%
Opus 4.570%
Opus 4.5 Thinking73%
Opus 4.6 Thinking80%

V4-Pro 显著超越 Sonnet 4.5、接近 Opus 4.5。在对 85 名 DeepSeek 内部研究员与工程师的调研中,52% 表示 V4-Pro 已可作为日常默认编码模型,39% 倾向于是,反对者不到 9%。被反复提及的不足是偶发的低级错误、对模糊指令的误解与过度思考——这恰好指向后续迭代的方向。


三、小结

DeepSeek-V4 的架构创新可以概括为用结构化压缩换取长上下文效率,用流形约束换取深层稳定性,用矩阵级优化换取收敛速度。CSA + HCA 的混合注意力是当前开源社区在百万 token 上下文方向最系统的工程化方案;mHC 用 Birkhoff polytope 这一漂亮的数学工具解决了 Hyper-Connections 的实战痛点;Muon 在万亿参数规模的成功部署也为后续模型提供了重要参考。

后训练侧,V4 并没有押注单一的 RL 算法奇迹,而是用专家培养 + 全词表 OPD 的两阶段范式,配合 XML 工具调用、跨回合思维保留、token 级 WAL、DSec 沙箱等组合拳,把 Coding Agent 这一长链路、强工程依赖的能力做扎实。R&D 内部基准 67% 通过率与开发者 91% 的正向反馈,比任何公开 benchmark 都更能说明问题。

对从业者而言,V4 给出的最大启示或许是:长上下文与 agent 能力不是独立追求的两件事——只有当注意力效率足够高、推理状态能够持续保留、训练基础设施能容忍长 rollout 与频繁抢占时,agentic AI 才真正具备规模化训练的可能。V4 把这条路径完整地走通了一次。

在 Claude Code 中使用 Claude Opus 4.7 的最佳实践

本文翻译自Claude官方Blog:https://claude.com/blog/best-practices-for-using-claude-opus-4-7-with-claude-code

了解如何利用重新校准的effort级别、自适应思考以及新的默认设置,优化你在 Claude Code 中使用 Opus 4.7 的体验。

  • 类别:Claude Code
  • 产品:Claude Code
  • 日期:2026 年 4 月 16 日
  • 阅读时长:5 分钟

Opus 4.7 是我们目前正式发布的最强模型,适用于编码、企业工作流以及长时间运行的智能体(agentic)任务。它比 Opus 4.6 更善于处理模糊性,在查找 bug 和代码评审方面能力大幅提升,跨会话保留上下文更可靠,并且能够在更少指引下推理出含糊任务的解决方案。

在我们的发布公告中,我们提到两个变化会影响 token 用量:更新后的分词器(tokenizer),以及在更高 effort 级别下(尤其是较长会话的后续轮次)更倾向于深入思考的特性。因此,从 Opus 4.6 切换到 Opus 4.7 时,可能需要做一些调优才能达到最佳性能。对提示词(prompt)和编排框架(harness)进行少量调整,就能带来显著差异。

本文将介绍这些变化,以及如何在 Claude Code 中最有效地使用 Opus 4.7。

组织交互式编码会话

Opus 4.7 的 token 用量和行为表现,会因部署形式不同而有所差异:是部署为单轮用户输入的、更自主的异步编码 agent;还是部署为多轮用户输入的、更交互的同步编码 agent。在交互式场景中,它会在用户每轮输入后投入更多推理:这能在长会话中提升其连贯性、指令遵循度和编码质量,但同时也倾向于消耗更多 token。

要在 Claude Code 中充分发挥 Opus 4.7 的能力,我们建议把 Claude 当作一位你正在委派任务的能干工程师,而不是一位需要你逐行指导的结对编程伙伴:

  • 首轮就把任务说清楚。 明确的任务描述应包含意图、约束、验收标准和相关文件路径,这能为 Opus 4.7 提供产出高质量结果所需的上下文。在多轮中逐步抛出含糊的提示,往往会降低 token 效率,有时也会影响整体质量。
  • 减少必要的用户交互次数。 每一轮用户输入都会增加推理开销。把问题集中起来一次问完,并提供足够上下文让模型能持续推进。
  • 在合适场景下使用 auto 模式 对于你信任模型可以安全执行、不需频繁确认的任务,auto 模式可以缩短周转时间。它特别适合那些你已经在前期提供了完整上下文的长时间任务。Auto 模式现已在 Claude Code Max 用户的研究预览中开放,可通过 Shift+Tab 切换开启。
  • 为已完成任务设置通知。 你可以让 Claude 在任务完成时播放提示音,它能基于钩子(hook)机制创建自己的通知。

Opus 4.7 推荐的 effort 设置

Claude Code 中 Opus 4.7 的默认 effort 级别现在是 xhigh。这是一个介于 high 和 max 之间的新级别,让用户在难题上能更精细地权衡推理深度和延迟。我们建议大多数智能体编码工作使用 xhigh,尤其是对智能要求高的任务,例如设计 API 和 schema、迁移遗留代码、评审大型代码库。

各 effort 级别的进一步指引如下:

  • medium 和 low:适用于对成本敏感、对延迟敏感或范围明确的工作。模型在更难的任务上能力会比高级别时弱,但仍优于同 effort 级别下的 Opus 4.6——有时还会消耗更少 token。
  • high:在智能与成本之间取得平衡。如果你在并发运行多个会话,或想在质量没有大幅下降的前提下节约开销,可选择 high。
  • xhigh(默认,推荐):大多数编码和智能体使用场景的最佳设置。它具备强自主性和高智能,又不会像 max 那样在长 agent 运行中产生失控的 token 消耗。
  • max:在真正困难的问题上能再榨出一些性能,但回报递减,且更容易出现过度思考。建议有意识地用于例如:在 evals 中测试模型能力上限、对智能极度敏感且不计成本的任务等。

如果你正在升级到新模型,我们建议你尝试不同 effort 级别,而不是简单沿用旧设置。同一任务期间也可以在不同 effort 级别间切换,以更高效地管理 token 用量和推理深度。

我们之所以将 Opus 4.7 的默认 effort 设为 xhigh,是因为我们认为这是绝大多数编码任务的最佳设置。如果你是已有的 Claude Code 用户但没有手动设置 effort 级别,系统会自动将你升级到 xhigh。你仍然可以手动调整。

适应自适应思考(Adaptive Thinking)

Opus 4.7 不支持带固定思考预算的 Extended Thinking。 取而代之的是自适应思考(adaptive thinking)。它让”思考”在每一步都成为可选项,模型可以根据上下文自行决定何时投入更多思考。它能快速回应简单查询、在某一步用不上思考时跳过思考,并把思考 token 投入到最可能产生价值的地方。在一次完整的 agent 运行中,这能积累成更快的响应速度和更好的用户体验。

本次版本中,自适应思考有显著改进——尤其是 Opus 4.7 不再那么容易过度思考。

如果你想更精细地控制思考频率,可以直接在 prompt 中明确要求:

  • 想要更多思考时,可以这样写:”在回答前请仔细、按步骤思考;这个问题比看上去更难。”
  • 想要更少思考时,可以这样写:”优先快速作答,而不是深入思考。拿不准时直接给出答复。”这样能节省 token,但在更难的步骤上可能损失一些准确性。

值得了解的行为变化

Opus 4.6 与 4.7 之间有一些默认行为发生了变化。如果你为旧模型精心调校过 prompt 或编排框架,这些变化值得关注。

回复长度会按任务复杂度校准。 Opus 4.7 不像 Opus 4.6 那样默认啰嗦。简单查询会得到更短的答案,开放式分析则会得到更长的回应。如果你的使用场景依赖特定的长度或风格,请在 prompt 中明确说明。我们发现,提供你想要的语气的正面示例,比”不要这样做”的负面指令效果更好。

模型调用工具的次数变少,推理变多。 在很多情况下这反而带来更好的结果。如果你想要更多的工具使用(比如在 agent 工作中更激进地搜索或读取文件),请明确说明何时以及为何应该使用该工具。

默认情况下,它派生子 agent 的次数变少。 Opus 4.7 在何时把工作委派给子 agent 这件事上更加审慎。如果你的使用场景能从并行子 agent 中受益(例如对多个文件或独立条目并行处理),建议明确写出来。例如:

不要为单次响应中可以直接完成的工作派生子 agent(例如重构一个你已经能看到的函数)。当需要并行处理多个条目或读取多个文件时,在同一轮中派生多个子 agent。

接下来可以尝试什么

Opus 4.7 在长时间运行的任务上比此前模型表现更好。这让它非常适合那些过去因为需要持续监督而成为瓶颈的任务,比如复杂的多文件改动、含糊的调试问题、跨服务的代码评审,以及多步骤的智能体工作。

我们建议把 effort 保持在 xhigh,看看你的第一轮输入能把任务推进到多远。

更多内容请参阅我们的 Opus 4.7 提示词指南,以及关于 Claude Code 中上下文与会话管理的文章。

我做了个 Chrome 插件,让 AI 编程时修改页面变得更容易

大家好,我是 Jerry 👋

今天想跟大家分享一个我刚发布的小工具——Coding Agent Communicator


🤔 痛点

相信很多同学在使用 AI 编程助手(比如 Cursor、Claude Code)的时候,会有这种感觉:

“AI 生成的代码是能跑,但我想在某个具体位置加个标注,告诉它’这里要改’,该怎么表达?”

截图画红圈?贴代码?描述具体位置?

太累了。


💡 解决方案

Coding Agent Communicator 就是来解决这个问题的。

它是一个 Chrome 插件,安装之后,你可以:

  • • 🖍️ 在页面上直接选取元素并标注,指出要修改的地方
  • • 💬 添加可视化注释
  • • 🤖 把这些信息一键复制后发送给你的 Coding Agent

就像这样:

点选一个元素:”这里改成圆角” → 复制 → 发送 → AI 自动理解并修改

所见即所得,所想即所得。指哪改哪。


🎯 像谁?

如果你用过 VisBug,可能会有熟悉感。但它的定位更偏向”设计debug”,而 Coding Agent Communicator 是专门为 AI 协作场景设计的:

  • • 标注更精准(支持 CSS 选择器定位)
  • • 集成更深度(直接对接 Coding Agent)
  • • 操作更丝滑(一键复制发送,包含控制台报错信息)

📦 怎么用?

  1. 1. 打开 Chrome 浏览器
  2. 2. 访问 Chrome Web Store 安装(https://chromewebstore.google.com/detail/coding-agent-communicator/enegomjnlhjlfefoofggbdmcnbjpcnfl
  3. 3. 点击插件启动 → 选择页面元素进行标注
  4. 4. 写注释、复制、发送

完全免费,无需配置,装好就能用。


🧪 未来计划

目前是 v1.0,基本功能已经跑通。

如果你有想法,欢迎来 GitHub 提 Issue 👇

GitHub – aooyoo/coding-agent-communicator


🙋‍♂️ 最后

做这个插件的契机很简单:我在用 Cursor/Claude Code 的时候,总觉得”表达我要什么”比”写代码”还累。

希望能帮到有同样困扰的同学。

如果你觉得有意思,求个转发~ 🌟

谢谢大家!

春节期间我做了个 Agent 客户端:TurboClaw

正月初八,开工大吉!

Claude Code 发布正好一周年了。

这一年,CLI Agent 帮我们搞定了不少 coding 和系统维护工作。

直到上个月 OpenClaw 爆火,我们正式进入了个人 Agent 时代。

但说实话,OpenClaw 使用门槛有点高。

安装部署麻烦,用起来也偏技术,普通人根本玩不转。

春节期间突发奇想,我就做了这个东西。

图片

TurboClaw 是什么

TurboClaw 是最新的个人 Agent 客户端。

说白点,把用 OpenClaw 类 Agent 的门槛直接降到 0。

安装包只有 10MB,下载就能用。

自带免费基础模型,不用配置大模型 API Key 也能跑。

内置实用热门skills,开箱即用。

图片

能干什么

本地文件访问、编辑、整理、系统级命令行权限,这些都有。

你可以用它整理桌面、清理缓存、操作任意文件夹。

它支持个性定制、长期记忆、主动性的心跳机制、定时任务。

多会话管理、多模型、多语言,也都支持。

最爽的是,可以用你熟悉的聊天 App 随身控制。

图片

接入聊天软件

Telegram、Discord、飞书、钉钉、QQ,这些消息应用都支持。

设置里填个 Token 或 App ID,就能开启远程控制模式,立即拥有随时待命的AI同(niu)事(ma)。

新手友好,连 @BotFather 创建机器人都有提示。


模型选择

支持 Zhipu(智谱)、OpenAI、Anthropic、DeepSeek、OpenRouter 这些主流供应商。

默认内置 glm-4.7-flash,开箱就能免费体验。


下载使用

目前只支持 Apple Silicon 的 Mac。

下载地址:https://github.com/aooyoo/TurboClaw/releases/tag/v1.0.0(点击阅读原文直接前往)

安装很简单,双击解压,把 app 拖到应用程序文件夹就行。

首次打开如果提示「无法验证开发者」,点击「完成」后到系统设置-隐私与安全性中选「仍要打开」就行。


源码开源

源码我也开源了:https://github.com/aooyoo/TurboClaw

有问题或者有功能建议,欢迎交流。

10分钟上手 Clawdbot/Moltbot/OpenClaw:需要给它配备个电脑的AI Agent

在本文截稿时,Clawdbot官方已经宣布更名为MoltBot,如果接下来你在其它地方看到MoltBot,那也是它。

前言:这两天它太火了,不用焦虑,先看看我的体验

上个月在 X 上就刷到过 Clawdbot 的讨论,那时候 Claude Cowork 都还没出。

说实话,第一眼看到这个项目时,我有点怀疑:又是哪个轮子?

真正让我决定试试的,是 Youtube 上看到一个硅谷的博主推荐,他专门买了个mac mini来跑。

于是我在一台老 Intel MacBook 上装了 Clawdbot。(先说,不用另买mac mini,老mac/vps/树莓派/WSL2都行。至于为什么不推荐在主力电脑上安装,主要是因为它权限太高,容易把你的工作环境弄坏。)

然后就开始踩坑。

官方的安装命令在 macOS 11.7 上直接编译失败,Node.js 依赖各种报错。折腾了一晚上,最后手动装了 nvm 和 Node.js 22.0 搞定。

如果你也遇到了同样的问题,直接跳到「安装前准备」那一节,我写了详细的解决方案。

装完之后,我真香了。


一、Clawdbot 到底是什么?

Clawdbot 本质上是一个基于 CLI 的桌面 Agent,但它打通了 Telegram、WhatsApp 这些消息服务。

啥意思呢?

你可以在手机上给 Telegram 发一条消息,家里的电脑就开始干活了。

和 Claude Code 的核心区别:

特性ClawdbotClaude Code
消息集成✅ Telegram/WhatsApp/Discord等❌ 无
远程控制✅ 随时随地❌ 只能本地
记忆系统✅ 改进版会话级
本地权限✅ 更多受限/请求授权
费用✅ 使用现有订阅(ChatGPT/GLM等)Cowork 需会员

说白了,它就是一个「随时能联系上的 AI 助手」。


二、安装前准备(重要!)

前置要求

  • Node.js >= 22(注意版本!
  • macOS / Linux / Windows (WSL2)

⚠️ 常见坑:Node.js 版本问题

如果你用的是老版本 macOS(11.7 或更早),官方安装命令大概率会失败。

我的报错是这样的:

gyp ERR! build error
gyp ERR! stack Error: `make` failed with exit code: 2

解决方案:手动安装 Node.js 22

# 1. 安装 nvm
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.0/install.sh | bash
 
# 2. 重新加载终端配置
source ~/.bashrc  # 或者 source ~/.zshrc
 
# 3. 安装 Node.js 22
nvm install 22
nvm use 22
 
# 4. 验证版本
node --version  # 应该显示 v22.x.x

为啥不用官方的 Node.js 安装包?

因为老版本 macOS 上,某些原生依赖编译不过。官方安装包24+在老版本上也不支持。nvm 会下载预编译的二进制文件,直接绕过这个问题。


三、快速安装(10 分钟)

官方安装命令

curl -fsSL https://clawd.bot/install.sh | bash

或者用 npm:

npm install -g clawdbot@latest

Windows 用户(PowerShell):

iwr -useb https://clawd.bot/install.ps1 | iex

验证安装

clawdbot --version

如果能看到版本号,说明安装成功了。


四、配置向导(3 分钟)

Clawdbot 提供了一个 onboarding wizard,会一步步引导你配置:

clawdbot onboard --install-daemon

向导会让你选择:

1. Gateway 模式

  • Local(推荐):Gateway 运行在本机,适合个人使用
  • Remote:Gateway 运行在远程服务器,适合 24/7 运行

2. 模型和授权

  • OpenAI OAuth(推荐):登录 ChatGPT 授权即可
  • API Key:使用自己的 API Key(支持 OpenAI/Anthropic/其他)

我用的是 GPT-4,直接用 ChatGPT 登录授权就行。

3. 消息渠道配置

  • WhatsApp:扫码登录(类似微信网页版)
  • Telegram:创建 Bot 并输入 Token
  • Discord:创建 Bot 并输入 Token

强烈推荐先用 Telegram 试手,因为配置最简单。

4. 后台服务

向导会问你要不要安装后台服务(launchd/systemd),建议选 Yes

这样 Clawdbot 会开机自启动,不用每次手动运行。


五、连接 Telegram(核心功能)

第一步:创建 Telegram Bot

  1. 在 Telegram 里搜索 @BotFather
  2. 发送 /newbot
  3. 按提示输入 Bot 名称(比如 MyClawdbot
  4. BotFather 会给你一个 Token,类似这样:
1234567890:ABCdefGHIjklMNOpqrsTUVwxyz

复制这个 Token,一会要用。

第二步:在 Clawdbot 中配置

如果你用了 onboarding wizard,直接在向导里输入 Token 就行了,超简单。

如果已经完成了向导,想手动加一个 Telegram Bot,可以这样:

# 编辑配置文件
nano ~/.clawdbot/clawdbot.json

添加 Telegram 配置:

{
  "channels": {
    "telegram": {
      "token": "你的_Bot_Token"
    }
  }
}

第三步:启动 Gateway

clawdbot gateway --port 18789 --verbose

如果安装了后台服务,Gateway 应该已经在运行了。可以用这个命令检查:

clawdbot status

第四步:第一次对话

  1. 在 Telegram 里搜索你刚创建的 Bot
  2. 发送任意消息,比如 hello

重点来了:第一次对话会返回一个 pairing code(配对码)。

别慌,这是正常的。Clawdbot 默认开启安全模式,陌生 DM 需要手动批准。

批准配对:

clawdbot pairing approve telegram <配对码>

然后你再发一条消息,Bot 就会正常回复了。


六、验证和使用

检查状态

# 查看 Gateway 状态
clawdbot status
 
# 健康检查
clawdbot health
 
# 安全审计
clawdbot security audit --deep

打开 Dashboard

Clawdbot 提供了一个 Web 控制面板:

clawdbot dashboard

然后在浏览器打开 http://127.0.0.1:18789/

你可以在 Dashboard 里:

  • 查看所有会话
  • 发送测试消息
  • 配置 Agent
  • 查看日志

远程控制

现在你可以:

在手机上给 Telegram Bot 发消息:

帮我看看 ~/Documents 里有什么文件

家里的电脑就会执行这个命令,然后把结果发回给你。

这太爽了。


七、实用技巧

1. 保持 Gateway 持续运行

如果你用的是 macOS,后台服务会自动管理。

如果想手动启动:

# 前台运行(调试用)
clawdbot gateway --verbose
 
# 后台运行
clawdbot gateway --daemon

2. 查看日志

# 实时查看日志
tail -f /tmp/clawdbot/gateway.log
 
# 或者用 clawdbot 命令
clawdbot logs --follow

3. 配置文件位置(记一下,有用)

  • 主配置~/.clawdbot/clawdbot.json
  • 工作区~/clawd(存放你的 skills、prompts、memories)
  • 凭证~/.clawdbot/credentials/
  • 会话历史~/.clawdbot/agents/<agentId>/sessions/

4. 更新 Clawdbot

# 如果你用的是安装脚本
curl -fsSL https://clawd.bot/install.sh | bash
 
# 如果你用的是 npm
npm update -g clawdbot@latest

八、常见问题

Q1: Telegram Bot 不回复?

原因 1:没批准配对码(最常见)

clawdbot pairing list telegram
clawdbot pairing approve telegram <配对码>

原因 2:Gateway 没运行

clawdbot status
# 如果显示 "stopped",启动它
clawdbot gateway --daemon

原因 3:没配置模型授权

clawdbot onboard  # 重新配置模型和授权

Q2: 如何更换模型?

编辑配置文件:

nano ~/.clawdbot/clawdbot.json

修改模型配置:

{
  "models": {
    "defaults": {
      "provider": "openai",
      "model": "gpt-5.2"  // 或其他模型
    }
  }
}

然后重启 Gateway:

clawdbot gateway restart

Q3: 能同时在多个渠道用吗?

可以。

Clawdbot 支持同时连接 WhatsApp、Telegram、Discord 等多个渠道,想配几个配几个。

配置方式都和 Telegram 类似,在 onboarding wizard 里依次配置就行了。


九、为什么我现在介绍它?

和 Claude Code 对比

场景ClawdbotClaude Code
远程任务✅ 手机随时发任务❌ 必须在电脑前
24/7 待命✅ 家里电脑一直开着❌ 同上
消息集成✅ Telegram/WhatsApp❌ 无
编程能力✅ 完整文件操作✅ 同样强大
Skills 生态✅ 兼容 MCP✅ 更成熟

我的结论:

  • 如果你主要在电脑前用 Claude Code,继续用就行
  • 如果你需要远程控制随时发任务,Clawdbot 更香

和豆包手机对比

这是两个不同的技术路线:

Clawdbot豆包手机
路线CLI AgentGUI Agent
操作方式命令行图形界面
适用场景开发者、系统操作普通用户、手机操作

它们不是竞争关系,而是互补。

我相信未来会出现两者结合的方案。


十、适合谁用?

✅ 推荐人群

  1. 需要远程控制电脑的开发者
    • 随时随地查看服务器状态
    • 手机上发任务,家里电脑执行
  2. 重度 Telegram/WhatsApp 用户
    • 喜欢在聊天软件里直接操作
    • 不想切换到专门的 AI 应用
  3. 对 Claude Code 的限制不满的人
    • Cowork 要付费
    • 想要更多本地权限
    • 需要更好的记忆系统
  4. 喜欢折腾的技术爱好者
    • 愿意花时间配置
    • 想要完全掌控自己的 AI 助手

❌ 不推荐人群

  1. 完全不熟悉命令行的用户
    • 虽然有向导,但还是需要一点 CLI 知识
    • 可以先学学命令行基础
  2. 只需要偶尔用 AI 的人
    • 如果只是偶尔问问题,ChatGPT 网页版就够了,别折腾
    • 够用就好
  3. 对隐私极度敏感的人
    • Clawdbot 需要授权访问文件系统
    • 虽然是本地运行,但如果你很在意这个,要考虑清楚
    • 安全第一

十一、最后:我的真实体验

装好 Clawdbot 之后,我最大的感受是:

随时能联系上的 AI,真的不一样。不是一点点的不同,是「完全不同物种」的那种不一样。

以前用 Claude Code,我得:

  1. 打开电脑(如果电脑没开的话)
  2. 打开终端
  3. 输入命令
  4. 等结果

现在用 Clawdbot:

  1. 掏出手机,Telegram 发一条消息
  2. 该干嘛干嘛,等它干完活通知我

体验完全不同。

听起来好像差别不大?

但你试过在外面突然想起来「哎呀,家里有个脚本没跑」,掏出手机就能操作,就知道有多爽了。

而且它本身完全开源且免费,用你现有的AI订阅连接上即可。

如果你之前对 Claude Code、Claude Cowork 又爱又恨,那 Clawdbot 值得认真试一试。


十二、快速开始

安装(10 分钟左右,需要本地编译依赖):

curl -fsSL https://clawd.bot/install.sh | bash

配置向导(3 分钟):

clawdbot onboard --install-daemon

启动 Gateway:

clawdbot gateway --daemon

然后在 Telegram 上给你的 Bot 发第一条消息。

试试看,你会有惊喜。


参考资源

  • 官方文档:https://docs.clawd.bot/
  • GitHub 仓库:https://github.com/clawdbot/clawdbot
  • Reddit 讨论:Clawdbot: the full setup in 30 minutes
  • Medium 教程:How to Set Up Clawdbot

作者的话:这篇文章是基于我的真实安装经历写的。如果你在安装过程中遇到问题,欢迎在评论区交流。

2025年的碎碎念

年更文来啦,2025年的合集——

今年因为有了更好的AI,做了更多事情。可以称为Agent元年了,助手们都升级成了Agent:ChatGPT、Gemini+NotebookLM、Claude Code、Manus。

今年,做了近30个大大小小的demo,去复现、去学习、去思考创新。

今年,写了52期AI大模型动态周报,完成了又一年的AI编年史。

1月

2025-01-02 13:05:12
芒果tv app竟然没有湖南卫视直播

2025-01-05 14:09:01
闪念胶囊AI版

2025-01-07 18:58:57
Time Machine用移动硬盘,就老是要忘记备份

2025-01-08 11:32:51
飞书的会议后智能纪要和近期会议总结,完全就是AI秘书了,秒杀实习生……

2025-01-10 14:29:31
微信啥时候能支持会话分组啊,现在要变相实现的话只能把工作群全丢到折叠的群聊里

2025-01-11 09:43:03
ICS、纪实人文、七彩戏剧三个频道停播,在东方有线和电信IPTV被直接跳过,看看新闻把ICS直播替换为了ShanghaiEye,纪实人文替换为了新纪实(轮播东方卫视制作的纪录片)

2025-01-11 21:21:42
飞机两个黑匣子数据可以实时流式传输到服务器备份,航班执行完成后则删除

2025-01-11 21:25:05
五星体育广播、KFM981、浦江之声广播三套广播频率停播

2025-01-12 13:22:50
#nowplaying 许卿安 – 周深

2025-01-13 09:51:19
摸鱼神器:https://iwoso.co/hotnews

2025-01-14 16:39:47
Ollama几乎可以让任何8GB及以上内存的PC变成AI PC

2025-01-19 00:40:56
凌晨12点的宝安机场就跟晚高峰一样🤪

2025-01-19 00:43:22
原来开启了面容锁的app,桌面小组件也会被删掉/无法添加(合理但好像少了提示

2025-01-20 01:00:46
有人在小红书评论区写了一句hack prompt,大模型翻译时遵循了这句prompt😂

2025-01-21 19:57:47
今天热到什么程度呢?就是在餐厅吃饭脱了外套,然后走的时候走出来很远了,都没有发现外套忘了带。

2025-01-24 14:23:40
ChatGPT Operator的演示中用到的服务都是web的(browser use),湾区生活中的主流服务,包括opentable、instacart、stubhub、thumbtack、doordash,没有演示跨服务的操作。

2025-01-24 14:28:57
https://www.youtube.com/watch?v=CSE77wAdDLg

2025-01-26 12:57:28
DeepSeek-R1已经被Ollama放在首页第二位推荐了

2025-01-26 13:19:33
DeepSeek官方线上版本比开源的效果好,本地跑的7b的版本我觉得不如qwen2.5,可能要更大参数,但我设备性能不够了

2025-01-27 18:15:06
过年期间亲戚聊天内容来自大家平时刷的短视频😳

2025-01-28 23:53:03
春晚直播信号版本:高清、超高清HDR、竖屏、听觉无障碍、视觉无障碍、CGTN版
春晚视频号:竖屏+后台
春晚小红书:大家的春晚

2025-01-30 16:08:39
过年期间给不方便科学上网的朋友按头安利了DeepSeek

2月

2025-02-01 09:33:32
测试了两道此前仅有r1和o1做对的数学题,免费的o3-mini都做对了,且推理速度和输出速度极快!真卷啊

2025-02-02 07:39:41
siliconflow在华为昇腾芯片的集群上部署了deepseek-r1推理服务!

2025-02-03 10:38:28
https://www.setn.com/News.aspx?NewsID=1603533

2025-02-03 12:46:16
在飞机上读paper,配合本地LLM可以轻松翻译加查询讨论

2025-02-03 14:56:00
sam altman正在东京跟孙正义对谈。今天早上OpenAI宣布的Deep Research也是在东京办公室发布的。

2025-02-05 14:20:53
除了openwebui,Enchanted客户端是mac上最好的ollama UI

2025-02-06 17:11:12
16G内存的mbp,本地部署ds有两种方案:
1、Ollama + deepseek-r1:14b + chat app,chat app推荐CherryStudio
2、LM Studio + deepseek-r1:7b去审查版gguf模型

2025-02-06 23:24:06
哪吒2的第一出品方是成都的公司,导演也是四川人

2025-02-07 08:49:42
GTA6今秋发布 https://a.jump-game.com/wapp/p/537313

2025-02-07 14:18:46
看完哪吒2,想起《十万个冷笑话》,又翻出来看了一遍,真是经典啊 https://www.bilibili.com/bangumi/play/ep12087/

2025-02-09 11:28:48
微博b站抖音毛象都能多点登录,小红书还不能

2025-02-09 15:18:06
Deepsex 离谱 https://huggingface.co/spaces/ValueFX9507/Tifa-Deepsex-Cot-14B

2025-02-10 14:41:05
双流T1翻新完毕,2月24日恢复运营,成都再次回到两场4航站楼1卫星厅

2025-02-10 14:43:08
https://unsloth.ai/blog/r1-reasoning

2025-02-11 11:59:02
https://www.bbc.com/zhongwen/articles/cgmyp4dpykzo/simp

2025-02-12 18:27:13
huggingface上这么多model的下载量,带宽得多大。。

2025-02-12 19:07:59
https://www.bilibili.com/video/BV1bnNDeFELK/
https://www.xiaoyuzhoufm.com/episode/67a1b697247d51713c868367

2025-02-13 19:11:36
哪吒2突破百亿票房

2025-02-13 22:14:31
【大神Andrej Karpathy最新讲座:深入探讨ChatGPT类大语言模型-哔哩哔哩】 https://b23.tv/pjyRR5g

2025-02-16 21:11:49
GPT-4.5、Claude4、Grok-3都快来了

2025-02-17 09:54:01
大部分伸手党已经会用AI搜索了

2025-02-17 09:55:07
网球初体验:因为乒乓球和羽毛球的思维惯性,老是接球发力和打高球。

2025-02-17 12:14:14
两周过去了,DeepSeek-R1-671b在ollama上的两个量化版本,Q2.51/Q1.58,都超过了5万下载量。也就是说有超过10万台192GB以上内存的设备都部署了满血版。

2025-02-24 08:41:21
https://anyvoice.net/zh/ai-voice-cloning

2025-02-24 10:49:37
俄乌战争三周年。

2025-02-24 20:55:35
Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型,也是首个能进行“扩展思考”的 Claude 模型。

2025-02-26 10:11:51
特斯拉FSD就这么突然的在国内推送了,V13.2.6版本。
官方更新公告中称为“城市道路Autopilot”。此前已购买FSD且为HW4的焕新3和model s/x plaid已经收到2024.45.32.12推送。
目前看起来跟北美的纯视觉端到端版本是一样的,并未针对中国道路做训练,无法识别实线、待转区和部分掉头车道。

2025-02-26 10:49:52
本次更新恰好在春节EAP赠送到期和焕新Y开启交付的时间。焕新Y应该交付即可支持。
马斯克称特斯拉使用了公开可用的中国道路和交通标志视频,通过创新的视频模拟环境对FSD进行了训练。

2025-02-27 10:05:53
在人工智能逐步替代标准化工作的趋势下,”长尾工作”正成为人类保持经济价值的核心领域。这些需要复杂认知、情感互动和创造力的工作类型,构成了未来人类就业的护城河。

2025-02-27 15:55:03
回看o1-preview刚发布时的推理过程reasoning_content,是分要点展示的
https://www.techradar.com/computing/artificial-intelligence/chatgpt-o1-preview-can-solve-riddles-faster-than-me-and-i-kind-of-hate-it-for-it

3月

2025-03-05 19:43:26
iOS18.4 已经可以显示5Ga的信号了

2025-03-06 11:43:21
https://mcp.composio.dev/

2025-03-07 19:28:34
Manus用到的模型是Claude和微调后的Qwen

2025-03-08 17:16:08
看《猫猫的奇幻漂流》像在玩《stray迷失》

2025-03-09 00:58:46
难哄 虽然剧情槽点很多,但台湾导演的拍摄风格、剪辑、视觉都不错,每首ost音乐也很棒,是一部质量很好的纯爱剧。

2025-03-10 18:26:34
modelscope的模型上传流程,跟huggingface差了两条街

2025-03-11 01:03:34
ImageNet数据集与竞赛开启了深度学习浪潮之后,每个时代都有自己的当红榜单指引着最前沿技术的发展:
BERT时代是语言理解基准CLUE、SpuerCLUE。
随后ChatGPT、Claude、Gemini已经刷爆了考验各学科知识的MMLU、以及用户盲选投票的LLM Arena大模型竞技场。
o1/r1/QwQ类推理模型正在比拼数学(AIME、FrontierMath)、博士级别理科题(GPQA)、编程/软件工程能力(Codeforces、SWE-bench、LiveCodeBench)。
而智能体刷GAIA,似乎正在成为行业最新共识。

2025-03-11 15:46:29
火山引擎开源的这些AI应用 质量都不低
https://www.volcengine.com/product/ai-app-lab

2025-03-13 17:54:19
自此,美国芯片企业中,英特尔CEO陈立武、英伟达创始人兼CEO黄仁勋、AMD董事长兼CEO苏姿丰、博通总裁兼CEO陈福阳、MPS芯源系统创始人兼CEO邢正人、安霸总裁兼CEO王奉民等,均为华人。
(三个台湾,两个马来西亚,一个大陆

2025-03-16 20:39:51
塞尔吉尼奥在国足队内跟蒋光太粘在一起嘛

2025-03-17 01:20:31
VOA因为川普的行政令都停播了

2025-03-17 11:15:39
https://lookup.icann.org/zh
RDAP查询工具(新版WHOIS)

2025-03-17 17:02:08
Grok和Gemini的深度研究都还挺好用的

2025-03-17 19:05:40
FSD在中国大陆开启一个月免费体验活动,将推送给所有符合条件的车辆(目前尚不确定是否包含HW4以下的车辆)

2025-03-18 11:15:28
Manus也是一种自动驾驶。

2025-03-18 19:00:58
我的第一个Manus case回放: https://manus.im/share/xBetXI2KjAJhq6FybgOqP4?replay=1

2025-03-20 22:26:48
春分+国际幸福日

2025-03-21 09:19:56
小红书什么时候能多设备同时登录啊🥲

2025-03-21 09:32:03
2024年上海的冬天过去了。2024.11.20-2024.3.20

2025-03-21 11:55:11
意大利报纸《IL Foglio》推出全球首份完全由AI生成的实体报纸,从写作到讽刺手法皆出自AI之手。《IL Foglio》的编辑Claudio Cerasa称,这次发行AI报纸,是一项为期一个月的新闻实验的重要部分,旨在全方位展示AI技术对工作方式以及日常生活的影响。

2025-03-21 17:42:14
计算机历史博物馆收藏了2012年的AlexNet的源码,AlexNet的开发者包括Geoffrey Hinton、Ilya Sutskever和Alex Krizhevsky
https://github.com/computerhistory/AlexNet-Source-Code

2025-03-23 18:27:41
“穷人的焦虑来自于没钱,富人的焦虑来自于都得死。富人的松弛感来源于有钱,穷人的松弛感来源于都得死。”

2025-03-23 18:55:43
《联合早报》:中国特稿:中共二十大下半场 盘点政治新星行情
https://www.zaobao.com/news/china/story20250323-6048835

2025-03-23 20:56:06
Google退出中国市场15周年。

2025-03-24 13:56:21
RWA 是指可以在区块链上进行代币发行、交易或管理的传统物理或金融资产。一旦有了RWA通证之后,就可以用来做很多DeFi资产管理,这类资产包括房地产、商品、股票、债券、应收账款、知识产权等。通过区块链技术将这些现实世界的资产进行代币化,使它们可以数字形式进行交易和管理,从而提高流动性和透明度。

2025-03-24 18:41:49
flowith oracle模式生成的网站合集:https://flowithai.feishu.cn/docx/I5J6dQZt9opp2Rxhdi2c0JnrnKc

2025-03-25 09:57:43
todesk减少免费版用户每月连接次数了

2025-03-26 14:46:10
ai.dev域名指向Google AI Studio

2025-03-26 16:54:28
trae对普及AI编程的贡献会比cursor更大

2025-03-26 20:07:04
Claude太适合写nextjs项目了,搭配github+vercel+supabase,发布小型web应用太方便了

2025-03-27 22:18:46
用trae做了一个免费LLM API服务,技术栈:nextjs+vercel+supabase
platform.aitools.cfd
由于3.7一直排队,编码+debug都由Claude-3.5-Sonnet模型完成

2025-03-28 11:06:00
mac微信4.0.3.50彻底重构了,聊天记录都要迁移一遍 :0010:

2025-03-28 13:08:50
https://stcn.com/article/detail/1609852.html

2025-03-28 14:54:30
云族裔发售了,画面好逼真啊

2025-03-28 17:51:19
https://x.com/PJaccetturo/status/1905151190872309907
效果太好了

4月

2025-04-02 10:30:39
虽然都叫自动驾驶,但实际的技术可能差很远,高精地图+hard code和大模型端到端可以说从原理上有根本的不同,这也是为什么fsdv12和v13差距这么大。

施工路段NOA时速97=不要命。

2025-04-02 16:10:36
https://firstpagesage.com/seo-blog/the-google-algorithm-ranking-factors/

2025-04-05 14:08:53
微软50周年,盖茨在博客撰文:https://www.gatesnotes.com/meet-bill/source-code/reader/microsoft-original-source-code

2025-04-06 00:34:08
https://www.youtube.com/watch?v=AhhQ3e8Re1k

2025-04-07 22:06:26
https://zh.wikipedia.org/wiki/%E4%B8%8A%E6%B5%B7%E6%8A%A5%E7%BA%B8%E5%88%97%E8%A1%A8
现时上海仍有79份报纸在出版

2025-04-09 12:29:36
https://next-hackathon-2025.vercel.app/

2025-04-09 14:18:30
https://cn.nytimes.com/china/20250409/china-trump-tariffs/

2025-04-11 10:33:39
Google搜索框变长了

2025-04-12 14:33:50
大风来了💨

2025-04-14 09:56:53
周末想做一个东西,刚才上班路上跟deepseek-v3-0324讨论好了技术方案 :0000:

2025-04-14 13:16:31
https://xhslink.com/iNYicab

2025-04-14 20:47:27
纸上得来终觉浅,绝知此事要躬行。

2025-04-15 20:33:45
寄蜉蝣于天地,渺沧海之一粟。哀吾生之须臾,羡长江之无穷。

2025-04-17 11:02:47
有人说微信现在成了最大的AI应用,但是元宝账号又不是所有用户默认关注的,并且目前也还没有上任何与微信个人数据结合的扩展功能。

2025-04-17 12:15:14
o3已经是agent了,会搜索、执行代码、理解图片等操作组合完成任务

2025-04-21 16:50:14
ChatGPT已经可以自动判断当前问题是否需要搜索最新信息后回答了。

2025-04-22 22:26:54
瑞哥火到国外了

2025-04-23 15:39:44
少看社交媒体,多看书

2025-04-24 21:10:51
清理mac微信旧版本数据,腾出接近100GB空间 :0000:

2025-04-29 08:39:36
Qwen3的混合推理,简单问题不think,复杂问题才think。还可以手动控制,加/no_think 或/think

5月

2025-05-04 10:19:59
nike run club美区重装后用海外ip可登回原账号

2025-05-05 20:03:33
今天开ap走高架路,自动绕开了一段积水路段,第一次遇到。

2025-05-09 16:57:29
gemini的veo2生成视频的效果太好了

2025-05-11 12:05:52
快递因为都直接放驿站 所以现在买东西都宁愿选择外卖/即时配送了

2025-05-11 13:16:09
目前mcp server的鲁棒性太差

2025-05-12 11:14:41
web.skype.com已跳转到teams.live.com

2025-05-13 13:46:57
鸿蒙PC的一些细节:
-华为原来销售的所有笔记本设备都无法升级到鸿蒙PC系统
-目前两个虚拟机软件:鸿云虚拟桌面(云电脑)、Oseasy虚拟机(可安装Arm Win系统)
-可添加打印机和扫描仪
-type-C口可外接显示器,HDMI转接头也可以使用

2025-05-14 13:58:13
AI从工具逻辑转向交付成果逻辑

2025-05-15 10:17:39
NotebookLM的命名跟ChatGPT如出一辙。

2025-05-15 21:28:29
心情很down

2025-05-16 08:50:49
鸿蒙PC即将发布一款折叠屏电脑……

2025-05-16 11:48:10
天地图的api做得不错

2025-05-19 00:02:30
vibe coding时你会发现模型引入的package都是老版本,这个服务提供的上下文可以帮助模型知道当前最新版本:https://context7.com/

2025-05-20 16:46:06
不同的任务散落在ChatGPT、Claude、DeepSeek、Manus、Cursor、CherryStudio、OpenWebUI里,难找

2025-05-21 14:39:02
Flow TV (随机观看使用Google Flow filmmaker生成的视频)
https://labs.google/flow/tv

2025-05-21 15:37:38
https://stitch.withgoogle.com/
UI设计

2025-05-21 18:31:45
小满。

2025-05-22 23:46:15
veo 3的作品简直难辨真假

2025-05-23 00:54:17
https://www.youtube.com/watch?v=EvtPBaaykdo

2025-05-26 19:31:42
才开始听tank去年手术前完成的专辑《我不伟大 至少我能改变我》

2025-05-29 01:29:27
洗完头自然干+睡觉起来,自动空气刘海,比吹的还好一点😂

2025-05-30 18:25:38
中国的AI大模型还是得靠开源,在国际上获得影响力。DeepSeek、Qwen、Hunyuan

6月

2025-06-01 18:19:58
国铁上海东的官方名称叫“东方枢纽上海东站”

2025-06-03 10:47:30
iOS用年份命名,iPhone应该不会

2025-06-04 11:22:34
Claude自己写的博客:https://www.anthropic.com/claude-explains

2025-06-06 21:00:50
OpenAI和Anthropic的官方文档都提供了一键copy page的功能,便于开发者快速把文档复制发给AI作为上下文。

2025-06-08 14:20:22
HDC25要发布HarmonyOS6了😂

2025-06-08 19:46:18
最近对投放的理解更深入了

2025-06-13 11:11:54
上影节开始了

2025-06-15 11:21:31
https://developer.mozilla.org/zh-CN/docs/Web/HTTP

2025-06-15 11:28:57
原来斗内是donate的音译

2025-06-16 16:53:39
Manus的UI和交互,果然影响了后来的Agent产品

2025-06-17 14:07:55
国内的AI六小龙已经变成四小龙了

2025-06-20 14:09:34
As an Early Access rider, you can be among the first to use our new Robotaxi App and experience an autonomous ride within our geofenced area in Austin. Through this exclusive preview, you’ll have the opportunity to provide valuable feedback on our Robotaxi service.

2025-06-22 00:59:34
基座大模型公司,现在差不多2-3个月迭代一次模型能力,否则就跟不上对手的速度,渐渐淘汰。

2025-06-24 14:00:36
柴静发了视频之后,新闻调查停播了?6月7号之后,连续两期没播了

2025-06-25 15:13:05
SpecStory插件(VSCode/Cursor),可以快速将与AI的对话历史保存为markdown

2025-06-26 15:22:18
vercel, cloudflare, supabase, google ai studio都是大善人

2025-06-27 14:09:59
现在电脑买来,本地模型要占掉50GB左右

2025-06-29 14:36:39
我好像天生更对开放开源有好感,开始用Void替代Cursor,虽然还不能完全替代,但基本功能可以了

7月

2025-07-02 00:07:00
Apple Music都十年了啊

2025-07-02 08:39:23
听到蝉鸣了。

2025-07-09 09:59:19
以前:收u
现在:稳定币收款

2025-07-11 11:47:00
macOS上对图片右键-快速操作-转换图像,即可快速压缩图片大小

2025-07-13 11:50:35
国内的开源大模型几乎都会兼容华为昇腾910B的推理了

2025-07-14 23:39:51
Moonshot 团队在社交平台上给出明确答复:Kimi K2的架构确实完全继承自 DeepSeek V3。他们团队曾尝试多种不同于DeepSeek V3的MoE/Dense结构变种,但始终没有任何设计在 loss 上显著超过 DeepSeek V3。为了在已经面临优化器和大规模参数这两大变量下避免引入更多不确定性,团队选择了一个务实的策略:完全继承DeepSeek V3的底层架构。

2025-07-15 20:45:32
Grok的Ani有点油腻

2025-07-16 18:54:43
@thepaper 政治正确大师

2025-07-17 10:28:46
荣威i6 max专晒乘客……

2025-07-18 16:10:35
徐正源与蓉城的纠纷,之前传言已久,没想到竟然是真的。徐师在蓉城球迷心中有极高的声望,可谓功勋教练。

2025-07-19 12:48:12
美国创新,中国复制,欧洲监管

2025-07-21 13:36:01
港美股的年度收益,要交20%的税了

2025-07-23 15:47:44
Trae的SOLO模式竟然可以在同一个项目下实现与IDE模式秒切换界面,妙啊

2025-07-23 15:54:43
今天体验的新产品:trae solo模式、qwen code with qwen3-coder、trickle.so、zread.ai、codebuddy IDE

2025-07-25 20:31:00
上海进入WAIC时间~

2025-07-29 21:24:50
兵马俑上竟然留存了制作者的指纹:
考古人员通过超景深显微镜捕捉到了2000多年前清晰的指纹印记,提取了指纹100多枚。这些穿越时空的“指尖密码”,不仅让后人触及到秦代工匠的远古技法,更揭示出一个事实——兵马俑的塑造者中,竟有未成年人。

2025-07-30 15:17:51
再次感叹:K2的Agentic能力太强了

2025-07-30 16:06:49
雨天在家细读:https://manus.im/zh-cn/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

2025-07-30 22:24:19
ETH十周年。

2025-07-31 11:01:48
ollama有GUI了

8月

2025-08-02 00:10:57
Crew-11成功!

2025-08-06 10:07:43
世运会首个比赛日已经开启

2025-08-06 10:30:17
开源模型胜利了

2025-08-06 11:16:26
https://gpt-oss.com/

2025-08-06 15:25:36
把Ollama的gpt-oss加载到GPU:
curl http://localhost:11434/api/generate ^
-d “{\”model\”:\”gpt-oss:20b\”,\”keep_alive\”:\”5m\”,\”options\”:{\”num_gpu\”:99},\”prompt\”:\”\”,\”stream\”:false}”
立即卸载模型:
curl http://localhost:11434/api/generate -d “{\”model\”:\”gpt-oss:20b\”,\”keep_alive\”:0}”

2025-08-07 09:44:44
OpenAI预告了GPT-5将于明天凌晨发布。

2025-08-08 09:26:57
GPT-5在所有领域都进步了一点点

2025-08-08 11:48:44
https://www.kaggle.com/benchmarks/kaggle/chess-text/tournament
最终o3拿下了冠军

2025-08-10 01:45:30
赤藓糖醇的回甘时间也太长了

2025-08-11 01:08:53
美国在线(AOL,现隶属于雅虎旗下)宣布将于 2025 年 9 月 30 日正式停止其基于公共交换电话网络(PSTN)的拨号上网服务,结束其长达 34 年的运营历史。

2025-08-11 17:08:12
Claude Code对token使用的计量还挺准的

2025-08-13 11:21:48
蘇姿丰和黃仁勳是遠房親戚。蘇姿丰的外公和黃仁勳的母親是兄妹,因此蘇姿丰要喊黃仁勳一聲「表舅」。

2025-08-13 16:54:54
这周又是日期数字的个位数与星期几对应的一周。

2025-08-15 08:54:14
凌晨看展新体验get

2025-08-15 08:54:49
在视频号刷到金味麦片,戳中一个小时候的回忆

2025-08-18 13:38:50
继王自如之后,罗永浩也开视频播客了

2025-08-19 11:03:12
千问Qwen直接把万相Wan的事情都干了

2025-08-22 11:41:12
AutoGLM大半年后拿出的方案是云手机+云电脑。云手机背后是华为云的云手机服务,云电脑背后是阿里云的无影。

2025-08-25 10:36:52
有些产品的AI助手,还在用2023年的模型,一问就感觉不如小学生。对,说的就是supabase

2025-08-27 15:12:38
nano banana对接好了

2025-08-29 11:05:33
很多东西变了,但很多东西也没有变。

9月

2025-09-01 10:00:52
iOS 26动效的增加,导致部分UI的响应时间有延迟

2025-09-01 12:06:59
Notion邮箱,实际上是Gmail的又一个客户端,但加载速度好快啊!

2025-09-03 09:58:02
印象中这是第五次看阅兵了

2025-09-03 13:32:42
东风-5C “打击范围覆盖全球”,这个应该是轨道级飞行。

2025-09-04 12:09:29
https://developer.apple.com/cn/videos/design/

2025-09-06 13:26:29
隔了几个月再看元宝客户端,非常好,产品交互和体验在国内完全对齐ChatGPT,简洁派表示舒适,豆包太花哨了

2025-09-07 15:01:16
霍炬的观点可能是真相,就是Anthropic并不是反华,而是反开源。因为目前头部的开源模型几乎都来自中国。

2025-09-08 14:11:57
Agent,会根据大模型在外部操作的结果来执行下一步,这会影响模型以外的虚拟世界。

2025-09-09 10:28:54
现在最强的生图模型和生视频模型都出自Google了

2025-09-10 11:36:57
国行页面继续标注“为Apple智能预备好”,年底前应该可以上了吧

2025-09-11 10:12:39
国行AirPods Pro 3硬件上与海外版本是一样的。

2025-09-12 12:50:46
姚顺雨的名字跟尧舜禹谐音 :0080:

2025-09-14 18:05:46
香蕉是一种攻击性很强的水果,你可以在搅拌机里加入15种水果,但要是加入1根香蕉,那它就是香蕉奶昔。

2025-09-14 20:36:36
窗外是蓝星 蓝星是我们的蓝色星球 地球

2025-09-16 10:42:21
西贝的自杀式直播,暴露了贾国龙完全不熟悉基层情况。

2025-09-16 16:38:08
成都明天再开两条地铁,武侯祠终于有地铁直达了

2025-09-17 10:55:04
https://www.volcengine.com/experience/ark?launch=seedream

2025-09-17 14:40:37
「電話」與 FaceTime 中的「即時翻譯」功能可在一對一通話時使用,適用於已啟用 Apple Intelligence 的相容 iPhone、iPad 或 Mac;支援英文 (英國、美國)、法文 (法國)、德文 (德國)、葡萄牙文 (巴西) 與西班牙文 (西班牙)。今年稍晚,iPhone 和 FaceTime 的「即時翻譯」功能將新增支援以下語言:簡體中文、繁體中文 (華語)、義大利文、日文、韓文。

2025-09-20 18:06:06
ChatGPT会话的分享链接发给别人后,别人还能继续接着聊。这个逻辑挺有意思的。

2025-09-23 11:09:20
https://lmarena.ai/leaderboard/image-edit

2025-09-24 11:17:45
有点感动是怎么回事
经典模式回归:腾讯 QQ 发布 Windows 9.9.22、macOS 6.7.81 版本更新,支持合并独立聊天窗口 https://www.ithome.com/0/885/281.htm

2025-09-26 18:05:10
我永远都是行动派。

2025-09-28 10:50:28
Kimi的OK Computer很不错

2025-09-30 10:27:25
https://www.anthropic.com/news/claude-sonnet-4-5

2025-09-30 11:13:34
趁evus收费之前更新了一下

10月

2025-10-01 17:46:46
Sora 2终于不是期货了 也不是Pro Plan专属 发布就能免费玩上

2025-10-03 14:31:55
我才发现iOS 26上的高光可以随着手机摆动而移动……

2025-10-04 18:08:22
新的RAG:让模型智能自主决策到哪个文件去查找所需信息

2025-10-04 19:09:54
iOS26本地传输数据竟然恢复不了已下架的app……

2025-10-09 13:42:17
浦东美术馆 抓个尾巴

2025-10-13 16:36:10
liblib的国内产品直接提供了nano/mj/gpt-image-1等模型,还挂着网信算法备案号和生成式人工智能服务备案号……

2025-10-14 11:10:52
鸿蒙端微信大版本号从1.0跳到8.0了,大部分功能跟iOS和安卓已对齐。

2025-10-14 18:29:43
俄罗斯禁了所有漫游到俄罗斯境内的海外sim卡联网

2025-10-15 10:59:21
招行和shadowrocket的app都换成液态玻璃tabbar了

2025-10-15 11:02:46
这个赛季,开拓者要成主队了……

2025-10-15 14:12:55
Apple Intelligence已开启功能:
本地:Siri基础问题、相册擦除、通知中心总结/首要通知、写作工具、同传翻译
联网:ChatGPT扩展、视觉智能、图乐园、智绘表情

2025-10-17 17:31:38
单扬单摄之外,C1X基带的iPhone Air支持5G-A

2025-10-20 23:26:54
《许我耀眼》赵露思穿搭合集:https://nutllwhy.github.io/xuwoyaoyan/

2025-10-22 11:17:49
Siri最大的问题是中文普通话的语音识别不准

2025-10-23 13:59:49
A19 Pro + C1X有点厉害啊

2025-10-23 16:01:17
从完整度来说,Comet导入Chrome也太彻底了,扩展、历史记录、连登录态都保留了…… Atlas学学

2025-10-27 15:38:59
用了5天,iPhone Air 真的还挺神奇的。
手感太轻太薄了,像拿着一片玻璃,但感觉又很结实。相比之下S25 edge并没有这种感觉,还是挺厚的。
有时候看着侧面在想,屏幕/电池/magsafe/背面板叠在一起居然只有5.6mm,好不真实。不像是现在这个时代能做出来的东西。
电池在导完数据的前两天耗电较快,这两天已经恢复正常,比mini系列的续航好太多,C1X应该功不可没。
可能就是高刷屏、超薄电池、背面超瓷晶面板,还有 C1X 基带能效、eSIM这些技术都成熟了,才能造出这样的设备吧。

2025-10-27 16:55:19
美区Apple Music竟然可以导入Spotify歌单(通过songshift的服务

11月

2025-11-04 11:33:38
微信把个人视频号入口改成了“视频号与公众号”,将公众号发布入口也放进去了

2025-11-04 11:34:28
Alpha Arena Season 1 is now over, as of Nov 3rd, 2025 5 p.m. EST
Season 1.5 coming soon

2025-11-06 08:55:13
乐播投屏太流氓了,还是用Apple TV投屏吧

2025-11-06 11:47:55
非常需要微信会话分组功能。

2025-11-08 11:01:13
AirPods Pro 3的重置改成了正面触控双击

2025-11-11 18:15:27
https://trustmrr.com/game 有点意思

2025-11-13 12:01:19
全运会没有奖牌榜了,各地还是会自己发布

2025-11-14 10:25:50
从Timenerd、Raycast到Rewind到MineContext、Dayflow

2025-11-14 15:25:16
有很多好的开源项目,不通过社交媒体还很难自己发现。

2025-11-14 17:28:02
Steam Machine如果在5000元级还是很有竞争力的

2025-11-19 21:01:02
库拉索🇨🇼晋级世界杯决赛圈,之前还没听说过这个国家,查了一下是荷兰的附属王国。

2025-11-24 14:01:46
虽然已有预期,但依然被NanoBananaPro驱动的NotebookLM生成的信息图和PPT惊呆了

2025-11-26 13:22:48
ChatGPT想做小程序生态,内置应用程序,看来App Store的小程序内购分成政策适用微信也针对OpenAI

2025-11-28 10:20:19
Apple的很多初代产品,我都是尝鲜者:Apple Watch初代、AirPods初代、12寸MacBook初代、iPhone Air初代

12月

2025-12-01 10:57:48
#nowplaying 派对动物 – 五月天

2025-12-02 14:09:09
Gemini DeepResearch的思考过程现在会出现循环

2025-12-03 10:40:44
豆包手机是中兴nubia M153工程机,现在在这款手机登录微信,会被微信提示风险强制退出……

2025-12-03 11:51:46
今年王自如和罗永浩都回归科技数码圈了

2025-12-04 18:32:59
系统叫Obric UI,系统账号是豆包账号,内置有云服务(与欢喜云的同步项相同)和应用商店。

2025-12-07 11:09:22
《电脑爱好者》9月24日停止更新,12月6日正式注销。

2025-12-10 10:38:19
豆包手机在交互上的重大创新我觉得有两点:
1、PhoneUse操作手机在后台实现,且在后台也支持跨应用操作,不占用前台任务,相比云端实现又能拥有完整context,同时在隐私上也与当前屏幕内容隔离开;
2、可以设置定时重复任务,实现固定工作流,大大提高灵活性和实用性,虽然目前最多只能设置5个任务。

2025-12-11 15:27:56
记忆突然被拉回20年前

2025-12-11 18:58:41
type1决策:做了就不能回头;
type2决策:做错了还能重新尝试;
很多人都把type2决策当成type1,不敢去试错。

2025-12-12 11:19:48
OpenAI都十岁了。

2025-12-15 17:11:16
https://openrouter.ai/state-of-ai

2025-12-16 13:19:32
aistudio和灵光带来的趋势非常明显,明年基本上可以实现要啥工具现生成。

2025-12-16 16:02:50
国产信创生态还需要降低软硬件成本,信创服务器这么贵

2025-12-18 16:44:18
Gemini 3 Flash真的做到了又快又好……

2025-12-21 11:55:14
#FForever Fantasy4ever

2025-12-22 14:36:31
4年的电脑报合订本,清晰展现了AI时代的发展变化

2025-12-22 23:28:53
12月22日,中国国际广播电台劲曲调频广播频率HitFM(北京地区FM88.7和上海地区FM87.9)与轻松调频EzFM(北京地区FM91.5、重庆市FM89.8、西藏自治区拉萨市FM100.0)正式官宣,将于12月23日0时起停播。

2025-12-23 16:24:59
快手这次没有出现系统层面的入侵,是接码批量注册+内容安全的绕过……

2025-12-23 17:06:50
在语音输入的准确度接近100%的时候,就会很愿意使用了,比手打快很多。

2025-12-23 18:07:22
今年ChatGPT的使用被Gemini分走了很多

2025-12-24 20:51:36
在Cursor里用的ClaudeCode就没统计了

2025-12-26 13:10:17
TRAE的国内版,因为下半年国产基座模型的提升,现在也基本可用了

2025-12-28 09:16:43
10年以上俱乐部:小红书、豆瓣、微信读书、网易云音乐、QQ音乐

2025-12-28 10:25:33
“ALICE线”(ALICE Threshold)
ALICE是“Asset Limited,Income Constrained,Employed”的缩写,即“资产有限、收入有限、有工作”,它代表着美国收入高于联邦贫困线但经济不安全的家庭。

2025-12-29 11:57:44
在HarmonyOS能用tooot,但iOS却没有了……

2025-12-29 16:51:00
https://claude.com/blog/skills-explained

2025-12-29 19:04:38
智谱的AI输入法,界面都跟Typeless差不多,快捷键也一样……

2025-12-30 09:18:20
中国AI创业者的高光时刻 恭喜Manus!

2025-12-30 14:23:08
商业竞争就是这么朴素😂

2025-12-31 09:46:59
香港《亚洲周刊》因报道南博事件中庞家人的发声而被封禁微博/微信公众号。

2025-12-31 16:58:27
Typeless的asr成精了

2025-12-31 23:45:12
今年的生产力时间用在了这些软件上:Cursor/Trae/Codebuddy/Kiro/Antigravity(辗转薅Claude🫣

2026-01-02 12:07:48
突然觉得2026是一个很未来的年份

2026-01-02 17:53:38
我的 #2025年度产品:
iPhone Air
Google AI Studio Build Mode
Gemini App
豆包输入法 + Typeless
TRAE + Claude Code
Manus
Lovart
ClashVerge
SpeedPush
Voodle

2026-01-02 18:12:31
今年增加一个我的 #2025年度AI模型:
DeepSeek-R1
Gemini 3.0 Flash
Gemini 3.0 Pro Image
GPT-5.2
Claude Opus 4.5
Qwen3
Kimi-K2-Thinking
GLM-4.7
MiniMax-M2.1
Seedream 4.5

小白入门 Claude Code:从命令行到通用Agent

前言:我为什么不推荐 Cursor 了?

去年 8 月第一次接触 Claude Code 时,我其实挺无感的。

当时朋友跟我说它是”通用 Agent”,可以操作电脑上的所有东西。我试了一下,让 K2 模型写了个房地产官网的案例,效果也就那样。

真正让我改观的是三个月后——Skills 功能上线


一、它和其他 AI 编程工具到底有什么不同?

最大的区别:它是”真·通用”

Cursor、TRAE、Antigravity这些 AI IDE,只能在你当前打开的文件夹里操作。

但 Claude Code 不一样:

  • 只要你给它授权,它可以操作整个电脑的文件
  • 你的 Node.js 环境、Python 环境、Homebrew、Docker…它都能直接调用
  • 它不是一个”编辑器插件”,而是一个有权限的电脑操作员

我给不懂编程的朋友演示时,他们的反应是:

“原来 AI 现在可以操作本地文件啊!”

这不是技术问题,是认知问题

很多人对 AI 的印象还停留在”聊天机器人”阶段,不知道它已经能直接帮你干活了。


二、我的 Claude Code 使用时间线

2025年8月22日:初次尝试

  • 版本:2.0.76
  • 模型:Kimi K2
  • 任务:写地产官网测试页面
  • 感受:也就那样

当时的问题:

  1. 不能显示改了什么文件(一次性全写完)
  2. 没有 Skills 功能
  3. 命令行操作不方便

2025年10月:Skills 功能出现

朋友告诉我 Claude Code 出了 Skills,我问”这啥?”

他给了一个我至今觉得最好的比喻:

如果拿电话销售来举例:

  • MCP = 通讯录数据(资源)
  • Skills = 打电话的 SOP(流程)
    • 第一句说什么
    • 第二句说什么
    • 遇到拒绝怎么办

Skills 相当于把别人的专业经验封装成了一个可复用的提示词包。

一个让我震惊的例子

我用 GLM-4.7 模型写了一个比较”AI 感”的前端页面,然后告诉 Claude:

“使用 frontend-dev 这个 Skills 来更新这个页面”

结果出来了一个非常有设计感的网页

我知道,自己写 prompt 或者写到 .claude/CLAUDE.md 里也能实现。但:

  • 别人的经验可以通过 Skills 快速共享
  • Skill 不只是 prompt,还包括脚本、资源、配置

2026年1月:2.1.10 版本 + 完整工作流

现在我的 Claude Code 工作流是:

工具用途
命令行快速任务、自动化
Zed Editor内置 Claude Code 侧边栏,可视化操作
Obsidian + Claudian知识库内直接调用 AI 进行Vibe Writing
CC Now右键在任何目录快速启动 Claude Code
CC Mate切换配置文件、查看用量统计

搭配起来,非常 OK


三、小白 10 分钟上手指南

第一步:安装(30 秒)

1 curl -fsSL https://claude.ai/install.sh | bash

或者用 npm:

1 npm install -g @anthropic-ai/claude-code

第二步:授权(1 分钟)

运行 claude,会自动打开浏览器进行授权。

小技巧:推荐用 API Key,更稳定,不会被风控。

第三步:第一个命令(1 分钟)

1 # 列出当前目录文件
2 claude "列出当前目录的文件,并告诉我每个文件是干什么的"
3  
4 # 分析一个项目
5 claude "帮我分析这个项目的结构"

第四步:安装你的第一个 Skill(3 分钟)

前端开发 Skill(强烈推荐新手试试):

在 Claude Code 中搜索社区 Skills,找到 frontend-design 并安装。

安装后试试:

1 claude "用 frontend-design skill 帮我做一个个人博客页面"

效果会超出你的预期


四、为什么我最后选择了它?

1. 它不只是”编程助手”

我虽然会写代码,但现在我用 Claude Code 做的事:

  • ✅ 公众号文章写作和排版
  • ✅ 知识库内容整理
  • ✅ 数据分析和报告生成
  • ✅ 文件批量处理
  • ✅ 系统配置管理

它是一个”电脑操作员”,不只是”编程助手”。

2. Skills 生态太强大了

社区已经有各种 Skills:

  • frontend-design – 高质量前端页面生成
  • vibe-writing – AI 写作,降低 AI 味
  • iosdev-cn – iOS 开发上架全流程
  • code-review – PR 代码审查
  • notebooklm-skill – 连接 NotebookLM 和 Obsidian

别人踩过的坑、总结的经验,你都能直接复用。

3. 它能操作你的环境

Cursor 这些工具,本质上是在”沙盒”里操作。

但 Claude Code 可以:

1 # 直接运行你本地的 Python 脚本
2 claude "运行 data_analysis.py 并生成报告"
3  
4 # 调用你的 npm scripts
5 claude "帮我跑一下测试并总结结果"
6  
7 # 操作你的 Docker 容器
8 claude "检查所有 Docker 容器的状态"

这不是模拟,这是真实的操作。


五、新手的常见误区

误区 1:“我不会编程,用不了”

错!

Claude Code 最有用的功能,往往和编程无关:

  • 帮你整理文件夹里的杂乱文件
  • 批量重命名图片
  • 从一堆 PDF 里提取信息
  • 自动生成周报、日报

误区 2:“命令行太难了”

有三种使用方式:

  1. 纯命令行 – 最高效,但需要适应
  2. Zed Editor – 内置侧边栏,有可视化界面
  3. Obsidian + Claudian – 在知识库里直接用,适合写作/整理

选择你舒服的方式就行。

误区 3:“只用来写代码”

大材小用了!

它是一个通用 AI Agent,能操作电脑上的几乎所有东西。


六、我的推荐配置

API 供应商推荐:智谱 Coding Plan

强烈推荐使用智谱 Coding Plan,GLM-4.7模型加上内置的mcp已可平替Sonnet 4.5。国内访问稳定,性价比高。

通过我的邀请链接注册即可获得 2000万 Tokens 大礼包

👉 注册地址:https://www.bigmodel.cn/invite?icode=dv9RDTDnM9igGdUHQjQRag%3D%3D

基础配置

1 // ~/.claude/settings.json
2 {
3   "language": "Chinese",
4   "env": {
5     "ANTHROPIC_BASE_URL": "https://open.bigmodel.cn/api/paas/v4",
6     "ANTHROPIC_API_KEY": "你的智谱API Key"
7   }
8 }

推荐安装的 Skills

Skill 名称用途
frontend-design高质量前端页面生成,设计感强
vibe-writingAI 写作,降低 AI 味,适合公众号
code-simplifier重构屎山代码,提升代码质量和可维护性
code-reviewPR 代码审查
notebooklm-skill连接 NotebookLM 和 Obsidian
iosdev-cniOS 开发上架全流程指南

推荐安装的工具

工具用途安装
CC Now右键快速启动brew install cc-now
CC Mate配置切换、用量统计brew install ccmate
ClaudianObsidian 插件商店搜索安装
Zed内置 Claude Codebrew install --cask zed

七、进阶:理解 MCP 和 Skills 的关系

用电话销售的比喻:

概念电话销售比喻实际例子
MCP通讯录数据GitHub API、数据库、文件系统
Skills销售话术 SOP写作流程、代码审查流程、发布流程

你需要两者配合:

  • MCP 提供”能力”(能做什么)
  • Skills 提供”流程”(怎么做)

八、最后:为什么我现在推荐它?

和 Cursor 对比

维度Claude CodeCursor
操作范围整个电脑当前项目
可扩展性Skills + MCP自定义 prompts
使用场景编程 + 通用任务主要是编程
学习曲线稍陡(命令行)平缓(GUI)

和 ChatGPT 对比

维度Claude CodeChatGPT
文件操作直接读写需要上传下载
环境调用可运行命令不能
上下文持久化会话每次新开

九、给新手的建议

1. 先别追求”完美配置”

从最简单的开始:

  • 安装 Claude Code
  • 试一个简单的命令
  • 感受一下”AI 操作你的电脑”

2. 选择一个你舒服的入口

  • 如果你习惯命令行 → 直接用 CLI
  • 如果你喜欢可视化 → 用 Zed Editor
  • 如果你主要做知识管理 → 用 Obsidian + Claudian

3. 从一个 Skill 开始

推荐从 frontend-design 或 vibe-writing 开始:

  • 效果明显
  • 文档完善
  • 社区活跃

4. 加入社区

  • Reddit 的 r/ClaudeAI
  • GitHub 的 claude-code 仓库
  • 国内的 AI 编程社群

每天都有新技巧、新 Skills 出现。


十、最后的最后

2025年8月我觉得它”也就那样”。

2026年1月,它已经成为我每天必用的工具。

这不是因为 Claude Code 变了太多,而是因为我:

  1. 理解了它的定位(通用 Agent,不只是编程工具)
  2. 掌握了 Skills 的用法(复用他人经验)
  3. 找到了适合自己的工作流(命令行 + Zed + Obsidian)

如果你还在观望,今天就是最好的开始。

安装只需要 30 秒:

1 curl -fsSL https://claude.ai/install.sh | bash

试试看,你会有惊喜。


参考资源

  • Claude Code 官网:https://claude.ai/code
  • GitHub 仓库:https://github.com/anthropics/claude-code
  • Zed Editor:https://zed.dev
  • Claudian 插件:https://github.com/YishenTu/claudian
  • CC Now:https://github.com/someawesome/cc-now
  • CC Mate:https://github.com/djyde/ccmate

作者的话:这篇文章是我的真实使用体验。如果你是 Claude Code 的新手,希望它能帮你快速上手;如果你已经是老手,欢迎分享你的使用技巧。