分类目录归档:我的博客

Vibe Coding时代面向大模型沟通的奥秘

文/Jerry、Gemini

AI编码工具的浪潮正以前所未有的方式重塑软件开发行业。然而,若仅仅将这些工具视为简单的聊天机器人或代码补全器,我们将错失其真正的潜力。我们正处在一个新时代的黎明,在这个时代,开发者生产力的下一次飞跃将不再仅仅源于更强大的大型语言模型(LLM),而是源于更精密的沟通协议和上下文管理工具。

从最初简单的代码片段建议,到如今能够执行复杂、多文件任务的AI Agent,我们与AI的互动模式正在发生根本性的转变。这种转变凸显了一个核心挑战:如何有效地与这些日益强大的AI系统进行沟通?当AI的“记忆”有限、知识陈旧、且其推理过程如同一个“黑箱”时,我们如何确保它能准确理解我们的意图,并可靠地执行任务?

本文旨在深入探讨这一核心问题。笔者将剖析当前开发者与AI沟通时面临的根本性障碍,并以AI原生代码编辑器Cursor为例,详细拆解其为解决这些问题而设计的精密工具集。更重要的是,我们将视野拓宽至整个生态系统,审视诸如模型上下文协议(Model Context Protocol, MCP)等新兴标准,以及Context7等第三方服务如何共同构建一个更加智能、可控的AI协作环境。通过对主流AI编码工具的横向比较,我们将揭示行业的发展趋势,并最终描绘出在人机协作的新范式下,未来软件开发的蓝图。这不仅是一份工具指南,更是一次对未来开发者角色的深度思考。

沟通的鸿沟——你的“AI程序员实习生”需要一份指南

在深入探讨解决方案之前,我们必须首先理解问题的本质。为何我们需要专门的工具来与AI沟通?答案在于当前大型语言模型固有的局限性。这些局限性构成了人机协作中的“沟通鸿沟”,只有正视它们,我们才能构建有效的桥梁。

记忆与注意力的极限:“迷失在中间”

大型语言模型最广为人知的特性之一是其“上下文窗口”(Context Window),即模型在一次交互中能够处理的信息量上限,通常以令牌(token)为单位计算 。然而,这个窗口也并非是完美无瑕的记忆存储器。  

研究表明,LLM存在显著的“位置偏差”(position bias)。麻省理工学院(MIT)的研究人员发现,模型倾向于过度关注上下文窗口开头和结尾的信息,而忽略中间部分的内容 。这种“迷失在中间”(lost-in-the-middle)的现象意味着,如果一名律师使用AI助手在长达30页的法律文件中查找特定短语,AI更有可能在文件的首页或末页找到它,而中间页的内容则容易被忽视。  

这种现象并非随机的缺陷,而是源于构成LLM的Transformer架构中注意力机制的设计选择。随着模型层数的增加,这种偏见会被放大,因为输入序列的早期部分在模型的推理过程中被更频繁地使用 。这一发现揭示了一个关键的矛盾:虽然拥有更大的上下文窗口似乎是件好事,但它并不必然带来更好的性能。如果仅仅是扩大窗口尺寸,而没有解决底层的注意力偏差问题,我们实际上只是创造了一个更大的“中间地带”,让关键信息更容易在其中“迷失”。  

此外,研究还指出,许多开源模型的“有效上下文长度”往往远低于其宣称的训练长度。这部分归因于模型在预训练和后训练阶段形成的相对位置频率分布存在左偏,阻碍了其有效捕获远距离信息的能力 。因此,解决方案不能仅仅是追求“更多的上下文”,而必须转向“更智能的上下文”。如何构建和呈现上下文,使其关键信息能够被模型准确捕捉,变得与上下文的绝对大小同等重要,甚至更为关键。这正是笔者在后续章节中讨论的各类工具所要解决的核心问题。  

陈旧知识的隐患与上下文的成本

LLM的另一个根本性限制是其知识的静态性。模型通常在某个时间点之前的大规模数据集上进行训练,这意味着它们的“知识库”会随着时间的推移而变得陈旧 。对于日新月异的软件开发领域而言,这是一个致命伤。一个模型可能会自信地生成使用已被弃用的库函数或API的代码,甚至“幻觉”出根本不存在的API,这在处理像Next.js这样频繁更新的框架或模型未曾深入学习过的小众库时尤其突出 。  

解决这一问题的一种直接思路是利用长上下文窗口,在每次查询时将最新的文档“喂”给模型。然而,这条路充满了挑战。长上下文窗口的计算成本极其高昂,每一次查询都需要巨大的计算和内存资源,这直接导致了更高的费用和更慢的响应时间 。这在开发者和企业面前形成了一个清晰的权衡:在获取更准确结果与控制成本、保证性能之间做出选择。  

作为长上下文的替代方案,检索增强生成(Retrieval-Augmented Generation, RAG)应运而生。RAG系统在响应查询前,首先从一个外部知识库(如最新的文档、数据库)中检索相关信息,然后将这些信息与用户的原始提示一并提供给LLM 。这种方法在处理海量、动态变化的数据集(如代码库或实时网页内容)时,展现出卓越的可扩展性和成本效益。它能有效解决知识陈旧的问题,因为知识库可以随时更新。  

然而,RAG也并非万能。它在处理需要复杂、多步骤推理或在动态演变的对话中需要灵活适应的场景时,可能会受到限制,因为它通常在生成过程开始前就一次性检索了所有信息 。这催生了行业向混合架构发展的趋势,即结合长上下文的广阔推理能力和RAG的精准信息检索能力。一个理想的系统应该能够动态地将通过RAG检索到的最新、最相关的数据,注入到一个长上下文模型的推理过程中。这不仅是技术上的选择,更是平衡成本、速度和推理能力的战略决策,也是Context7等工具背后的核心理念。  

从黑箱到协作者:对控制与透明度的渴求

LLM常常被形容为“黑箱”,用户输入提示,模型输出结果,但其内部的决策过程却难以捉摸 。这种不透明性使得在金融、医疗、法律等高风险应用中难以完全信任它们。当模型给出一个意想不到的答案时,我们无从知晓它是基于正确的推理,还是源于数据偏见或模型幻觉。  

此外,当前主流LLM对文本的严重依赖也带来了局限。它们将“语言”等同于“文本”,这不仅排除了手语等非文本化的人类自然语言,加剧了特定社群的边缘化,也限制了模型对世界的多模态理解能力 。  

因此,推动应用本文所讨论的各类沟通工具,其根本动力源于一种将LLM从不可预测的“黑箱”转变为可信赖的“协作者”的强烈需求。这是在不确定性的技术之上,强加结构、可预测性和控制权的努力。这一过程深刻地呼应了人机交互(Human-Computer Interaction, HCI)领域在适应AI时代时的核心演变:从设计简单的用户界面,转向构建复杂、透明、以人为中心的协作系统 。我们需要的不仅是一个会写代码的助手工具,更是一个我们能够理解、引导和信任的编程伙伴。  

AI原生IDE——以Cursor为例

为了具体说明现代工具如何应对前述的沟通挑战,我们将以AI代码编辑器Cursor作为一个详细的案例进行研究。Cursor的设计理念和功能集,为我们提供了一个观察开发者如何与AI建立高效、可控对话的绝佳窗口。

Cursor作为沟通枢纽:一种AI优先的架构

Cursor并非简单地在传统代码编辑器中加入一个AI聊天窗口。它是一个基于VS Code开源代码库构建的、以AI为核心的编辑器,其设计初衷就是为了将大型语言模型(如GPT-4o和Claude 3.5 Sonnet)深度整合到开发工作流的每一个环节 。  

这种“AI优先”(AI-first)的架构体现在其核心功能的设计上,每项功能都针对不同粒度的AI交互模式:

  • Tab键预测:超越了传统的单行代码补全,Tab功能能够预测并生成多行、结构化的代码编辑,并根据最近的更改动态调整其建议 。  
  • Cmd-K(或Ctrl-K)内联编辑:通过快捷键,开发者可以快速选中代码并给出自然语言指令,进行精确的代码生成、重构或解释,而无需打断心流 。  
  • Agent模式:这是为复杂任务设计的。在Agent模式下,AI可以独立探索代码库、执行终端命令、识别、创建并编辑相关文件,完成诸如搭建新项目、实现一个完整功能等大规模、跨文件的修改 。  

Cursor的设计哲学与将AI作为“插件”的传统思路形成了鲜明对比。在后者中,AI往往是一个附加组件,其与开发环境的集成深度受限。而Cursor将AI视为环境的基础设施,这种架构选择使其能够实现更深层次、更具上下文感知能力的整合,从而将AI从一个被动的“助手”提升为一个主动的“伙伴”。

控制AI的视线:.cursorignore的角色

在与AI协作时,一个核心问题是:我们不希望AI“看到”所有东西。无论是出于隐私保护、安全考虑,还是为了提升性能和专注度,控制AI的访问范围至关重要。Cursor为此提供了两个功能强大且粒度分明的忽略文件:.cursorignore.cursorindexingignore 。  

  • .cursorignore:隐私与专注的守护者 这个文件旨在尽最大努力(best-effort)阻止AI访问和索引指定的文件或目录 。其主要用途是保护敏感信息,如包含密钥的配置文件、专有商业逻辑代码,或任何不应被发送到第三方LLM服务的内容 。同时,它也能帮助开发者排除无关文件,让AI更专注于当前任务。  
  • .cursorindexingignore:性能优化的利器 与前者不同,此文件仅阻止文件被代码库索引 。被列入其中的文件不会出现在Cursor的上下文搜索结果中,这对于包含大量生成文件(如 node_modules)或二进制文件的项目非常有用,可以显著提升索引速度和搜索准确性。然而,关键区别在于,AI仍然可以在特定情况下访问这些文件,例如当用户手动打开它们或在聊天中明确引用它们时 。  

这两个文件的存在,直接反映了在AI编程中上下文、性能和隐私三者之间的内在张力。.cursorindexingignore解决了索引海量无关文件带来的性能问题,而.cursorignore则处理了更关键的隐私与安全问题。这种精细的控制粒度,让开发者能够根据具体需求,在这三者之间做出明智的权衡。值得一提的是,这两个文件的语法与开发者早已熟悉的.gitignore完全相同,并支持分层配置,极大地降低了学习和使用成本 。  

编码化意图:掌握rules.md以实现持久化指导

如果说.cursorignore是告诉AI“不要看什么”,那么Cursor Rules则是明确地告诉AI“应该怎么做”。这是一项革命性的功能,它将AI从一个通用的代码生成工具,转变为一个深度理解特定项目架构、规范和目标的“项目感知伙伴” 。  

这一系统已经从最初单一的.cursorrules文件,演进为一个更强大、更灵活的体系,其核心是位于项目.cursor/rules/目录下的.mdc(Markdown Domain Configuration)文件 。这些规则大致可分为三类:  

  1. 用户规则(User Rules):在Cursor的全局设置中定义,适用于所有项目,通常用于设定个人偏好,如AI的语气、回应风格等 。  
  2. 项目规则(Project Rules):以.mdc文件形式存储在项目内,可以被版本控制(如Git),与团队共享,确保AI行为在整个团队中保持一致 。  
  3. 记忆(Memories):根据用户与AI的对话自动生成的规则,帮助AI从过去的交互中学习 。  

.mdc文件的强大之处在于其前端元数据(frontmatter)部分,它通过几个关键字段来定义规则的触发和行为:

  • description: 用自然语言描述规则的用途。这不仅仅是给人看的注释,更是给AI看的“触发条件”。AI会根据当前对话的上下文,判断该描述是否与任务相关,从而决定是否激活此规则 。  
  • globs: 使用文件路径模式(如 app/controllers/**/*.rb)来限定规则的作用域。当用户引用的文件匹配该模式时,规则就会被注入上下文 。  
  • alwaysApply: 一个布尔值,设为true时,该规则会被无条件注入上下文,适用于全局性的指导原则 。  

通过这些规则,开发者可以实现高度定制化的AI行为。例如,可以编码化项目的架构模式(“在API目录中,所有验证都必须使用zod”)、代码风格规范(“React组件应遵循‘Props接口在顶部,样式在底部’的布局”)、甚至是复杂的、由AI驱动的工作流(“当我要求‘分析应用’时,自动运行开发服务器,获取日志,并提出性能改进建议”)。  

这种机制代表了一种范式上的转变:从命令式提示(imperative prompting)转向声明式AI配置(declarative AI configuration)。开发者不再需要在每次对话中重复性地输入冗长的指令,而是通过编写规则文件,一次性地、持久化地定义AI在其项目中的行为准则和约束。这本质上是一种元编程(meta-programming),开发者正在“编程”他们的AI助手。这是使AI Agent变得足够可靠、可预测,从而能够在企业级开发中大规模应用的关键一步。其逻辑链条如下:

  1. LLM在不同会话间没有记忆 。在每个提示中重复复杂的指令是低效且易错的。  
  2. Cursor Rules通过在提示层面提供“持久化、可复用的上下文”来解决这个问题 。  
  3. .mdc文件的globsdescription字段使得这些指令可以被自动、智能地应用,无需用户时刻记起。
  4. 这使得人机交互从简单的问答对话,提升为一个结构化、可配置的系统。开发者不再仅仅是AI的“用户”,更是AI在其项目内行为的“架构师”。这是一种更成熟、更具可扩展性的人机协作模型。

llms.txt标准:一次早期的探索

在探讨更先进的解决方案之前,有必要回顾一下llms.txt。这是一个早期的社区驱动尝试,旨在为AI可读的文档创建一个标准化格式 。其理念是,文档库的作者可以在其网站根目录放置一个 llms.txt文件,该文件会列出一系列指向详细文档的Markdown文件链接。这样,像Cursor这样的AI编辑器理论上就可以通过解析这个清单,来获取最新的、结构化的知识。

然而,这一标准的采纳和实现并不一致。一些用户发现,像Cursor这样的工具似乎并没有完全遵循该规范去抓取和索引所有链接的文件,导致AI的上下文不完整,从而引发了用户的困惑 。  

尽管llms.txt的实践效果有限,但它作为一个历史产物具有重要意义。它代表了社区为解决LLM“知识陈旧”问题所做的首次标准化努力。它的局限性——依赖于客户端的主动抓取、缺乏动态性和交互性——恰恰凸显了对更强大、更可靠、由服务器驱动的解决方案(如Context7和MCP)的迫切需求,清晰地展示了行业技术演进的路径。

上下文生态系统——超越本地项目

有效的AI协作不仅依赖于本地项目的上下文,更需要一个能够连接外部知识和工具的广阔生态系统。本部分将视野从单个编辑器扩展到正在兴起的服务和协议,它们共同构成了AI的“外部大脑”。

使用Context7实现动态、高保真度的上下文

Context7是由Upstash团队开发的一个强大平台,其核心使命是解决LLM知识陈旧的顽疾 。它通过一个精密的自动化流程,为LLM和AI编码助手提供永远最新的、特定版本的文档和代码示例。  

该平台的工作流程可以概括为“RAG即服务”(RAG-as-a-Service):

  1. 解析(Parse):自动从各大文档库(支持Markdown、reStructuredText、Jupyter Notebooks等多种格式)中提取代码片段和示例 。  
  2. 丰富(Enrich):利用LLM为提取出的代码片段添加简洁的解释和元数据 。  
  3. 向量化(Vectorize):将处理后的内容转化为向量嵌入,以便进行快速的语义搜索 。  
  4. 重排(Rerank):使用专有的排序算法对搜索结果进行评分,确保返回给用户的上下文是最相关的 。  
  5. 缓存(Cache):通过Redis等高性能缓存提供服务,确保低延迟响应 。  

通过这一流程,Context7能够提供比简单复制粘贴文档更高质量的上下文。它剔除了无关的“噪音”(如导航栏、广告等),只保留了干净、精确的代码和描述 。这对于那些LLM训练数据中覆盖不足的新兴框架或小众库来说,价值尤为巨大 。  

Context7代表了一种重要的行业趋势:将上下文检索的过程外部化和产品化。它提供了一个强大的抽象层,任何AI客户端(如Cursor、Claude等)都可以通过简单的API调用或链接嵌入,接入一个高质量、持续更新的知识库,而无需自行构建和维护复杂的数据摄取与处理管道。这极大地降低了构建智能、知识丰富的AI应用的门槛。

通用翻译器:模型上下文协议(MCP)

如果说Context7是为AI提供高质量“弹药”的军火库,那么模型上下文协议(Model Context Protocol, MCP)则是连接所有武器系统和传感器的标准化总线。MCP是由Anthropic公司于2024年11月推出的一项开放标准,并迅速得到了OpenAI、Google DeepMind、Microsoft等行业巨头的支持 。它的目标是标准化AI模型与外部工具、系统和数据源的集成方式。  

MCP被形象地比作“AI应用的USB-C端口” 。在MCP出现之前,将LLM连接到数据库、API或本地文件系统,需要开发者为每个连接编写定制化的、脆弱的“胶水代码”,这是一项繁重且难以维护的工作 。MCP通过定义一个通用的、基于JSON-RPC 2.0的协议,彻底改变了这一局面 。  

MCP的核心架构是Client-Server模型 :  

  • MCP主机(Host):指代希望通过MCP访问数据的AI应用程序,如Cursor、JetBrains IDE或Claude桌面应用。
  • MCP服务器(Server):是一个轻量级程序,它将特定的外部能力通过MCP协议暴露出来。
  • 能力(Capabilities):服务器可以暴露三种主要能力:
    • 资源(Resources):提供数据和上下文,如文件内容、数据库查询结果 。  
    • 工具(Tools):提供可执行的函数,让AI能够产生实际的副作用,如发送API请求、执行计算 。  
    • 提示(Prompts):提供可复用的提示模板和工作流 。  

一个不断增长的MCP服务器注册表正在形成,涵盖了从Git、GitHub到数据库、网页抓取等各种常用工具 。这意味着任何兼容MCP的主机都可以即插即用地连接到任何兼容MCP的服务器,从而获得其能力。  

MCP是本文所讨论的最具变革性的趋势。它标志着单体、封闭的AI模型时代的终结,以及一个可组合、Agentic的AI系统新纪元的开启。行业的价值主张正在从单个LLM的原始智能,转向AI应用通过一个通用协议来编排一个由专业化工具和数据源组成的网络的能力。

其内在逻辑是:

  1. 单个AI工具存在固有局限(知识陈旧、无法与现实世界交互)。  
  2. 以往将它们与外部服务连接的过程是定制化、脆弱且成本高昂的 。  
  3. MCP将这种连接标准化 。  
  4. 这种标准化允许任何兼容MCP的客户端(如Cursor、Copilot)即时连接到任何兼容MCP的服务器(如Context7、GitHub),从而创造出能力的组合爆炸效应 。  
  5. 一个AI Agent现在可以在一个统一的工作流中,无缝地查询数据库、读取本地文件、搜索最新文档并发送一条Slack消息。这正是当前备受关注的“AI Agent”概念背后的技术基石。

横向比较:主流AI编码工具的上下文管理策略

AI编码工具市场日益拥挤,各个产品都声称自己“智能”。为了拨开营销的迷雾,看清本质,我们必须比较它们在上下文管理这一核心能力上的具体实现机制。下表总结了几个主流工具的关键特性,随后的分析将对此进行详细阐述。

工具持久化指令 (类比 rules.md)文件排除 (类比 .cursorignore)聊天内上下文 (@, #)动态上下文 (MCP支持)Agent能力 (Agent Mode)
Cursor✅ (User/Project Rules, .mdc)✅ (.cursorignore, .cursorindexingignore)✅ (@Files, @Codebase, etc.)✅ (Agent Mode)
GitHub Copilot✅ (Personal/Repo Instructions)✅ (Content Exclusion)✅ (@workspace, #file)✅ (Public Preview)✅ (Coding Agent)
JetBrains AI Assistant❌ (无直接对应功能)✅ (.aiignore)✅ (@, #file, #symbol)✅ (Beta)🟡 (Edit Mode, 多文件变更)
Zed✅ (Rules)🟡 (通过规则和工具配置)✅ (@ mentions)✅ (Agent Panel)
Aider (CLI)✅ (通过配置文件和只读文件)✅ (.aiderignore)🟡 (通过 /add, /read 命令)🟡 (通过 AiderDesk 扩展)✅ (原生命令行Agent)

GitHub Copilot:从助手到平台的演进

GitHub Copilot已经从一个简单的代码补全工具,迅速演变为一个复杂的、深度集成上下文的编程平台。它通过@workspace#file等变量为聊天提供精确的上下文范围 。其“内容排除”功能类似于.cursorignore,允许组织和个人阻止特定文件被AI处理 。更重要的是,Copilot引入了个人和仓库级别的“自定义指令”,这在功能上与Cursor的rules.md非常相似,允许团队为特定项目编码AI的行为准则 。最关键的战略举措是,GitHub正在积极拥抱MCP,旨在将Copilot打造成一个可扩展的平台,能够集成无数第三方工具和服务 。  

JetBrains AI Assistant:深度IDE集成

JetBrains AI Assistant的优势在于其与IntelliJ IDEA、PyCharm等IDE的无缝集成。它利用IDE本身对代码结构的深刻理解,提供高度情境化的重构和修复建议 。在上下文管理方面,它同样支持通过#@符号在聊天中引用文件、符号等 。它通过.aiignore文件来排除特定文件,以保护隐私和提升性能 。与Copilot一样,JetBrains也正在将MCP作为其连接外部数据源(如数据库、API)的核心技术,目前处于Beta阶段 。  

命令行Agent (Aider & Amazon Q CLI):Git原生的工作流

Aider和Amazon Q CLI代表了另一种截然不同的交互范式,专为习惯于命令行的开发者设计。它们的上下文管理与本地文件系统和Git仓库紧密绑定。Aider会通过分析整个代码库,构建一个紧凑的“仓库地图”(repository map),为LLM提供高层次的项目结构概览,这在大型项目中尤为有效 。这些工具将Git作为核心交互机制,AI的每一次修改都会被自动提交,使得完整的版本历史记录成为人机对话的一部分,开发者可以使用 git diff/undo等命令轻松地审查和回滚AI的变更 。这种工作流对于偏爱脚本化、自动化和版本控制的开发者具有极大的吸引力。  

开源挑战者 (Zed & Void):性能与透明度的追求

Zed和Void是新一代的开源代码编辑器,它们从一开始就将AI和高性能作为核心设计目标。Zed拥有一个强大的“Agent面板”(Agent Panel)来管理与AI的交互,支持通过@符号添加上下文,并且也是一个MCP客户端,能够连接外部工具 。Void则定位为Cursor的开源替代品,它将隐私和本地模型控制放在首位,允许用户直接连接到本地运行的LLM,避免将代码发送到第三方服务器,同时它也实现了Agent功能和MCP支持 。它们的开源特性为开发者提供了最大程度的控制权和透明度。  

新兴的范式——人机协作编程的未来

当我们整合前述的所有趋势——从应对LLM固有缺陷的本地工具,到连接外部世界的生态协议——一幅关于未来软件开发协作模式的清晰图景便浮现出来。这不仅是工具的演进,更是开发者角色和工作流程的深刻变革。

从助手到Agent:一种新的协作模型

行业正在经历一个关键的转变:从AI助手(Assistants)到AI代理(Agents)的演进。助手是被动地响应指令,帮助完成特定任务的工具,如代码补全或回答问题 。而Agent则是能够主动地规划、分解任务并自主执行完整工作流的系统 。  

本文中详细讨论的工具和协议,正是实现这一转变的基石。一个所谓的“Agent”,本质上就是一个拥有了更优越能力的助手:

  • 更好的上下文:通过RAG技术(如Context7)和长上下文窗口获得准确、全面的信息。
  • 更好的工具:通过MCP协议获得与外部世界交互的能力。
  • 更好的指令:通过持久化规则(如rules.md或自定义指令)获得清晰、一致的行为准则。

可以说,正是这些先进的沟通框架,赋予了AI“代理权”(agency)。与此同时,人机协作编程(pAIr programming)作为一个学术研究领域也日益受到关注。研究表明,尽管AI伙伴展现出巨大潜力,但目前仍缺乏像传统人与人协作编程那样成熟的评估方法和最佳实践指南 。这预示着,如何设计高效、和谐的人机协作模式,将是未来HCI领域的核心课题。  

人类为架构师,AI为实现者

随着AI能力的增强,开发者的角色正在发生根本性的变化。一位经验丰富的开发者分享的有效AI协作工作流是:首先让人类制定策略和计划,然后让AI去实现,最后由人类进行审查和迭代 。这个模型将人类的优势(战略思维、架构设计、创造力、批判性评估)与AI的优势(不知疲倦的执行、对细节的记忆、快速生成)完美结合。  

在这个新范式中,最有价值的人类技能不再是单纯地记忆和编写特定语言的语法,而是:

  • 复杂问题分解能力:将模糊的业务需求转化为清晰、可执行的技术任务。
  • 架构设计能力:为系统搭建合理、可扩展的骨架,确定技术选型,这是AI目前难以胜任的创造性工作 。  
  • AI引导与利用能力:精通如何为AI提供恰当的上下文、制定明确的规则,并从其输出中甄别出高质量的部分 。  

未来,一名高级开发者的价值,将更多地体现在其作为“AI牧马人”或“AI协调员”的能力上。他们负责定义问题、策划解决方案、监督执行过程并对最终质量负责。

对现代开发者的建议:在CADE时代茁壮成长

CADE(AI驱动的编码时代,Coding in the Age of AI-Driven Engineering),或者叫Vibe Coding(氛围编程)时代已经到来。为了在这个新时代中保持竞争力并提升效率,开发者可以采取以下行动策略:

  • 1. 成为上下文管理大师 将上下文管理视为一项核心开发技能,而不是一个辅助功能。深入学习你所选择的IDE提供的特定上下文工具,无论是Cursor的@引用、Copilot的@workspace,还是JetBrains的#file。在开始一项任务前,思考“我需要为AI提供哪些文件、哪些代码片段、哪些文档,才能让它最好地理解我的意图?”。
  • 2. 拥抱声明式指导 从一次性的、命令式的聊天提示,转向持久化的、声明式的规则配置。投入时间为你和你的团队编写高质量的项目级规则(Project Rules)或仓库自定义指令(Repository Custom Instructions)。这是一项高杠杆的活动:一次性的投入,可以在后续无数次的人机交互中,带来代码质量的显著提高和开发风格的一致性,从而节省大量的时间。
  • 3. 用协议思维看待工具 开始关注并理解MCP这样的开放协议。要认识到,你的IDE正在从一个封闭的工具,演变为一个连接着由无数服务组成的网络的“主机”。浏览MCP服务器的注册列表,思考你可以如何将你自己的数据源或内部工具通过MCP连接到你的AI工作流中。这会为你打开全新的自动化可能性。
  • 4. 采取“人在其中”(Human-on-the-Loop)的心态 永远不要盲目地信任AI的输出。将AI定位为强大的实现工具,但将架构决策、安全审查、逻辑正确性验证和最终的产品质量把关等关键环节,牢牢掌握在人类智慧的手中。建立一个“计划-AI执行-人类审查”的迭代循环工作流 。学会批判性地评估AI的建议,并准备好在它犯错时进行纠正和引导。  

最终,与AI的沟通是一门艺术,也是一门科学。掌握这门艺术的开发者,将不仅仅是代码的编写者,更是未来软件的首席架构师。

深度学习中的稠密架构与稀疏架构

在深度学习中,稠密架构(Dense Architecture)和稀疏架构(Sparse Architecture)是两种常见的神经网络设计方式,它们的主要区别在于神经元或连接的分布密度。

1. 稠密架构(Dense Architecture)

稠密架构是指每一层的神经元都与前一层的所有神经元连接的网络结构。这种结构在大多数传统的深度学习网络中都很常见,比如经典的全连接神经网络(Fully Connected Networks)和卷积神经网络(CNN)中的某些部分。

特点

• 每个神经元都会与前一层的所有神经元进行连接。

• 网络结构非常密集,参数量通常很大。

• 计算量和存储开销较大,可能导致较长的训练时间和较高的计算资源需求。

• 适用于一些要求高表达能力的任务。

优点

• 高度连接的结构使得网络可以学习非常复杂的模式和特征。

• 对于大多数传统任务,如图像分类、语音识别等表现良好。

缺点

• 参数非常多,容易导致过拟合。

• 高计算和存储需求,尤其是在大型网络中,计算资源开销很大。

2. 稀疏架构(Sparse Architecture)

稀疏架构是指每一层的神经元只与前一层中的部分神经元连接,而不是与每个神经元都连接。这样做的目的是减少计算和存储成本,提高效率。

特点

• 只有一部分连接被保留,而其他连接被去除,从而减少了网络中的参数数量。

• 稀疏连接的选择可以是手动设计的,也可以通过一些算法自动选择,比如基于稀疏性的正则化方法。

• 通常采用稀疏矩阵表示,以节省内存和计算资源。

优点

• 更少的参数,使得网络计算和存储更加高效。

• 可能有助于提高泛化能力,减少过拟合。

• 可以应用于一些资源受限的环境,比如嵌入式系统和边缘计算设备。

缺点

• 由于不是每个神经元都参与计算,可能会限制模型的表达能力,导致性能下降。

• 稀疏结构设计较复杂,可能需要特定的优化方法来训练。

稠密与稀疏架构的对比

特性稠密架构 (Dense)稀疏架构 (Sparse)
连接方式每个神经元与前一层所有神经元连接仅部分连接
参数数量较多较少
计算和存储开销
训练效率需要更多计算资源计算资源消耗较低
表现能力可能略低(取决于稀疏程度)
过拟合风险较高较低
适用场景传统大规模深度学习任务资源受限场景,如边缘计算、嵌入式

稀疏架构的应用

在一些前沿的研究中,稀疏架构已被广泛应用,例如神经网络剪枝(Pruning)技术,它通过去除一些不必要的连接(或者低权重的连接)来实现稀疏化。此外,一些更先进的模型,如稀疏变换器(Sparse Transformer)等,也采用了稀疏连接来提高计算效率,尤其是在处理大规模数据时。

总之,稠密和稀疏架构各有优缺点,通常会根据具体应用需求来选择合适的架构。在某些情况下,可能会结合这两者的优势,使用混合架构(如稠密-稀疏混合网络)来获得更好的效果。

2024年的碎碎念

1月

2024-01-01 20:19:02

对甜品的最高评价是不太甜 对男人的最高评价是不太男

2024-01-02 12:02:27

一些景点有了新的装修;
iPhone用上了八达通;
更多商户支持了WeChatPay和Alipay;
KeeTa崛起,蚕食Foodpanda等外卖平台;
很多地方还残留有covid-2019疫情的贴纸提示,有些taxi上也还留有“认证抗疫的士”的贴纸;

2024-01-02 12:05:16

元旦假期日均出入境人次恢复到2019年水平

2024-01-02 18:56:09

卫视中文台、卫视电影台、星卫HD电影台、星卫娱乐台停播

2024-01-04 00:00:48

每半个月领到的WLD,转到CEX卖掉,然后U转到OneKeyCard(这一步有手续费)就能在国内支付使用了……

2024-01-04 15:05:33

Pascal、Euler 和 Oberon 等语言的作者和合作者 Niklaus Wirth 于 2024 年 1 月 1 日去世,享年 89 岁。Niklaus Wirth 于 1934 年 2 月 15 日出生于瑞士,先后任教于斯坦福、苏黎世大学、苏黎世联邦理工学院,曾在施乐帕洛阿尔托研究中心进修两年。他是 Algol W 、Modula、Pascal、 Modula-2、Oberon 等语言的主设计师,是 Euler 语言的发明者之一。1984 年他因在编程语言上的贡献而获图灵奖。他亦是Lilith电脑和Oberon系统的设计和执行队伍的重要成员。

2024-01-05 18:49:05

Introducing http://aoyo.ai – the new AI search

This is an AI search product designed for everyone.

-Based on the latest RAG technology, it allows you to search foreign language content on the internet in your native language, and the AI will summarize and respond in your native language.

-No ads, no content censorship, supporting traditional search commands like site/filetype/inurl, and can replace daily web searches.

2024-01-07 10:55:40

《繁花》的电视频道播出时间:https://www.tvmao.com/drama/YG0jXGVl/playingtime

2024-01-08 17:32:56

做出海工具不要用国内域名注册商和dns,godaddy+cloudflare+github+vercel完事

2024-01-08 22:22:29

Vision Pro来了! 1/19开始预订,2/2美国上市

2024-01-08 23:32:45

元梦之星做得比蛋仔派对精美

2024-01-11 01:00:39

单曲循环一首low歌,明年的年度听歌报告不会有它吧

2024-01-11 01:21:17

我的 #2023年度产品 :ChatGPT、Midjourney、Raycast、HomeAssistant、aoyo.ai

2024-01-11 09:09:12

Apple Music家庭版涨价到17元/月

2024-01-11 09:23:40

一觉醒来:
GPTs和ChatGPT团队版发布
SEC批准比特币ETF

2024-01-11 11:47:31

微信AI将会在今天微信公开课PRO上亮相

2024-01-11 16:54:00

实体产品:HappyRain碳纤维伞、摩飞便携电热水杯、SteamDeck、魅族myvu眼镜、添添闺蜜机

2024-01-13 19:27:18

赖萧配得票率已经超过40%

2024-01-15 20:02:24

瑙鲁与台湾断交,ROC邦交国只剩12个了

2024-01-19 19:29:01

冬青奥会在韩国江原道

2024-01-24 12:15:54

感谢流感疫苗的保护

2024-01-24 15:25:40

商业航天发展迅速,火箭发射的成本会越来越低。

2024-01-25 20:51:22

焦点访谈关注了人工智能(发展新质生产力系列报道)

2月

2024-02-01 10:20:35

对他人大段话语的引用,只用在每一段开头用左双引号。

2024-02-08 12:34:39

今年春节档前三预测:《热辣滚烫》《飞驰人生2》《第二十条》

2024-02-16 16:05:13

活到老,学到老。

2024-02-17 09:17:06

九牛迁到深圳改名新鹏城了,没能实现成都德比(虽然中甲时期有过)

2024-02-18 08:36:11

sora可以帮助电影创作者rapid prototype

2024-02-23 22:31:58

看了几集《小敏家》,剧中的装修风格不错。

2024-02-29 00:03:22

四年一次的一天。

3月

2024-03-06 15:23:12

视频生成今年应该会大跃进

2024-03-09 20:17:54

宽屏(16:9)HD视频是2010年左右普及的。

2024-03-10 13:05:08

United Nations Relief and Works Agency for Palestine Refugees “联合国近东巴勒斯坦难民救济和工程处” 或者简称为“近东救济工程处” 为什么官方中文名带有“近东”二字

2024-03-11 19:45:30

短跑第4道是卫冕道。卫冕冠军通常被安排在第4道。

2024-03-13 21:30:48

今年还是拜登vs川普

2024-03-15 18:09:26

看到一个新品牌和新品类:盖狮可吸果泥

2024-03-17 22:11:34

Suno出现之后,音乐工业会有大的变化吧

2024-03-27 17:52:11

小米SU7的电机研发还是砸了重金的。

4月

2024-04-05 20:37:13

保持对世界的好奇心

2024-04-07 19:22:45

小米SU7的广告视频是在外滩拍的

2024-04-13 21:04:09

原来民国时期就有证券市场。

2024-04-16 18:58:33

奥运火炬传递开始了。

2024-04-25 20:31:20

神舟十八号任务,成都人叶光富担任01指令长。上一次是神十三,这次任务完成后他在太空的累计时长可能会超过一年。

5月

2024-05-02 17:40:28

殷墟遗址在河南安阳市境内

2024-05-06 20:12:56

龟兹 和 虚与委蛇,以前读错了。

2024-05-07 19:25:10

M4 iPadPro 13寸,比Pencil还薄

2024-05-20 21:03:44

深圳有数字人民币硬钱包申领自助机了

2024-05-22 18:47:22

中华民国四个字出现在了央视

6月

2024-06-05 09:22:45

支付宝小荷包产品做得不错

2024-06-13 20:09:37

今年3个热播剧的片尾曲都是周深唱的

2024-06-14 23:47:02

欧洲杯揭幕战在安联球场,东道主德国的主场也是拜仁慕尼黑的主场

2024-06-22 19:34:50

在欧洲杯赛场的场边广告牌看到比亚迪的子品牌:方程豹

7月

2024-07-07 20:28:12

“垸”的意思是湖区大坝围合的陆地

2024-07-10 08:05:36

欧洲杯半决赛和美洲杯半决赛碰到了一起

2024-07-12 18:53:29

上半年新能源汽车占有率已达33.5%

2024-07-14 19:40:11

Trump被枪击后振臂一呼的形象刻在了历史中。

2024-07-16 15:09:14

伏天开始了,听到了更近的蝉鸣。

2024-07-26 16:08:24

进入奥运时间!

2024-07-28 04:02:44

21年之后有了cctv16奥林匹克频道,这次奥运会期间cctv5台标都不变成cctv奥运五环了

2024-07-29 07:58:21

用Termius替代了Transmit

2024-07-30 08:08:08

https://www.aminer.cn

8月

2024-08-01 10:48:32

deepseek模型背后是幻方,一个做量化交易的金融巨头,合理。

2024-08-05 08:36:44

李政道去世了

2024-08-06 00:50:58

巴黎奥运冲浪比赛是在大溪地(法属)举行的。

2024-08-06 00:56:23

原来Apple Intelligence要求iPhone 15 Pro是因为端侧大模型占用运行内存较高,需要8G内存以上的设备才能运行。

2024-08-07 03:47:59

腾讯课堂也要停止服务了,2016-2024

2024-08-08 06:25:51

OpenAI 发布 gpt-4o-2024-08-06 输出token提升3倍 降价33%-50% 支持JSON格式输出

2024-08-09 09:14:10

Google 播客将于 2024年8月30日停用,在此之前,您可以导出播客订阅,以便导入到您选择的服务中。 https://support.google.com/youtubemusic/answer/14151168

2024-08-09 10:54:59

刘海龙:媒介的三阶段 https://shop.vistopia.com.cn/article?article_id=570003&share_uid=gS0Ek

2024-08-10 09:08:41

抓娃娃,这不是楚门的世界吗

2024-08-11 16:08:02

巴黎奥运收官。

2024-08-17 03:56:57

中国游戏工业迎来里程碑时刻 《黑神话:悟空》全球媒体评分解禁 https://www.cnbeta.com.tw/articles/game/1442539.htm

2024-08-19 03:18:44

ollama本地运行qwen2,真简单

2024-08-20 03:15:45

https://store.steampowered.com/charts/mostplayed

2024-08-20 13:16:43

黑神话:悟空 Steam 最高同时在玩人数215.2万,超过幻兽帕鲁了

2024-08-24 00:47:37

三伏天结束。

2024-08-24 10:19:30

Apple Watch的米奇表盘居然可以点击报时(以前手表都是静音的所以没发现

2024-08-26 06:46:48

今年全球有10次载人航天发射任务:https://spacemission.vercel.app/

2024-08-28 02:12:36

由三体宇宙联合 PICO 出品的三体 VR 互动叙事作品《三体:远征》正式登陆 PICO 平台。玩家可以在 PICO 应用商店搜索《三体:远征》加入三体游戏,接收来自三体星系的的召唤,探索恒纪元、乱纪元的奥秘。

8月26日,高度还原《三体》原著中“三体游戏”内容的虚拟现实互动叙事作品《三体:远征》将上线。玩家将佩戴上“V装具”进入书中的三体游戏世界。据了解,《三体:远征》由PICO和三体宇宙出品,三体宇宙制作。

2024-08-28 13:05:31

新教材对一些表述的调整

2024-08-30 05:10:03

QQ手机客户端也内置了微信小程序基础库,可以直接运行微信小程序了

2024-08-30 05:12:47

国内对于基座大模型市场争夺,主要是各家云厂商提供便捷化配置型产品(比如appbuilder/百炼/元器),和提供自家和别家开源模型快捷部署服务等形式。

9月

2024-09-05 01:28:07

https://www.shapeof.ai

2024-09-07 01:19:57

Boeing‘s Starliner undocking from ISS without crew.

2024-09-09 17:15:19

Watch S10终于变薄了

2024-09-10 01:42:47

Watch S10国行版本不支持快充和呼吸暂停检测功能

2024-09-10 09:28:52

SpaceX launch the FIRST commercial spacewalk, Polaris Dawn https://www.youtube.com/watch?v=gWOYQ5Dto7c

2024-09-10 14:54:13

新华网新闻稿中出现的翻译:脸书母公司“元”(meta);谷歌旗下公司“深层思维”(deepmind);法国AI创企“米斯特拉尔人工智能”(Mistral AI);

央视报道中出现的翻译:人工智能公司“抱抱脸”(huggingface)

2024-09-12 06:53:17

Endpoint,有翻译为「终结点」的,有翻译为「端点」的

2024-09-13 00:09:34

体验了OpenAI最新的大模型o1-preview(🍓),每次回答都会把推理/思考过程列出来,但实际效果并没有超出预期,不知道正式版会不会好一些。目前Plus用户限制每周30条(o1-preview)和50条(o1-mini)。

2024-09-14 01:43:09

多邻国终于不是感冒的绿鸟了😂

2024-09-15 12:47:00

微信开发者工具教育版 提供基于混元大模型的AI编程助手,官方教程:https://developers.weixin.qq.com/community/business/course/00082803ba0ad06ce59d416545bc0d

2024-09-16 12:51:55

《中国计算机报》原执行总裁张永捷去世:生前患癌多年 https://m.cnbeta.com.tw/view/1445974.htm

2024-09-18 05:55:07

Microsoft 365(Office 365)Web版现在有3个域名:

office.com

microsoft365.com

m365.cloud.microsoft

2024-09-19 11:55:16

iOS18建议的壁纸挺不错

2024-09-21 15:16:29

玩了一下“Social AI”App,UI很像Threads,当你发布一条post之后,立即会有5条来自AI fans的评论,评论区继续往下滑会再来5条,评论风格各异,可以按照自己的喜好选择fans评论的风格。也算是另一种AI陪伴了😅

2024-09-23 05:28:05

继china.com邮箱之后,老牌电邮服务商tom.com邮箱本月27日清理免费邮箱数据,收费邮箱还会继续运营,最低是15元/月。

2024-09-25 04:11:40

在抖音刷到几个连麦听方言猜家乡的博主,通过听数字1-10、出去玩、外公外婆和一些关键词的方言说法,大部分都能精确到县,越是南方口音或者越是小众有特点的方言越被快速猜到。

2024-09-25 07:14:45

需要AI帮忙总结群聊内容

10月

2024-10-02 02:45:20

https://www.cnbeta.com.tw/articles/tech/1447696.htm

2024-10-02 02:46:48

https://m.cnbeta.com.tw/view/1447731.htm

2024-10-02 02:50:54

https://m.cnbeta.com.tw/view/1447744.htm

2024-10-02 02:51:46

https://m.cnbeta.com.tw/view/1447742.htm

2024-10-02 09:39:04

鸿蒙Next借鉴了许多iOS的优点,比如隐私控制和UI交互,这是智能手机和移动互联网发展15年来的一次规范重构的机会。

2024-10-04 02:14:24

power pages、glean、notebooklm、chatgpt canvas、claude artifacts都倾向于在一个workspace里完成辅助创作任务。

2024-10-04 15:12:22

Realtime API 两个Playground:

https://platform.openai.com/playground/realtime

https://playground.livekit.io

2024-10-09 12:43:49

诺贝尔化学奖应该直接颁给AlphaFold模型

2024-10-11 03:41:32

Cybercab、Robovan

2024-10-12 10:31:16

Flux Lora 模型「 Flux_小红书真实风格丨日常照片丨极致逼真」https://www.liblib.art/modelinfo/d9675e37370e493ab8bf52046827a2b0?from=search&versionUuid=7852ee527ca34d8b940d0749a75e4b67

2024-10-13 12:37:06

筷子夹助推器nb了 我在看科幻片

2024-10-15 15:02:21

“即使强如火箭,也要抱抱”

2024-10-18 02:20:05

Ollama+OpenWebUI就是目前最好的本地大模型方案

2024-10-19 15:20:25

微信webview开始在标题栏显示网页域名。

2024-10-20 08:59:51

OneKey Card 服务逐步下线👋

2024 年 9 月 30 日起,将不再接受新的注册和充值。

2024 年 10 月 31 日,所有余额将安全转入您的钱包,并可随时提现。

2025 年 1 月 31 日,OneKey Card 服务将正式停止。

2024-10-21 02:18:39

人人网现在只剩关注页还能加载出数据了。。

2024-10-25 03:07:08

Cursor还能直接用来进行代码目录的语义化搜索,比如直接@codebase询问某模块的代码在哪里

2024-10-25 08:16:27

智谱开源端到端语音模型 https://github.com/THUDM/GLM-4-Voice

2024-10-28 00:36:48

崔永熙nba常规赛首秀替补登场2分钟,得分1分,加油!

2024-10-28 01:22:30

无论路上有没有车,在户外步行或骑行时都不要使用手机,要随时注意周围的情况。

2024-10-28 08:51:31

国行iPhone15 Pro系列、16系列、M芯片iPad Pro系列在iOS 18.2 Beta 使用Apple Intelligence的教程

https://t.me/s/TestFlightCN/28298

2024-10-29 01:58:33

神舟十九号任务有两位90后航天员,其中一位是女性。

2024-10-30 01:00:16

小米星辰无网通功能需在通话APP中使用,使用该功能前需插入SIM卡并登录小米账号;

数据来源于小米实验室,以上数据在内蒙古自治区乌兰察布市察哈尔右翼前旗草原(空旷、无遮挡、无干扰情况下)进行测试。

2024-10-30 11:11:11

鸿蒙AppGallery,迅雷和B站的更新记录里都提到了PC端,看起来全部鸿蒙应用都是Universal的

2024-10-30 11:23:11

https://www.nytimes.com/news-event/2024-election

https://decisiondeskhq.com/results/2024/General/President

https://www.politico.com/2024-election/results

https://edition.cnn.com/us

https://polymarket.com/elections

2024-10-31 12:07:03

在代码生成方面,Claude的口碑已经超过GPT

11月

2024-11-01 01:33:50

来自纽约的The Browser Company宣布停止Arc浏览器的开发。我其实也一直没有切到Arc做主力浏览器,试了几次又回到了Chrome。但真的很喜欢pin的常用webapp

2024-11-05 12:39:15

fox news在直播投票日情况了

2024-11-06 10:48:39

btc新的史高

2024-11-06 15:53:57

上古软件仓: https://skywind.me/wiki/%E4%B8%8A%E5%8F%A4%E8%BD%AF%E4%BB%B6%E4%BB%93

2024-11-07 03:31:00

万斯以前是作家,84年的,今年才40岁。这次川普万斯团队背后有硅谷投资人彼得蒂尔和马斯克的支持。传统上硅谷精英都是民主党的支持者,但也苦民主党久矣,这届川普政府感觉会是共和党内的新力量。

2024-11-08 11:06:48

微信收藏的搜索功能需要一个AI助手

2024-11-09 17:03:51

今年很多大型赛事的主色都用了紫色:钻石联赛、WTT、巴黎奥运会田径、WTA总决赛

2024-11-10 14:14:42

再次吹爆Claude,在软件和代码领域完全碾压ChatGPT

2024-11-11 14:41:03

多邻国的小听力练习做成了莉莉主持的podcast 有意思

2024-11-12 03:15:50

博通宣布 VMware Workstation 和 Fusion 彻底免费,支持商用

2024-11-13 01:36:04

DOGE起飞

2024-11-14 16:21:28

世预赛国足险胜巴林,两连胜小组排名第四

2024-11-17 06:37:47

SmartisanOS 8的字体实在是太好看了(翻出来再吸吸)

2024-11-21 03:22:58

Windsurf新王登基

2024-11-23 03:48:02

HBO Max登陆亚洲市场,有中文字幕了!

2024-11-24 15:08:05

还是在TL刷到了台湾今晚拿到的棒球世界冠军,大陆一点消息都看不到

2024-11-25 00:55:53

珍惜每一次btc回调机会,10万是共识

2024-11-25 07:42:08

Cursor更新到0.43

2024-11-25 08:21:25

多健康平安活一天 就是多成功了一天

2024-11-26 08:10:12

Mate70系列出厂搭载鸿蒙4.3,到手不用申请可直接升级5.0,明年发布的手机出厂搭载5.0。

2024-11-27 02:59:30

网易小蜜蜂,像素级对齐小红书……

2024-11-27 05:54:11

真理是不会只属于一个人的,最终它会被每个人发现。

2024-11-29 14:59:59

今天大陆媒体报道马龙到访的是“台湾文化大学”😂 这个反而不敢叫本名“中国文化大学”了🧐

2024-11-30 08:51:01

ChatGPT上线两周年。

12月

2024-12-01 02:14:20

看机器人之梦看得好难过

2024-12-01 15:04:29

https://mp.weixin.qq.com/s/ORX9rk8bTwvZNI0GhxRuKg

2024-12-02 05:37:54

又要开始年度总结了。

2024-12-04 06:44:29

这个收藏单出圈了:https://neodb.social/collection/2lYCXSioZK0RbaS3PG0k0s

2024-12-06 00:43:57

200刀的ChatGPT订阅来了

2024-12-09 10:16:30

中国上一次实施“适度宽松的货币政策”,还是胡温时期。

2024-12-10 04:02:27

https://sora.com/explore/recent

看看这个效果,感觉跟2月份没太大区别,但有了Storyboard,更好控制生成了

2024-12-10 04:07:45

把Google Cloud和Google One订阅都取消了

2024-12-11 07:07:53

邪恶大鼠标这个名字有点可爱是怎么回事

2024-12-12 10:37:09

大部分时候要低能耗蛰伏,潜龙勿用

2024-12-13 02:00:39

不去使用世界最先进的产品,就会固步自封。

2024-12-13 03:51:30

OpenAI关于昨天的事故分析报告:https://status.openai.com/incidents/ctrsv3lwd797

2024-12-13 06:59:15

Google — Year in Search 2024

2024-12-13 07:48:15

https://cn.nytimes.com/books/20241213/best-books-2024

2024-12-17 02:05:00

iPhone屏幕的色温真是每一台都不一样……(都关掉TrueTone的情况下

2024-12-18 13:36:17

iOS18了都还不能应用分屏 emmm这很难评

2024-12-19 00:42:27

把MacBookPro升级到15.2,Surface升级到24H2

2024-12-20 08:18:15

我的 #2024年度产品:

Claude

ChatGPT macOS客户端

Cursor

NotebookLM+Google AI Studio

Ollama+OpenWebUI

fullmoon+pocketpal

macOS15 iPhone镜像

扣子

欧易 Web3钱包

凤凰秀

2024-12-20 16:43:10

2024-12-23 06:29:20

用fullmoon在6GB内存的iPhone上用上了llama3.2-3b

https://fullmoon.app

2024-12-23 07:46:53

Google/Deepmind还是没有掉队,甚至坐二望一:

Gemini 2.0 Flash

https://aistudio.google.com

Imagen 3

https://labs.google/fx/zh/tools/image-fx

Veo 2

https://labs.google/fx/zh/tools/video-fx

2024-12-24 14:02:41

微信-我-设置-个人信息收集清单-图片与视频/位置

这里相当于是“微信年度总结”了

(仅支持绑定中国大陆手机号的微信帐号,WeChat不支持)

2024-12-24 15:10:45

http://share.fengshows.com/video.html?id=0c7081cd-e116-4298-851b-76916e932d6f&channelID=r06

2024-12-24 16:27:45

https://www.bilibili.com/video/BV1ttk9YkEVx

2024-12-24 16:49:24

闪极A1眼镜的排产已经到25年11月了……

2024-12-27 02:22:51

https://movie.douban.com/annual/2024/?fullscreen=1

2024-12-30 03:09:23

有了AI生成代码之后,做的工具形态更多了,从网站/app到browser插件、userscript、bookmarklet……

Apple Intelligence论文阅读

以下内容基于AI总结后修改而来,供中文读者参考。

1. 简介

在2024年的苹果全球开发者大会上,苹果公司介绍了“Apple Intelligence”,这是一个集成于iOS 18、iPadOS 18和macOS Sequoia的个人智能系统。这个系统由多个强大的生成模型组成,这些模型经过优化,能够快速、高效地完成用户的日常任务,并根据当前活动即时适应。Apple Foundation Models(苹果基础模型,简称AFM)经过专门调整,能够在写作和优化文本、优先和总结通知、创建有趣的图像以及简化应用间的交互等用户体验中发挥作用。

Apple Intelligence 的设计始终贯彻苹果的核心价值观,并建立在业界领先的隐私保护基础之上。为了开发这些AI工具和模型,我们遵循以下负责任AI的原则:

  1. 为用户提供智能工具:识别AI的负责任使用场景,为用户提供特定需求的工具,同时尊重用户的使用选择。
  2. 真实地代表用户:构建能够真实代表全球用户的产品,努力避免在AI工具和模型中延续偏见和系统性问题。
  3. 小心设计:在设计、模型训练、功能开发和质量评估的每个阶段采取预防措施,以防止AI工具的误用或潜在危害,并不断根据用户反馈改进AI工具。
  4. 保护隐私:使用强大的设备端处理和创新基础设施如私有云计算,保护用户隐私,不使用用户的私人数据进行模型训练。

在本文中,我们将详细介绍两种模型的开发:适用于设备的约30亿参数的AFM-on-device模型和更大的基于服务器的AFM-server模型。这些模型是苹果为了支持用户和开发者开发的一系列生成模型的一部分。

2. 架构

AFM 基础模型是基于 Transformer 架构的密集解码器模型,具有以下设计选择:

  • 共享的输入/输出嵌入矩阵,用于减少参数的内存使用。
  • 采用预规范化(Pre-Normalization)和 RMSNorm,以提高训练稳定性。
  • 使用分组查询注意力(Grouped-query attention, GQA)来减少 KV 缓存的内存占用。
  • 采用 SwiGLU 激活函数,以提高效率。
  • 采用 RoPE 位置嵌入,基频设置为 500k,以支持长上下文处理。

AFM-on-device 的模型尺寸为:模型维度 3072、查询头数 24、键/值头数 8、层数 26,非嵌入参数数为 2.58B,嵌入参数数为 0.15B。

3. 预训练

3.1 数据

AFM 预训练数据集包括多种高质量的数据混合,这些数据包括:

  • 从出版商处获得的许可数据
  • 筛选过的公开数据集和开源数据集
  • Applebot 爬取的公开信息

所有数据均经过严格的去污和去除个人信息的处理,确保没有包含任何苹果用户的私人数据。

3.2 配置处理

AFM 预训练分为三个阶段:

  1. 核心预训练(Core Pre-training)
  2. 继续预训练(Continued Pre-training)
  3. 上下文扩展(Context Lengthening)

每个阶段均使用去耦权重衰减(decoupled weight decay)进行正则化,并采用 µParam(simple)来简化参数范数控制。

4. 后训练

在模型基础上进行的后训练阶段,我们进行了大量研究,以确保模型的通用能力,包括指令跟随和对话能力。我们采用了监督微调(SFT)和来自人类反馈的强化学习(RLHF)两种方法。引入了两种新的后训练算法:拒绝抽样微调算法和镜像下降策略优化算法。这些方法显著提升了模型质量。

4.1 数据

我们在后训练中采用了混合数据策略,包括人工注释和合成数据。人工注释包括演示数据和人类偏好反馈,而合成数据则由模型生成,用于增强数据质量和多样性。

4.1.1 人工注释

演示数据包含系统级和任务级的指令及其对应的响应,强调数据质量的重要性。人类偏好反馈则通过比较和排序两个模型响应来收集偏好标签,用于进一步改进模型。

4.1.2 合成数据

在某些领域,模型生成的响应质量能够与人工注释相媲美,甚至超越。因此,我们扩展了提示集合以增加多样性,并生成合成数据用于训练。

5. 支持苹果智能功能

苹果基础模型被设计用于支持iPhone、iPad和Mac上的苹果智能系统。我们使用LoRA适配器,以使基础模型能够动态地适应用户的日常任务。LoRA适配器是小型神经网络模块,可以插入基础模型的不同层中,以进行特定任务的微调。适配器的参数值使用16位表示,能够动态加载和切换,以有效管理内存和确保操作系统的响应速度。

5.1 适配器架构

LoRA适配器被用于所有的自注意力层和前馈网络层的线性投影矩阵中,只需微调适配器,保持基础模型的原始参数不变。这种方法既保留了模型的通用知识,又能支持特定任务。

5.2 优化

为了在边缘设备上高效地部署AFM模型并降低推理成本,我们应用了量化技术将权重的有效位数减少到4位以下,同时保持模型质量。为保持模型在特定领域的能力,我们开发了最先进的量化方法和框架,使得量化模型能够几乎无损地压缩,提供灵活的量化方案选择。

5.3 案例研究:摘要功能

我们利用AFM-on-device模型来实现电子邮件、消息和通知的摘要功能。虽然AFM-on-device在一般摘要任务上表现良好,但在严格符合规格方面存在困难。因此,我们对量化后的AFM-on-device模型进行了微调,生成高质量的摘要。

6. 评估

6.1 预训练评估

在预训练阶段,我们使用多个综合基准对AFM模型进行评估。核心预训练、继续预训练和长上下文预训练阶段均显著提高了模型在各种任务上的表现。特别是数学和代码模型的能力得到显著提升,尽管大部分基准表现变化在噪声范围内。

6.2 后训练评估

在后训练阶段,我们对未量化、量化和准确性恢复的模型进行了评估。实验结果显示,AFM-on-device模型在数学和语言理解等任务中表现优异,甚至超过了多个强大的开源和商用模型。尤其在写作、工具使用等任务上,AFM模型表现出色,与GPT-4等模型相媲美。

我们对AFM-on-device和AFM-server模型在各种指令跟随任务中进行了评估,这些任务涉及生成响应的长度、格式和内容等要求。结果表明,AFM模型在执行指令和一般指令跟随能力方面表现优异,超过了多个竞争模型。

7. 负责任的AI

7.1 概述

苹果智能的开发始终遵循负责任的AI原则,包括用户赋能、真实代表用户、谨慎设计和保护隐私。我们开发了一套安全分类体系,用于设计和评估我们的生成AI功能。这一分类体系覆盖了12个主要类别和51个子类别,包括仇恨言论、歧视、非法活动等。我们严格审查训练语料,确保不包含苹果用户的数据,并在推理过程中使用防护模型对输入和输出进行评估。

7.2 预训练

在预训练阶段,我们采取了多种措施确保模型的安全性,包括严格的数据政策、法律审查和安全过滤。我们避免过度过滤,以保持模型的通用能力,并为特定特征的政策迭代留有余地。

7.3 后训练

后训练阶段的目标是确保模型输出对用户有帮助,同时尽量减少潜在的危害。我们在训练数据中包括了对抗性数据,并通过监督微调和人类反馈的强化学习(RLHF)等方法提升模型的安全对齐能力。

结论

本文介绍了支持苹果智能功能的基础语言模型,包括AFM-on-device和AFM-server。这些模型旨在快速、有效地在iPhone、iPad和Mac等设备上运行,提供高质量的用户体验,如电子邮件、消息和通知的摘要。我们致力于在开发过程中贯彻负责任AI的原则,确保模型的安全性和用户隐私保护。

巴黎奥运,我这样看

央视频app:CCTV-5/5+/16/4K版16/4K/8K等多个频道直播信号在奥运会期间限时免费。另外央视频推出了9.9元15天VIP会员,切换频道想要免广告的话可以买一个。每天在“赛事中心”查看赛程,选择热点赛事进行预约,相当于加到了我关注的赛事列表,可在“我的预约”中查看所有关注的赛事时间和赛果。

奥运官网/app/小程序:查询赛中实时数据,运动员得分、排名等(https://olympics.com/zh/paris-2024/schedule),数据更新比直播信号快

微信浮窗:腾讯体育赛程(https://m.sports.qq.com/sports-event/h5-olympics-schedule.htm?competitionId=180000)、奖牌榜(https://m.sports.qq.com/sports-event/h5-medal-rank.htm?competitionId=180000)、一篇每日看点(来自人民日报)、一篇每日金牌赛日程(来自上海发布)

咪咕视频app:支持多角度信号同屏播放。

腾讯体育app:查看赛程、奖牌榜。

aoyo.ai:使用AI获取最新信息,并解答关于比赛规则、赛果、数据统计等的问题。

微信和抖音的”奥运会“搜索结果:随时获取最新资讯。

WWDC 2024 观后

新的操作系统,记录一些印象深刻的功能点,以此来观察Apple今年的软件升级方向:

iOS 18 / iPadOS 18

-控制中心改版,可全屏滑动切换页面,比如切换到媒体控制页、Home页、通信功能控制页

-新的Passwords App,统一管理所有密码

-手写计算器,在iPad备忘录中手写数学算式,画个等号或者横线,可直接计算出结果

-基于Apple Intelligence的全新Siri,支持双击Home Indicator打字与Siri沟通

macOS 15 Sequoia

-iPhone镜像,连续互通功能家族又新增成员,看演示几乎无延迟,对齐安卓阵营的多屏协同

-窗口Snapping,拖动窗口贴边即可快捷分屏

-新的Passwords App,统一管理所有密码

-Game Porting Toolkit 2,使得大量PC端游能更快移植,育碧11月发售的《刺客信条影》将同步发售macOS版本

-基于Apple Intelligence的全新Siri

watchOS 11

-新的Vitals应用程序和Training Load功能

-仅支持Apple Watch S6及以后的设备,经典的S4和基于S4的SE系统升级将截止到watchOS 10.6了

visionOS 2

-支持无线方式接入MacBook,在前方展示一个4K大屏幕,后续将可以拓展成更巨大的带鱼屏

tvOS 18

-支持21:9投屏

Audio&Home

-AirPods支持了点头、摇头交互,当腾不开手的时候来电,可以点头接电话,摇头拒接

Apple Intelligence

-Siri全局新UI,能结合个人数据和当前屏幕内容进行回答

-本地大模型+私人云服务线上大模型,线上不存储个人数据

-Keynote用了最后40分钟来讲Apple智能,分别通过功能、技术架构、应用体验三个部分做了介绍

-很多跨app的操作,后续第三方应用开发者适配后,都能张张嘴快速完成,省去点点点的很多步

-现在仅支持英语,中文支持日期没有公布

2023年的碎碎念

1月

2023-01-02 12:05:12

推荐一个电子书聚合搜索:https://tool.yibook.org/

2023-01-03 09:05:17

我的 #2022年度产品 :TeslaMic&雷石KTV、AirPlay盒子、SynologyPhoto、DSPlayer、小报童

2023-01-03 14:38:15

抖音、小红书、bilibili、微博、网易云音乐的私信系统都越来越接近完整IM了

2023-01-07 01:20:17

“人矿”一词最早出现在1984年的中共党媒《人民日报》上。意思是说,人是一种“资源”。不过现代中国网友则更多的用于对其自身调侃和对个人命运的比喻,类似韭菜、牛马等。讽刺不把人当人。

也有网友认为,“人矿”的意思就是特指那些生下来,就被作为消耗品使用的中国人。他们读20年书,还30年房贷,养20年医院,一辈子被剥削、压榨套取利益,最后还被买卖人体器官,是为终极“韭菜”。

“人矿”一词被创造出来之后,在中国知乎网站上引发热议,不少人形容这个词准确传递出这个时代缩影下的人间悲歌,并一度冲上热搜榜。

有网民表示,“如果称我们是国家的主人,有很多事情无法解释。如果称‘人矿’,那就全说得通了。”

2023-01-07 03:19:46

晚点已经透露了小米汽车的最新进展,快的话下半年就会发布。

2023-01-07 04:13:05

有人用Stable Diffusion对日文汉字进行了训练,得到一个可以生成假汉字的AI模型

2023-01-09 11:45:47

MediaDevices.getDisplayMedia()

2023-01-11 05:53:57

今年微信公开课的主角只有视频号

2023-01-11 16:52:06

小小、我爱的人、爱情,很多人都不知道是杰伦写的

2023-01-14 02:27:46

看过《去有风的地方》

https://neodb.social/tv/season/GV6taEAk1jhcNBkbF0G2Q

2023-01-14 13:17:54

9亿人感染,6万人死亡。

2023-01-14 14:14:17

看过《中国奇谭》

https://neodb.social/tv/Bl7c8ML6qvjJ7J9v9nOZw

2023-01-14 14:18:58

李现说话的样子很像张朝阳

2023-01-14 14:47:02

USDT 2022年的总清算额达到18.2万亿美元,超越VISA和MasterCard

2023-01-15 01:57:06

B站给我推荐的主题颗粒度不如小红书的细

2023-01-15 11:57:59

三体电视剧版21:30在CCTV-8开播

2023-01-18 09:45:50

畸形防疫结束后,发达的线下商业和交通网络又让大城市的生活有了魔力。

2023-01-18 10:54:44

看过《三体》

https://neodb.social/tv/season/3IZfpVCON5B3RQj4aoALIp

2023-01-20 07:41:12

新版的macQQ也更新到这个UI了,之前更多应用里的天气、腾讯网、自选股都没了

2023-01-20 08:51:00

Twitter更新开发者条款:明确不允许开发第三方客户端

2023-01-20 09:05:43

成都进入两万亿GDP俱乐部。

2023-01-21 13:06:17

看大家吐槽春晚好欢乐!

2023-01-22 07:42:24

看过《流浪地球2》

https://neodb.social/movie/5P5rawCZmazL0NHXI2Hepd

2023-01-23 23:59:29

iOS 16.3对Apple ID增加了硬件密钥的支持

2023-01-24 15:47:45

国产的桌面操作系统,有这么几种路线:deepin/UOS以及优麒麟是Linux发行版,fydeOS是ChromeOS定制版,reactOS是Android x86定制版。

2023-01-25 05:55:51

📍乌镇

2023-01-25 12:56:52

ChinaCDC披露本轮疫情主要数据:https://www.chinacdc.cn/jkzt/crb/zl/szkb_11803/jszl_13141/202301/t20230125_263519.html

2023-01-25 13:14:18

山姆会员商店买的佳沛金果盒子里居然有个这:https://www.xsense.co/xsense-system/dataloggers/rf-hitag/

看了下是冷链管理用的温度数据记录器,应该是工作人员忘了取下来?

2023-01-26 02:54:48

工资卡在招行、公积金签约卡在招行、新版社保卡在招行、个人养老金账户在招行

2023-01-26 04:04:09

YiBook的电子书工具:https://www.yibook.org/

2023-01-28 07:55:53

2023年开工~

2023-01-29 09:02:28

影史前四票房的影片,卡梅隆执导的占了三部

2023-01-30 03:57:34

iteration integration两个词很像,还经常在同一个语境里出现。

2023-01-30 15:14:24

2023年了,现在最激动人心但大多数人还不了解的东西应该就是L2-L3辅助驾驶

2023-01-31 09:36:39

https://help.openai.com/en/articles/6825453-chatgpt-release-notes

ChatGPT昨日进行了模型更新,提升了事实性和数学能力

2月

2023-02-01 14:27:58

rewind.ai就像是超梦视频的一种了,随时可以回溯电脑屏幕上见到的东西,并且在信息量和存储空间上保持了平衡(1个月的记录数据约占用15GB空间),工作时也几乎感觉不到它的存在,目前唯二的缺点就是搜索仅支持英文以及有点小贵(每月20刀)。

2023-02-01 15:06:26

#nostr 协议的iOS客户端Damus上架,今天很多人涌入了

2023-02-01 18:21:51

nip-05认证需要hex key,用这个converter可以把npub公钥转成hex:

https://astral.ninja/devTools

2023-02-04 09:22:50

Teams将会加入会后AI recap,能直接给出总结性的meeting minutes

2023-02-04 14:17:06

https://store.steampowered.com/hwsurvey/

2023-02-04 14:39:17

nostr网络几乎是全公开的,甚至私信列表都是公开的…… 只是私信消息用私钥加了密

2023-02-04 16:09:32

一年之计在于春

2023-02-04 18:59:53

https://nostr.directory/

2023-02-06 01:18:05

元宵节的doodle点进去是台湾灯会诶,真正做到了“让世界看见台湾”

2023-02-06 03:43:21

两个真正出圈的AI:AlphaGo、ChatGPT,在命名上都是两个词,4-5个音节

2023-02-07 03:03:11

文心一格,文心一言

2023-02-07 04:24:39

效率革命

2023-02-09 01:56:14

Bard给出错误答案的问题:“关于詹姆斯·韦伯太空望远镜(JWST),我可以告诉我9岁的孩子它有哪些新发现?” 问ChatGPT得到的答案就相对正确。

2023-02-09 16:56:10

https://uegov.world/

2023-02-10 16:59:35

武汉上街的规模不小,可以。

2023-02-11 20:48:36

railway部署项目还是比netlify方便

2023-02-13 15:51:44

考虑把new bing设为默认搜索引擎了

2023-02-14 08:13:23

#aigc #chatgpt 留存这两个tag

2023-02-16 06:59:55

公众号给图文内容加了一种类小红书笔记的排版,之前有思考过,这种排版突出图片,加强了图片的视觉冲击力,适合生活方式内容。

2023-02-16 13:26:02

OpenAI拿下了ai.com

2023-02-18 14:22:35

Clockology,完全实现表盘自由

2023-02-19 10:43:26

有点意思

2023-02-23 01:07:30

灵感转瞬即逝

2023-02-23 03:43:52

看久了Chrome,感觉Edge的圆角UI有点好看了

2023-02-26 12:15:50

从图片中复制文本已经如此习以为常。

2023-03-01 05:34:33

人工智能·AI 工具导航网站盘点:https://zhuanlan.zhihu.com/p/608944516

2023-03-01 05:38:19

语音消息转文字也已经习以为常。

3月

2023-03-01 22:52:07

https://www.youtube.com/live/Hl1zEzVUV7w

2023-03-02 02:07:02

收回之前的判断,Bing Chat太啰嗦且保守了,啥事都是“我只是个搜索引擎”,还是ChatGPT for Google插件更好用~

2023-03-02 04:15:36

OpenAI终于放出了ChatGPT所用的模型:gpt-3.5-turbo

切换方法:model参数“text-davinci-003”修改为“gpt-3.5-turbo”

2023-03-02 07:33:52

https://platform.openai.com/docs/guides/chat

2023-03-02 08:45:15

ChatGPT真的是一个技术经验丰富的朋友,可以跟他探讨思路

2023-03-05 01:35:35

支付宝-生活,竟然做成视频号了……口碑生活现在变成了小程序

2023-03-05 13:44:44

小程序自己出了一个多端框架Donut,直接在IDE里编译完就能在手机端体验

https://dev.weixin.qq.com/

2023-03-06 12:10:11

如果大语言模型是电,ChatGPT是电灯,还会有哪些电器?

2023-03-06 17:15:57

ChatGPT已经提前预定了一个年度产品的席位。

2023-03-06 17:42:26

“人工智能的iPhone时刻”更准确的说法应该是“人工智能的AppStore时刻”。

2023-03-07 07:47:08

再多体验了几天,Edge的Bing侧边栏可以实时理解左侧网页上的内容,并且在时效性较高的内容上也能给出回答。虽然也遇到过回答错误和无法回答的情况,但在信息查询整合这个需求上(也即搜索引擎)还是实现得比较好的,值得肯定!

2023-03-07 08:44:20

https://chatexcel.com/

2023-03-08 18:05:31

创投圈有一种2011年移动互联网时代的氛围了

2023-03-09 14:31:33

“没有政治体制改革,经济体制改革的成果可能毁于一旦。”

2023-03-10 02:59:25

“全票当选”

2023-03-11 13:39:29

国内用美区bing app访问new bing,还要把系统地区切到美国:https://answers.microsoft.com/zh-hans/microsoftedge/forum/all/%E6%89%8B%E6%9C%BAbing/3da74b48-60d7-4f06-9575-0c06daab55c1

2023-03-11 14:39:29

李强这个总理,总感觉名不正言不顺,上海民间不少议论,但网上看不到任何评论。(当然,这次并无意外,从去年10月进常委排名第二就已经揭晓答案了)

2023-03-12 05:51:47

Glarity Summary对Google搜索结果的归纳整理已经离谱到还会给出“个人见解”

2023-03-13 01:15:30

立法法的修改,等于把立法权从全体会议缩小到常委会,而常委会几乎是委员长(一尊的傀儡)一言堂。

2023-03-14 02:14:09

GPT-4和文心一言,都可能在本周开放。

2023-03-15 03:05:24

OpenAI:GPT-4 是一种高级语言模型,可以处理和生成多达 25,000 个单词的文本,可以理解图像并表达与其相关的逻辑思想。虽然其并非完美无缺,但它可以帮助人们实现日常生活中的多种任务,如教育、个人辅导和更高效的生产力等。OpenAI 和微软合作开发 GPT-4,致力于使其成为更具实用性的技术,更加个性化地服务于每个人。虽然 GPT-4 尚不完美,但其已经成为当前最先进的人工智能系统之一,我们期待通过使用和改进不断提高其性能和安全性,使其成为更加广泛普及的智能辅助系统。

2023-03-15 03:18:56

GPT-4 擅长于需要高级推理、复杂指令理解和更多创造力的任务。支持多模态(图片)理解和高达25000词的prompt。但响应速度较慢。

目前开放给Plus用户的GPT-4模型尚不支持图片输入,从发布会视频看,演示人员在jupyter notebook里用pycord实现了一个discord机器人,通过机器人进行了图片输入。

开发者平台上,目前也需要加入等待名单,OpenAI会优先将GPT-4开放给使用GPT3.5创建过应用的开发者。

另外,New Bing已经运行在GPT-4模型之上,但也还不能进行图片输入,且最高2000词。

2023-03-15 13:22:24

315晚会上测试用的数据恢复软件叫FinalData企业版

2023-03-16 07:56:35

百度文心一言的界面一看就是深受ChatGPT和New Bing的启发 :0520:

2023-03-16 13:17:41

党政更加不分

2023-03-16 16:09:43

Google Docs又浅浅更新了UI :0080:

2023-03-16 16:14:24

https://chatyoutube.com

2023-03-16 16:47:35

微软赢麻了,Office全系配AI Copilot

2023-03-17 01:47:12

大眼夹重生了哈哈哈 这周太炸裂了

2023-03-17 01:52:29

通用型人工智能真的会带来生产力革命,格局不能小了。LLM是电,ChatGPT是电灯的话,Office Copilot已经是电视机了。再想远一点,人人都能拥有一个真正可用的个人助理(能帮你做事赚钱的),而且,可能还不止一个。

2023-03-17 06:36:14

20年6月,OpenAI GPT-3

22年3月,OpenAI GPT-3.5 (text-davinci-003)

22年10月,微信大语言模型WeLM:https://welm.weixin.qq.com/docs/playground/

22年11月,ChatGPT

https://chat.openai.com/

23年2月,微软New Bing

https://www.bing.com/new

23年2月,复旦大学MOSS

https://moss.fastnlp.top/

23年3月,微软Dynamic 365 Copilot

https://www.microsoft.com/en-us/ai/dynamics-365-ai

23年3月,OpenAI GPT-4

https://openai.com/research/gpt-4

23年3月,Google Workspace AI

https://workspace.google.com/blog/product-announcements/generative-ai

23年3月,百度文心一言

https://yiyan.baidu.com/

23年3月,Microsoft 365 Copilot

https://news.microsoft.com/reinventing-productivity/

2023-03-18 10:41:25

想看《网络谜踪2》

https://neodb.social/movie/6MC6fgqepgrunY4llqA54T

2023-03-20 00:12:32

过去的一周,通用型AI完全走入大众视野。

2023-03-20 08:12:05

在Mastodon实例转发了Solidot关于Mastodon用户数突破一千万的新闻🤣

2023-03-20 08:38:26

大街上戴dyson zone的压力还是很大的

2023-03-21 16:01:16

帮黄仁勋翻译下:AI离不开Cloud,Cloud离不开NVIDIA芯片和基础服务

2023-03-23 14:46:01

https://www.youtube.com/watch?v=_E-4jtTFsO4

2023-03-24 01:18:43

加入Loop Preview,但还没看到Copilot

2023-03-25 05:59:52

想看《小熊维尼:血染蜂蜜》

https://neodb.social/movie/5x0lx60NyErQKTAmSzs8Av

2023-03-25 06:07:01

提出摩尔定律的戈登·摩尔去世。

2023-03-25 09:49:38

skype直接强行增加了bing chat聊天会话hhhh

2023-03-25 09:51:06

在Loop设置-实验性功能-Copilot处打开了,见到了Copilot的中文UI,但请求报错,还不能完成。

2023-03-28 14:37:10

GPT-4正在重塑我的思维和认知。

2023-03-29 02:52:04

在云闪付里绑了一张很久之前开的卡,绑完发现还有余额,这就是赛博时代的“从衣柜深处的衣服兜里翻到了钱”吧……

4月

2023-04-01 11:49:14

Glarity Summary现在可以在任意网页上进行内容总结了

2023-04-01 16:25:52

https://github.com/twitter/the-algorithm

抽空读一下

2023-04-03 23:05:44

耳石症

2023-04-03 23:05:56

twitter logo变成了doge

2023-04-05 05:51:43

M6竟然在中国大陆上映了

2023-04-05 06:06:47

CashApp创始人在旧金山遇刺身亡……

2023-04-05 14:17:56

开发一个工具的成本低到0,自然语言描述给gpt就行了

2023-04-09 04:13:46

这一波AIGC产品,很高兴看到首选发布Web应用的越来越多。Web应用有快速迭代持续交付的优势,体验也越来越接近Native应用。

2023-04-09 04:14:50

LLM毫无疑问会成为基础设施。

2023-04-09 13:22:00

有些小颗粒度的内容是在一些垂直的媒体或者社区去follow的,这个也会有汇总的需求。

2023-04-11 01:46:58

手机仍然是最重要的个人计算设备,但随着AGI的发展,我们有望减少因手机的工具属性而消耗的时间。比如一些需要点很多次才能完成的事情,之后可能一两次点击就搞定了。

2023-04-11 07:14:26

生成式人工智能服务管理办法。这真是速度了

2023-04-12 17:15:32

确保Web3在香港发生。

2023-04-15 11:40:13

给一个最近很喜欢的开源项目提了PR,被merge了,开心

2023-04-22 16:27:26

全球就像重生了一样,又是一个轮回的开始吗?

2023-04-22 16:30:55

上海车展:士别三年,国产新势力已经快把传统品牌干死了……

2023-04-27 00:31:50

中超恢复主客场制之后,现场气氛非常棒!

5月

2023-05-01 06:54:28

读过《中国文化常识课》

https://neodb.social/book/5FPkwXyGiGfHYZX2xgD1PD

2023-05-01 16:33:37

iOS日历的中国工作日和闹钟还是没有连起来

2023-05-02 10:22:14

以前觉得视频教程不怎么好,现在理解了看视频其实就是人类最原始的学习方法:模仿

2023-05-02 13:57:29

吴恩达的ChatGPT Prompt课程:https://learn.deeplearning.ai/chatgpt-prompt-eng/lesson/1/introduction

2023-05-05 13:29:10

全剧终

2023-05-10 02:41:35

iPad Pro上会有越来越多的专业软件,这就是Apple Silicon带来的红利

2023-05-11 01:19:00

Pixel Fold感觉是两年前的机器😂

2023-05-11 01:27:43

PaLM 2 说部分任务超越GPT-4,但LLM就是必须全能才可用。

2023-05-11 05:19:26

目前已公开,无需自己搭建即可使用的LLM Chat服务有:ChatGPT、NewBing、文心一言、Claude、Google Bard、讯飞星火

阿里通义千问和商汤SenseChat目前并未开放。

2023-05-11 16:35:58

想看《人选之人:造浪者》

https://neodb.social/tv/21eA4iogGAja20EVHYAZjd

2023-05-12 08:05:14

512地震15周年。

2023-05-14 05:02:51

在玩《塞尔达传说 王国之泪 ゼルダの伝説 ティアーズ オブ ザ キングダム》

https://neodb.social/game/4Ixm8bYfeqJAoZkl09KKfR

2023-05-14 15:21:19

为亚洲杯准备的球场虽然没举办亚洲杯,但都成为了中超球队更好的主场。在电视平台转播和社交媒体传播下,今年有越来越多的人去现场看中超比赛,至少成都和上海火爆的球市可以证明这一点。

2023-05-15 01:24:30

很有意思的幕后 https://www.nintendo.com.hk/interview/totk/index.html

2023-05-16 15:25:15

获得GPT-4 with Browsing权限~

2023-05-17 00:47:07

instagram推出广播频道功能,类似telegram channel

2023-05-17 14:11:24

上纲上线,过于离谱

2023-05-18 11:55:10

确实,工业革命级的机遇,不急于在几个月内拿出电灯泡产品

2023-05-19 00:13:48

ChatGPT官方iOS客户端上架

2023-05-21 17:05:46

体验了GPT-4的Plugins,大多外部服务都撑不住ChatGPT带来的请求量,好多个插件都挂了

2023-05-25 00:38:06

Windows11终于要官方支持rar解压

2023-05-29 01:12:27

桂海潮毕业于北京航空航天大学,硕博连读又留校任教,也是北京航空航天大学宇航学院航天飞行器技术系教授、博士生导师,航天动力学和智能控制实验室核心成员,空间载荷专家。

2023-05-30 06:41:32

很久没能静下心进入心流状态了。

2023-05-30 07:14:38

国航排队航班催C919滑行快一点,虹桥机坪atc回应:人家是有要求的嘛😂

2023-05-30 08:05:53

矢量数据库要火一波了

2023-05-31 02:09:42

盖茨说他一生中经历了两次技术变革,第一次是GUI,第二次是LLM

2023-05-31 03:05:55

github已经官方支持了树形文件目录浏览,可以告别Octotree了

6月

2023-06-02 07:17:48

按量付费的IaaS服务中,DO、GCP、AWS、Azure几家是支持随时释放资源的

2023-06-04 09:48:54

蓉城客场运气好,在白玉碗带走3分。可惜罗慕洛伤退。

2023-06-05 15:18:03

6月的WWDC比9月的秋季特别活动更像是科技春晚

2023-06-05 16:05:48

凤凰山体育公园完美继承了成都体育中心金牌球市的衣钵

2023-06-06 13:43:47

曾经无数次设想Apple的AR眼镜发布后会是什么样,没想到这一天已经来了。

2023-06-06 16:35:41

使用vision pro进行facetime通话时,自己的形象是一个建模出来的虚拟数字人。

2023-06-08 05:40:15

两年过去了,Mac App Store里能用的iPhone App也没有太多

2023-06-12 11:02:04

Apple给开发者提供了一个叫做Reality Composer Pro的工具,这是为Vision Pro做了个Unity啊

2023-06-14 01:30:43

Vision Pro的视野空间叫做Shared Space

2023-06-18 10:13:29

盖茨来中国,今天翻出他3月21号的博客再读了一遍,https://www.gatesnotes.com/The-Age-of-AI-Has-Begun

2023-06-18 11:08:06

《新华社新闻信息报道中的禁用词和慎用词(2016年7月修订)》

https://baike.baidu.com/item/%E7%A6%81%E7%94%A8%E8%AF%8D/20139960

这个好像很久没修订了,不过全文能出现在百度百科也是出乎意料。是一个很好的简中语境科普材料。

2023-06-21 09:17:37

好热,一看日历都到夏至了

2023-06-22 11:01:47

IOIOX的免费泛域名证书造福大众!rssforever的rsshub镜像造福大众!ghproxy的github镜像造福大众!

2023-06-23 04:37:10

github web topbar更新了

2023-06-23 12:47:59

2023年榕江(三宝侗寨)和美乡村足球超级联赛 http://www.lysy360.com/league/10195/card#1

2023-06-23 12:52:42

北京大学出现反专制标语 一举牌者被校方保安带走https://www.rfa.org/mandarin/yataibaodao/renquanfazhi/gt-06222023233902.html

2023-06-24 01:57:09

mac版印象笔记升级到最新版后,已经不支持国际版账号,总算完全分开了,国际版app现在所有平台体验一致了,笔记历史也能正常查看了

2023-06-24 14:11:26

凤凰的实时timeline:https://news.ifeng.com/loc/timeline/event/8QryCOYZx2v?isFull=0&immersion=true&ifengsp=1

俄卫星通讯社做的这个地图,不是更明摆着你在入侵乌克兰 https://sputniknews.cn/20230114/1047134621.html

2023-06-26 09:25:29

https://developer.apple.com/documentation/xcode-release-notes/xcode-15-release-notes

2023-06-27 15:09:05

台湾的metoo才是真正的metoo

2023-06-27 15:34:32

才意识到所有的iPad都是没有震动马达的(即使是iPad mini)

2023-06-29 03:09:31

自动驾驶研发十年:https://mp.weixin.qq.com/s/7rSUVz9kzJz4Fmcj6eXuNg

7月

2023-07-06 01:29:59

ig新的threads应用之后会接入Fediverse

2023-07-06 07:50:52

Raycast正式替代掉用了10年的Alfred

2023-07-07 06:44:22

WAIC 2023在线直播:https://online2023.worldaic.com.cn/home

2023-07-10 07:52:28

不得以防止失联、提前关注、故留悬念等方式,诱导用户关注其他账号 //哈哈哈哈哈哈哈哈哈哈哈哈

2023-07-12 05:59:58

试了下Claude2,效果也蛮好的了。api还没开放,需要申请。

2023-07-12 06:02:00

GPT-4的代码解释器,实际是一个自然语言的python运行环境,能做的事情绝不仅限于解释代码和数据分析。

2023-07-12 06:07:34

iPad版微信小程序菜单没有“添加到桌面”,其实通过手机端唤起safari后,在iPad safari上添加到主屏幕就好了。

2023-07-13 03:37:20

已经可以实现图片转格式,以及将链接生成二维码(常见的python库能实现的功能)。但还不能联网使用第三方api比如OCR查看图片中的内容。

2023-07-16 04:29:14

成都的世大运氛围已经拉满了~

2023-07-16 14:34:54

看过《智能时代》

https://neodb.social/tv/season/3C7IswjC2mqwz2q43ixUOo

2023-07-19 03:25:03

llama2来了 https://huggingface.co/blog/llama2

2023-07-19 13:48:43

美团入股了智谱AI(清华GLM大模型背后的主体),加上之前的光年之外,大模型的船票已经握紧了。

2023-07-21 02:16:44

凯文米特尼克去世,年仅59岁。

2023-07-23 07:02:50

想看《芭比》

https://neodb.social/movie/2Wv4wI4vD9A2xKldfm6bVN

2023-07-24 12:44:06

玩了一会儿SteamDeck之后再拿起Switch:卧槽,这才是掌机啊

2023-07-25 09:00:08

http://tech.sina.com.cn/s/2004-12-27/1428485862.shtml

IBM的ViaVoice算是我第一次接触“人工智能”吧

2023-07-27 06:04:21

小程序的手机号授权,都改为了手机号验证组件,准备开始收费(价格跟通过短信验证码验证类似)。其实很多场景不需要做验证,只是授权来作为唯一id的。而且本身是从用户微信绑定的手机号来的,一般情况下也不需要再验证了。

2023-07-28 08:36:43

https://results.2021chengdu.com/index.htm#/schedule/dailyschedule

这个赛果发布系统不错

8月

2023-08-01 02:59:40

Agent as a Service

https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2023-08-02 03:14:48

秦刚依然下落不明,已经有传言他自杀了……

2023-08-04 18:47:08

云安、阿璞、阿信、青峰,台湾男生都好有才

2023-08-06 04:29:08

用docker把MetaGPT跑起来了~ 测试写了三个小游戏

2023-08-07 08:21:12

Evernote最近丢数据,还是把所有笔记全部导到Notion了(虽然丢失所有空行

2023-08-07 08:24:24

动不动就识别为电信诈骗,这个识别模型有点简单了

2023-08-08 10:22:39

Cortana要彻底被Windows Copilot替代掉了,微软已经关闭了Windows11上独立的Cortana应用。

2023-08-09 02:49:19

切换Bing国际版:https://www.bing.com/?mkt=en-US

2023-08-10 04:21:06

看到路特斯的流媒体后视镜,现在政策已经允许不带实体后视镜吗?不过特斯拉上的左右辅助后视镜头已经做到比实体后视镜视野广、夜视好了,确实可以替代了

2023-08-10 11:34:21

小程序也要备案,开发者又多一个门槛

2023-08-13 07:23:57

内马尔也要去沙特踢球了😅

2023-08-13 09:24:25

wordpress app升级成了jetpack app

2023-08-14 04:32:15

玩过《博德之门3 Baldur’s Gate III》

https://neodb.social/game/0w4Ta4NeXBnTnvEuJr2qAk

2023-08-17 03:38:30

有了AI之后,人人都是神笔马良。

2023-08-17 16:10:54

原来缅北的“园区”都是2019之后建起来的

2023-08-19 07:45:45

任然庄心妍金玟岐赵乃吉周思涵王靖雯 几个巨头了 :0080:

2023-08-20 12:26:32

看过《陌生人:对话圣战分子 Season 1 第1季》

https://neodb.social/tv/season/4r0SibQawf9OrCyTgaCqyJ

2023-08-21 09:07:00

花总口述:缅北电诈真相 https://mp.weixin.qq.com/s/yN1rlXcuwqRkxWQV__9lzA

2023-08-21 10:52:36

腾讯文档做了“智能文档”,也借鉴了notion

2023-08-23 08:17:48

目前普通用户“直接登录就能使用”或者“只要申请就肯定能通过”的国内chatgpt产品有5个:

百度文心一言、阿里通义千问、讯飞星火、搜狗百川、字节豆包

国际产品:ChatGPT、Claude、Bing、Bard

国内聚合产品:ChatHub、ChatALL

国际聚合产品:Poe、Pi、Perplexity

2023-08-30 05:23:49

中芯国际居然可以生产7nm制程的芯片了

9月

2023-09-03 02:39:22

https://www.apple.com/apps/ 酷

2023-09-03 17:39:00

很真实的小说 https://xszj.org/b/340683

2023-09-04 05:47:47

喝了酱香拿铁,酒味儿还挺重的 :0010:

2023-09-07 12:54:35

https://vocalremover.org/zh/

人声伴奏分离工具

2023-09-08 01:36:51

混元这个名字比文心/千问/星火都更贴切

2023-09-10 16:13:24

sunbelife做的“鸿蒙Smartisan主题”:https://mp.weixin.qq.com/s/0MHmCuKOCiCpMQjYaTUKAw

2023-09-12 17:53:29

usb-c正式一统天下

2023-09-13 02:39:15

Watch上已经是设备端Siri了,难道内置了一个LLM?

2023-09-15 04:27:30

瑞幸x茅台、7分甜x奇奇蒂蒂、奈雪x薄盒范特西,奶茶店争相做品牌联名

2023-09-16 16:57:54

外宾WeChat用户终于有看一看入口了……(Mac微信最新版本

2023-09-19 02:59:01

白岩松上次露面是周五的新闻1+1,昨晚节目是王宁,看看今晚

2023-09-19 03:02:20

王志安对习近平不去参加印度G20的分析还是有道理的,他可能真的觉得G20不再重要,而要以金砖国家为基础搞新的。朋友圈越来越小越来越穷真的是绝了

2023-09-20 14:25:33

Party Animals正式上架开服!

2023-09-21 15:07:50

HomeAssistant简直跟TeslaMate有一拼,数据控狂喜

2023-09-25 01:57:37

子母扣yyds了

2023-09-26 10:32:50

https://blogs.microsoft.com/zh/blog/2023/09/21/announcing-microsoft-copilot-your-everyday-ai-companion/

2023-09-28 07:20:49

Telegram的第三方客户端越来越追不上主端的更新速度了

https://mp.weixin.qq.com/s/IIRfnjl4YGNJJmmnx_KznQ

2023-09-30 08:56:24

https://info.hangzhou2022.cn/zh/results/all-sports/competition-schedule.htm

10月

2023-10-02 06:09:24

今晚乒乓球女双决赛是朝鲜vs韩国 :0080: 之前女足朝鲜vs韩国的时候差点打架 哈哈哈哈

2023-10-02 06:12:21

想看《浊水漂流》

https://neodb.social/movie/7XMp1e61V5Pq3nYPKr77rV

2023-10-02 06:19:35

Chrome可以“复制视频当前帧”了~

2023-10-03 02:35:17

亚运电竞手游的官方用机是vivo的iqoo 11s

2023-10-03 06:29:14

7月某个大型活动时误关live photo,这两个月拍的照片都不能动 :0170:

2023-10-05 03:11:19

Arc Browser宣布了他们的AI新功能Arc Max,可以看出考虑了很多实际应用场景。

1、AI链接预览:按住shift之后mouseover一个链接时,即可直接查看由AI总结的链接页面内容。

2、AI总结tab网页title:很多网站的title有统一前缀,导致实际title在很后面根本看不到,或者是为了SEO堆砌了很多无用关键词,现在Arc Max可以帮助重命名网页title。

3、同上,下载文件的title也会被重命名。

4、页面内查询功能:直接升级为AI问答

2023-10-05 05:04:02

发现qq音乐有首次收听时间显示了,手动点个赞

2023-10-05 09:05:01

中超官网的api域名证书过期了也没人管

2023-10-05 11:42:08

分管科技的杭州副市长胥伟华博士,有中科院工作经历,是这次亚运会的IT总指挥。

2023-10-05 11:55:32

新闻联播首位90后主播王音琪,在新闻直播间主持已经10年了

2023-10-06 01:34:29

这种环境谁还敢说话

2023-10-08 03:26:39

iOS 17最明显的改变是:打字时的光标颜色😅

2023-10-08 08:57:01

watchOS 10 中,不再支持左右滑动屏幕来切换表盘,现在需要长按表盘进入编辑界面,才能左右滑动切换。

2023-10-08 11:25:02

习近平文化思想…… :0391: :0190:

2023-10-09 02:35:03

iOS小组件更新更频繁、可交互,现在iPhone上的小组件也可以直接添加到mac桌面,通过连续互通刷新数据。

2023-10-10 00:22:46

亚运会跟世界杯同一年举办2022 2026 2030

奥运会跟欧洲杯同一年举办2024 2028 2032

2023-10-10 08:29:58

DALL·E 3 √get

2023-10-11 08:01:58

设备端机器学习会开始跑LLM

https://developer.apple.com/cn/machine-learning/api/

2023-10-12 08:03:10

X的home icon由鸟巢形改成了火箭形

2023-10-12 08:06:04

Bard的看图能力跟GPT-4V差不多诶

2023-10-13 06:02:17

老高和小茉最近的一期提到,我们要多做能留下记忆的事情。这好像也是我一直以来默默践行的。

2023-10-13 06:04:29

体验了心光app,现在的分词、关键词提取、总结的效果还很差,几乎不可用。

2023-10-13 06:08:51

体验了纯银的新产品「犬岛」,内在美社交app,通过回答不同的问题来丰富自己的profile。

每个人都有很多故事,每个人都是一本书,刷问题的同时也是在阅读每一个陌生人,这种感觉还真的很奇妙。

所以,即使不抱着社交的目的,刷刷别人的思想,也会对自己有所启发。(至今我回答的两个问题都是从别人的回答得到的启发,而不是主动从问题列表里去答的)

2023-10-14 15:56:12

iPhone的耗电来源又多了一个:Mac小组件

2023-10-16 06:30:45

想读《崇祯》

https://neodb.social/book/5Lz6qmhQeHlGQ8iSZ6tW6E

2023-10-17 04:00:57

百度把搜索、地图、网盘、商业分析产品都加入AI进行重构

2023-10-18 05:00:25

很多图书馆都有龙源的期刊资源,但是读览天下的没有几个有,省立中山图书馆nb

2023-10-20 03:17:57

OpenAI的API服务宕机2个半小时了…… 有Azure OpenAI备用还不错

2023-10-22 14:58:32

胡锦涛、秦刚、李尚福,现在依然不知道下落和近况

2023-10-25 03:14:41

发现github的北极代码存档徽章不显示了

2023-10-26 03:19:46

长二F确实稳啊

2023-10-26 03:29:34

王局还是去的年代向钱看

2023-10-27 02:24:59

也算是十年前投身过大众创业万众创新浪潮。

2023-10-27 05:50:57

Apple has released the developer beta of iOS 17.2, and it includes the new Journal app, a digital daily diary for users to log their activities.

2023-10-27 05:55:57

别了李克强,别了团派!|李克强|习近平|团派|两会|总理|政治斗争|王局拍案20230306 https://www.youtube.com/watch?v=O0p0jsV_eI8&list=PL3bAfMXyZjrPfLIHtd6Phb4R1gBswybSq&index=143

2023-10-28 18:09:39

原来iPad也可以作为homekit家庭中枢

2023-10-31 03:01:28

Apple Event在美西时间17:00开始,30分钟结束,大家下班去过万圣节了~

11月

2023-11-01 08:43:11

上海居然把公交改道,给万圣cos狂欢人群腾了路,这波可以

2023-11-02 06:32:19

今天只发现星巴克和东方甄选刷了灰

2023-11-02 07:16:38

Studio Display Pro赶紧发布吧,需要miniLED和ProMotion拯救下MacBook扩展显示器

2023-11-02 16:00:46

原来只有5个人有过十里长街相送的待遇,李克强这次一大原因是刚离任不久,民众对过去十年是十分有感的。

2023-11-06 06:43:37

Grok AI排队:https://grok.x.ai/

2023-11-07 01:28:33

OpenAI的iPhone 4时刻:https://www.youtube.com/watch?v=U9mJuUkhUzk

2023-11-07 03:27:10

OpenAI的开发者后台也大升级了,Usage统计更加详细,但去掉了每月累计图表

2023-11-07 03:47:26

GPT-4V API开放,支持多张图片与文本混合输入,GPT正式进入多模态时代。图片输入所消耗的token数量按像素尺寸计算。

2023-11-07 03:51:10

DALL·E 3 API也正式开放,图片生成质量大幅提高。

2023-11-07 04:16:54

想看《地球脉动 第三季》

https://neodb.social/tv/season/3smiJE2Hzp1TABMI4N4IXP

2023-11-07 06:44:01

GPTs,直接读作:/ˈdʒiː.piː.tiːz/,意思也相当于GPT的复数,无数个不同角色的GPT

2023-11-08 10:08:34

GPT-4-Turbo和GPT-4-Vision API目前都在Preview阶段,每日请求数限制为200条和100条……只能用来测试体验

2023-11-10 07:21:22

https://humane.center/

2023-11-11 06:55:26

https://www.gptshunter.com/

周三就有开发者做了第三方GPT Store

2023-11-11 08:25:20

关于Humane的一些介绍:

https://hu.ma.ne/

https://x.com/humane/status/1722789149525299491

https://mp.weixin.qq.com/s/IovIZChwAIIT_kmI7Ry7Aw

https://mp.weixin.qq.com/s/IovIZChwAIIT_kmI7Ry7Aw

这就是我想拥有的AI随身记录设备,全天续航,持续记录我的个人数据,可以随时询问回溯。并且投影到手掌显示信息也很酷炫。

想来也是,一些个人助理的事情,最好能语音交互解决,必要的时候才需要显示内容,不一定需要大屏设备。

一些场景:询问眼前食物的热量、第一人称视角拍摄、面对面翻译

2023-11-13 15:17:05

应该有两种带个人数据的AI:

一种是能访问我的消息、通讯录、日历、相册、日记、足迹、健康数据等私密信息的,可供我随时回溯和查询,可以作为我的个人助理;一种是收集了我所有的作品和公开发表的内容,能模仿我的文风语气生成内容的数字分身,他人可以与我的数字分身聊天,交换思想。

2023-11-15 03:25:58

NHK:中国经济失速的真相 https://www.youtube.com/watch?v=4hiolj4PUFw

2023-11-16 07:19:38

中美要么把休斯顿和成都总领馆恢复一下

2023-11-19 05:54:44

还是希望Sam Altman和Greg Brockman回到OpenAI,这个team不是草台班子,罢免Sam的董事会才是。

2023-11-20 08:14:53

连续剧以小时级速度更新……

2023-11-21 02:10:28

本地跑大模型:https://ollama.ai/

2023-11-21 04:57:02

业界有观点认为,GPT-5可能已经在OpenAI内部表现出超越人类的特性,才会使ilya急于阻止sam融资和推向市场。

2023-11-22 03:43:19

本地跑LLM的几个整合包方案:

1、LlamaGPT,Umbrel on Ubuntu https://apps.umbrel.com/app/llama-gpt

2、Ollama & Chatd,支持macOS和linux,https://ollama.ai/

3、ChatGLM3一键整合包,仅支持Windows https://xueshu.fun/3157/

4、Baichuan 2离线整合包,仅支持Windows https://zhuanlan.zhihu.com/p/664308020

5、Pinokio 支持macOS和Windows https://pinokio.computer/

2023-11-22 06:42:52

OpenAI Assistants API,其中的知识库文件上传限制为最多20个,单个文件不超过512MB

2023-11-22 10:07:22

跟进热点做网站获得流量:

Godaddy购买域名;

Github托管代码;

Vercel部署项目;

GoogleSearchConsole管理收录;

ProductHunt冷启动;

2023-11-23 00:46:42

Procreate Dreams的Perform Mode表演模式真的实现了拖拽元素做动画

2023-11-23 06:01:45

vercel和nextjs确实好用

2023-11-23 15:21:20

蓝白合破局,kp啊

2023-11-24 10:02:10

M1的MacBook Pro已经上市三年了

2023-11-26 06:01:17

想看《备忘录 The Memo》

https://neodb.social/movie/1lE3hSp4oQ5Wc8fySnkgJH

2023-11-28 06:18:00

蛋炒饭抗议是一种网络抗议方式,于每年10月24日(毛岸英诞辰日)前后,又或11月25日(毛岸英的死亡日期)发生。 网民以张贴蛋炒饭食谱的方式,作为一种对毛岸英于朝鲜战争期间身亡的微妙讽刺;谣言称,毛岸英是因为做蛋炒饭生火把敌机引来,才牺牲的。

2023-11-28 08:44:30

白纸一周年过了,接下来还有防控新十条一周年、乙类乙管一周年

2023-11-28 09:03:23

大陆影人的作品在金马60拿下最佳剧情片、最佳原著剧本、最佳纪录片和最佳纪录短片奖,可谓创2019年以来的新纪录。

大陆导演兼编剧孙杰(作业本)自编自导的首部剧情片《大山来了》入围本届最佳新导演及最佳原著剧本奖,在最佳新导演奖败给《年少日记》香港导演卓亦谦,但《大》拿下最佳原著剧本奖。有指,孙杰本欲出席11月24日的新导演电影论坛,但金马网站突然宣布孙杰因“行程异动”无法参加。他未出席颁奖典礼,由友人代为领奖。

记录上海因冠病疫情封城的《备忘录》获得最佳纪录短片奖;最佳纪录片奖由大陆导演王兵聚焦童装工厂年轻工人的《青春(春)》,击败许鞍华、蔡明亮和赵德胤的作品夺得。

2023-11-29 03:15:00

想读《疫年纪事》

https://neodb.social/book/1UusbLJzXLOl1oBSOXk0q3

2023-11-29 13:50:14

《黑铁的鱼影》BD/DVD今日发行,大陆定档12/16

2023-11-30 02:19:41

ChatGPT发布一周年。

2023-11-30 13:07:46

魅族21太漂亮了

12月

2023-12-04 03:27:24

中国教育部今天在全国中小学举办了宪法晨读活动,直播信号来自 https://static.qspfw.moe.gov.cn/2023xfr/index.html 没有在CETV进行直播。

2023-12-04 11:38:38

五月天演唱会完全是听个氛围,一起边唱边跳。如果真有垫唱的情况完全可以理解,这个我觉得不算假唱,又不是直接拿CD音源来放 :0060:

2023-12-06 14:47:20

Pika 1.0就像是Midjourney v5发布时的效果

2023-12-06 16:01:37

Bard已经升级到Gemini Pro模型

2023-12-08 07:07:13

Grok的中文能力明显较差,逻辑能力也不怎么样,唯一亮点就是有X的实时搜索结果作为信源。

2023-12-09 14:33:06

这周二刷了疯狂动物城和飞屋环游记,有发现以前看的时候没注意的细节

2023-12-13 04:27:17

https://trends.google.com/trends/yis/2023/GLOBAL/

Google年度热搜榜

2023-12-13 16:33:46

https://blog.google/technology/ai/gemini-api-developers-cloud/

2023-12-14 09:14:47

再次感慨,AI一天,人间一年。

2023-12-15 05:21:04

happyrain的碳纤维伞肯定能上我的年度产品榜

2023-12-15 06:01:21

crisp这个在线客服工具甚至能看到用户的浏览器界面……

2023-12-15 06:32:48

doubao.com和ciciai.com是字节AI chatbot同一个产品的国内版和国际版……

2023-12-15 15:41:49

我只希望我的朋友们——无论是多年至交、已无联系的同窗还是萍水相逢的网友,能够不被这些眼光所裹挟,能够在自己的舒适区中实现精神的自洽和作为人的自由。

2023-12-16 18:28:26

《黑铁的鱼影》里竟然出现了deepfake的应用……反思人脸识别的过度使用

2023-12-17 15:41:59

https://www.fal.ai/camera

逆天了,输入人名,立即实时deepfake

2023-12-18 06:36:16

英国核废料储存设施被指泄露,多国关注核安全隐患 https://theinitium.com/zh-Hans/article/20231213-whatsnew-international-uk-sellafield

2023-12-19 06:52:32

Arc Browser的书签Folder分享功能不错,展示美观,适合公开发布。

2023-12-19 08:02:54

https://a16z.com/big-ideas-in-tech-2024/

2023-12-20 12:59:44

每次穿新衣服的第一天,吃饭必然会洒到衣服上 :0170:

2023-12-20 19:02:33

今年的很多数据都是在跟2019年对比,仿佛2019年就是去年。

2023-12-21 06:03:10

阿联酋教育部还做了个这:https://chat.milo.dev.digest.ai/

2023-12-21 15:04:53

#nowplaying 圣诞星 – 周杰伦&杨瑞代

https://y.qq.com/tl_live/client/liveroom_pc/index.html?showid=10000746&_wv=1

2023-12-23 15:55:46

哈雷彗星最近一次经过远日点的时间是在2023年12月9日。远日点是彗星轨道上离太阳最远的点,哈雷彗星在这次经过远日点时距离太阳大约是35.1天文单位。

(扫把星开始奔向地球,2061年见

2023-12-24 01:45:15

怎么还没有轻便好用日常能穿的风火轮鞋子

2023-12-25 04:28:09

电视剧里的角色用的是iPhone4,瞬间反应过来是十几年前拍的

2023-12-27 06:47:31

年终总结多到看不完了

2023-12-28 14:57:16

香港这几年的变化还不小

2023-12-31 14:38:45

刚才是一首什么奇怪版Queencard。。。

OpenAI DevDay Nov. 2023 观后

3月15日发布会上展示过的GPT-4视觉能力的API终于正式发布了,训练数据截止到2023年4月,可以说GPT-4 Vision & 128k context才是GPT-4的正式版形态。

DALL·E 3模型一并开放,与GPT-4配合,图文生成相得益彰。

目前GPT-4 Turbo和GPT-4 Vision都还是preview,模型代号分别为gpt-4-1106-preview和gpt-4-vision-preview;每个开发者账号每天的调用次数上限仅有200次(GPT-4 Turbo)和100次(GPT-4 Vision)。

很快就看到新的应用:有人用它来理解一段视频的所有关键帧,它可以快速理解视频的主要内容并能根据理解给出询问问题的结论。

具有真人语音效果的TTS-1模型也正式开放,一个可以听说读写画、具有人类所有知识的智能体诞生了,除了没有肉体和情感。

11/10补充:

GPTs,虽然这个idea今年2月在业界就有了,但OpenAI的产品实现也值得观察:通过自然语言提需求创建prompts应用,应用能力不仅是会话,还支持创建者上传自有的知识库、调用web browsing、dalle3和python沙盒,甚至可以配置与外部联动的自动化。可通过固定链接小范围传播(分享后有落地页),也可发布到GPT Store供他人使用,用户端也可以多模态输入。

杭州亚运,直播怎么看

本届亚运会,官方转播权在央视,焦点比赛,CCTV5/5+/16会进行直播,16现在还有HD和4K两个台标版本。部分地区电信移动联通的IPTV盒子可能没有5+和16这两个频道,如果没找到,可以翻出当地广电的数字电视机顶盒试试。

移动端:央视频App、咪咕视频、抖音、腾讯视频/腾讯体育。跟此前奥运会大运会一样,移动端都可以切换多视角机位,或者是多赛同看。值得一提的是,抖音的直播无需开会员,直接无广告,切换顺滑,直播页面交互简单,体验非常好。更新到最新版本在抖音搜索“亚运”即可进入专题页面。

数据:亚运官方info站有来自BONAN的实时比分数据,同时也有赛程、场馆运动员资料等信息,可以查看完赛赛果、当前正在进行的所有赛事和即将开始的赛事,有PC/移动端自适应网页。另外,亚组委官方支付宝小程序“智能亚运一站通”的第二个tab“赛事通”,也有类似info站的信息,没有运动员资料,但有每场比赛的比分详情可视化图表,可以看到比分胶着的比赛,双方得分是交替上升的。

另外,腾讯视频的赛程表上可以查看单场赛事的实际开赛时间,并可直接进入视频直播。

AI改变生活

回想起来,02年左右在PC上第一次体验到了IBM的语音输入,通过ViaVoice软件,用耳麦说话就能实现在Word中打字,算是我第一次接触到“人工智能”。

而现在,我们对语音转文字、从图片中复制文本等场景已经完全习以为常,自然到就像呼吸一样。

说到语言翻译,这些年的进步也是显著的。与十年前相比,现在的机器翻译已经更为流畅、自然。特别是结合了图像识别技术之后,我们可以直接拍照进行翻译,效果也大幅提升。而在大型语言模型如GPT系列的推动下,机器翻译的效果甚至已经接近于母语者的水平。

对于开车来说,高算力的芯片配合遍布车身的摄像头提升了车辆自身的感知能力,让我们驾驶更加安全,很多场景下辅助驾驶已经比我自己还开得稳。例如雨天人眼已经看不清车道标线,而计算机视觉呈现出的3D画面却毫秒级的显示出了我是否仍保持在车道中。

除了这些,还有更多的可能性正在被探索。例如,我们可以通过图像识别技术来识别和跟踪动物,帮助我们更好地保护生态环境。我们也可以通过语音识别技术来帮助听力障碍的人们理解他人的话语,使他们能够更好地参与到社会交往中。

这些技术的应用是无限的,它们让我们的生活变得更加便利,也为我们提供了更多的机会和可能性。我们期待着它们在未来能够带给我们更多的惊喜和变化。而我们,也将和这些技术一起,不断地探索和前进,创造一个更美好的未来。