1ffa0
机械之心报道 作者:蛋酱 国产 AI 领域,,,,,,从今天起有了既能深度研究又能下手操作的自主智能体产品。。。。。。。 这款神器叫做 「AutoGLM 深思」 ,,,,,,来自中国公司智谱。。。。。。。 我们来看一个很是经典的案例:只需要输出你想讨论的话题,,,,,,AI 就能自动去小红书、知乎等平台上深度盘问、总结完整报告,,,,,,并转化为面向公共的撒播内容。。。。。。。 短短 14 天里,,,,,,AI 孵化出了一个 5000 多个粉丝的小红书账号,,,,,,还接到了商单。。。。。。。 「起号」,,,,,,从未云云简朴高效: 3 月 31 日,,,,,,智谱官宣了新一代 Agent 产品「AutoGLM 深思」。。。。。。。 相比于此前 OpenAI 的 Deep Research 等产品,,,,,, 「下手能力」 是 AutoGLM 深思最大的亮点之一。。。。。。。 它能够「边想边干」,,,,,,像人类一样自动操作和浏览网页 ,,,,,,这意味着知网、小红书、公众号、京东等优质却差池外开放 API 的信源都能被审查到,,,,,,同时基于背后基座模子的多模态明确能力,,,,,,这些网页上的图文信息也能被充分使用。。。。。。。 2025 年,,,,,,大模子手艺的演进来到了要害的新阶段:从纯粹的语言模子到多模态模子,,,,,,再到今天,,,,,,我们终于看到了成熟的自主 Agent 产品,,,,,,业内称之为「Agentic AI 时代」。。。。。。。更详细地说,,,,,,我们触手可及的大模子应用已经从「天生式 AI 的单次响应」,,,,,,真正升级为具备自主推理能力、指挥自身行动和工具挪用的智能系统。。。。。。。 「AutoGLM 深思」的面世,,,,,,扛起了国产 AI Agent 落地的大旗。。。。。。。且在今天的宣布后,,,,,, 「AutoGLM 深思」即全量上线,,,,,,免费开放给每一位用户。。。。。。。 体验方法:https://chatglm.cn/(下载「智谱清言」PC 客户端) 与此同时,,,,,,我们也看到了智谱这家中国公司在 Agent 领域的领先手艺结构,,,,,,包括推理、多模态、影象和工具。。。。。。。值得一提的是,,,,,,「AutoGLM 深思」基于的是智谱全栈自研的 Agent 手艺,,,,,,包括 新一代推理模子 GLM-Z1-Air 和基座模子 GLM-4-Air-0414,,,,,,前者性能比肩 DeepSeek-R1,,,,,,在速率提升最高 8 倍的同时,,,,,,价钱仅需 DeepSeek-R1 的 1/30。。。。。。。 关于智谱来说,,,,,,2025 年将是以「开源」为主题的一年。。。。。。。所有 Agentic 相关的模子和手艺,,,,,,包括基座模子 GLM-4-Air0414、推理模子 GLM-Z1-Air、深思模子 Z1-Rumination、智能体框架,,,,,,都将在 4 月 14 日正式开源。。。。。。。模子会在接下来的两周内,,,,,,陆续上线智谱 AI 大模子开放平台(bigmodel.cn),,,,,,惠及整个手艺社区。。。。。。。 首个免费可用、具备强反思能力的 Agent 产品 智谱体现,,,,,,「AutoGLM 深思」可以视为自主智能体的「Preview 版本」,,,,,,可以明确为 DeepResearch 和 Agent 的强强组合。。。。。。。 我们可以从三个方面去评价「AutoGLM 深思」: 翻开智谱清言,,,,,,说出自己的需求,,,,,,也就是一段 Prompt,,,,,,剩下的所有交给 AI: 它能探讨开放式问题并凭证效果执行操作,,,,,,能够模拟人类「深度研究」的历程,,,,,,从数据检索、剖析到天生报告。。。。。。。 再来一个看看: 到这里,,,,,,我们都应该看出来「AutoGLM 深思」的优势何在了。。。。。。。 「AutoGLM 深思」在一样平常 Deep Reseach 的基础上,,,,,,叠加了 AutoGLM 操作电脑浏览器的情形交互能力,,,,,, 有用增进了模子思索的宽度和深度,,,,,,自然输出的内容也就更周全了。。。。。。。 这也是第一个 C 端可以使用的拥有强反思能力的 Agent 产品。。。。。。。现在,,,,,,AutoGLM 深思的平均思索办法在 20 步以上,,,,,,拥有处置惩罚重大问题的能力。。。。。。。 现在上线的是「AutoGLM 深思」Preview 版本,,,,,,较量善于 Research 相关场景。。。。。。。在未来的两周,,,,,,产品还将增添更多的 Agent 执行能力。。。。。。。 另一方面,,,,,,「免费开放」的意义值得重视。。。。。。。以 OpenAI 的 Deep Research 为例,,,,,,虽然功效上很是吸引人,,,,,,但被惊艳到的也执偾付费 200 美元购置了 Pro 套餐的那一波会员。。。。。。。而「AutoGLM 深思」选择「免费」开放给所有用户,,,,,, 这延续了智谱的古板,,,,,,也瞬间突破了外洋 AI 公司制订的高昂价钱门槛。。。。。。。 「AutoGLM 深思」背后 智谱在下一盘 Agent 的棋 在百舸争流的手艺大厘革时代,,,,,,模子能力的领先始终是智谱这家公司位于行业内的焦点竞争力。。。。。。。在「AutoGLM 深思」面世之前,,,,,,智谱围绕 Agent 的手艺结构已经一连多年。。。。。。。 可以说,,,,,,这家公司 见证、加入、引领 了 Agent 手艺的几个主要生长阶段: 智谱清言是最早具备 Function Call 能力的大模子应用。。。。。。。早在 2023 年 10 月,,,,,,智谱就在其时的 ChatGLM3 基座大模子和智谱清言中引入了代码交互能力,,,,,,并支持 AgentTuning 手艺,,,,,,让模子实现了自主妄想使命并挪用工具完成使命。。。。。。。 2024 年头,,,,,,陪同着 GLM-4 的宣布,,,,,,智谱清言上线了 GLMs 个性化智能体定制功效。。。。。。。用户无需编程基础,,,,,,即可通过简朴的提醒词指令建设专属智能体,,,,,,并通过智能体中心分享和挪用。。。。。。。 到了 2024 年底,,,,,,智谱开放了「AutoGLM」。。。。。。。这是智谱第一个产品化的智能体 Agent,,,,,,可以做到让 AI 通过语音直接使用硬件装备,,,,,,还能跨差别 App 全局操作。。。。。。。 每一次更新,,,,,,都陪同着智谱在相关手艺研发的突飞猛进。。。。。。。「AutoGLM 深思版」的推出,,,,,,意味着智谱 Agent 产品的又一次重大迭代,,,,,,背后是更强盛的基础模子、推理、Agent 框架。。。。。。。 在这场宣布活动上,,,,,,智谱透露了「AutoGLM 深思」背后的要害手艺希望: 手艺演进路径:GLM-4 基座模子 → GLM-Z1 推理模子 → GLM-Z1-Rumination 深思模子 → AutoGLM 模子。。。。。。。 首先是 推理模子 GLM-Z1-Air 。。。。。。。GLM-Z1-Air 是智谱基于扩展强化学习手艺训练的新一代推理模子,,,,,,面临重大、开放问题,,,,,,能够举行推理和反思,,,,,,为 Agent 提供了强盛的推理、妄想与反思能力。。。。。。。其效果比肩 DeepSeek-R1,,,,,,提速 8 倍,,,,,,价钱是 R1 的 1/30,,,,,,可以在消耗级显卡上运行。。。。。。。 在性能体现上,,,,,,GLM-Z1-Air 可以与 DeepSeek-R1(671B,,,,,,激活 37B)媲美。。。。。。。智谱在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中对 GLM-Z1-Air 举行了评估,,,,,,评估效果显示 GLM-Z1-Air 展现了较为强盛的数理推理能力,,,,,,为更多重大使命的解决提供了支持。。。。。。。 GLM-Z1-Air 背后的基座模子是 GLM-4-Air-0414 ,,,,,, 以 32B 参数目比肩更大参数目的海内外主流模子。。。。。。。它在预训练阶段加入了更多的推理类数据,,,,,,并在对齐阶段针对智能体能力举行了优化,,,,,,在工具挪用、联网搜索、代码等智能体使命上的能力获得大大增强。。。。。。。 在 GLM-Z1 的基础上,,,,,,智谱又通过强化学习训练了 深思模子 GLM-Z1-Rumination ,,,,,,提升了模子连系工具使用完生长程推理能力。。。。。。。 同时,,,,,,智谱在 MAAS 平台上将免费模子 GLM-4-Flash 的基座版本更新至 GLM-4-Flash-0414,,,,,,并推出了对应的推理版本 GLM-Z1-Flash,,,,,,在保存大部分效果的情形下更轻量级、更高速,,,,,,完全免费挪用,,,,,,以适用于更普遍的应用场景。。。。。。。 在落地历程方面,,,,,,智谱也已经有了清晰的妄想:「智谱将专注于在 AGI 和基座模子研发偏向,,,,,,我们未来很长一段时间将专注于 Agentic GLM 相关模子手艺的研发上。。。。。。。我们在基座模子上搭建智能体平台,,,,,,以便资助万利官网生态同伴挪用智谱智能体的能力,,,,,,打造基于行业、地区和场景的智能体应用。。。。。。。在行业生态方面,,,,,,我们是模子厂商的占位,,,,,,我们希望资助应用相助同伴做出乐成的大模子应用。。。。。。。在都会生态方面,,,,,,我们依然是模子厂商的占位,,,,,,通过与外地龙头企业相助来赋能外地工业升级与政务的智能化。。。。。。。」 「古板的重大事情流将不复保存」 手艺和产品的飞速迭代,,,,,,将为每一小我私家带来什么??????? 举例来说,,,,,,克日 OpenAI 为 GPT-4o 增添了原生的图像生乐成能,,,,,,从网友的反响到机械之心的亲自体会,,,,,,天生效果都可以说是「一骑绝尘」,,,,,,不管是人物真实性照旧内容一致性。。。。。。。关于「文生图」这一赛道来说,,,,,,GPT-4o 树立了一个全新的标杆,,,,,,让所有的竞争敌手又主要了一下,,,,,,也让这条赛道重新活跃了起来。。。。。。。 更主要的是,,,,,,它指出了 AI 正在一直趋近理想中的状态:「所有古板的、重大的事情流都将不再保存。。。。。。。」 一句话 P 图、一句话玩手机、一句话写报告…… 不管是图像的天生和一连编辑,,,,,,照旧装备操控,,,,,,都指向这一最终形式。。。。。。。 因此,,,,,,我们能够看到「AutoGLM 深思」所具备的划时代的意义:当推理模子的「深度研究」连系 Agent 的「下手执行」,,,,,,它能够模拟人在面临重大问题时的思索、能够像人一样感知这个天下、能够像人一样使用工具。。。。。。。 Chatbot 同样具有交互性和功效性,,,,,,而 Agent 与之最大的差别就是自主性和顺应性。。。。。。。「AutoGLM 深思」的价值在于,,,,,,模子实现了自己决议操作历程,,,,,,能够通过一连、多步推理实现模子自主妄想,,,,,,并通过反思实现动态调解,,,,,,不需要提前设计事情流。。。。。。。 以后以后,,,,,,我们不需要再设计重大的智能体事情流。。。。。。。 这就是自主智能体的雏形,,,,,,不久后的我们,,,,,,或许就能触摸到 AI 作为生产力工具的理想形态。。。。。。。 就像领域内最近在讨论的看法:我们所有人都在一架上升的电梯里,,,,,,你可以站着不动,,,,,,也可以原地俯卧撑。。。。。。。但最终,,,,,,都能轻松抵达谁人一经遥不可及的高点。。。。。。。