摘要
智能体(AI Agent)被视为AI发展的下一阶段,DeepSeek此举意在缩小与美国头部企业(如OpenAI)的技术差距,抢占下一代人机交互入口。
继2025年1月开源爆款R1、3月推出MoE架构的V3系列后,DeepSeek已验证其“低成本+高性能”技术路径,为新Agent模型奠定工程与训练基础。
要实现成熟Agent,需解决多步任务规划、持续反馈学习、多模态兼容、场景泛化及安全性、公平性、稳健性等多重技术难题。
R1/V3已快速渗透政务(公文/政策解读)、企业金融(风控、客服)、医疗(诊断、影像分析)等领域,为Agent模型推出提供真实数据与商业验证闭环。
彭博消息,DeepSeek正在开发一款更高级的AI Agent模型,皆在与OpenAI等美国企业竞争。
据知情人士透露,这款AI Agent可在用户指令极少的情况下,帮助用户执行多步骤任务。他们补充称,该系统还能基于自身过往行动进行学习并持续优化。由于相关信息尚未公开,上述人士要求匿名。
事实上,DeepSeek的这一布局,正顺应了行业内打造AI Agent的大趋势。智能体被视为人工智能发展的下一阶段。知情人士补充称,DeepSeek创始人梁文锋正推动团队,计划在今年第四季度正式推出这款新模型。
2025年1月末,DeepSeek发布的开源模型DeepSeek-R1成为其发展历程中的关键节点。该模型推出后迅速登顶苹果App Store免费应用榜单,性能表现也获得广泛关注,其市场反响与技术突破被认为对AI产业格局产生了积极影响。
此后,DeepSeek再接再厉推出性能更优、性价比更高的DeepSeek-V3系列,该系列采用MoE架构,在开源模型中展现出全球领先的性能水平,可与行业内主流闭源旗舰模型相媲美,同时还具备训练成本更低、效率更高的优势。
从技术战略来看,DeepSeek此次研发的新模型核心在于强化AI Agent功能,其关键特性包括支持“最小化提示”,即能在用户指令极少的情况下代用户完成多步骤任务,同时具备基于过往行动进行学习和优化的能力,朝着更高自主性的AI Agent方向发展。
相较于传统大模型需要用户不断强化指令才能推进任务的模式,AI Agent模型在效率和执行力上实现了显著提升,这一技术升级也预示着人机互动正逐步向高度自动化方向演进。
不过,构建成熟的AI Agent系统仍面临多项核心技术挑战,例如,如何实现精准的任务规划与高效的多步逻辑执行,如何在任务执行过程中建立有效的反馈机制以支持持续学习与优化,如何实现多模态数据的兼容处理与多场景下的默认输入适配,以及如何在提升自主性的同时保障系统的安全性、公平性与稳健性等。
尽管目前DeepSeek尚未公开披露新模型的具体技术细节,但结合其此前在DeepSeek-R1和DeepSeek-V3模型研发中展现出的低成本高效能经验,行业以及权威媒体普遍认为其已具备开发更高阶段AIAgent系统的技术基础。
在应用场景拓展方面,DeepSeek的技术已逐步在政务、企业、医疗等多个领域落地。在政务系统领域,R1模型已被广泛应用多种地方政务平台,例如,部分地方政府的政务系统接入该模型后,在公文写作、政策解读、智能服务等场景中发挥了重要作用,有效提升了政务处理效率与服务质量。
在企业与金融领域,多家企业已宣布与DeepSeek展开合作,将其AI技术集成到自身业务体系中,同时,不少金融机构也已在研究分析、风险控制、客户沟通等业务环节引入DeepSeek的模型,为业务优化提供技术支持。在医疗行业,DeepSeek的技术在部分医疗机构的诊断支持、病理与影像分析、临床决策辅助等方面的应用也在逐步推进,展现出较大的应用潜力。
本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.firethy.com/65913.html