思考和编码能力超越DeepSeek-R1?Claude推出的全球首个混合推理模型什么样 siyushenqi.com • 5天前 • 海外营销 • 阅读 9 会思考的Claude。 作者丨汪酱 编辑丨火狐狸 就在今日凌晨(北京时间),Anthropic投下了两个“王炸”。 一是号称目前全球首个混合推理模型Claude 3.7 Sonnet——一个模型,两种思考模式,既能快速响应用户提问,也能如DeepSeek一般展示深入的推理过程。 二是智能编程工具Claude Code——这一编程工具能直接理解并操作开发者的代码库,并且可以一次性完成超45分钟以上的人工任务,开发、编码、测试流程全包揽,在代码能力的完整性和完成性上远超其它大模型。 会思考的Claude 3.7 Sonnet 自DeepSeek上线以来,我们已经料想到AI大模型赛道会有源源不断的活水涌上来,只不过无论上涌的速度,还是能力的追赶,都太快了。Claude 3.7 Sonnet正是其中一个。 根据Anthropic官方的解释,他们认为推理是前沿模型的一种集成能力,而不是完全独立的模型,因此Claude 3.7 Sonnet和市场上其他推理模型有所不同,它既是一个普通的LLM(能够生成文本并理解语言模式),同时也是一个推理模型(能够将复杂的问题拆解成一个个步骤,显示出其达成最终解决方案的思维路线)。 (图:让其写五个世界上任何地方都找不到的原创笑话,Claude 3.7 Sonnet展示了思考过程) 值得一提的是,根据AWS生成式人工智能副总裁Vasi Philomin表示,Claude 3.7 Sonnet的扩展推理思维在数学竞赛、物理、编码、深度分析等方面能力能为客户带来最大收益,比如可以构建更为复杂的GenAI驱动的应用程序。 (图:Claude 3.7 Sonnet在遵循指令、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学上有显著提升) 根据早期测试显示,Claude 3.7 Sonnet对于复杂代理工作流具有非常优越的精确性,能力甚至超过OpenAI o1和DeepSeek R1。 (图:该测试评估了AI模型解决现实世界中软件问题的能力,Claude 3.7 Sonnet在SWE-bench Verified测试中展示了最先进的性能) 此外,当通过API使用Claude 3.7 Sonnet时,用户还能够控制预算进行思考,比如给其提供一个token的数值,告诉它思考不得超过该数量的token,就能够一定程度上控制预算(目前最高输出限制为128K个token),但需要注意的是,这一方式也会影响模型回答的速度和答案的质量。 安全性方面,Claude 3.7 Sonnet能够更加准确地区分请求的正确性和错误性,因此减少了45%的“不必要拒绝”,这意味着Claude 3.7 Sonnet能够更加流畅快速地响应用户需求。 从其目前的模型形态来看,对于企业级使用者更加友好。目前,Claude 3.7 Sonnet已经可以适用于所有Claude的订阅计划,比如免费版、专业版、团队版、企业版,同时不仅能通过Anthropic API接入访问,还可以通过Amazon Bedrock、Google Cloud的Vertex AI进行访问,除免费版外的所有版本均支持扩展思考模式。 至于定价,无论哪种模式,其API定价均保持不变(和前代的模型一致),输入100万个token收费3美元,输出100万个token收费15美元(其中包括思考过程中使用的token)。相比之下,我们发现OpenAI o3-mini(早于Claude发布的能推理的模型)要更加便宜,输入定价1.1美元/1M token,输出为4.4美元/1M token。 写代码“神器”:Claude Code 虽然Claude 3.7 Sonnet的编码能力已经很强了(经官方测试),但Anthropic还是想将编码能力进一步拉高,进而推出了Claude Code这一专门的智能编程工具。目前,这一工具的功能还在持续优化中,因此尚未正式上线,仅作为研究预览版限量开放,并将根据用户反馈来进行改进。 根据Anthropic官方表示,Claude Code的定位是一个AI编程助手,能力覆盖从搜索、阅读代码、编辑、运行、测试、推送代码到GitHub等全流程。最值得关注的是,Claude Code能直接理解开发者的代码库,并且无缝集成到开发环境之中,经过测试,Claude Code已经能够在单个会话中完成通常需要45分钟以上的人工工作,极大降低人工成本。 结语 自DeepSeek推出后,AI大模型赛道无疑已经拉响了军备竞赛警报,各大科技公司纷纷加大投入,加速研发更加先进、更加智能的AI模型。比如前有OpenAI的o3-mini,凭借其出色的性能和灵活性,在多个应用场景中展现出了强大的竞争力。而现在,Claude 3.7 Sonnet的横空出世,更是将这场竞赛推向了一个新的高潮。 这场AI大模型的军备竞赛,不仅能推动技术的快速发展,同时也将在更多领域发挥关键作用,从优化业务流程、提升工作效率、降低运营成本等多个方面为企业提供助力。而可以预见的是,在这场竞赛中脱颖而出的AI模型,无疑也将成为各个行业的首选工具,为行业的数字化转型和智能化升级提供强有力的支持。 本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.firethy.com/32910.html 赞 (0) 打赏 微信扫一扫 支付宝扫一扫 0 0 生成海报 关于作者 siyushenqi.com 关注私信 7.4K 文章 0 评论 296 问题 16 粉丝 私域神器:国内海外私域营销拓客软件 中国做题家,撑起美国AI 上一篇 5天前 阿里云视频生成大模型万相2.1重磅开源 下一篇 5天前 相关推荐 海外营销 2023年拉美电商市场重点趋势 拉美将是全球增长最快的电商市场。 siyushenqi.com 6天前 8000 海外营销 AI融入语言教学,不输Duolingo的小语种教学应用大爆发 日活用户上千万,语言教学市场大爆发。 siyushenqi.com 16小时前 3000 海外营销 Shopee构建跨境直播生态体系,实现全链路价值共创 2月5日,东南亚电商平台Shopee宣布,截止2020年年底,由平台Shopee Live直播功能带来的订单增长超6倍 siyushenqi.com 5天前 8000 海外营销 百世集团联合菜鸟推出中马全链路跨境物流服务 9月23日,百世集团与菜鸟合作,开通了一条提供中国至马来西亚全链路跨境物流服务线 siyushenqi.com 5天前 9000 海外营销 零一万物决定给大厂让路 零一万物被曝要将团队整体打包卖给阿里,但李开复辟谣否认出售。事实上,公司退出基础大模型竞争,部分人员加入阿里旗下公司,与阿里云成立“产业大模型联合实验室”,在超大参数模型训练任务上为阿里让路,转而退到小参数、高性价比的模型训练上,强化应用层落地以获取更高商业回报。 siyushenqi.com 5天前 7000 海外营销 独家丨微软云PK掉亚马逊云,撬走SHEIN 数十亿云订单 未来谁当全球云计算一哥?或许取决于中国企业 siyushenqi.com 6天前 10000 海外营销 为什么AI浏览器可以聚集一切 在AI时代,浏览器依旧是组成AI体验的核心部件之一,AI浏览器从搜索的容器变成了AI能力的躯体,从信息获取的窗口变成了代理执行的伙伴,成为AI应用中竞争激烈的节点之一,众多企业和开发者投身其中。 siyushenqi.com 5天前 7000 海外营销 微软用AI Agent生成2500万对高质量数据,极大提升大模型性能! 为了解决训练数据短缺和质量差的难题,微软研究院发布了一个专门用于生成高质量合成数据的的AI Agent——Agent Instruct。 siyushenqi.com 5天前 9000 海外营销 走,出海去!美国社交观察 今天让我们一起走进美国,看看这颗「社交皇冠上的明珠」,该如何摘取。 siyushenqi.com 2025 年 8 月 3 日 23000 海外营销 跨境业务暂停不到两年,东南亚电商巨头Bukalapak又将目标瞄向菲律宾,App下载量已超.... 继 BukaGlobal 之后,印尼本土电商平台 Bukalapak 再次启动外扩计划,将目光瞄准菲律宾。 siyushenqi.com 6天前 7000 海外营销 2024年11月成功出海的中国手游 - 《Capybara Go!》问鼎增长榜,中重度手游休闲化趋势显著 2024年11月中国手游产品在海外市场收入及下载量排行榜,详细榜单变化如下。 siyushenqi.com 1天前 2000 海外营销 Noon营销副总预测2021年斋月对中东网购影响,时尚类将回升 在2020年4月斋月开始的时候,恰逢阿联酋政府下达封锁措施的指令,因为大批消费者被迫转移到线上,通过网购来购买生活必需品。 siyushenqi.com 5天前 7000 海外营销 国内首款C端AI电商应用产品落地,物圆TreLoop重塑二手交易体验 人工智能(AI)二手电商应用物圆TreLoop于近日正式开放内测。作为国内首款面向C端用户的AI电商产品,物圆TreLoop致力于为年轻用户群体打造一个集多品类、多功能于一体的生活闲置物品分享与交易平台。 siyushenqi.com 5天前 7000 海外营销 私域神器每周合作精选 No.86|国内竖屏短剧全球授权;畅读寻海外优质短剧;多款游戏产品寻合作/流量 本期精选的合作类型涵盖国内竖屏短剧全球授权;畅读寻海外优质短剧;多款游戏产品寻合作/流量。接下来就一起看看吧~ siyushenqi.com 11小时前 1000 海外营销 自变量机器人,一年融4轮! 自变量机器人(X Square Robot)完成数亿元 Pre-A++ 轮融资,由光速光合和君联资本领投,北京机器人产业基金和神骐资本跟投。融资将用于下一代具身智能通用大模型的训练与场景落地。 siyushenqi.com 5天前 9000 海外营销 名创优品是怎么成功蜕变的呢? 名创优品是怎么成功蜕变的? siyushenqi.com 6天前 9000 海外营销 将“宜家”搬到线上,搭积木式3D设计应用如何做到好评如潮? 3D设计+游戏+社交=梦中情房。 siyushenqi.com 1天前 2000 海外营销 完整外贸的报价单都包括哪些内容? 一份完整的报价单包括报价单的头部、主体和尾部,这几个部分的需要展示的内容和作用都不一样。 报价单的头部 报价单的头部也叫作报价单的抬头,用来展示公司的基本信息,通常包括公司的名称、LOGO、地址、电话、邮箱和主要联系人等。 建议大家在做报价单的时候,头部的LOGO一定要加并且要有一定的设计感,因为它代表了公司的形象,也体现了卖家的专业度。 有的客户每天会收到… siyushenqi.com 2024 年 9 月 20 日 452000 海外营销 推理越多,幻觉越重?多模态推理模型的「幻觉悖论」 随着推理链条的加长,模型的视觉感知能力却明显下滑,逐渐依赖语言先验进行“脑补”,生成内容越来越容易脱离图像本身,甚至出现凭空捏造的幻觉现象。 siyushenqi.com 5天前 10000 海外营销 10月Gmail注册100%流程 10月Gmail注册100%流程 siyushenqi.com 2025 年 8 月 3 日 17000 海外营销 投流价贵,爽点难找,短剧出海团队靠AIGC如何快速入局 AIGC如何帮短剧团队降低成本快速出海。 siyushenqi.com 16小时前 0000 海外营销 跨境电商Shein冲刺IPO,创始人许仰天将赴美会见投资者 快时尚跨境电商希音(Shein)越来越接近在伦敦上市,该公司高管预计将在未来一周与潜在美国投资者会面。 siyushenqi.com 2025 年 8 月 5 日 16000 海外营销 年销10亿!全球百强榜“暗曝”中国隐形冠军,专打最卷市场 这家企业的“反向”操作很亮眼。 siyushenqi.com 6天前 8000 海外营销 阿里国际发布最新版多模态大模型Ovis,拿下开源第一 阿里国际AI团队已在40多个电商场景里测试了AI能力,基于Ovis模型进行开发,帮助50万中小商家、对1亿款商品进行了信息优化,商家对于AI的调用量呈指数级增长。 siyushenqi.com 5天前 7000 海外营销 行业洞察丨欧洲市场2021移动市场破千亿 《State of Survival》等月环比增长超50% 欧洲手游市场仍然在稳步上升 siyushenqi.com 2025 年 8 月 3 日 14000 海外营销 PAGC 2025丨展会推荐官 DoinTV CTO 张岩、舵手互娱 创始人 苏超然、DDream & Role AI 创始人 王俊皓 邀您参与万人出海展会 PAGC 2025丨展会推荐官 DoinTV CTO 张岩、舵手互娱 创始人 苏超然、DDream & Role AI 创始人 王俊皓 邀您参与万人出海展会 siyushenqi.com 1天前 3000 海外营销 创梦天地获Playrix千万战略投资,《卡拉彼丘》出海遇强援? Playrix以3900万港元认购创梦天地2.11%股份,交易价较市价折让3.4%,实现从代理合作到股权绑定的升级。 siyushenqi.com 3天前 9000 海外营销 马斯克跟苹果互怼,但他们没告诉你的AI隐私真相是? 怒喷苹果和OpenAI,马斯克是否反应过度? siyushenqi.com 5天前 10000 海外营销 TikTok 近千万播放,“自卫钥匙扣”又被一个卖家带火了 2021年,关于“女性人身安全”的话题趋势在全球迅速蔓延,带火了一系列自卫安全钥匙扣产品。 siyushenqi.com 6天前 10000 海外营销 2023年11月成功出海的中国手游 - 《原神》重回收入榜与增长榜冠军,悠星网络、网易多款手游增长亮眼 Sensor Tower商店情报平台最新数据显示,2023年11月中国手游产品在海外市场收入及下载量排行榜,详细榜单变化如下。 siyushenqi.com 11小时前 1000 发表回复 请登录后评论...登录后才能评论 提交