200万上下文!月之暗面Kimi又长长长了,一次处理500个文件,还能读懂甄嬛传了 siyushenqi.com • 2025 年 8 月 13 日 下午11:07 • 海外营销 • 阅读 16 月之暗面的路线是,无损上下文长度是每一扇门的钥匙。 成立一年,拿了大把融资,大模型“长文本路线”代表人物月之暗面(Moonshot AI)现在最关心的是什么? ——依然是“长”。 去年10月,月之暗面发布支持20万汉字输入的Kimi智能助手(下简称Kimi),彼时Claude-100k支持约8万字,GPT-4-32k支持约2.5万字。Kimi是全球市场上能够产品化使用的大模型服务中最长的上下文输入长度。 20万字的“胃口”,现在变成200万了。 这是什么概念呢。举个例子,目前微信读书上单本超过200万字的作品只有5部。 会议室里,月之暗面 AI Infra负责人许欣然拿出了一个全本《倚天屠龙记》的复印版本——A4纸打印,叠起来几乎有一瓶350ml的怡宝纯净水的一半高,约100万字——还有一整个《甄嬛传》剧本,现在的Kimi Chat一次可以吃掉这俩。 一本《倚天屠龙记》的厚度 图源:硅星人 这意味着什么? 如果把上下文长度理解成大模型的“精力”,那么现在Kimi能够一口气精读500个甚至更多数量的文件,帮助用户快速分析所有文件的内容,并且支持通过自然语言进行信息查询和筛选。在Kimi还是20万字输入长度的时候,它的能力界限还在50个文件左右。 比如你可以直接扔给Kimi 500份简历,然后让它把其中符合要求的人初筛出来。 图源:月之暗面 每个文件也可以长一点。 英伟达GPT大会又要开场了,如果需要一些背景知识,你可以把英伟达过去几年的完整财报一次性扔给Kimi,让它成为一位临时的英伟达财务研究专家,来帮你分析总结英伟达历史上的重要发展节点。 图源:月之暗面 甚至你可以把LLM库的源代码直接给Kimi,然后你将会收获一个大概懂大模型是怎么回事的同事——它了解这个代码库里的所有细节,还能快速梳理出代码的结构。 图源:月之暗面 “有个1万小时定律,意思是投入1万小时的话在任何领域你都会成为一个专家,我们希望Kimi可以用10分钟完成同样的事。”许欣然说。 当然它也能做些不那么严肃的事,比如刚才提到的《甄嬛传》。 当我把全集几十万字的剧本传给Kimi, 然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。Kimi竟然能在不同时间段、各个场景的故事情节里把甄嬛、果郡王的情感线以及关于孩子的真相理顺,堪比一个看了好几十遍电视剧的“甄”学家。 图源:月之暗面 SimilarWeb数据显示,去年12月Kimi的周访问量还在10万次上下,到了1月下旬才突破40万,但是从春节开始访问量疾速攀升,到现在周访问量已经超过160万次。 然后Kimi收到的用户反馈也越来越多,从这些反馈来看,20万字很长,足够做很多更有价值的事——但还不够长。在尝试更复杂的任务,解读更长的文档时依然会遇到对话长度超出限制的情况。这也是Kimi的上下文长度需要继续提升的一个直接原因。 月之暗面相信长文本技术是大模型“登月计划”的第一步,关于大模型幻觉的问题,实用价值低的问题,本质上都是因为困在文本长度的限制里。甚至模型微调也只是目前文本长度有限情况下的权宜之计。 “所有问题都是文本长度的问题。如果你有10亿的 context length(上下文长度),今天看到的问题都不是问题”。月之暗面CEO杨植麟在之前的采访中表示。 如果单单只是为了“变长”,办法很多。长文本最终要建立在lossless(信息不随着文本长度增加而损失)上才有意义。而无损的⻓上下文将会是通往AGI的关键基础技术。某种程度上,绝对的文本长度是花架子,无损压缩的能力才能分模型的胜负。 “从word2vec到RNN、LSTM,再到Transformer,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文⻓度。”杨植麟此前表示。 月之暗面方面透露,这次上下文长度从20万字扩展到200万字由于没有采用常规的渐进式提升路线,研发和技术团队遇到的技术难度也是指数级增加的。为了达到更好的⻓窗口无损压缩性能,团队从模型预训练到对⻬、推理环节均进行了原生的重新设计和开发。许欣然所领导的AI Infra层目前效率已经提升到了原来的3倍。 而无损上下文长度的线性变化最终会决定上层建筑的形态——也就是人们到底能用大模型做什么。 领域专家、可完成复杂多步任务的Agent、多模态模型。许欣然提到了这三个方向,或许这也会是忠于长文本路线的月之暗面未来的发展方向。 Kimi智能助手已支持200万字超⻓无损上下文,并于即日起开启产品“内测”。对大模型超⻓无损上下文能力有需求的用户,可到Kimi智能助手网⻚版kimi.ai首⻚申请抢先体验。之后,月之暗面会逐步开放更多用户来体验具备超⻓无损上下文能力的Kimi智能助手。 本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.firethy.com/33586.html 赞 (0) 打赏 微信扫一扫 支付宝扫一扫 0 0 生成海报 关于作者 siyushenqi.com 关注私信 7.9K 文章 0 评论 296 问题 16 粉丝 私域神器:国内海外私域营销拓客软件 Sora并非完美,致命缺点也很多 上一篇 2025 年 8 月 13 日 下午11:07 英伟达新核弹B200发布,一台服务器顶一个超算,万亿参数大模型30倍推理加速 下一篇 2025 年 8 月 13 日 下午11:08 相关推荐 海外营销 一周要闻 NO.84丨字节AI项目 "扣子"上线;茅台抱团出海;3D打印笔月入40万 一起看看这周有哪些出海圈值得关注的大事记吧! siyushenqi.com 2025 年 8 月 14 日 12000 海外营销 2024年,国产手游《Last War》和《菇勇者传说》在韩国市场杀疯了 2024年第三季度,韩国手游下载量达1.3亿次,内购营收近12.4亿美元,环比分别增长17%和3%.去年前三个季度,累计下载量3.5亿次,内购总收入37亿美元,其中75%来自Google Play。 siyushenqi.com 5天前 5000 海外营销 还有戏?TikTok电商在印尼迎来一线生机 TikTok电商重回印尼后,如何与本土制造共同发展? siyushenqi.com 2025 年 8 月 12 日 10000 海外营销 GEO优化3年内难成气候,但谁不布局谁吃亏 大概就只能想到这么多…… siyushenqi.com 4天前 5000 海外营销 再见,仅退款 商家们要熬出头了。 siyushenqi.com 2025 年 8 月 5 日 22000 海外营销 2023年10月中国手游发行商全球收入排行榜 2023年10月中国手游发行商全球收入排行榜出炉,本篇文章旨在对该排行榜进行详细报道。 siyushenqi.com 4天前 6000 海外营销 思考和编码能力超越DeepSeek-R1?Claude推出的全球首个混合推理模型什么样 会思考的Claude。 siyushenqi.com 2025 年 8 月 13 日 13000 海外营销 跨境电商出现新风口,卖家的机会来了 跨境电商进入大变革时代。 siyushenqi.com 2025 年 8 月 12 日 11000 海外营销 成立6年布局上百个市场,追觅为什么这么快? 追觅成立时间较短、布局节奏却很快,在产品研发之外完成上百个国家市场的洞察,其实是一个很大的命题。 siyushenqi.com 2025 年 8 月 13 日 50000 海外营销 做出20亿营收的单品后,他们成功拿到了第一笔巨额融资 目前大约70名员工。 siyushenqi.com 3天前 2000 海外营销 单条4000万播放量,TikTok又带爆这类产品! 时尚与发型,永远是Tiktok上最流行的话题趋势。 siyushenqi.com 2025 年 8 月 13 日 12000 海外营销 八年旧作新出海?倩女幽魂进军东南亚买量营销分析 自2016年开服以来,网易倩女幽魂手游凭借其精良的游戏品质,一度跻身全球App Store收入前十,并在2017年达到服务器爆满的盛况。 siyushenqi.com 5天前 5000 海外营销 英伟达新核弹B200发布,一台服务器顶一个超算,万亿参数大模型30倍推理加速 老黄这次主题演讲题目为《见证AI的变革时刻》,但不得不说,英伟达才是最大的变革本革。 siyushenqi.com 2025 年 8 月 13 日 11000 海外营销 2023全球排名第一,亚马逊稳坐跨境电商头把交椅 2023年外贸成绩单发布,跨境电商增长19.6%,亚马逊多项数据均稳居全球第一。 siyushenqi.com 2025 年 8 月 12 日 14000 海外营销 ArcX、iGameBUY 确认入驻PAGC 2025丨第五届全球产品与增长展会! ArcX、iGameBUY 确认入驻PAGC 2025丨第五届全球产品与增长展会! siyushenqi.com 6天前 5000 海外营销 ilivepay 确认入驻PAGC 2025丨第五届全球产品与增长展会! ilivepay 确认入驻PAGC 2025丨第五届全球产品与增长展会! siyushenqi.com 6天前 9000 海外营销 股价大涨超4倍,AI 助力AppLovin 非游广告投放 提供真正有价值的解决方案。 siyushenqi.com 4天前 3000 海外营销 TEMU的上限在哪里? 身经百战的全球电商巨头,正被卷入一场由后来者制定的游戏规则 siyushenqi.com 2025 年 8 月 12 日 13000 海外营销 美妆占领短剧,抖音淘宝必有一战 国产美妆品牌能靠短剧翻身吗? siyushenqi.com 2025 年 8 月 8 日 23000 海外营销 脸书遭泰国政府指控:未按要求删除淫秽、敏感等内容 据海外网消息,泰国政府周四正式向警方指控Facebook和Twitter这两家公司。 siyushenqi.com 2025 年 8 月 13 日 13000 海外营销 全球狂吸20亿美元 “起跑”两年的《赛马娘》能否跑通中国市场? 马作的卢飞快,逆流回国吸金。 siyushenqi.com 3天前 1000 海外营销 私域神器每周合作精选No.123|真人互动游戏找海外发行;塔防、割草产品寻发行、投资;工具类APP出海推广方案 本期精选的合作类型涵盖真人互动游戏找海外发行;塔防、割草产品寻发行、投资;工具类APP出海推广方案等。接下来就一起看看吧~ siyushenqi.com 5天前 4000 海外营销 鸣潮之后,DNF手游也“抛弃”了安卓商店 国内安卓应用商店或许不得不重新考虑自身的位置了。随着头部游戏厂商试图挣脱渠道的束缚,希望掌控更大的主动权,“不带安卓商店玩”的风向开始快速爆发。 siyushenqi.com 4天前 2000 海外营销 太猛了,拼多多冲入世界100强 黄峥:拼多多将是一家勇于投资未来、立足长远的公司。 siyushenqi.com 2025 年 8 月 12 日 13000 海外营销 AI Agent的任务,是让我们每天最多工作四个小时 玩意儿能让我们每天只工作四个小时么? siyushenqi.com 2025 年 8 月 13 日 13000 海外营销 亚马逊和Temu的“互相成就” Temu 希望变得更像亚马逊,以降低供应链风险并提供更快的送货服务,而亚马逊也在竞相复制 Temu,因为它无法忽视这样一个事实:对于一些购物者来说,Temu 的低价胜过亚马逊的便利性。 siyushenqi.com 2025 年 8 月 6 日 16000 海外营销 夫妇做短剧月进账4亿多?当事方披露:净利不足1%,爆款不到10%,三成项目血本无归 当事公司辟谣:短剧业务净利不足1%,行业爆款率正在降低 siyushenqi.com 4天前 4000 海外营销 阶跃星辰发布Step R-mini!推理模型从此不再文理偏科 国产大模型“六小虎”成员阶跃星辰发布了最新一代模型Step Reasoner mini(简称“Step R-mini”),这是其Step系列模型家族的首个推理模型,体验地址为https://yuewen.cn。该模型擅长主动规划、尝试和反思,通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复,既擅长解决逻辑推理、代码和数学等复杂问题,也能兼顾文学创作等通用领域,实现“文理兼修”。 siyushenqi.com 2025 年 8 月 13 日 33000 海外营销 豪掷500亿日元,索尼成「老头环」开发商母公司最大股东 索尼集团与日本角川株式会社签署了战略资本与业务联盟协议,旨在加深合作并提高全球IP价值。 siyushenqi.com 5天前 4000 海外营销 一文盘点25位原大厂高管AI创业版图,覆盖全产业链 改变中国AI大模型创业格局的25人。 siyushenqi.com 2025 年 8 月 13 日 12000 发表回复 请登录后评论...登录后才能评论 提交