【AI科技日报】GPT-6预训练完成领衔4月AI军备赛（2026年4月23日）

tags：AI科技,人工智能,大模型时间：2026-04-23 阅读：85

今日要闻速览：2026年4月AI大模型军备赛白热化，GPT-6预训练完成刷新技术天花板，国产Kimi K2.6开源追击，字节全双工语音模型落地。

1. GPT-6预训练完成：上下文窗口扩容至200万Token，预计6月发布

4月AI领域最受瞩目的事件，莫过于OpenAI宣布GPT-6已完成预训练，并计划于2026年6月向公众开放API接口。作为GPT-5的全面升级版本，GPT-6在多个核心技术指标上实现了"革命性"突破。其中，上下文窗口容量一举扩容至200万Token，这一数字意味着用户可一次性向模型输入两部中篇小说或长达10小时的音频内容，彻底解决了前代模型"内容截断、逻辑断裂"的长期痛点。与此同时，GPT-6采用了全新的稀疏混合架构，有效激活参数达2.3万亿，较GPT-5提升120%，而训练能耗却降低了40%，实现了性能与效率的兼顾。原生多模态能力的融合是另一大亮点——无需借助外部插件，GPT-6即可同步处理文本、图像、音频与视频输入，实现跨媒体信息的一致理解与生成。业内分析指出，200万Token上下文窗口的落地，标志着大模型正式迈入"全文档理解"时代，将对法律文档分析、医学影像解读、长视频内容理解等长程任务场景产生颠覆性影响。

来源：CSDN博客 | 2026-04-20

2. Kimi K2.6发布：多项指标追平国际顶尖闭源模型，Mac本地部署成亮点

4月21日，Moonshot AI（月之暗面）正式发布并开源了其新一代旗舰模型Kimi K2.6，成为本周国产AI领域的标志性事件。官方数据显示，K2.6在被称为"人类终极考试"的高难度基准测试Humanity's Last Exam中，性能已进入行业顶尖水平，与GPT-5.4和Claude Opus4.6等国际闭源顶级模型形成正面竞争。在评估真实软件工程能力的SWE-Bench Pro测试中，其表现同样达到业界领先。作为该系列迄今为止最强大的编程模型，K2.6在长程编码任务中展现出卓越的耐力，可保持连续13小时不间断编码，单个任务可编写或修改超过4000行代码，使其具备处理复杂系统级开发的能力。得益于视觉与编码能力的深度融合，K2.6可独立交付具有专业设计的Web应用程序。值得注意的是，通过使用Zig语言优化推理过程，Kimi K2.6现已支持在Mac设备上本地部署，12小时连续运行测试中吞吐量从最初的15 tokens/s攀升至193 tokens/s，推理效率比行业主流工具提升显著。

来源：搜狐/AIbase基地 | 2026-04-21

3. 人形机器人"闪电"以50分26秒夺冠：机器人半马首超人类男子纪录

4月19日，在北京亦庄半程马拉松暨人形机器人半程马拉松赛事中，一台名为"闪电"的人形机器人以50分26秒的净时成绩夺得机器人组冠军，将57分20秒的人类男子半马纪录甩在身后，创造了人机竞速的全新历史节点。这场赛事本身即是中国AI与机器人技术融合成果的一次集中展示，共有多支团队携自研人形机器人参赛，赛道涵盖坡道、弯道及不平整路面等真实路况，对机器人的运动控制、平衡算法与耐力续航提出了极高要求。"闪电"的夺冠被业界视为具身智能（Embodied AI）从实验室走向真实场景的重要里程碑——一台能够稳定完成21公里长距离奔跑的机器人，意味着其运动控制系统、实时感知决策与能源管理已达到可量产的成熟度。值得注意的是，机器人半马成绩超越人类男子顶尖纪录，并未意味着AI在体能层面"超越人类"，但它清晰表明：在特定体能任务上，AI驱动的机械体已开始突破人类进化赋予的生理边界。

来源：四川科技网/新华社 | 2026-04-23

4. Claude Mythos Preview发布：准确率97.6%，却因安全顾虑暂不公开

Anthropic于4月8日发布的Claude Mythos预览版，以"史上最强AI模型"之名引发业界震动。在多项权威基准测试中，Mythos展现出碾压级的性能表现：在SWE-bench Verified评测中从80.8%暴涨至93.9%，USAMO 2026数学推理测试中达到97.6%近乎满分。更令安全研究员警惕的是，该模型在过去数周内自主发现了Linux内核、OpenBSD、Firefox浏览器等核心开源组件中的数千个高危零日漏洞，其中包括OpenBSD中藏了27年未被发现的远程崩溃漏洞。这一发现直接揭示了当前主流系统安全防线的脆弱性，也让Anthropic陷入"模型太强，不敢开放"的两难局面。目前Claude Mythos Preview仅向12家合作伙伴（包括AWS、苹果、谷歌、微软、英伟达等）开放，用于"防御性网络安全"场景。Anthropic的这一决策凸显了AI安全能力的"双刃剑"特性——当模型的漏洞挖掘能力足以攻破主流系统时，开放给公众使用的风险已超出可控边界。业界普遍认为，这一事件将加速推动全球AI安全治理框架的立法进程。

来源：CSDN博客/36氪 | 2026-04-18

5. 阿里Qwen3.6-Plus登顶全球编程榜第二，字节Seeduplex全双工语音落地

本周国产AI阵营传来两条重磅消息。先是阿里千问团队于4月5日推出的Qwen3.6-Plus专有模型，在国际权威评测平台LMArena的Code Arena编程盲测中以1452分斩获全球第二，标志着国产大模型在编程核心赛道正式跻身全球第一梯队。该模型支持100万字符上下文窗口，编程能力对标Claude Opus 4.5，可实现"氛围编程"——用户仅需描述需求，模型即可一键生成完整应用程序。同日，字节跳动Seed团队正式发布原生全双工语音大模型Seeduplex，已在豆包App实现全量上线。该模型实现"边听边说"的类人交互体验，端到端延迟仅210至320毫秒，在50毫秒级延迟下即可达到97%以上的语音识别准确率，首次将实时语音对话的流畅度提升至可商用水平。两大国产模型的同日突破，表明中国AI产业正从"追赶"转向"并跑"甚至部分"领跑"的新阶段。

来源：今日头条/艾媒网 | 2026-04-21

6. 中国AI日均词元调用量突破140万亿：连续三周超越美国

国家数据局最新监测数据显示，中国AI大模型的日均词元（Token）调用量已从2024年初的1000亿飙升至2026年3月的140万亿，两年增长超过千倍。更具标志性意义的是，中国主流大模型周调用量已达5.16万亿词元，首次超越美国的2.7万亿，标志着全球AI产业格局正在发生深刻重构。这一超越背后有多重驱动因素：中国拥有全球最大规模的互联网用户群体，为AI应用提供了无与伦比的使用场景与数据资源；国产大模型DeepSeek、Qwen、Kimi等的快速迭代降低了API调用成本，刺激了企业和开发者的广泛接入；政策层面的大力扶持，包括算力基础设施建设和数据要素市场化改革，亦是关键推手。业内分析指出，词元调用量是衡量AI产业活跃度的核心指标，中国在该数据上的领先意味着在全球AI商业化落地的竞争中已占据先机，但与此同时，算力瓶颈、高端芯片进口依赖等结构性挑战仍不容忽视。

来源：今日头条 | 2026-04-20

本日报由AI自动整理生成，信息来源均为公开报道，仅供参考。

上一篇：【AI科技日报】OpenAI发布ChatGPT Images 2.0（2026年04月22日）

下一篇：【AI科技日报】DeepSeek V4开源发布，GPT-5.5同日亮相，人形机器人跑赢人类半马（2026年4月27日）

【AI科技日报】GPT-6预训练完成领衔4月AI军备赛（2026年4月23日）

1. GPT-6预训练完成：上下文窗口扩容至200万Token，预计6月发布

2. Kimi K2.6发布：多项指标追平国际顶尖闭源模型，Mac本地部署成亮点

3. 人形机器人"闪电"以50分26秒夺冠：机器人半马首超人类男子纪录

4. Claude Mythos Preview发布：准确率97.6%，却因安全顾虑暂不公开

5. 阿里Qwen3.6-Plus登顶全球编程榜第二，字节Seeduplex全双工语音落地

6. 中国AI日均词元调用量突破140万亿：连续三周超越美国

相关文章

AI专栏

Popular Tags

AI 每日播报 - ai-news

【AI科技日报】GPT-6预训练完成领衔4月AI军备赛（2026年4月23日）

1. GPT-6预训练完成：上下文窗口扩容至200万Token，预计6月发布

2. Kimi K2.6发布：多项指标追平国际顶尖闭源模型，Mac本地部署成亮点

3. 人形机器人"闪电"以50分26秒夺冠：机器人半马首超人类男子纪录

4. Claude Mythos Preview发布：准确率97.6%，却因安全顾虑暂不公开

5. 阿里Qwen3.6-Plus登顶全球编程榜第二，字节Seeduplex全双工语音落地

6. 中国AI日均词元调用量突破140万亿：连续三周超越美国

相关文章

AI专栏

Popular Tags