@include('layouts.partials.header')

【AI科技日报】GPT-6预训练完成领衔4月AI军备赛(2026年4月23日)

今日要闻速览:2026年4月AI大模型军备赛白热化,GPT-6预训练完成刷新技术天花板,国产Kimi K2.6开源追击,字节全双工语音模型落地。

1. GPT-6预训练完成:上下文窗口扩容至200万Token,预计6月发布

4月AI领域最受瞩目的事件,莫过于OpenAI宣布GPT-6已完成预训练,并计划于2026年6月向公众开放API接口。作为GPT-5的全面升级版本,GPT-6在多个核心技术指标上实现了"革命性"突破。其中,上下文窗口容量一举扩容至200万Token,这一数字意味着用户可一次性向模型输入两部中篇小说或长达10小时的音频内容,彻底解决了前代模型"内容截断、逻辑断裂"的长期痛点。与此同时,GPT-6采用了全新的稀疏混合架构,有效激活参数达2.3万亿,较GPT-5提升120%,而训练能耗却降低了40%,实现了性能与效率的兼顾。原生多模态能力的融合是另一大亮点——无需借助外部插件,GPT-6即可同步处理文本、图像、音频与视频输入,实现跨媒体信息的一致理解与生成。业内分析指出,200万Token上下文窗口的落地,标志着大模型正式迈入"全文档理解"时代,将对法律文档分析、医学影像解读、长视频内容理解等长程任务场景产生颠覆性影响。

来源:CSDN博客 | 2026-04-20

2. Kimi K2.6发布:多项指标追平国际顶尖闭源模型,Mac本地部署成亮点

4月21日,Moonshot AI(月之暗面)正式发布并开源了其新一代旗舰模型Kimi K2.6,成为本周国产AI领域的标志性事件。官方数据显示,K2.6在被称为"人类终极考试"的高难度基准测试Humanity's Last Exam中,性能已进入行业顶尖水平,与GPT-5.4和Claude Opus4.6等国际闭源顶级模型形成正面竞争。在评估真实软件工程能力的SWE-Bench Pro测试中,其表现同样达到业界领先。作为该系列迄今为止最强大的编程模型,K2.6在长程编码任务中展现出卓越的耐力,可保持连续13小时不间断编码,单个任务可编写或修改超过4000行代码,使其具备处理复杂系统级开发的能力。得益于视觉与编码能力的深度融合,K2.6可独立交付具有专业设计的Web应用程序。值得注意的是,通过使用Zig语言优化推理过程,Kimi K2.6现已支持在Mac设备上本地部署,12小时连续运行测试中吞吐量从最初的15 tokens/s攀升至193 tokens/s,推理效率比行业主流工具提升显著。

来源:搜狐/AIbase基地 | 2026-04-21

3. 人形机器人"闪电"以50分26秒夺冠:机器人半马首超人类男子纪录

4月19日,在北京亦庄半程马拉松暨人形机器人半程马拉松赛事中,一台名为"闪电"的人形机器人以50分26秒的净时成绩夺得机器人组冠军,将57分20秒的人类男子半马纪录甩在身后,创造了人机竞速的全新历史节点。这场赛事本身即是中国AI与机器人技术融合成果的一次集中展示,共有多支团队携自研人形机器人参赛,赛道涵盖坡道、弯道及不平整路面等真实路况,对机器人的运动控制、平衡算法与耐力续航提出了极高要求。"闪电"的夺冠被业界视为具身智能(Embodied AI)从实验室走向真实场景的重要里程碑——一台能够稳定完成21公里长距离奔跑的机器人,意味着其运动控制系统、实时感知决策与能源管理已达到可量产的成熟度。值得注意的是,机器人半马成绩超越人类男子顶尖纪录,并未意味着AI在体能层面"超越人类",但它清晰表明:在特定体能任务上,AI驱动的机械体已开始突破人类进化赋予的生理边界。

来源:四川科技网/新华社 | 2026-04-23

4. Claude Mythos Preview发布:准确率97.6%,却因安全顾虑暂不公开

Anthropic于4月8日发布的Claude Mythos预览版,以"史上最强AI模型"之名引发业界震动。在多项权威基准测试中,Mythos展现出碾压级的性能表现:在SWE-bench Verified评测中从80.8%暴涨至93.9%,USAMO 2026数学推理测试中达到97.6%近乎满分。更令安全研究员警惕的是,该模型在过去数周内自主发现了Linux内核、OpenBSD、Firefox浏览器等核心开源组件中的数千个高危零日漏洞,其中包括OpenBSD中藏了27年未被发现的远程崩溃漏洞。这一发现直接揭示了当前主流系统安全防线的脆弱性,也让Anthropic陷入"模型太强,不敢开放"的两难局面。目前Claude Mythos Preview仅向12家合作伙伴(包括AWS、苹果、谷歌、微软、英伟达等)开放,用于"防御性网络安全"场景。Anthropic的这一决策凸显了AI安全能力的"双刃剑"特性——当模型的漏洞挖掘能力足以攻破主流系统时,开放给公众使用的风险已超出可控边界。业界普遍认为,这一事件将加速推动全球AI安全治理框架的立法进程。

来源:CSDN博客/36氪 | 2026-04-18

5. 阿里Qwen3.6-Plus登顶全球编程榜第二,字节Seeduplex全双工语音落地

本周国产AI阵营传来两条重磅消息。先是阿里千问团队于4月5日推出的Qwen3.6-Plus专有模型,在国际权威评测平台LMArena的Code Arena编程盲测中以1452分斩获全球第二,标志着国产大模型在编程核心赛道正式跻身全球第一梯队。该模型支持100万字符上下文窗口,编程能力对标Claude Opus 4.5,可实现"氛围编程"——用户仅需描述需求,模型即可一键生成完整应用程序。同日,字节跳动Seed团队正式发布原生全双工语音大模型Seeduplex,已在豆包App实现全量上线。该模型实现"边听边说"的类人交互体验,端到端延迟仅210至320毫秒,在50毫秒级延迟下即可达到97%以上的语音识别准确率,首次将实时语音对话的流畅度提升至可商用水平。两大国产模型的同日突破,表明中国AI产业正从"追赶"转向"并跑"甚至部分"领跑"的新阶段。

来源:今日头条/艾媒网 | 2026-04-21

6. 中国AI日均词元调用量突破140万亿:连续三周超越美国

国家数据局最新监测数据显示,中国AI大模型的日均词元(Token)调用量已从2024年初的1000亿飙升至2026年3月的140万亿,两年增长超过千倍。更具标志性意义的是,中国主流大模型周调用量已达5.16万亿词元,首次超越美国的2.7万亿,标志着全球AI产业格局正在发生深刻重构。这一超越背后有多重驱动因素:中国拥有全球最大规模的互联网用户群体,为AI应用提供了无与伦比的使用场景与数据资源;国产大模型DeepSeek、Qwen、Kimi等的快速迭代降低了API调用成本,刺激了企业和开发者的广泛接入;政策层面的大力扶持,包括算力基础设施建设和数据要素市场化改革,亦是关键推手。业内分析指出,词元调用量是衡量AI产业活跃度的核心指标,中国在该数据上的领先意味着在全球AI商业化落地的竞争中已占据先机,但与此同时,算力瓶颈、高端芯片进口依赖等结构性挑战仍不容忽视。

来源:今日头条 | 2026-04-20

本日报由AI自动整理生成,信息来源均为公开报道,仅供参考。

需要任何帮助联系我们