Air News - 最新科技资讯

Satya Nadella阐述微软AI核心竞争力与平台新方向

在近期的Stratechery访谈中，微软CEO Satya Nadella 深入剖析了公司在生成式AI时代的定位、与OpenAI的合作、内部MAI模型布局以及Project Solara等新平台的战略意义，展望了算力、软件与Agent业务的协同路径。

2026/06/04•29 阅读•1分钟•视野

Nvidia RTX Spark亮相Computex，微软Project Solara揭示AI设备新蓝图

在本月的Computex大会上，Nvidia公布了全新RTX Spark PC芯片，并与Microsoft共同推出首批搭载该芯片的Windows电脑；同场Microsoft在Build大会上展示了“Project Solara”，一个基于Android的AI代理设备平台，并同步发布了自研的MAI模型系列。业界普遍关注这两大布局对AI算力与终端形态的深远影响。

06/03 (周三)•21 阅读•1分钟•视野

Google向伯克希尔发行10亿美元股份加速AI算力布局

Alphabet宣布通过股权融资募集80亿美元，其中10亿美元由伯克希尔哈撒韦认购。此举旨在为公司的AI算力扩张提供资金，标志着资本成为AI竞争的关键资源。

06/02 (周二)•55 阅读•1分钟•视野

NVIDIA推出Polar框架让代码Agent强化学习零改动跨平台

05/28 (周四)•344 阅读•1分钟•前沿

EAGLE 3.1发布：解决推理中注意力漂移显著提升推测解码稳定性

05/27 (周三)•146 阅读•1分钟•前沿

ZeroEntropy发布Zerank-2跨编码器检索模型，实现高精度检索与排序

ZeroEntropy 今日开源 4 B 参数的 Qwen3‑基跨编码器 Zerank-2，提供从查询‑文档配对打分到两阶段检索‑重排的完整方案。该模型在金融、法律、代码等多领域实验中显著提升 NDCG@10，成为 RAG 系统的高精度增益层。

05/27 (周三)•111 阅读•1分钟•应用

OmniVoice Studio推出本地开源语音克隆平台，实现全链路离线生成替代ElevenLabs

OmniVoice Studio是一款完全本地运行的开源桌面应用，提供语音克隆、视频配音、实时转写和说话人分离等功能，支持 646 种语言的文本转语音，无需 API 密钥、云账号或订阅费用，为用户提供高隐私的全链路离线生成方案。

05/26 (周二)•115 阅读•1分钟•开源

Open-MM-RL多模态强化学习管线实现完整数据分析与奖励评估

MarkTechPost 今日发布了一套基于 TuringEnterprises/Open-MM-RL 数据集的完整多模态强化学习工作流。文章从数据结构、图像分布到答案类型进行全方位统计，并构建可验证的奖励函数、视觉语言模型提示模板，最终导出 GRPO‑style 数据，为后续大模型强化学习提供可靠基准。

05/26 (周二)•94 阅读•1分钟•开源

NVIDIA FLARE助力联邦学习实验：FedAvg与FedProx在非IID CIFAR-10上的对比实战

NVIDIA FLARE团队发布了完整的联邦学习实验教程，演示如何在非IID CIFAR-10数据上对比FedAvg和FedProx两大算法。文章提供完整代码、参数配置及可视化结果，为企业落地联邦学习提供可复制的实践方案。

05/26 (周二)•102 阅读•1分钟•应用

八大认证平台竞争激烈，WorkOS领衔助力2026 AI代理企业部署

随着Model Context Protocol（MCP）下载量突破9700万/月，AI代理在企业应用中的渗透率预计2026年底将达到40%。在此背景下，身份认证成为关键瓶颈。本文梳理了WorkOS、Stytch、Auth0、Composio、Nango、Arcade、TrueFoundry 与 Cloudflare Workers八大平台的合规性、功能深度与落地适配，帮助企业快速选型。

05/25 (周一)•114 阅读•1分钟•视野

WorkOS推出auth.md协议实现AI代理自动注册免除人工表单

WorkOS今日发布auth.md协议，提供基于OAuth的标准化注册文件，帮助AI代理在无需人工填写表单的情况下完成身份验证、凭证获取与撤销，显著提升企业AI集成的安全性与自动化水平。

05/25 (周一)•89 阅读•1分钟•应用

StepFun发布StepAudio 2.5 Realtime 实时语音大模型，实现角色扮演一致性与声学感知

05/25 (周一)•104 阅读•1分钟•前沿

NVIDIA发布Gated DeltaNet-2 线性注意力层实现擦除写入解耦显著提升长上下文检索

05/24 (周日)•99 阅读•1分钟•前沿

腾讯开源TencentDB Agent Memory打造四层本地记忆管线，令Agent令牌消耗降超60%

腾讯近日在MIT许可证下开源TencentDB Agent Memory，提供符号化短期记忆与四层长周期记忆金字塔的本地化解决方案。该系统基于SQLite+sqlite-vec，融合BM25与向量检索，在OpenClaw和Hermes中实现，官方基准显示令牌使用下降61%，任务成功率提升逾50%。

05/24 (周日)•92 阅读•1分钟•开源

SuperClaude框架打造多模式Claude工作流，提升AI开发效率

本教程展示如何在Anthropic的Claude模型之上，借助开源SuperClaude框架构建包含指令、代理、模式和会话记忆的多步骤工作流，实现从需求构思到代码实现的全链路AI辅助开发。本文还提供完整代码示例和实战案例，帮助开发者快速上手并提升Prompt的一致性与角色感知。

05/24 (周日)•60 阅读•1分钟•开源

Perplexity开源Bumblebee打造只读开发者端供应链扫描器

05/23 (周六)•105 阅读•1分钟•开源

GBrain开启自连线记忆层，让AI代理永不遗忘

Garry Tan 领衔开源项目 GBrain v0.38.2.0 今日正式发布，提供基于 markdown 与本地 PGLite 的自连线记忆层。该层通过正则推理自动构建类型化知识图谱，零 LLM 调用即可实现结构化检索，为 AI 代理提供持久且可编辑的上下文记忆。

05/23 (周六)•74 阅读•1分钟•开源

OpenMythos打造循环深度Transformer，MLA与GQA模型对比展示推理深度扩展

OpenMythos 在 GitHub 开源的循环深度 Transformer 实现，本文通过 Google Colab 教程构建 MLA 与 GQA 两种注意力变体，比较参数规模与循环注入矩阵的谱半径，并在合成求和任务上验证循环次数对推理深度的提升，展示了在固定参数下通过增加循环实现更强推理能力的可行路径。

05/22 (周五)•67 阅读•1分钟•开源