

NVIDIACodexSWE-BenchGRPOPolar
•338 阅读•1分钟•前沿

EAGLE 3.1发布:解决推理中注意力漂移显著提升推测解码稳定性
vLLMKimiSpeculative DecodingTorchSpec
•141 阅读•1分钟•前沿

StepFun发布StepAudio 2.5 Realtime 实时语音大模型,实现角色扮演一致性与声学感知
RLHFStepFunStepAudio 2.5 Realtime声学感知
•99 阅读•1分钟•前沿

NVIDIA发布Gated DeltaNet-2 线性注意力层实现擦除写入解耦显著提升长上下文检索
NVIDIAGated DeltaNet-2线性注意力长上下文检索
•93 阅读•1分钟•前沿

专注细分领域胜过大模型:3B特化模型在OCR上实现质量、成本双赢
AnthropicQwenClaude Opus 4.6Dharma-AINanonets-OCR2
•74 阅读•1分钟•前沿

Microsoft发布Fara1.5浏览器智能体系列 将网页任务成功率提升至七成以上
MicrosoftQwen3.5Fara1.5Online-Mind2Web浏览器智能体
•71 阅读•1分钟•前沿

阿里巴巴推出Qwen3.7-Max 1M上下文推理代理模型
生成式AIAgentic AIAlibaba1M上下文Qwen3.7-Max
•66 阅读•1分钟•前沿

Cohere发布Command A+ 218B稀疏MoE模型 实现两块H100高效代理工作流
MoE多模态CohereAgenticCommand A+
•63 阅读•1分钟•前沿

字节跳动发布Lance,首个统一图像视频理解与生成的3B模型
文生视频字节跳动Lance统一多模态
•55 阅读•1分钟•前沿

OpenAI新推理模型破解80年几何猜想 引领数学AI新纪元
OpenAIGPT-5Erdős猜想推理模型
•24 阅读•1分钟•前沿

Google I/O 2026发布Gemini Omni与AI搜索全新功能,开启多模态时代
GoogleGemini OmniGemini 3.5 FlashAntigravity
•22 阅读•1分钟•前沿

Stability AI发布Audio 3.0系列 实现6分钟专业音乐生成
音乐生成Stability AIAudio 3.0Stable Audio
•23 阅读•1分钟•前沿

NVIDIA推出Nemotron‑Labs‑Diffusion 三模解码模型 首次实现6倍并行吞吐
NVIDIALoRADiffusionNemotron-Labs-Diffusion自回归
•35 阅读•1分钟•前沿

Google发布Gemini 3.5 Flash,编码和代理任务速度提升四倍成本减半
GoogleLLMAgentAgentic AIGemini 3.5 Flash
•23 阅读•1分钟•前沿

OpenAI模型破解80年单位距离难题,掀起AI数学新纪元
OpenAI单位距离问题离散几何
•17 阅读•1分钟•前沿

AllenAI发布OlmoEarth v1.1 提升三倍计算效率助力全球卫星遥感
TransformerAllenAIOlmoEarth遥感计算效率
•24 阅读•1分钟•前沿

Google将街景引入Genie模型,开启真实街道模拟新篇章
GoogleGenieStreet ViewRobotics
•35 阅读•1分钟•前沿

Google发布Gemini 3.5 Flash 将AI代理化推向新高峰
GoogleAgentGemini 3.5 FlashAntigravity
•26 阅读•1分钟•前沿

Google推出Gemini Omni Flash 实现图文音视频一键生成
GoogleGemini文生视频Omni Flash
•19 阅读•1分钟•前沿

Google发布Android CLI 让AI代理加速安卓应用开发
GoogleGeminiAndroidAntigravity
•19 阅读•1分钟•前沿