Air News - 最新科技资讯

Google发布Android Bench 首个专注移动开发的LLM评测框架

Google AI今日正式开源Android Bench，这是面向Android开发任务的评测框架与排行榜。该基准从真实GitHub项目中抽取任务，覆盖API迁移、Wear OS网络等场景，并通过单元测试与仪器化测试验证模型修复效果，为LLM在移动端的实用性提供了首个量化标准。

GoogleGeminiLLMAndroidOpen Source

03/07 (周六)•5 阅读•1分钟•开源

Olmo Hybrid 7B发布：混合架构实现双倍预训练效率，挑战传统Transformer

开源OlmoGDNMamba

03/06 (周五)•13 阅读•1分钟•前沿

阿里巴巴发布Qwen 3.5系列引领开源大模型新范式

开源大模型MoE阿里巴巴Qwen 3.5

03/04 (周三)•21 阅读•1分钟•前沿

开源大模型驱动层级规划智能体，实现全链路多代理系统

本文基于开源指令模型 Qwen2.5-1.5B‑Instruct，详细阐述了如何构建由规划、执行与聚合三个子代理组成的层级规划系统。通过代码示例展示模型加载、JSON 结构化输出、工具调用以及多轮迭代执行的完整流程，为研发者提供可直接复用的实践方案。

开源LLMQwenHierarchical PlannerMulti-Agent

02/28 (周六)•15 阅读•1分钟•开源

Agoda开源APIAgent实现零代码将任意REST或GraphQL转为MCP服务器

旅行平台Agoda今日发布开源工具APIAgent，能够在无需编写代码和部署的情况下，将任意REST或GraphQL接口自动转换为符合Model Context Protocol（MCP）的服务器，帮助AI代理快速接入企业数据，显著降低集成成本。

开源AgodaAPIAgentMCP

02/17 (周二)•31 阅读•1分钟•开源

OpenAI发布GABRIEL工具包：让社会科学定量分析触手可及

OpenAI开源GABRIEL定量分析社会科学

02/13 (周五)•44 阅读•1分钟•开源

Hugging Face推出社区评估系统打破黑盒排行榜局限

开源Hugging FaceCommunity EvalsMMLUGPQA

02/04 (周三)•24 阅读•1分钟•开源

Arcee AI发布4000亿参数Trinity模型挑战Meta Llama 成为美国最大开源大模型

开源Arcee AITrinityLlama

01/29 (周四)•31 阅读•1分钟•开源

Moonshot AI发布Kimi K2.5 开源视觉代理模型实现原生Agent Swarm并支持千亿参数规模

开源月之暗面KimiAgent Swarm视觉代理

01/28 (周三)•27 阅读•1分钟•开源

Arcee AI发布Trinity Large 400B MoE模型打造美国本土开源大模型新标杆

NVIDIA开源Arcee AITrinity Large

01/28 (周三)•30 阅读•1分钟•前沿

中国开源AI生态升级，MoE成主流，国产芯片驱动全栈创新

DeepSeek开源腾讯华为MoE

01/27 (周二)•33 阅读•1分钟•开源

NVIDIA发布Earth‑2全套开源模型实现全栈天气预测AI自主可控

NVIDIA开源Earth-2天气预测

01/26 (周一)•38 阅读•1分钟•前沿

Clawdbot开源本地代理栈让聊天实现真实自动化

Clawdbot是一款可自行部署的开源个人AI助手，利用Anthropic、OpenAI等大模型并通过Gateway、Skill、Lobster等模块将聊天转化为可审计的本地自动化流程，帮助用户在私有硬件上安全高效地完成日常任务。

OpenAIAnthropic开源AI AgentClawdbot

01/26 (周一)•36 阅读•1分钟•开源

阿里云Qwen3‑TTS开源发布多语言实时语音合成实现细粒度声线控制

多语言开源TTS阿里Qwen

01/23 (周五)•42 阅读•1分钟•开源

Microsoft发布VibeVoice‑ASR 实现单次处理60分钟长音频

开源MicrosoftASRVibeVoice-ASR

01/23 (周五)•42 阅读•1分钟•开源

#开源

Google发布Android Bench 首个专注移动开发的LLM评测框架

Olmo Hybrid 7B发布：混合架构实现双倍预训练效率，挑战传统Transformer

阿里巴巴发布Qwen 3.5系列 引领开源大模型新范式

开源大模型驱动层级规划智能体，实现全链路多代理系统

DataClaw开源155K Claude对话数据 打破Anthropic数据封锁

Composio开源Agent Orchestrator助力多代理工作流突破ReAct瓶颈

NVIDIA发布Jetson部署指南 开源视觉语言模型实现边缘推理

NVIDIA发布DreamDojo开源机器人世界模型 实现44千小时人类视频预训练

GGML 与 llama.cpp 加入 Hugging Face 助力本地 AI 生态持续发展

Agoda开源APIAgent实现零代码将任意REST或GraphQL转为MCP服务器

OpenAI发布GABRIEL工具包：让社会科学定量分析触手可及

Hugging Face推出社区评估系统 打破黑盒排行榜局限

Arcee AI发布4000亿参数Trinity模型 挑战Meta Llama 成为美国最大开源大模型

Moonshot AI发布Kimi K2.5 开源视觉代理模型 实现原生Agent Swarm并支持千亿参数规模

Arcee AI发布Trinity Large 400B MoE模型 打造美国本土开源大模型新标杆

中国开源AI生态升级，MoE成主流，国产芯片驱动全栈创新

NVIDIA发布Earth‑2全套开源模型 实现全栈天气预测AI自主可控

Clawdbot开源本地代理栈让聊天实现真实自动化

阿里云Qwen3‑TTS开源发布 多语言实时语音合成实现细粒度声线控制

Microsoft发布VibeVoice‑ASR 实现单次处理60分钟长音频

标签分类

#
开源