
#开源

MCP路由式AI代理系统教程揭示动态工具曝光与上下文注入全流程
5月15日,MarkTechPost发布了一篇详细教程,手把手演示如何从零构建MCP风格的路由式AI代理系统。文章围绕工具发现、智能路由、结构化规划与安全执行四大模块展开,旨在帮助开发者实现工具最小化曝光、上下文注入以及可解释的多工具协作。

中国开源模型生态加速成本压缩 引领大模型研发新范式

Moonshot AI获20亿美元融资 估值达200亿美元引领开源大模型热潮

CopilotKit获2700万美元A轮融资 推动应用内AI代理落地
Talkie-1930发布13B Vintage语言模型,开启历史纯净推理新纪元
由Nick Levine、David Duvenaud和Alec Radford领衔的研究团队推出了Talkie-1930——首个13B开源Vintage语言模型,基于1930年前的英文文本训练,提供纯净的历史知识切片,为模型泛化与时间预测实验提供全新基准。

DeepSeek发布V4系列模型 参数突破1.6万亿 逼近前沿大模型
Hugging Face发布ml‑intern开源代理,LLM后训练实现全流程自动化
Hugging Face今日推出开源AI代理ml‑intern,可在单卡H100上于10小时内将Qwen3‑1.7B模型的GPQA得分从约10%提升至32%,实现文献检索、数据准备、训练执行与评估全链路自动化,为大模型后训练提供高效、低成本的解决方案。

Mythos开源模型点燃AI网络安全新变革

Deep Agents Deploy推出Beta版 实现模型无关开源智能体快速部署

Google发布Gemma 4:开源大模型实现智能压缩与全场景部署

Google发布Gemma 4开源大模型,Apache 2.0许可或成行业新标杆

Google DeepMind发布Gemma 4全模态大模型 开启设备端AI新纪元
Hugging Face推出TRL v1.0统一后训练框架,简化SFT与对齐流程
2026年4月1日,Hugging Face正式发布Transformer Reinforcement Learning(TRL)库的1.0版本。该版本将SFT、Reward Modeling、DPO、GRPO等后训练环节整合为统一的CLI与配置体系,面向生产环境提供稳定、可扩展的工具链,标志着后训练从“暗黑艺术”向标准化工程实践转变。

TRL发布v1.0 兼顾稳定与实验的后训练库正式上线

LiteLLM曝出凭证窃取恶意软件,Delve安全认证受质疑

Cohere发布开源语音转录模型Transcribe,2B参数可在消费级GPU上自托管
MolmoWeb-4B实现视觉驱动网页智能代理,开源多模态推理全流程指南
AllenAI 开源的 MolmoWeb-4B 通过截图直接理解网页,本文在 Colab 环境下演示了 4 位量化加载、提示模板构建、单步与多步推理以及数据集探索,帮助开发者快速搭建可视化网页代理。
Garry Tan发布gstack 开源Claude Code工作流工具,细分规划、审查、发布与QA四大环节
本周,创业导师Garry Tan在GitHub上开源gstack,将Claude Code包装为8套明确的工作流技能,覆盖产品规划、工程审查、代码发布和质量检测,旨在通过持久化浏览器提升AI辅助编码的可靠性与效率。
