开源 Open Source

开源模型、微调技术、本地部署生态

共找到 75 篇文章RSS Feed

Google推出TensorFlow 2.21，LiteRT正式取代TFLite，实现1.4倍GPU加速并支持NPU

Google今日发布TensorFlow 2.21，核心更新为LiteRT从预览版升至正式版，全面取代TensorFlow Lite。LiteRT在GPU上提升1.4倍性能，并首次原生支持NPU加速，同时扩展低精度算子并加入对PyTorch、JAX的一键转换，旨在提升移动端和边缘设备的AI部署效率。

GoogleGPUTensorFlowLiteRTNPU

03/07 (周六)•6 阅读•1分钟•开源

Google发布Android Bench 首个专注移动开发的LLM评测框架

Google AI今日正式开源Android Bench，这是面向Android开发任务的评测框架与排行榜。该基准从真实GitHub项目中抽取任务，覆盖API迁移、Wear OS网络等场景，并通过单元测试与仪器化测试验证模型修复效果，为LLM在移动端的实用性提供了首个量化标准。

GoogleGeminiLLMAndroidOpen Source

03/07 (周六)•5 阅读•1分钟•开源

Google开源模型SpeciesNet助力全球野生动物监测与保护

Google开源模型SpeciesNet助力全球野生动物监测与保护

GoogleSpeciesNetSnapshot Serengeti野生动物监测

03/07 (周六)•7 阅读•1分钟•开源

Daft打造高性能端到端机器学习数据管道实现结构化与图像数据统一处理

MarkTechPost 发布的实战教程展示了如何使用开源数据引擎 Daft，完成从 MNIST 原始 JSON 数据读取、图像重塑、特征工程、聚合统计到模型训练与 Parquet 持久化的完整流程，证明了 Daft 在结构化与图像并行处理上的高效可扩展性。

ParquetDaftMNISTLogisticRegression

03/06 (周五)•6 阅读•1分钟•开源

OpenAI发布Symphony框架助力自主AI代码代理实现高可扩展编程

OpenAI今日开源Symphony，一个基于Elixir与BEAM的调度框架，旨在通过结构化的实现运行（implementation runs）自动管理AI编码代理。该系统将issue追踪、沙盒执行、工作证明与代码合并闭环，实现大规模、容错的代码生成与部署。

OpenAISymphonyElixirAgentic

03/06 (周五)•17 阅读•1分钟•开源

全新Tree-of-Thoughts多分支推理代理发布，束搜索与启发式剪枝显著提升LLM推理效率

MarkTechPost 今日发布了基于 FLAN‑T5 的 Tree-of-Thoughts 多分支推理代理，采用束搜索、启发式评分和深度限制剪枝，实现对 24 游戏等任务的高效结构化推理。该框架开源代码完整，可直接复用于更广泛的数学与规划问题。

Tree-of-ThoughtsFLAN-T5Beam Search24游戏Heuristic Scoring

03/06 (周五)•12 阅读•1分钟•开源

Hugging Face推出Modular Diffusers 实现扩散管道可组合化

Hugging Face推出Modular Diffusers 实现扩散管道可组合化

Hugging FaceModular DiffusersFlux.2Mellon

03/05 (周四)•10 阅读•1分钟•开源

LangWatch发布开源评估层，助力AI代理全链路追踪与系统化测试

随着生成式AI从聊天界面向多步骤自治代理演进，非确定性成为制约生产化的核心瓶颈。LangWatch 作为首个开源的评估、追踪与仿真平台，为 LLM 代理提供统一的监控层，帮助开发者在完整执行路径上定位错误、迭代提示并实现合规部署。

LLMLangChainOpenTelemetryLangWatch

03/05 (周四)•9 阅读•1分钟•开源

LangChain推出LangSmith CLI与技能集，编码代理性能跃升至92%

LangChain推出LangSmith CLI与技能集，编码代理性能跃升至92%

ClaudeLangChainLangSmith

03/05 (周四)•11 阅读•1分钟•开源

Claude Code推出LangChain技能集将任务成功率从29%提升至95%

Claude Code推出LangChain技能集将任务成功率从29%提升至95%

ClaudeLangChainLangGraphDeep Agents

03/05 (周四)•17 阅读•1分钟•开源

阿里巴巴发布OpenSandbox 统一安全执行环境助力自主AI代理大规模部署

阿里巴巴发布OpenSandbox 统一安全执行环境助力自主AI代理大规模部署

LangGraph阿里Agentic AIOpenSandboxVNC

03/03 (周二)•12 阅读•1分钟•开源

Vaex助力百万行数据无内存瓶颈，打造高效端到端机器学习流水线

MarkTechPost 今日发布完整教程，展示如何使用开源库 Vaex 在不将数据全部加载到内存的前提下，完成从数据生成、特征工程、聚合统计到模型训练的全链路流水线。该方案在 200 万行合成数据上实现了秒级响应，为大规模分析提供了可落地的实践路径。

Vaexscikit-learnParquet

03/03 (周二)•9 阅读•1分钟•开源

阿里巴巴发布Qwen 3.5 小型系列模型实现低算力本地智能

阿里巴巴Qwen团队今日推出Qwen 3.5小型系列模型，参数规模从0.8B到9B，专为移动端、IoT和轻量化多模态代理设计，强调在算力受限环境下保持高推理能力。

阿里多模态Qwen 3.5边缘计算

03/03 (周二)•14 阅读•1分钟•开源

NullClaw发布超轻量Zig AI代理框架仅678KB二毫秒启动

NullClaw 采用原生 Zig 语言实现完整 AI 代理栈，二进制仅 678 KB、运行内存约 1 MB，冷启动时间低于 2 毫秒。该框架通过 vtable 接口实现模块化，支持多家大模型提供商和常见通讯渠道，专为资源受限的边缘设备和嵌入式场景打造。

RAGAI代理NullClawZig嵌入式AI

03/03 (周二)•9 阅读•1分钟•开源

阿里巴巴开源CoPaw工作站，提升个人AI代理的多渠道协作与持久记忆

阿里巴巴研发团队近日发布了开源框架CoPaw，旨在为开发者提供一套高性能的个人AI代理工作站，实现跨平台多渠道交互、持久记忆管理以及可插拔的技能扩展，帮助AI系统从单一模型推理向完整的自治应用迈进。

阿里CoPawAgentScopeReMe

03/01 (周日)•8 阅读•1分钟•开源

开源大模型驱动层级规划智能体，实现全链路多代理系统

本文基于开源指令模型 Qwen2.5-1.5B‑Instruct，详细阐述了如何构建由规划、执行与聚合三个子代理组成的层级规划系统。通过代码示例展示模型加载、JSON 结构化输出、工具调用以及多轮迭代执行的完整流程，为研发者提供可直接复用的实践方案。

开源LLMQwenHierarchical PlannerMulti-Agent

02/28 (周六)•14 阅读•1分钟•开源

Nous Research发布Hermes Agent 实现持久记忆与远程终端持续协作

2026年2月26日，Nous Research推出开源自主系统Hermes Agent，针对AI助手的记忆衰减和环境隔离两大痛点，实现多层记忆机制和持久机器访问，并通过Telegram、Discord等渠道提供统一网关，使工程师能够在本地、Docker、SSH等环境中持续协作。

Nous ResearchHermes AgentHermes-3Skill DocumentsRemote Terminal

02/26 (周四)•22 阅读•1分钟•开源

DataClaw开源155K Claude对话数据打破Anthropic数据封锁

DataClaw开源155K Claude对话数据打破Anthropic数据封锁

ClaudeAnthropic开源DataClaw

02/26 (周四)•23 阅读•1分钟•开源

Meta AI发布GCM工具提升GPU集群监控，保障大模型训练可靠性

Meta AI发布GCM工具提升GPU集群监控，保障大模型训练可靠性

MetaGPUOpenTelemetryGCMSlurm

02/25 (周三)•24 阅读•1分钟•开源

Multiverse Computing推出免费压缩模型HyperNova 60B，性能媲美Mistral Large 3

Multiverse Computing推出免费压缩模型HyperNova 60B，性能媲美Mistral Large 3

LLMMultiverse ComputingHyperNova 60BMistralCompactifAI

02/25 (周三)•27 阅读•1分钟•开源