开源 Open Source

开源模型、微调技术、本地部署生态

共找到 168 篇文章RSS Feed

Open-MM-RL多模态强化学习管线实现完整数据分析与奖励评估

MarkTechPost 今日发布了一套基于 TuringEnterprises/Open-MM-RL 数据集的完整多模态强化学习工作流。文章从数据结构、图像分布到答案类型进行全方位统计,并构建可验证的奖励函数、视觉语言模型提示模板,最终导出 GRPO‑style 数据,为后续大模型强化学习提供可靠基准。

88 阅读开源

OpenMythos打造循环深度Transformer,MLA与GQA模型对比展示推理深度扩展

OpenMythos 在 GitHub 开源的循环深度 Transformer 实现,本文通过 Google Colab 教程构建 MLA 与 GQA 两种注意力变体,比较参数规模与循环注入矩阵的谱半径,并在合成求和任务上验证循环次数对推理深度的提升,展示了在固定参数下通过增加循环实现更强推理能力的可行路径。

63 阅读开源
Hugging Face推出Ettin重排序模型族 实现跨规模检索精度新标杆

Hugging Face推出Ettin重排序模型族 实现跨规模检索精度新标杆

21 阅读开源
Supertone发布Supertonic 3,支持31语言本地化TTS并加入表达标签

Supertone发布Supertonic 3,支持31语言本地化TTS并加入表达标签

41 阅读开源