Liquid AI推出LFM2.5-230M,实现手机端每秒213标记的超轻模型

7 阅读2分钟开源

模型概览

Liquid AI在本次发布中提供了两套检查点:

  • LFM2.5-230M‑Base:原始预训练权重,供二次微调使用。
  • LFM2.5-230M:已完成指令微调的通用版本。

模型采用 LFM2 架构,拥有 14 层,其中 8 层为双门 LIV 卷积块,余下 6 层为分组查询注意力(GQA)块,旨在提升 CPU 上的推理速度。关键规格如下:

  • 参数量:230 M
  • 上下文长度:32 768 token
  • 词表规模:65 536
  • 多语言支持:包括英语、中文、阿拉伯语、日语等十余种语言
  • 知识截止:2024年中

性能基准

Liquid AI 在十项基准上对模型进行了评估,核心结果如下(分数越高越好):

  • IFEval:71.71,领先 Qwen3.5‑0.8B(59.94)和 Gemma 3 1B(63.49)
  • IFBench:38.40,领先同类模型
  • CaseReportBench(临床数据抽取):22.51,表现最佳
  • MMLU‑Pro:20.25,略逊于 Qwen3.5‑0.8B(37.42),表明在广泛知识覆盖上仍有提升空间。

模型在 工具调用(Function Calling)任务上表现突出,能够在系统提示中以 JSON 形式定义工具,生成 <|tool_call_start|><|tool_call_end|> 标记之间的调用语句,再返回自然语言答案。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。