VectifyAI发布Mafin 2.5与PageIndex 实现金融RAG 98.7%准确率
•22 阅读•3分钟•开源
RAGVectifyAIMafin 2.5PageIndex金融
•22 阅读•3分钟•开源

背景
在金融审计等高风险场景下,传统基于向量相似度的RAG(Retrieval‑Augmented Generation)常因文档布局信息缺失而产生幻觉。财报中的表格、页眉‑页脚以及图表的层级关系是理解关键数字的前提,却在常规的PDF‑to‑text过程里被剥离,导致即使是最强大的大模型也难以给出可靠答案。为了解决这一痛点,VectifyAI在2026年2月推出了两款新产品:多模态金融代理 Mafin 2.5 与开源的 PageIndex 框架,正式宣告向“Vectorless RAG”转型。
Mafin 2.5 关键指标
- FinanceBench 98.7%:在公开的金融检索基准FinanceBench上,Mafin 2.5取得近乎满分的准确率,远超GPT‑4o(约31%)和Perplexity(约45%)。
- 多模态接入:原生支持SEC 10‑K/10‑Q/8‑K全文索引、实时盈余电话会议文字稿以及Russell 3000、Nasdaq等实时行情数据。
- 端到端推理引擎:模型内部集成了对PageIndex树结构的专用检索模块,使得每一次生成都能基于明确的文档路径进行推理。
PageIndex 核心技术
PageIndex 通过“向量‑无”方式重塑传统RAG,核心特性包括:
- 层级树索引:将PDF转化为语义树,每个节点对应页面、章节、表格或图形,实现结构化导航。
- 视觉原生支持:利用视觉模型直接解析页面布局,识别图表、复杂网格,避免依赖OCR文本。
- 可审计路径:每一次答案都能回溯到具体的树节点、页码和行号,为监管合规提供完整的审计链。
- 开源实现:代码托管于GitHub,提供Python SDK 与 RESTful API,便于企业快速集成。
行业影响
- 提升金融合规安全:审计报告、监管申报等场景要求答案可追溯。PageIndex 的树形路径让审计师能够一键定位来源,显著降低监管风险。
- 降低向量成本:传统向量数据库需要大规模计算和存储,PageIndex 通过结构化索引削减了数十倍的向量计算开销,适合成本敏感的金融机构。
- 加速行业落地:Mafin 2.5 已对接多家券商的实时行情系统,能够在秒级返回财报关键指标,帮助投研团队实现自动化报告撰写。
结语
VectifyAI 把“结构化‑语义‑可审计”三大要素融合进金融RAG,首次在公开基准上实现接近 99% 的准确率。PageIndex 的开源生态有望吸引更多金融科技公司共同构建“无向量”检索标准,推动生成式AI在高监管领域的安全落地。未来,随着更多行业数据源接入和视觉模型的迭代,向量‑无 RAG 将可能成为金融、法律乃至医疗等垂直领域的新范式。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。