
#LLM
共找到 27 篇文章RSS Feed

LLMAI搜索Airbnb客服机器人自然语言查询
•6 阅读•1分钟•应用

Goodfire完成12.5亿美元估值融资 推动AI可解释性进入软件3.0时代
LLMGoodfireInterpretabilitySoftware 3.0
•15 阅读•1分钟•视野
联邦学习与LoRA结合实现LLM隐私微调:Flower 与 PEFT 开源方案发布
MarkTechPost 今日发布完整教程,展示如何使用 Flower 仿真引擎和 PEFT 的 LoRA 技术,在不泄露原始文本的前提下,对大语言模型进行联邦微调,提供端到端代码与实验结果。
LLMFlowerPEFTLoRAFederated Learning
•11 阅读•1分钟•前沿

Databricks CEO称AI将让SaaS失去意义,传统业务面临新挑战
LLMDatabricksGenieLakebase
•11 阅读•1分钟•视野

Harvey再获2亿美元融资 估值升至110亿美元 法律AI独角兽加速扩张
LLMSequoiaHarvey法律AIGIC
•11 阅读•1分钟•应用

ServiceNow推出SyGra Studio 打造可视化合成数据工作流
LLMServiceNowSyGraSynthetic Data
•26 阅读•1分钟•应用

NVIDIA推出VibeTensor,首个由LLM编码代理全程打造的深度学习运行时
NVIDIALLMCUDAVibeTensor
•24 阅读•1分钟•前沿

Accel再次领投5.7亿美元,Fibr AI用AI代理把静态网页变成一对一体验
LLMAccelFibr AI网站个性化
•19 阅读•1分钟•应用

Apple内部全面采用Anthropic Claude,打造自研AI工具链
ClaudeAnthropicAppleLLM
•17 阅读•1分钟•视野

Anthropic被音乐出版商起诉3亿美元版权侵权案震动AI行业
AnthropicLLMUniversal Music GroupConcord Music Group
•21 阅读•1分钟•视野
腾讯混元发布HPC‑Ops 高性能LLM推理算子库 助力模型部署提速
腾讯混元AI基础设施团队今日开源HPC‑Ops算子库,提供针对Attention、Grouped GEMM、Fused MoE等核心算子的高效CUDA实现,并通过紧凑的C++/Python接口对接现有推理框架。实测在内部服务中可提升30%查询吞吐,显著加速大模型部署。
LLM腾讯混元HPC-Ops
•16 阅读•1分钟•开源

OpenAI推出链接安全机制 防止AI代理泄露用户数据
ChatGPTOpenAILLMPrompt Injection
•15 阅读•1分钟•视野

Technology Innovation Institute发布Alyah基准:首个阿联酋方言评测提升阿拉伯大模型本地化能力
LLMTechnology Innovation InstituteAlyah
•19 阅读•1分钟•前沿
DeepEval助力LLM质量评估,自定义检索与LLM‑as‑Judge实现全链路自动化
在本篇教程中,作者基于 DeepEval 框架搭建了完整的 LLM 质量评估流水线,结合自定义 TF‑IDF 检索器和 LLM‑as‑Judge 多维度指标,实现了对 RAG 系统的自动化单元测试,为模型研发提供了可量化的安全保障。
OpenAILLMRAGDeepEval
•25 阅读•1分钟•应用
AI代理实现预算感知:在令牌、时延与工具调用约束下精准规划
本文展示了如何构建一款成本感知的规划代理,能够在令牌消耗、响应时延和工具调用次数的预算限制内,自动权衡输出质量与资源开支,实现高效、可控的AI任务执行。
OpenAILLMAgentic AI预算感知
•20 阅读•1分钟•应用

OpenAI详解Codex代理循环,完整呈现提示构建与性能优化
OpenAILLMAgentCodexResponses API
•40 阅读•1分钟•前沿

Liquid AI发布1.2B思考模型,实现千兆参数手机离线推理
大语言模型开源模型工具使用边缘推理
•35 阅读•1分钟•开源

千级Agent追踪难题破解:LangSmith洞察助力大规模行为分析
LLMLangSmithAgent生产分析可观测性
•31 阅读•1分钟•应用
全链路流式语音助手实战:从增量ASR到实时TTS的端到端延迟控制
本教程面向开发者,详细演示如何构建一个全链路流式语音代理,从分块音频输入、增量ASR、LLM Token 级流式推理到实时 TTS 合成,并在每个环节严格设定延迟预算,实现近乎即时的对话交互体验。
LLMASRTTS语音助手流式
•26 阅读•1分钟•应用
微软发布OptiMind 20B模型 实现自然语言到求解器级优化模型的直接转换
微软研究院推出开源的OptiMind‑SFT 20 B 参数模型,能够把业务需求的自然语言描述自动转化为混合整数线性规划并生成可直接调用 Gurobi 的 Python 代码,旨在突破运筹优化中模型构建的瓶颈,提升企业决策效率。
MicrosoftLLM运筹优化Mixture of ExpertsGurobi
•30 阅读•1分钟•开源