#
NVIDIA

共找到 134 篇文章RSS Feed
NVIDIA发布Gated DeltaNet-2 线性注意力层实现擦除写入解耦显著提升长上下文检索

NVIDIA发布Gated DeltaNet-2 线性注意力层实现擦除写入解耦显著提升长上下文检索

93 阅读前沿
NVIDIA推出Nemotron‑Labs‑Diffusion 三模解码模型 首次实现6倍并行吞吐

NVIDIA推出Nemotron‑Labs‑Diffusion 三模解码模型 首次实现6倍并行吞吐

35 阅读前沿
NVIDIA推出NVFP4 4位预训练方案,10万亿token规模实现FP8相近精度

NVIDIA推出NVFP4 4位预训练方案,10万亿token规模实现FP8相近精度

23 阅读前沿