AI 平台/部署

2025年 2月 26日
在 NVIDIA GPU 上训练的 Microsoft Phi SLM 的多模态最新进展
大语言模型(LLMs)已渗透到各行各业,并改变了技术潜力。但是,由于规模庞大,它们对于许多公司目前面临的资源限制来说并不切实际。
1 MIN READ

2025年 2月 20日
制造业产品设计工作流程的生成式 AI 转型
长期以来,制造行业的传统设计和工程工作流程一直以顺序迭代的方法为特征,这种方法通常既耗时又需要大量资源。这些传统方法通常涉及需求收集、
2 MIN READ

2025年 2月 11日
NVIDIA DGX 云推出即用型模板,更好地评估 AI 平台性能
在快速发展的 AI 系统和工作负载环境中,实现出色的模型训练性能远远超出芯片速度。这需要对整个堆栈进行全面评估,从计算到网络,再到模型框架。
2 MIN READ

2025年 2月 11日
聚焦:BRLi 和 Toulouse INP 使用 NVIDIA Modulus 开发基于 AI 的洪水模型
洪水对 15 亿人构成了重大威胁,使其成为重大自然灾害的最常见原因。洪水每年给全球带来高达 25 亿美元的经济损失。
1 MIN READ

2025年 1月 16日
借助 iGenius 和 NVIDIA DGX 云,继续为主权 AI 和受监管行业预训练先进的 LLM
近年来,大语言模型(LLMs)在推理、代码生成、机器翻译和摘要等领域取得了非凡的进步。然而,尽管基础模型具有先进的功能,
4 MIN READ

2025年 1月 15日
提升 AI 性能的 GPU 内存基础知识
生成式 AI 彻底改变了人们将想法变为现实的方式,而代理 AI 代表着这一技术变革的下一次飞跃。通过利用复杂的自主推理和迭代规划,
2 MIN READ

2025年 1月 13日
借助 NVIDIA DOCA 平台框架,助力新一代 DPU 加速云基础设施
越来越多的企业组织开始采用加速计算来满足生成式 AI、5G 电信和主权云的需求。NVIDIA 发布了 DOCA 平台框架 (DPF),
2 MIN READ

2024年 12月 16日
2024 年热门文章:NVIDIA NIM、语言模型突破和数据科学优化的精要
对于使用 NVIDIA 技术的开发者、研究人员和创新者来说,2024 年又是具有里程碑意义的一年。
2 MIN READ

2024年 12月 12日
延时 AI 模型增强 IVF 胚胎选择
来自康奈尔大学 (Weill Cornell Medicine) 的 研究人员 开发了一种由 AI 提供支持的模型,
1 MIN READ

2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求
对 AI 赋能服务的需求持续快速增长,这给 IT 和基础设施团队带来了越来越大的压力。这些团队的任务是配置必要的硬件和软件来满足这一需求,
2 MIN READ

2024年 11月 8日
NVIDIA TensorRT-LLM KV 缓存早期重用实现首个令牌速度 5 倍提升
在上一篇 博客文章 中,我们展示了通过将键值 (KV) 缓存卸载到 CPU 内存来重复使用该缓存如何在基于 x86 的 NVIDIA…
2 MIN READ