NVIDIA为运行RTX40和RTX30GPU的Windows11PC带来高达5倍的AI加速

发布时间：2023-11-17 16:17:01来源：

NVIDIA正在为数百万台由其最新RTXGPU提供支持的Windows11PC带来人工智能工作负载的巨大加速。

继之前的公告之后，NVIDIA现在透露，TensorRT-LLM正在添加到Windows11中，并将在11月21日在最新驱动程序套件中发布时为超过1亿RTX用户启用。这一消息是在Microsoft的Ignite大会上宣布的，这是一个讨论人工智能的未来以及随着我们的发展它将如何改变Windows生态系统的重要活动。

TensorRT-LLM为RTX40和RTX30GPU所有者提升AI能力

今天，NVIDIA确认TensorRT-LLMAI加速将适用于所有具有超过8GBVRAM的RTX台式机和笔记本电脑。除了TensorRT-LLM之外，NVIDIA和Microsoft还带来了DirectML增强功能，以推动稳定扩散和Llama2等流行的AI模型。

拥有支持TensorRT-LLM的NVIDIARTXGPU意味着您可以在本地使用所有数据和项目，而不是将它们保存在云中。这将节省时间并提供更精确的结果。RAG或检索增强生成是通过使用本地化库来更快地获得AI结果的技术之一，该库可以填充您希望LLM经历的数据集，然后利用该LLM的语言理解功能为您提供准确的结果结果。

NVIDIA为运行RTX40和RTX30GPU的Windows11PC带来高达5倍的AI加速1

NVIDIA表示TensorRT-LLMv0.6.0的性能提升了5倍，该版本将于本月晚些时候推出。此外，它还将支持其他法学硕士，例如Mistral7B和Nemotron38B。

NVIDIA为运行RTX40和RTX30GPU的Windows11PC带来高达5倍的AI加速2

对于那些想要尝试最新版本的TensorRT-LLM的人，可以通过此处的官方Github链接进行安装，并且您还可以从NVIDIA的NGC资源获取最新的优化模型。

另一个关键更新是OpenAI，这是一种非常流行的基于人工智能的聊天API，具有广泛的应用程序，例如帮助处理文档、电子邮件、总结Web内容、数据分析等等。再次强调，数据需要由用户手动上传或输入，因此对本地数据的访问相当有限，尤其是在数据集很大的情况下。

NVIDIA为运行RTX40和RTX30GPU的Windows11PC带来高达5倍的AI加速3

为了解决这个问题，NVIDIA和微软将通过一个新的包装器为OpenAI的ChatAPI提供API接口，该包装器不仅可以在WindowsPC上添加TensorRT-LLM加速，还可以让用户访问与在具有RTX的PC上本地运行类似的工作流程或在云中。因此，您不必将任何数据集上传到ChatAPI，因为整个数据集都可供ChatAPI使用，就像在本地可用一样。

标签：

免责声明：本答案或内容为用户上传，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如遇侵权请及时联系本站删除。

NVIDIA为运行RTX40和RTX30GPU的Windows11PC带来高达5倍的AI加速

相关阅读

猜你喜欢

生活经验

生活百科

生活常识

精选知识

最新滚动