英特尔发布 OpenVINO 2024.1,提供更多人工智能和 LLM 功能

2024年4月25日,英特尔工程师发布了 OpenVINO 2024.1,这是这一优秀的开源人工智能工具包的最新功能版本,它将继续扩展其功能和能力,尤其是围绕生成式人工智能 “GenAI “和大型语言模型(LLMs)的功能和能力。

在生成式人工智能方面,OpenVINO 2024.1 增加了针对英特尔至强 CPU 进行优化的 Mixtral 和 URLNet 模型,针对配备 Arc Graphics 的更快英特尔酷睿 Ultra(Meteor Lake)性能优化了 Stable Diffusion 1.5 / ChatGLM3-6B / Qwen-7B 模型,现在还增加了对 Falcon-7B-Instruct LLM 的支持。

OpenVINO 2024.1 还缩短了支持英特尔高级矩阵扩展(AMX)的英特尔处理器的大型语言模型编译时间,提高了英特尔 Arc Graphics GPU 上 oneDNN / INT4 / INT8 的 LLM 压缩和性能,并显著减少了英特尔 Core Ultra 处理器上较小 GenAI 模型的内存。

英特尔发布 OpenVINO 2024.1,提供更多人工智能和 LLM 功能

OpenVINO 2024.1 还将英特尔酷睿超 “Meteor Lake “处理器的神经处理单元(NPU)插件引入 GitHub 代码库,而不必依赖外部 PyPi 软件包。OpenVINO 的 JavaScript API 现在也可以通过 NPM 代码库进行访问。对于 ARM 处理器上的 OpenVINO,Arm 的卷积神经网络现在默认支持 FP16 推理。

总的来说,OpenVINO 2024.1 是一个很棒的版本。我期待着试用 OpenVINO 2024.1,并运行一些新的 OpenVINO 基准测试,尤其是如果 Core Ultra NPU 插件现在状态良好的话。OpenVINO 2024.1 工具包可从https://github.com/openvinotoolkit/openvino/releases/tag/2024.1.0下载。

本文为原创稿件,版权归作者所有,如需转载,请注明出处:https://www.nxrte.com/zixun/47635.html

(0)

相关推荐

发表回复

登录后才能评论