英特尔发布 OpenVINO 2024.1，提供更多人工智能和 LLM 功能

追风者 • 2024年4月26日上午9:36 • 行业资讯

2024年4月25日，英特尔工程师发布了 OpenVINO 2024.1，这是这一优秀的开源人工智能工具包的最新功能版本，它将继续扩展其功能和能力，尤其是围绕生成式人工智能 “GenAI “和大型语言模型（LLMs）的功能和能力。

在生成式人工智能方面，OpenVINO 2024.1 增加了针对英特尔至强 CPU 进行优化的 Mixtral 和 URLNet 模型，针对配备 Arc Graphics 的更快英特尔酷睿 Ultra（Meteor Lake）性能优化了 Stable Diffusion 1.5 / ChatGLM3-6B / Qwen-7B 模型，现在还增加了对 Falcon-7B-Instruct LLM 的支持。

OpenVINO 2024.1 还缩短了支持英特尔高级矩阵扩展（AMX）的英特尔处理器的大型语言模型编译时间，提高了英特尔 Arc Graphics GPU 上 oneDNN / INT4 / INT8 的 LLM 压缩和性能，并显著减少了英特尔 Core Ultra 处理器上较小 GenAI 模型的内存。

OpenVINO 2024.1 还将英特尔酷睿超 “Meteor Lake “处理器的神经处理单元（NPU）插件引入 GitHub 代码库，而不必依赖外部 PyPi 软件包。OpenVINO 的 JavaScript API 现在也可以通过 NPM 代码库进行访问。对于 ARM 处理器上的 OpenVINO，Arm 的卷积神经网络现在默认支持 FP16 推理。

总的来说，OpenVINO 2024.1 是一个很棒的版本。我期待着试用 OpenVINO 2024.1，并运行一些新的 OpenVINO 基准测试，尤其是如果 Core Ultra NPU 插件现在状态良好的话。OpenVINO 2024.1 工具包可从https://github.com/openvinotoolkit/openvino/releases/tag/2024.1.0下载。

本文为原创稿件，版权归作者所有，如需转载，请注明出处：https://www.nxrte.com/zixun/47635.html