AIGC
-
ollama v0.3 发布,支持 Llama 3.1 和 Mistral Large 2
ollama 是在系统上轻松运行大型语言模型 (LLM) 的开源工具,对于 ollama 的爱好者来说,olama v0.3 已经发布,并支持最新的激动人心的模型。 连夜发布的 o…
-
玩转 Gemma 2,模型的部署与 Fine-Tuning
Google 近期发布了最新开放模型 Gemma 2,目前与同等规模的开放模型相比,取得了明显的优势,同时在安全可控性上得到了显著的增强。 Gemma 2 提供了 9B 以及 27…
-
Meticulous Research:2031 年对话式 AI 市场价值将达到 541 亿美元
据Meticulous Research® 独家报告称,全球对话式 AI 市场预计到 2031 年将达到541 亿美元,预测期内的复合年增长率为23.9% 。 对话式 AI 是人工…
-
邪恶还是创新?日本一家连锁超市利用人工智能监控员工的笑容
日本连锁超市 AEON 已成为首家利用人工智能监控面向顾客的员工语气和举止的公司。 由 InstaVR 开发的“Mr Smile”解决方案旨在衡量和规范 AEON 240 家门店客…
-
在实施 Gen AI 之前,先还清技术债务
SnapLogic 发布一项名为 “The Code to Unlock Gen AI “的调查发现,63% 的受访公司报告了技术债务带来的 “…
-
适合成长型企业的 AI 实用方法
在大多数行业中,人工智能的炒作显然已达到顶峰。围绕着这个话题,有许多令人惊叹的使用案例,也有一些不那么令人惊叹的案例。为了帮助您减少噪音,专注于真正有用的东西,我们概述了任何成长型…
-
什么是 Google AI Teammate?人工智能与人类协作的未来
当你可以简单地将团队管理任务交给谷歌人工智能队友(Google AI Teammate)时,为什么还要雇佣更多员工呢?在今年的谷歌 I/O 大会上,这家科技巨头(简短地)提醒人们注…
-
ETT | iByond™ 与 WorldVuer 成立全球战略合资公司,打造全球首个人工智能操作系统 WiOS
2024年7月9日 – ETT | iByond™ 与 WorldVuer 共同成立了 WorldVuer iByond 合资公司,开发全球首个人工智能操作系统WiOS…
-
ZeroGPT.com:用于文本验证和增强的终极 AI 工具
在快速发展的数字通信领域,对能够准确识别和增强文本的工具的需求从未像现在这样强烈。ZeroGPT.com 已成为这一领域的关键平台,提供一整套先进的人工智能驱动功能,旨在满足各种文…
-
人工智能体(AI Agents)究竟是什么?
当 ChatGPT 首次亮相的时候,人工智能领域都在谈论新一代人工智能助手,然而过去一年来,大家开始转向了一个新的目标:人工智能体(AI Agent)。 在今年 5 月的谷歌年度 …
-
DNEG 集团获 United Al Saqer 集团 2 亿美元投资
总部位于伦敦的视觉特效、动画和技术公司 DNEG 集团获得了阿拉伯联合酋长国的 United Al Saqer Group(UASG)2 亿美元的投资。 DNEG 集团表示,这笔投…
-
高文院士获 2025 年度“IEEE社会基础设施创新奖”
近日,IEEE奖励委员会官网公布了2025年度“IEEE技术领域奖”(IEEE Technical Field Awards)名单,中国工程院院士、北京大学博雅讲席教授、视频与视觉…
-
Funcodec:一个基本的,可复制的和可集成的开源神经语音编解码器工具包
FunCodec是一个基础的神经语音编解码器工具包。FunCodec为最新的神经语音编解码器模型(如SoundStream和Encodec)提供可复制的训练配方和推理脚本。 题目:…
-
BBC 研究发现,观众对 GenAI 制作的视频内容感到担忧
根据 BBC 委托开展的一项评估该技术认知度的研究,观众对于在视频内容中使用生成式人工智能感到担忧,但对于在音频内容中使用 GenAI 持一定开放态度。 该研究由 Ipsos UK…
-
AI 语音的工作原理及其重要性
人工智能(AI),具体来说是 AI 语音,改变了企业与客户互动的方式。AI 语音实现了人与机器之间无缝且直观的沟通。该技术还使组织能够通过虚拟助手和文本转语音应用程序提供全天候客户…
-
人工智能转录如何助力简化通信
近年来,人工智能已成为几乎所有商业环境中的变革力量。越来越先进的算法让公司能够以更少的投入完成更多的任务,提高了工作场所的生产力、效率甚至创新能力。 目前,55% 的公司正在以某种…
-
谷歌的新人工智能可以根据像素生成音轨
2024年6月18日, Deep Mind展示了其生成式 AI 视频转音频研究的最新成果。这是一个新颖的系统,它将屏幕上看到的内容与用户的书面提示相结合,为给定的视频片段创建同步的…
-
LM4LV:用于低级视觉任务的冻结大型语言模型
大语言模型(LLM)的成功促进了多模态大语言模型(MLLM)的新研究趋势,改变了计算机视觉各个领域的范式。尽管 MLLM 在许多 high-level vision 和 visio…
-
什么是 Google Vids?人工智能助力视频创作
Google Vids 是在 Google Next 2024 大会上发布的最新人工智能工作空间工具,旨在改变团队协作和知识共享的方式。作为谷歌文档(Google Docs)、电子…
-
Cognizant 推出首套医疗保健 LLM 解决方案
作为去年 8 月宣布的扩大合作关系的一部分,Cognizant 在谷歌云的生成式人工智能(genAI)技术上推出了第一套医疗保健大型语言模型(LLM)解决方案,包括该公司的 Ver…