今天 • 2024年6月13日 • 周四
15:06

MTK 整合 NVIDIA TAO,加速物联网边缘 AI 应用发展

在 COMPUTEX 2024 期间,MediaTek 宣布将 NVIDIA TAO 与自家 NeuroPilot SDK 集成,以支持边缘 AI 推理芯片开发。此举将为开发者提供无缝体验,推动物联网应用在多个领域如智能零售、制造、医疗等实现丰富的边缘 AI 和生成式 AI 功能。MediaTek 边缘计算产品旨在提升性能和能效,通过集成先进的多媒体和通信技术,为不同设备提供出色的 AI 体验。NVIDIA TAO 工具包的集成将简化 AI 视觉应用的开发流程,缩短开发周期,助力快速推向市场。

14:06

Omdia 显示,虚拟助手是推动金融服务软件收入的主要人工智能用例

人工智能(AI)的普及通过其自动化功能为银行带来了诸多好处,如提高效率、节约成本以及促进产品创新和开发。根据 Omdia 的最新研究,就软件收入而言,最重要的人工智能用例是虚拟助理,预计到 2028 年将为 IT 供应商带来超过 27 亿美元的收入。

Omdia 的《金融服务中的人工智能》报告 的最新研究发现,虚拟助理是最普遍的使用案例,主要用于内部目的。不过,这一趋势有望发生转变,因为近一半的零售银行表示,他们前台的首要任务是与联络中心进行更一致、更复杂的互动。Omdia金融服务首席分析师 Philip Benton 说:”虽然许多银行都在努力成为推出基于生成式人工智能(GenAI)的虚拟助理的先驱,将其作为吸引新客户的工具,但如果不能有效执行,就有可能疏远现有客户。”

11:04

字节关停多个互动剧业务,看点余额将折算退款

字节跳动旗下巨量引擎开发的探索 IAP 互动剧小程序业务,包括泡泡心选、爪爪心选、果冻心选将于 6 月 17 日停止运营。这些小程序目前内嵌于抖音 App 中。用户未消耗完的看点可在关停前使用,6 月 17 日后,剩余的看点余额及会员有效期将折算退款至付款账户。

09:48

消息称 Meta 将裁员最多 50 名副总裁

马克・扎克伯格计划通过减少副总裁数量来精简 Meta 公司规模,目前副总裁人数已从去年的约 300 人减少至接近 250 人。公司目标是减少中层和高层员工,增加底层员工,以实现更高效的工作环境。据 Statista 数据,Meta 的员工人数已从 2022 年底的 86,482 人降至 2023 年底的 67,317 人,为史上首次同比下降。扎克伯格认为,更精简的组织能更快执行优先事项,提高工作效率和工作的趣味性。Meta 在 2022 年 11 月裁员 1.1 万人,占当时员工总数的 13%,随后在 2023 年 3 月宣布计划再裁员 1 万人并冻结 5,000 个职位的招聘。

昨天 • 2024年6月12日 • 周三
16:32

微信读书集成腾讯混元 AI 大模型:有用户宣称可以一日千页

微信读书 APP 集成了腾讯混元大模型,推出了 「AI 问书」 等功能,大幅提升了用户阅读效率和体验。用户可通过 AI 获得名词解释、整理书籍信息、预设问题和学习知识,还能通过 「AI 大纲」 简化文章结构,快速把握重点。尽管如此,对于需要深入品味的书籍,仍然建议耐心阅读。

09:56

苹果 Vision Pro 全球各地价格对比:欧洲超 3 万元

苹果的 Vision Pro将于 6 月 28 日在部分国家率先上市,其余地区则需等到 7 月 12 日。购买时可选择个性化选项,如蔡司光学插件或定制处方镜片,分别需额外支付 115 欧元和 170 欧元。还有专用旅行箱和 AppleCare + 全年保护计划可选,价格分别为 220 欧元和 550 欧元。Vision Pro 配件包括独奏针织带、双环带和个性化光封设计,需用支持 Face ID 的 iPhone 或 iPad 进行面部扫描调整。256GB 基础版 Vision Pro 的价格未提及。新系统 visionOS 2 预计将在今年秋季发布更新。

2024年6月7日 • 周五
17:13

Google Messages 即将推出通过 RCS 发送报警短信的功能

谷歌正在与一家名为RapidSOS的公司合作,该公司已经可以为 iPhone 和 Android 用户将某些医疗信息转发给急救人员。一旦紧急调度中心启用此功能,通过 Google Messages 向该中心发送短信的用户将看到他们正在通过 RCS 发送短信的常见指示。当调度员响应时,他们还会看到已读回执和正在输入指示。

RCS 还将支持与急救人员共享更高质量的图像和视频,并允许您发送精确的位置。谷歌表示,它正在与合作伙伴合作,将 RCS 消息传递扩展到紧急服务,并“邀请生态系统与我们合作,为每个人提供可靠的紧急消息传递。”我不禁觉得这是对苹果的一个推动,人们普遍预计苹果将在下周的 WWDC 上宣布对 RCS 的支持。

17:04

传音与腾讯合作,手机将搭载 GVoice 游戏语音技术

传音研发中心和腾讯游戏语音 GVoice 签署技术创新合作协议,将在移动语音技术领域深入合作,为全球新兴市场游戏玩家提供语音交互体验。传音将在其智能终端设备中使用腾讯游戏语音 GVoice 的娱乐功能和底层算法能力,为用户带来更高质量的游戏语音交互体验。双方还计划举办联创会,围绕游戏科技的创新应用与发展进行深度交流探讨。

10:57

Meta 为 WhatsApp 程序引入新 AI 功能,旨在提升企业效率

Meta 公司在巴西举办的 「Meta 交流大会」 上宣布,将为 WhatsApp 商务应用引入几项新的 AI 功能,包括便于创建可直接开启 WhatsApp 对话的 Facebook 和 Instagram 广告,并能自动回复客户常见问题。这些功能将提高企业与客户间的互动效率,使企业可以向特定群体发送定制化信息。此外,Meta 还宣布营销人员将能够利用 AI 技术创建 click-to-message 广告,并计划逐步推广至其他市场。扎克伯格表示,click-to-message 广告有望为 Meta 带来每年高达 100 亿美元的收入。这一新功能的首批推广地区定在印度和新加坡,并计划不久后扩展到巴西。

10:34

阿里云发布开源模型 Qwen2

6月7日,阿里云更新技术博客,宣布发布开源模型Qwen2-72B。所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。

相比2月推出的通义千问Qwen1.5,Qwen2实现了整体性能的代际飞跃。通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。通义千问团队在技术博客中披露,Qwen2系列包含5个尺寸的预训练和指令微调模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B为混合专家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分组查询注意力)机制,以便让用户体验到GQA带来的推理加速和显存占用降低的优势。

在中英文之外,模型训练数据中增加了27种语言相关的高质量数据,提升了模型的多语言能力。Qwen2还增大了上下文长度支持,Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务。

09:57

智谱 AI 发布 GLM-4 开源模型

智谱 AI 发布清言 App 和 MaaS 大模型开放平台 bigmodel.cn 的最新更新。清言 App 可实现多智能体在同一对话框中协作。MaaS 2.0 平台接入新模型,降低使用成本,提供一键微调功能和 AllTools 智能体 API。新一代 MaaS 平台全面赋能多个行业,助力企业智能升级。开源模型 GLM-4-9B 能力全面提升,支持多语言和视觉模型。AI 老罗成为智谱清言首位数字员工,并向全社会公开。

2024年6月6日 • 周四
18:51

曝印度 MX Player 已被亚马逊收购,估值低于 1 亿美元

印度视频播放软件和 OTT 服务平台 MX Player 被亚马逊收购,收购估值低于 1 亿美元。MX Player 最初于 2011 年推出,全球用户超过 2.8 亿。亚马逊计划保留 MX Player 品牌,并扩大在印度的视频流媒体服务,以增强在二三线城市及更偏远地区的影响力。

16:55

文生视频公司 Pika 获新一轮 8000 万融资,估值达 4.7 亿美元

人工智能初创公司 Pika 宣布获得 8000 万美元的 B 轮融资,由 Spark Capital 领投,估值达 4.7 亿美元。Pika 聚焦于生成式视频模型,计划用融资继续训练 AI 模型,改进产品特性,并扩大团队规模。创始人 Demi Guo 和 Chenlin Meng 是斯坦福大学研究生,为全身心投入创业而休学。Pika 的首款 AI 视频制作软件能快速生成短视频片段,并计划在今年晚些时候进行一次重大升级,支持生成更高质量、更长时间的视频片段。

16:44

首个 AI 原生开源操作系统,openEuler 24.03 LTS 正式发布

openEuler 24.03 LTS 版本发布会成功举办,这是 openEuler 社区发布的首个 AI 原生开源操作系统。该版本在基础设施、内核、智能解决方案和全场景体验方面进行了全面升级。openEuler 社区致力于打造一个健康、可持续发展的操作系统根社区,已通过 ISO 18974 自认证,成为首个通过该认证的开源社区。未来,openEuler 将持续携手全球伙伴、用户和开发者,将 openEuler 打造成国际化的开源协作平台。

15:06

Stability AI 推出 Stable Audio Open 开源音频生成模型

Stability AI 推出了名为 Stable Audio Open 的开源音频生成模型,该模型可以根据用户输入的提示词生成长达 47 秒的高质量音频样本,包括鼓点、乐器旋律、环境音和拟声音效等。该模型基于 transforms 扩散模型,在自动编码器的潜在空间中操作,以提高生成音频的质量和多样性。用户可以在 HuggingFace 上试用这一模型。

14:06

腾讯混元发布开源加速库,生图时间缩短 75%

腾讯发布了一款针对混元文生图开源大模型的加速库,使得推理效率得到显著提升,生图时间缩短 75%,同时降低了混元 DiT 模型的使用门槛。用户可以通过 ComfyUI 的图形化界面使用该模型,或者在 Hugging Face Diffusers 通用模型库中,用三行代码即可调用混元 DiT 模型,无需下载原始代码库。

10:37

微软为 Vision Pro 头显推出 OneDrive 云盘应用

微软为苹果Vision Pro 头显推出了 OneDrive 应用,允许用户在沉浸式环境中体验 OneDrive 云盘服务。OneDrive 可备份、保护、同步和访问照片及文件,支持共享文件、文档、照片和视频,还能自动备份手机照片和视频。用户可使用 5GB 免费云存储,或升级到 Microsoft 365 订阅获得 1TB 存储空间。

2024年6月5日 • 周三
16:44

斗鱼一季度营收 10.4 亿元,同比下降 29.9%

斗鱼公布 2024 年第一季度财务数据,营收 10.397 亿元,同比下降 29.9%。净亏损 8800 万元,去年同期净利润为 1450 万元。移动月活跃用户数从上年同期的 5020 万减少至 4530 万,平均付费用户数也从 450 万降至 340 万。

14:56

微软推出全新 「贴纸制作器」:AI 加持 自由创建个性化贴纸

微软旗下的 AI 图像编辑器 Microsoft Designer 推出了新的 「贴纸制作器」 功能,用户可以创建个性化贴纸,结合文本内容实时生成精美贴纸。这款功能旨在满足用户对于个性化创作的需求,特别强调了便捷性和易用性。业内专家认为,这将推动 AI 技术在创意设计领域的应用和发展。

09:55

ChatGPT 大规模宕机已恢复 OpenAI 尚未公布原因

北京时间 6 月 4 日,OpenAI 的生成式 AI 聊天机器人 ChatGPT 发生重大宕机,全球超过 3000 名用户受到影响。OpenAI 在当天承认问题并进行修复,但修复后仍出现新问题。至格林威治标准时间 6 月 5 日下午 5:01,宕机问题已解决。OpenAI 尚未回应宕机的确切原因。

点击加载更多