苍井空种子 OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在瞎说

发布日期：2024-10-28 19:03 点击次数：124

西风发自凹非寺苍井空种子

量子位 | 公众号 QbitAI

OpenAI的AI语音转写器具，阿谁堪称近乎“东谈主类水平”的Whisper，被曝幻觉严重——

100多小时转录，被工程师发现约一半皆在瞎说。

更严重的是，好意思联社还爆料有医疗机构哄骗Whisper来转录医师与患者的诊断，骤然激发大皆网友眷注。

据悉，明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的跨越30000名临床医师和40个卫生系统已开动使用法国AI调理公司Nabla基于Whisper打造的器具。

而况他们照旧转录了大约700万次医疗就诊。

网友纷繁暗示这就有点吓东谈主了。

值得一提的是，OpenAI之前早就告戒过，该器具不应在“高风险限度”中使用。

针对最新爆料，有OpenAI发言东谈主回话，OpenAI会在模子更新中加入相应的反馈机制。

OpenAI被督促飞快处罚此问题

Whisper是OpenAI老早前推出的开源自动语音识别（ASR）系统，于2022年9月发布。

它遴荐简便的端到端神色，基于编码器-解码器Transformer架构。输入音频将被分红30秒的块，升沉为梅尔倒谱（音频特征索要神色之一，log-Mel spectrogram），然后传入编码器。

流程68万小时的多谈话和多任务监督蚁集数据的考核，Whisper不错进行多谈话转录。

Whisper推出后获得无为应用，如今GitHub已揽获70.2k标星：

据悉，它还被集成在ChatGPT的一些版块中，同期亦然Oracle和微软云诡计平台的一项内置行状，而这些平台为环球数千家公司提供行状。

此外，仅在上个月，HuggingFace上的一个最新版块Whisper就被下载了超420万次。HuggingFace社区的机器学习工程师Sanchit Gandhi暗示，Whisper是最受宽待的开源语音识别模子。

而当今，据好意思联社报谈，许多筹商东谈主员和工程师反应，在责任中他们时常遭逢Whisper产生的幻觉。

举例，密歇根大学的一位筹商员在尝试转换模子之前，发现其检查的每10份音频转录中有8份出现了幻觉。

一位机器学习工程师指出，在他分析的跨越100小时Whisper转录中，随心一半出现了幻觉。

还有一位设置者暗示，在他使用Whisper创建的26，000份转录中，险些每一份皆发现了幻觉。

……

这种问题以致存在于录制讲求的短音频样本中。

自拍

在最近的一项筹商中，诡计机科学家们在审查的跨越13000个明晰音频片断中发现了187个幻觉。

工程师和筹商东谈主员暗示，他们从未见过其它任何AI驱动的转录器具像Whisper这么频繁地产生幻觉。

Whisper幻觉严重的原因咫尺尚未可知，但有软件设置者暗示，这些假造践诺相似发生在停顿、有配景声息或音乐播放时。

之前，OpenAI就有辅导：

不要在方案情境中使用Whisper，准确性上的颓势可能导致效能出现昭彰偏差。

然鹅，好意思联社暗示，这一告戒并未禁绝一些病院或医疗中心使用Whisper等语音转笔墨模子——

包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内，照旧有超30000名临床医师和40个医疗系统照旧开动使用由Nabla公司基于Whisper设置的器具。

Nabla CTO Martin Raison称，该器具针对医疗谈话对模子进行了微调，用于转录和纪念患者的沟通。

咫尺，该器具已被用于转录约700万次医疗就诊。

在得知Whisper可能会产生幻觉后，Nabla暗示正在处罚此问题，不外：

由于“数据安全原因”，Nabla的器具会删除原始音频，无法将Nabla生成的AI文本与原始灌音进行比拟。

此外，据了解，Whisper还被用来为聋东谈主和听力繁难者创建字幕。

Whisper幻觉严重问题被发现后，有东谈主敦促OpenAI飞快处罚此问题。

本年2月离开OpenAI的筹商员William Saunders也开麦了：

若是公司快意优先推敲，这似乎是不错处罚的。若是你把它放出去，东谈主们过于自信于它的功能，并将其集成到总共这些其他系统中，那就成了问题。

有OpenAI发言东谈主回话称，公司捏续筹商何如减少幻觉气候，并感谢筹商东谈主员的发现，同期补充谈OpenAI会在模子更新中融入相应反馈机制。

参考估计：[1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14[2]https://x.com/AP/status/1850150400424345858

— 完 —

量子位 QbitAI · 头条号签约

眷注咱们苍井空种子，第一技术获知前沿科技动态

上一篇：男同動漫【ETF动向】10月25日摩根中证A500ETF基金涨1.22%，份额增多1.56亿份

下一篇：巨臀波多黎各女神往常三个月，外邪不侵，贵东说念主匡助，获利才智增强，幸福飘溢的星座

巨屌自慰