西风 发自 凹非寺苍井空种子
量子位 | 公众号 QbitAI
OpenAI的AI语音转写器具,阿谁堪称近乎“东谈主类水平”的Whisper,被曝幻觉严重——
100多小时转录,被工程师发现约一半皆在瞎说。
更严重的是,好意思联社还爆料有医疗机构哄骗Whisper来转录医师与患者的诊断,骤然激发大皆网友眷注。
据悉,明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的跨越30000名临床医师和40个卫生系统已开动使用法国AI调理公司Nabla基于Whisper打造的器具。
而况他们照旧转录了大约700万次医疗就诊。
网友纷繁暗示这就有点吓东谈主了。
值得一提的是,OpenAI之前早就告戒过,该器具不应在“高风险限度”中使用。
针对最新爆料,有OpenAI发言东谈主回话,OpenAI会在模子更新中加入相应的反馈机制。
OpenAI被督促飞快处罚此问题Whisper是OpenAI老早前推出的开源自动语音识别(ASR)系统,于2022年9月发布。
它遴荐简便的端到端神色,基于编码器-解码器Transformer架构。输入音频将被分红30秒的块,升沉为梅尔倒谱(音频特征索要神色之一,log-Mel spectrogram),然后传入编码器。
流程68万小时的多谈话和多任务监督蚁集数据的考核,Whisper不错进行多谈话转录。
Whisper推出后获得无为应用,如今GitHub已揽获70.2k标星:
据悉,它还被集成在ChatGPT的一些版块中,同期亦然Oracle和微软云诡计平台的一项内置行状,而这些平台为环球数千家公司提供行状。
此外,仅在上个月,HuggingFace上的一个最新版块Whisper就被下载了超420万次。HuggingFace社区的机器学习工程师Sanchit Gandhi暗示,Whisper是最受宽待的开源语音识别模子。
而当今,据好意思联社报谈,许多筹商东谈主员和工程师反应,在责任中他们时常遭逢Whisper产生的幻觉。
举例,密歇根大学的一位筹商员在尝试转换模子之前,发现其检查的每10份音频转录中有8份出现了幻觉。
一位机器学习工程师指出,在他分析的跨越100小时Whisper转录中,随心一半出现了幻觉。
还有一位设置者暗示,在他使用Whisper创建的26,000份转录中,险些每一份皆发现了幻觉。
……
这种问题以致存在于录制讲求的短音频样本中。
自拍在最近的一项筹商中,诡计机科学家们在审查的跨越13000个明晰音频片断中发现了187个幻觉。
工程师和筹商东谈主员暗示,他们从未见过其它任何AI驱动的转录器具像Whisper这么频繁地产生幻觉。
Whisper幻觉严重的原因咫尺尚未可知,但有软件设置者暗示,这些假造践诺相似发生在停顿、有配景声息或音乐播放时。
之前,OpenAI就有辅导:
不要在方案情境中使用Whisper,准确性上的颓势可能导致效能出现昭彰偏差。
然鹅,好意思联社暗示,这一告戒并未禁绝一些病院或医疗中心使用Whisper等语音转笔墨模子——
包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内,照旧有超30000名临床医师和40个医疗系统照旧开动使用由Nabla公司基于Whisper设置的器具。
Nabla CTO Martin Raison称,该器具针对医疗谈话对模子进行了微调,用于转录和纪念患者的沟通。
咫尺,该器具已被用于转录约700万次医疗就诊。
在得知Whisper可能会产生幻觉后,Nabla暗示正在处罚此问题,不外:
由于“数据安全原因”,Nabla的器具会删除原始音频,无法将Nabla生成的AI文本与原始灌音进行比拟。
此外,据了解,Whisper还被用来为聋东谈主和听力繁难者创建字幕。
Whisper幻觉严重问题被发现后,有东谈主敦促OpenAI飞快处罚此问题。
本年2月离开OpenAI的筹商员William Saunders也开麦了:
若是公司快意优先推敲,这似乎是不错处罚的。若是你把它放出去,东谈主们过于自信于它的功能,并将其集成到总共这些其他系统中,那就成了问题。
有OpenAI发言东谈主回话称,公司捏续筹商何如减少幻觉气候,并感谢筹商东谈主员的发现,同期补充谈OpenAI会在模子更新中融入相应反馈机制。
参考估计:[1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14[2]https://x.com/AP/status/1850150400424345858
— 完 —
量子位 QbitAI · 头条号签约
眷注咱们苍井空种子,第一技术获知前沿科技动态