OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在胡说

栏目分类

热点资讯

企业微信AI功能全量上线，能否改写企业做事生态格式？

Uber CEO：马斯克念念分工“RoboTaxi”

256GB 5G双卡手机性能可以

芯驰科技E3650旗舰MCU：奈何得志车企多元需求，引颈智能

游戏技巧怎么重塑超等数字场景，引颈文创产业新变革？

你的位置：科技前沿网 > 新兴技术 > OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在胡说

新兴技术

OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在胡说

发布日期：2024-11-21 06:59 点击次数：115

OpenAI语音转录器具被曝严重幻觉：转录100小时，一半儿在胡说

西风发自凹非寺

量子位 | 公众号 QbitAI

OpenAI的AI语音转写器具，阿谁堪称近乎“东说念主类水平”的Whisper，被曝幻觉严重——

100多小时转录，被工程师发现约一半齐在胡说。

更严重的是，好意思联社还爆料有医疗机构讹诈Whisper来转录医师与患者的诊断，已而激发多数网友关切。

据悉，明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的向上30000名临床医师和40个卫生系统已初始使用法国AI诊治公司Nabla基于Whisper打造的器具。

何况他们如故转录了偶而700万次医疗就诊。

网友纷纷默示这就有点吓东说念主了。

值得一提的是，OpenAI之前早就劝诫过，该器具不应在“高风险鸿沟”中使用。

针对最新爆料，有OpenAI发言东说念主修起，OpenAI会在模子更新中加入相应的反馈机制。

OpenAI被督促速即束缚此问题

Whisper是OpenAI老早前推出的开源自动语音识别（ASR）系统，于2022年9月发布。

它罗致通俗的端到端阵势，基于编码器-解码器Transformer架构。输入音频将被分红30秒的块，转化为梅尔倒谱（音频特征索要阵势之一，log-Mel spectrogram），然后传入编码器。

进程68万小时的多话语和多任务监督网罗数据的磨练，Whisper不错进行多话语转录。

Whisper推出后获取闲居应用，如今GitHub已揽获70.2k标星：

据悉，它还被集成在ChatGPT的一些版块中，同期亦然Oracle和微软云谋略平台的一项内置就业，而这些平台为群众数千家公司提供就业。

此外，仅在上个月，HuggingFace上的一个最新版块Whisper就被下载了超420万次。HuggingFace社区的机器学习工程师Sanchit Gandhi默示，Whisper是最受迎接的开源语音识别模子。

而当今，据好意思联社报说念，好多磋商东说念主员和工程师反馈，在职责中他们每每碰到Whisper产生的幻觉。

举例，密歇根大学的一位磋商员在尝试阅兵模子之前，发现其查验的每10份音频转录中有8份出现了幻觉。

一位机器学习工程师指出，在他分析的向上100小时Whisper转录中，大致一半出现了幻觉。

还有一位竖立者默示，在他使用Whisper创建的26,000份转录中，险些每一份齐发现了幻觉。

……

这种问题以至存在于录制淡雅的短音频样本中。

在最近的一项磋商中，谋略机科学家们在审查的向上13000个明晰音频片断中发现了187个幻觉。

工程师和磋商东说念主员默示，他们从未见过其它任何AI驱动的转录器具像Whisper这么频繁地产生幻觉。

Whisper幻觉严重的原因目下尚未可知，但有软件竖立者默示，这些杜撰现实每每发生在停顿、有布景声息或音乐播放时。

之前，OpenAI就有指示：

不要在有策画情境中使用Whisper，准确性上的劣势可能导致效果出现昭着偏差。

然鹅，好意思联社默示，这一劝诫并未禁锢一些病院或医疗中心使用Whisper等语音转笔墨模子——

包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内，如故有超30000名临床医师和40个医疗系统如故初始使用由Nabla公司基于Whisper竖立的器具。

Nabla CTO Martin Raison称，该器具针对医疗话语对模子进行了微调，用于转录和回归患者的疏导。

目下，该器具已被用于转录约700万次医疗就诊。

在得知Whisper可能会产生幻觉后，Nabla默示正在束缚此问题，不外：

由于“数据安全原因”，Nabla的器具会删除原始音频，无法将Nabla生成的AI文本与原始灌音进行比拟。

此外，据了解，Whisper还被用来为聋东说念主和听力贫困者创建字幕。

Whisper幻觉严重问题被发现后，有东说念主敦促OpenAI速即束缚此问题。

本年2月离开OpenAI的磋商员William Saunders也开麦了：

若是公司欣慰优先琢磨，这似乎是不错束缚的。若是你把它放出去，东说念主们过于自信于它的功能，并将其集成到所有这些其他系统中，那就成了问题。

有OpenAI发言东说念主修起称，公司执续磋商如何减少幻觉惬心，并感谢磋商东说念主员的发现，同期补充说念OpenAI会在模子更新中融入相应反馈机制。

参考调处：[1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14[2]https://x.com/AP/status/1850150400424345858

— 完 —

量子位 QbitAI · 头条号签约

关切咱们，第一本领获知前沿科技动态

上一篇：争作念新时间的“雷小锋” 太原迎泽区第一履行小学举行主题升旗典礼