挪威一名男子以“毁谤罪”,将OpenAI的聊天机器人ChatGPT告上了法庭——原因是ChatGPT提供了关于他的错误信息——ChatGPT称他为“杀儿犯”。据BBC等媒体报道称,居住在挪威的阿尔韦・耶尔马尔・霍尔门于去年8月在ChatGPT中输入了 ...
就在刚刚,OpenAI 宣布在其 API 中推出全新一代音频模型,包括语音转文本和文本转语音功能,让开发者能够轻松构建强大的语音 Agent。 据 OpenAI 介绍,新推出的 gpt-4o-transcribe ...
美东时间周四,OpenAI举行了一场重磅的技术直播,发布了三款全新语音模型:语音转文本模型GPT-4o Transcribe和GPT-4o MiniTranscribe,以及文本转语音模型GPT-4o MiniTTS。
在科技迅速发展的今天,语音技术已经成为人工智能领域的重要组成部分。2025年3月21日,美东时间周四,OpenAI举行了一场颇具影响力的技术直播,向大众介绍了其最新推出的三款语音模型。这些模型的问世无疑将为各行各业的语音交互和信息处理带来革命性的变化 ...
就在昨天,OpenAI 推出的「最贵大模型 API」o1-pro API 还因为每百万 token 收费 600 美元而遭到了 AI 社区的广泛吐槽。今天 OpenAI 推出的三款语音 API ...
今天,这家 ChatGPT 的开发商发布了三个全新的专有语音模型:gpt-4o-transcribe、gpt-4o-mini-transcribe 和 gpt-4o-mini-tts。这些模型最初通过应用程序接口 (API) ...
就在刚刚,OpenAI 发布了一系列新模型和工具,具体来说OpenAI在API 中推出三种新的先进音频模型:️ 两种语音转文本模型 - 表现优于 Whisper 新的 TTS ...
智东西 作者 | 陈骏达 编辑 | 云鹏 ...
据悉,这一计划的首个数据中心综合体位于得克萨斯州的小城阿比林,预计将于2026年中期竣工。该综合体的设计电力容量高达1.2吉瓦,足以容纳多达40万个英伟达强大的AI芯片。一旦全部装满,它将成为全球范围内已知的最大AI算力集群之一,为OpenAI的先进 ...
在噪音旋涡中舞动,OpenAI以新的声浪重返语音AI舞台。尽管因Scarlett Johansson事件曾遭遇波折,这并未阻挡这家ChatGPT的开发者继续精耕细作,其最新的语音AI模型——gpt-4o-transcribe、gpt-4o-mini-transcribe及gpt-4o-mini-tts,今日惊艳亮相,秀出科技的无限可能性。
在文本转语音上,OpenAI最新推出了gpt-4o-mini-tts模型,开发者通过“模拟耐心客服”或“生动故事叙述”等指令,控制语音风格,可以应用于客服(合成更具同理心的语音,提升用户体验)和创意内容方面。
根据OpenAI官方数据显示,在行业标准的33种语言测试中,gpt-4o-transcribe的错误率相较于Whisper有了显著下降,尤其在英语方面,错误率更是低至 2.46%! 这对于需要高精度语音转录的场景来说,无疑是一个巨大的进步。