一大早,OpenAI就宣布了o1-pro API已上线的消息。 估计是为了给最后的价格做铺垫,它首先细数了o1-pro的一大堆优点: 它比o1使用更多计算资源,提供更优质且稳定的响应。支持视觉处理、函数调用、结构化输出,并兼容响应式和批量API。
日前,OpenAI方面发布3款全新语音模型,其中包括语音转文本模型GPT-4o Transcribe、GPT-4o MiniTranscribe,以及文本转语音模型GPT-4o MiniTTS。
今天,这家 ChatGPT 的开发商发布了三个全新的专有语音模型:gpt-4o-transcribe、gpt-4o-mini-transcribe 和 gpt-4o-mini-tts。这些模型最初通过应用程序接口 (API) ...
近日,OpenAI再度引发科技界的轰动,其API平台上新推出了三款音频处理模型,这三款模型分别是专注于语音转文字的gpt-4o-transcribe与gpt-4o-mini-transcribe,以及文字转语音的gpt-4o-mini-tts。根据OpenAI的官方信息,这些新模型在识别准确率、语言理解能力以及适应各种复杂场景的能力上均有显著提升。
在科技迅速发展的今天,语音技术已经成为人工智能领域的重要组成部分。2025年3月21日,美东时间周四,OpenAI举行了一场颇具影响力的技术直播,向大众介绍了其最新推出的三款语音模型。这些模型的问世无疑将为各行各业的语音交互和信息处理带来革命性的变化 ...
至于OpenAI的新语音转文本模型“GPT-4o-transcript”和“GPT-4o-mini- transcript”,它们的准确度明显高于 OpenAI之前发布的语音转文本模型Whisper,并在多种语言中实现更低的词错误率 (WER)。
根据OpenAI官方数据显示,在行业标准的33种语言测试中,gpt-4o-transcribe的错误率相较于Whisper有了显著下降,尤其在英语方面,错误率更是低至 2.46%! 这对于需要高精度语音转录的场景来说,无疑是一个巨大的进步。
就在昨天,OpenAI 推出的「最贵大模型 API」o1-pro API 还因为每百万 token 收费 600 美元而遭到了 AI 社区的广泛吐槽。今天 OpenAI 推出的三款语音 API ...
14 小时on MSN
IT之家 3 月 21 日消息,OpenAI 昨日(3 月 20 ...
9 小时on MSN
挪威一名男子以“毁谤罪”,将OpenAI的聊天机器人ChatGPT告上了法庭——原因是ChatGPT提供了关于他的错误信息——ChatGPT称他为“杀儿犯”。据BBC等媒体报道称,居住在挪威的阿尔韦・耶尔马尔・霍尔门于去年8月在ChatGPT中输入了 ...
连发三款音频模型,OpenAI踢开语音智能体开发大门,openai,智能体,mini,sdk ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果