Qwen 团队是中国电商巨头阿里巴巴的一个部门,专注于开发其不断扩展的开源 Qwen 大语言模型(LLM)系列。该团队推出了 QwQ-32B,这是一种新的 320 亿参数推理模型,旨在通过强化学习(RL)提高复杂问题解决任务的性能。
由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型,2025年1月下旬,英伟达(NVIDIA)等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法,可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号(Spu ...
在过去的三个月里,中国大模型创业公司DeepSeek和AI应用创业公司Manus如同一股狂潮,激荡着全球AI市场,快速改变着硅谷、阿里巴巴等巨头们的既定发展路径。根据DeepSeek的研究,投入2048张英伟达H800芯片以及558万美元的训练成本,他们研发的DeepSeek-V3已与OpenAI的明星模型GPT-4o相媲美,令人赞叹不已。
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
原文作者:Jacob Dreyer通过押注AI,中国希望能开发面向全球市场,尤其是低收入国家的成本效益高的实用商业工具。中国巨大的消费市场或推动“具身人工智能”(embodied ...
随着数以百万计的用户涌入平台,DeepSeek的聊天机器人经常出现服务中断。 出于数据安全方面的考虑,世界各地主管部门正在限制其使用。 美国在考虑采取一些措施,包括禁止DeepSeek在其政府设备上使用。 其他网络公司则正在利用DeepSeek的免费代码来推进自己的业务。
不等了,就是现在! 百度搜索已正式全量接入DeepSeek-R1满血版,在宣布“将接入”仅过了24小时后。 基于百度搜索的国民级用户覆盖,满血版DeepSeek ...
DeepSeek席卷校园:头部高校开AI大课。 2025 年 2 月,中国高校掀起了一场以 DeepSeek 人工智能课程为核心的教育蜕变。 深圳大学宣布其基于DeepSeek的通 ...
快科技2月24日消息,大家有没有发现,最近DeepSeek很少再出现“服务器繁忙,请稍后再试”了? 据国内媒体报道,有用户反馈,DeepSeek算力紧张的 ...
Hace poco, la empresa china de inteligencia artificial (IA) DeepSeek causó sensación en el mundo con el lanzamiento de su ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果