但2024年最后一个月,它密集发布了多个模型。其中圣诞节后发布的名为DeepSeek-V3(以下简称「V3」)的模型,宣称在性能上「相当于」业界领先的闭源模型GPT-4o与Claude-3.5-Sonnet, 「优于」最好的开源模型Meta的Llama 3,且总训练成本仅为557.6万美元 ,这个数字只有(据估计投资超过5亿美元)前者的1%。
2 月 5 日,雷克萨斯中国公众号发文,表示丰田汽车与上海市政府就共同助力中国社会绿色低碳发展相关举措达成合作意向,丰田决定在上海市金山区成立 LEXUS 雷克萨斯纯电动汽车及电池的研发生产公司。
DeepSeek给整个AI产业带来的影响是全方位、多层次的,除了自身模型的优秀,DeepSeek对于产业的带动效应更值得关注,从芯片产业到上层云服务产业,几乎所有头部玩家和创企都在积极涌入DeepSeek“生态圈”。
对于科研人员来说,R1的平价和开源可能会改变传统:使用它的应用编程接口(API),就能以其专利竞品收取的一小部分费用对这个模型提问;其在线对话机器人DeepThink(深度思考)的使用更是免费。科研人员还能在自己的服务器上下载这个模型,免费运行和拓展模型——这些都是闭源竞品模型o1办不到的。