1. 概述
DeepSeek-R1 是幻方量化旗下 AI 公司深度求索(DeepSeek)研发的一款高性能推理模型。该模型使用强化学习技术进行后训练,专注于提升在数学、代码和自然语言推理等复杂任务上的表现。
DeepSeek-R1 在需要逻辑推理、思维链推理和实时决策的任务中表现出色,如解决高级数学问题、生成复杂代码、解析复杂科学问题等。在类似Codeforces的挑战场景中获得了2029 Elo评分;在复杂推理基准测试中,表现与OpenAI的o1模型相当。尽管总共有6710亿的庞大参数,但每次前向传递时仅激活370亿个参数,比大多数大模型更加高效的利用资源。
当前在科研助手的社区镜像中,我们已经为您提前部署好了完整的服务,方便您即刻体验,开箱即用。
2. 准备环境
1.【镜像商城】创建应用
-
进入批量计算控制台,点击左上角,切换“科研版”;
-
进入“科研版”总览页,点击快捷入口【找镜像】,进入镜像商城
-
在“镜像商城”中,找到名为“DeepSeek语言模型推理服务”的镜像,点击【使用此镜像】,进入开发机创建界面;
-
【基础信息】-【主机规格】中,优选NVIDIA-A100-40G,框架版本已默认选好【社区镜像】的“open-webui-deepseek-r1-cuda11.3”
2.点击【确认订单】,完成开发机创建并启动。
3.启动开发机并登录VNC
- 【开发机】刷新状态,等待新创建的开发机状态进入到【运行中】状态后点击右侧操作栏【打开】。
- 点击【打开】跳转到vnc开发机,成功进入到远程桌面中。
3.启动Open WebUI,准备DeepSeek模型
- 点击桌面上【OI】图标,等待弹窗浏览器;
- 在打开的浏览器窗口中,点击【选择一个模型】下拉框中选择预置好的模型【deepseek-r1:latest 7.6B】,即刻完成模型加载,无需等待。
4.使用DeepSeek-R1模型服务
- 在对话框里输入问题后点击【发送消息】图标,deepseek将给出答复: