简介
DeepSeek 是一款基于 Transformer 架构的大型语言模型,具备强大的自然语言理解和生成能力,能够处理多种复杂的语言任务。自发布以来,DeepSeek 凭借其卓越的性能和广泛的应用场景,迅速赢得了业界的关注和认可。
目前,智能边缘云ECX已经适配DeepSeek-R1系列模型,包括1.5B、7B、8B、14B、32B及70B版本。
接下来将详细介绍如何在ECX上快速部署DeepSeek系列模型并使用Ollama运行。
注意
为维护良好的网络环境和公共秩序,禁止任何用户或机构利用天翼云平台从事违法活动、传播不良信息或实施违反社会公序良俗的行为。若发生此类行为,天翼云将依法采取必要措施,停止相关服务功能,并依法追究责任。
模型由DeepSeek公司提供,结果仅供参考,天翼云不对模型及模型的任何结果负责。
适配模型及推荐配置
DeepSeek配置 | 推荐虚拟机配置 | 标准价格 | 镜像 |
---|---|---|---|
DeepSeek-R1-Distill-Qwen-1.5B | g6i.4xlarge.4,16核64G,A10*1 | 按需:8.91元/小时 包月:4444元/月 |
Ubuntu-22.04-A10-DeepSeek-1.5b |
DeepSeek-R1-Distill-Qwen-7B | g6i.4xlarge.4,16核64G,A10*1 | 按需:8.91元/小时 包月:4444元/月 |
Ubuntu-22.04-A10-DeepSeek-7b |
DeepSeek-R1-Distill-Llama-8B | g6i.4xlarge.4,16核64G,A10*1 | 按需:8.91元/小时 包月:4444元/月 |
Ubuntu-22.04-A10-DeepSeek-8b |
DeepSeek-R1-Distill-Qwen-14B | g6i.4xlarge.4,16核64G,A10*1 | 按需:8.91元/小时 包月:4444元/月 |
Ubuntu-22.04-A10-DeepSeek-14b |
DeepSeek-R1-Distill-Qwen-32B | g6i4.8xlarge.4,32核128G,A10*4 | 按需:28.92元/小时 包月:14288元/月 |
Ubuntu-22.04-A10-DeepSeek-32b |
DeepSeek-R1-Distill-Llama-70B | g6i4.8xlarge.4,32核128G,A10*4 | 按需:28.92元/小时 包月:14288元/月 |
Ubuntu-22.04-A10-DeepSeek-70b |
其他配置价格可参考计费说明,最终活动及价格请以下单页面为准。
快速部署DeepSeek系列模型并使用Ollama运行
创建VPC
登录智能边缘云ECX控制台,菜单栏点击【边缘网络>虚拟私有云>VPC和子网】,点击按钮【+创建虚拟私有云】。
根据您的目标用户所在地域,就近选择业务部署的地域,并按需修改VPC名称、VPC网段、子网网段等,若无特殊需求,按照默认设置即可,勾选协议并点击【立即创建】。
完成后即可在VPC和子网列表看到刚刚创建的VPC。
创建安全组
登录智能边缘云ECX控制台,菜单栏点击【边缘网络>访问控制>安全组】,点击按钮【新建安全组】。
切换【入方向规则/出方向规则】,点击【添加规则】按需设置应用的安全组策略,在本方案中,需确保设置“11434,18080”入方向规则,点击【确定】保存安全组策略。
创建GPU虚拟机
登录智能边缘云ECX控制台,菜单栏点击【边缘虚拟机>实例】,点击按钮【新建实例】。
就近选择地域可用区,实例规格选择“GPU型”,根据您要部署的DeepSeek版本,选择合适的实例配置。
镜像配置-操作系统选择”镜像市场“,镜像服务类型选择“大模型”,操作系统选择“Ubuntu”,如下图所示。
存储配置,系统盘建议100GB以上。
网络配置,公网IP选择“新购买”。
安全组设置,选择刚刚创建的安全组。
完成后提交订单,完成支付后,返回控制台即可看到刚刚创建的虚拟机。
如需更多虚机创建指引,可参考如何创建实例。
体验模型
虚拟机创建完成后,新建网页,输入[http://公网IP:18080],如http://110.80.146.173:18080,即可通过webUI进行模型交互。
若需启用联网搜索等功能,可点击左侧菜单,点击【设置】自定义相关配置。
加载更多版本模型
若需加载其他版本DeepSeek模型,可登录虚拟机,执行以下命令。
ollama pull deepseek-r1:14b
将deepseek-r1:14b换成想要的模型,可访问https://ollama.com/library/deepseek-r1查看全部支持的模型。
加载完成后,可在webUI页面切换不同模型使用,如下图所示。
常见FAQ
1、存储容量不够怎么办?
如果您在使用过程中发现磁盘空间不足,可参考扩容云硬盘进行磁盘扩容。
2、已购资源配置性能不能满足我的使用怎么办?
如果您在使用过程中,发现CPU、内存或GPU性能不能满足您的需求,可参考升级实例进行虚拟机配置升级。
3、不同版本DeepSeek适用场景?
模型 | 适用场景 | 特点 |
---|---|---|
1.5B | 轻量级任务,如短文本生成、基础问答、边缘计算设备(如工业控制终端、智能家居中枢)。 | 资源消耗低,适合低配设备,响应速度快。 |
7B/8B | 中等复杂度任务,如文案撰写、表格处理、统计分析、个人开发者工作站。 | 性能与资源消耗平衡,适合对响应速度有一定要求且硬件资源有限的场景。 |
14B | 复杂任务,如长文本生成、数据分析、企业级合同分析、报告生成。 | 适合对模型性能有一定要求但硬件条件有限的场景。 |
32B | 高精度专业领域任务,如医疗咨询、法律分析、多模态任务预处理。 | 适合硬件条件较好的场景,能够处理高精度和复杂任务。 |
70B | 高复杂度任务,如金融预测、大规模数据分析、科研机构的复杂计算。 | 性能最强,适合对准确性和复杂度要求极高的专业领域。 |