概述
推理服务是将训练好的机器学习模型部署为可实时处理预测请求的系统,它涉及模型的配置、部署、监控和弹性伸缩。批量计算的推理服务确保了高效、可靠的推理能力。
注意事项
推理服务公测期免费试用,每人限制部署一个单实例服务,公测结束后按资源使用时长计费。
操作步骤
-
登录批量计算控制台。
-
在控制台左侧导航栏中,选择【科研服务】的【服务部署】。
-
在【服务部署】页面中,单击左上角的【部署新服务】。
-
在【部署新服务】页面中,分别需要配置基础信息和资源配置。在基础信息中填写服务名称、选择需要部署服务的模型和模型版本,选择所需的运行环境。在资源配置中选择模型服务所需的资源规格和实例数量。配置完毕后点击【启动服务】,即可创建模型推理服务。
-
以下是配置项的详细说明:
【基础信息】配置项 介绍 服务名称 模型推理服务的名称,用于在服务列表中展示模型名称。 模型选择 选择模型仓库中配置的模型。 版本选择 选择模型推理服务所使用的模型版本。 运行环境 选择实例运行的镜像,内置了模型推理服务所需的运行环境。 【资源配置】
配置项 介绍 可用区 为所选模型所在的可用区域,无法修改。 队列 选择对应可用区下的队列。 资源规格 选择对应可用区下的资源规格。 实例数量 为模型推理服务所需申请的实例数量。