概述

推理服务是将训练好的机器学习模型部署为可实时处理预测请求的系统，它涉及模型的配置、部署、监控和弹性伸缩。科研助手的推理服务确保了高效、可靠的推理能力。

操作步骤

登录科研助手控制台。
在控制台左侧导航栏中，选择【科研服务】。
在【科研服务】页面中，单击左上角的【部署服务】。
在【部署服务】页面中,分别需要配置基础信息和资源配置。在基础信息中填写服务名称、选择需要部署服务的模型和模型版本，选择所需的运行环境。在资源配置中选择模型服务所需的资源规格和实例数量。配置完毕后点击【启动服务】，即可创建模型推理服务。

以下是配置项的详细说明：
【基础信息】

配置项	介绍
服务名称	模型推理服务的名称，用于在服务列表中展示模型名称。
算法框架	选择模型所使用的框架，默认pytorch。
模型格式	选择模型推理服务所使用的模型格式，默认torchscript。
运行环境	选择实例运行的镜像，内置了模型推理服务所需的运行环境。

【模型来源】

【资源配置】