随着2022年ChatGPT的出现,大模型和RLHF为核心的技术落地意味着人工智能开启AI 新范式。人工智能是我们国家目前最重视的科学技术之一,也是发展各国关系的一条重要纽带。作为国家、企业公司的一份子,怎么助力公司人工智能大模型建设,我有一下自己的思考,也希望同一起感兴趣的小伙伴探讨。
(1)人工智能大模型建设步骤为开发阶段;研究阶段:研究、技术选型、设计;数据准备:模型大小、数据量、算法;模型评估:指标、性能、准确率、速度;部署:环境、硬件、软件;上线:模型上线、监控、维护等6个阶段。
团队分工上,需要数据、算法、架构、硬件、模型训练/调优、部署等工程师进行协调工作。
工期预估,在数据:2-3 月,数据集、数据库存储、数据收集和梳理;算法:1-2 月 算法计划、自然语言处理;
架构:深度学习、机器计算、自然语言处理,设计合理模型架构:网络结构、层数、卷积核大小;硬件配置:合适GPU\TPU,优化计算机网络和存储系统;模型训练:3-6 月训练、评估、验证;模型调优:迭代、参数调整、优化;部署:1-2月;
(2)根据人工智能大模型建设,结合公司发展规划、组建大数据模型团队,制定合理的目标。个人角度,主动学习人工智能大模型涉及的知识领域的广度和深度
(3)一是要在基础设施上提供相应的算力支持,能够提供更大规模的公共服务算力平台;二是模型生态建设上要有开源共享的目标,不仅要关注基础模型,每一个行业相关模型的探索,包括人工智能一系列应用;三是要降低AI使用门槛,降低模型应用成本