当前大模型技术浪潮一波接着一波,在技术界相当火热。在Datawings产品研发的实践中,也积极拥抱了大模型的能力。下面介绍下大模型在Datawings产品中的实践。
Datawings中的即席查询模块,通过输入用户的需求,智能获取相对应的sql相关的结果。比如以下几类问题(1:给我一个查询学生表的Sql,2:给我一个学生表的解释)。当前大模型也有开源,也有限时免费的。可以实现需求的部分功能。但是,算力再高的大模型也不能够精确地知道我们需要的Sql对应的表模型。所以这里我们需要通过对Datawings中元数据的采集实现一个本地知识库的建设。实践中知识库的建设采用了开源的embedding算法进行了元数据表模型的向量计算,将结果存储在Elasticsearch中。通过对向量的查询,可以获取和表关联最大的那个向量(即表模型)。最后我们将获取到的表模型和问题形成Prompt发送给大模型,这样大模型会返回给我们一个相对较准确的Sql结果,最后我们将结果进行优化和简化得到我们最终的结果来展示。以下是产品演示效果。