加餐 01|Text to SQL:自然语言写SQL查询
陈旸

你好,我是陈博士。
在 AI 时代,很多业务人员可以不写 SQL 就进行数据查询,他们可以通过自然语言向数据库进行提问。这依赖于一种技术,称为 Text to SQL。
Text to SQL 技术
Text-to-SQL(文本转 SQL)是将自然语言问题自动转换为结构化的 SQL 查询语句,这样可以让用户更直观的与数据库进行交互。Text-to-SQL 的技术演变经历了 3 个阶段。
早期阶段:依赖于人工编写的规则模板,来匹配自然语言和 SQL 语句之间的对应关系。
机器学习阶段:采用序列到序列模型等机器学习方法,来学习自然语言和 SQL 之间的映射关系。
LLM 阶段:借助 LLM 强大的语言理解和代码生成能力,利用提示工程、微调等方法将 Text-to-SQL 性能提升到新的高度。
我们目前已处于 LLM 阶段,基于 LLM 的 Text-to-SQL 系统会包含以下几个步骤:
自然语言理解:分析用户输入的自然语言问题,理解其意图和语义。
模式链接:将问题中的实体与数据库模式中的表和列进行链接。
SQL 生成:根据理解的语义和模式链接结果,生成相应的 SQL 查询语句。
SQL 执行:在数据库上执行 SQL 查询,将结果返回给用户。
LLM 模型选择
下面我按照闭源、开源、代码大模型,推荐一些我比较常用的大模型。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. Text-to-SQL技术将自然语言问题自动转换为结构化的SQL查询语句,让用户更直观地与数据库进行交互,经历了早期阶段、机器学习阶段和LLM阶段的演变。 2. LLM模型选择包括闭源模型、开源模型和代码大模型,其中Qwen、Qwen-coder、CodeGeeX和SQLCoder等模型具有不同的特点和适用场景。 3. 为了让LLM生成高质量的SQL查询语句,可以使用提示工程、上下文学习、推理增强和执行优化等技术来优化Text to SQL的工作流程。 4. 在SQL prompt template撰写中,方法3的SQL生成质量最高,因为它提供了更多的字段定义信息,适合LLM理解数据表的内容,而且能够让大模型直接写出SQL。 5. 高质量的prompt template可以让LLM生成高质量的SQL,对于数据分析师来说,掌握基本的SQL语法和撰写能力有助于SQL语句的校验和优化,以及对prompt的撰写。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《SQL 必知必会》,新⼈⾸单¥68
《SQL 必知必会》,新⼈⾸单¥68
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论