SQL 必知必会
陈旸
清华大学计算机博士
74942 人已学习
新⼈⾸单¥68
登录后,你可以任选4讲全文学习
课程目录
已完结/共 52 讲
第一章:SQL语法基础篇 (19讲)
SQL 必知必会
15
15
1.0x
00:00/00:00
登录|注册

加餐 01|Text to SQL:自然语言写SQL查询

你好,我是陈博士。
在 AI 时代,很多业务人员可以不写 SQL 就进行数据查询,他们可以通过自然语言向数据库进行提问。这依赖于一种技术,称为 Text to SQL。

Text to SQL 技术

Text-to-SQL(文本转 SQL)是将自然语言问题自动转换为结构化的 SQL 查询语句,这样可以让用户更直观的与数据库进行交互。Text-to-SQL 的技术演变经历了 3 个阶段。
早期阶段:依赖于人工编写的规则模板,来匹配自然语言和 SQL 语句之间的对应关系。
机器学习阶段:采用序列到序列模型等机器学习方法,来学习自然语言和 SQL 之间的映射关系。
LLM 阶段:借助 LLM 强大的语言理解和代码生成能力,利用提示工程、微调等方法将 Text-to-SQL 性能提升到新的高度。
我们目前已处于 LLM 阶段,基于 LLM 的 Text-to-SQL 系统会包含以下几个步骤:
自然语言理解:分析用户输入的自然语言问题,理解其意图和语义。
模式链接:将问题中的实体与数据库模式中的表和列进行链接。
SQL 生成:根据理解的语义和模式链接结果,生成相应的 SQL 查询语句。
SQL 执行:在数据库上执行 SQL 查询,将结果返回给用户。

LLM 模型选择

下面我按照闭源、开源、代码大模型,推荐一些我比较常用的大模型。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
  • 解释
  • 总结

1. Text-to-SQL技术将自然语言问题自动转换为结构化的SQL查询语句,让用户更直观地与数据库进行交互,经历了早期阶段、机器学习阶段和LLM阶段的演变。 2. LLM模型选择包括闭源模型、开源模型和代码大模型,其中Qwen、Qwen-coder、CodeGeeX和SQLCoder等模型具有不同的特点和适用场景。 3. 为了让LLM生成高质量的SQL查询语句,可以使用提示工程、上下文学习、推理增强和执行优化等技术来优化Text to SQL的工作流程。 4. 在SQL prompt template撰写中,方法3的SQL生成质量最高,因为它提供了更多的字段定义信息,适合LLM理解数据表的内容,而且能够让大模型直接写出SQL。 5. 高质量的prompt template可以让LLM生成高质量的SQL,对于数据分析师来说,掌握基本的SQL语法和撰写能力有助于SQL语句的校验和优化,以及对prompt的撰写。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《SQL 必知必会》
新⼈⾸单¥68
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部