• Geek_8c7e68
    2024-11-04 来自浙江
    老师,有没有自动识别文档的学习资料,比如文档格式不定,字段的位置也不定,然后需要提取里面的字段填充表单

    作者回复: 你好,同学 感谢你的提问 首先回答自动识别文档的问题: 可以使用文本识别(如OCR)来提取。 其次回到课程本身,如问题是如何识别页面中表单字段并实现自动填充的问题:那么,从课程内容的角度出发,解决问题的一种示例方式是: step1: 通过计算机视觉模型识别页面上的表单输入框和标签。 step2: 使用 OCR 提取标签文本,结合 NLP 技术分析标签内容。 step3: 判断字段类型(邮箱、手机号、姓名等)并填充对应的内容。 step4: 通过前端脚本自动填写表单。 那么对于以上步骤: step1 需要的知识结构属于课程内容,相信你已经有了自己的idea 和 propsoal step2 是学习曲线相对视觉更陡峭的的一个步骤,涉及NLP, 文档内容提取等许多算法,有两种学习方式: 先使用成熟的OCR等技术进行体验,以用促学的方式进行。 以AI学习路线来进行(示例): a. 基础知识与技能 (基础编程与Python, 基础机器学习算法, NLP基础) b. 深度学习与NLP进阶 (神经网络基础, LSTM与GRU, Transformer模型) c. 实战与专业练习: 文档分类与信息抽取项目:利用SVM、深度学习、BERT等算法进行文 档分类 多模态学习:处理包含图像、文本等不同模态的文档, 学习OCR (Tesseract)技术, 将图像转化为可识别文本。 在第二种以正向爬坡的学习方式中,会体感到CV和NLP的基础原理相近, NLP会对计算方式和计算环境有更高的要求,同时对学习者的要求也更 高。 step3 和 step4 则是则更多属于是工程链路上的部分,这里是我们的熟悉领域。 加油!

    
    