Paul
2025-06-19
来自北京
请问处理 PDF 文件,里面图片和对应文本的 mapping 如何处理,我目前是先把图片周围的名称抓下作为图片的名字,让后保留名字和文本的关系,把文本和图片元数据加在进向量数据库支持检索并能引用正确的图片。请问是否有更合理的方案
一丁
2025-06-19
来自广东
不用讲dify源码怎么处理的,他要是能处理完美,就不会要清洗了。我们想看你怎么清洗这些数据的逻辑
波波安
2025-06-18
来自广东
老师课程的PPT可以分享吗