作者回复: 第一个问题可以这么理解,第二个问题,不需要理解理论,只要知道蒸馏就是能力的传递就可以
作者回复: 垂直领域需要做微调或者RAG,模型用ds就可以
作者回复: ds 不支持多模态 所以图片这种数据没法蒸馏