若水清菡
2025-07-24
来自北京
如果你怀疑模型在某类问题上被植入了“后门”,你会怎么验证它? 能想到的一种快速的方法,将这类问题整理出典型的5-10个,发给市场上其他的大模型去交叉比对结果,如果自己的模型输出的结果与其他厂商大模型有较大差异,就可以怀疑自己采用的训练集这类数据有异常,然后再去排查是否存在被污染的可能性。