• KoalaNotSleepy
    2025-10-26 来自中国香港
    def run(self)函数有两处错误,需要修改后第2份代码才能正确运行,否则训练出来的模型只能得10分左右,和随机模型没有区别: 1. total_loss.backward()之前self.optimizer.zero_grad()之后添加self.local_model.zero_grad() 2. global_param._grad = local_param.grad改成global_param.grad = local_param.grad.detach()
    
    