洪老师好,您说:“Thorsten 利用因果推论中的倾向评分(Propensity Scoring)技术以及(Multi-armed Bandit)思想,把这样的方法成功地引入到机器学习中,使得无偏差地训练模型成为可能。 ”
我对这方面的研究感兴趣,查看Thorsten教授的主页, 找到下面这篇论文: T. Joachims, A. Swaminathan, T. Schnabel, Unbiased Learning-to-Rank with Biased Feedback, International Conference on Web Search and Data Mining (WSDM), 2017.
我的问题是, 这方面的研究(使用有偏差的数据,无偏差的训练模型)是否还有更多的参考资料?非常感谢😊
展开