小手冰凉*^O^*
2025-03-19
来自北京
老师好,文中“首先如下图所示,选择数据集,并设置学习率为 5e-6,梯度累积为 2,有利于模型拟合。”,这几个值是依据什么确定的?
kevin
2025-03-19
来自江苏
你好,请教一下学习率这个参数的设置规则
Tom
2025-03-19
来自广东
老师,微调的数据集要怎样调整效果会比较好?如:我要对某复杂的产品手册进行微调实现智能客服,我需要把我的产品手册转换成什么样的格式微调效果才会比较好?
共 1 条评论