• pedro
    2025-11-14 来自湖北
    价值阐述的很清晰,真场景,就看后面的落地了

    作者回复: 感谢认可! 会持续打磨内容,确保从理论到实践的完整闭环,让价值真正落地。

    
    
  • Geek_bd0069
    2025-11-14 来自四川
    我看过老师的强化学习的课程,强化学习的技术能用到这个项目中吗?老师能提供一下思路吗?

    作者回复: 感谢你的关注! 强化学习(RL)确实可以在大语言模型(LLM)应用开发中发挥作用,尤其是在对齐人类偏好、优化生成策略或构建智能体决策机制等场景中。例如: RLHF(基于人类反馈的强化学习):用于微调模型输出,使其更符合用户意图; LLM + RL 智能体:让大模型作为策略网络或推理引擎,在环境交互中通过奖励信号持续优化行为; 任务规划与工具调用:用强化学习优化 LLM 调用外部工具(如 API、数据库)的序列决策。 在本课程中,我们会聚焦 LLM 应用的核心开发范式(如提示工程、RAG、Agent 设计等),虽不深入 RL 算法本身,但会提及如何结合 RL 思想提升应用效果。如果您有具体场景,也欢迎进一步交流!

    
    
  • 张申傲
    2025-11-14 来自北京
    情感陪伴的核心是关系,关系产生于主体间,随着AI的主体性越来越强,人与AI间的关系也会成为越来越大的命题~
    
    1