极客时间-轻松学习，高效学习-极客邦

Geek_54dac1
2023-12-15 来自四川
该模型在 Candle 中还暂时不支持在 GPU 上运行，因为 Quantized models on Cuda 还不支持，参考：https://github.com/huggingface/candle/issues/1250；避免大家挖坑
作者回复: 很棒的探索和分享👍
无限可能
2023-12-15 来自北京
老师好，大模型小白有几个问题。通过 huggingface-cli scan-cache，扫描了一下 huggingface 下载过的文件，都是 7G 或者更大： 1. 这些模型文件里主要是什么内容，是包括了数据么？为啥会这么大？ 2. 类似这么大的文件，一定要下载到本地么，是否可以云部署之类，可以用完销毁。 3. 我理解，我想要运行本节课的demo，这 7G 的空间就是要长期规划出去了吧
作者回复: 1。主要是预训练神经网络模型权重数据 2。要下载到本地，要加载到显存或者内存中运行 3。是的
共 2 条评论
学水
2023-12-15 来自加拿大
这张感觉主要是给对rust有兴趣的mle，中间一些代码如果不是因为用过pytorch，完全不知道在干啥
作者回复: 是的，如果讲ml的话，又是专门一门课程了。可以在后续继续深入下去。你有pytorch基础就非常有利。👍
刘丹
2023-12-15 来自广东
老师，你好，请问能否推荐几个和 ChatGPT 交互的 Rust SDK ? 最好也能支持其它 LLM 。
作者回复: 有几个还不错的。 https://github.com/sobelio/llm-chain https://github.com/rustformers/llm https://github.com/jondot/awesome-rust-llm 当然最强的，还是candle啦。 https://github.com/huggingface/candle