23|Rust与大模型:用 Candle 做一个聊天机器人
- 深入了解
- 翻译
- 解释
- 总结
Rust语言在AI领域的应用备受关注,尤其在大语言模型(LLM)的训练和推理方面展现出了独特的优势。本文介绍了Rust语言在大模型应用上的优势,以及介绍了ChatGPT、LLaMA和量子化方法等内容,为读者提供了对Rust在AI领域的应用和发展趋势的全面了解。文章重点介绍了ChatGPT和LLaMA,以及其在大模型文件格式和量子化方法上的创新。特别是LLaMA的量子化方法,将权重从16位量子化到2位,大大减小了内存占用,促进了LLM生态的进一步繁荣。此外,文章还介绍了Rust生态中的几个优秀的机器学习框架,其中以Candle为例进行了详细介绍。Candle是一个极小主义的机器学习框架,支持HuggingFace上的大多数模型,具有简单的语法和CPU、Cuda、Metal的支持,同时也支持模型训练和分布式计算。文章还提供了使用Candle框架创建聊天机器人的示例,展示了其在实际应用中的灵活性和便利性。总的来说,本文通过介绍Rust语言在大模型应用上的优势,以及介绍了ChatGPT、LLaMA和量子化方法等内容,为读者提供了对Rust在AI领域的应用和发展趋势的全面了解。
《Rust 语言从入门到实战》,新⼈⾸单¥59
全部留言(13)
- 最新
- 精选
- tanwsl: Error: No such file or directory (os error 2) . 处理:simple.rs中 tikenizer和model的参数写全[/mnt/xx/xx/openchat_3.5_tokenizer.json]
作者回复: 👍
2024-01-15归属地:重庆21 - eriklee"首先 Rust 的性能与 C/C++ 一致,并且在调用 GPU 能力方面也同样方便" rust目前应该还不能直接访问cuda吧?毕竟cuda是c接口
作者回复: 有了c接口,就等于有了rust接口,因为rust调用c接口没有性能损耗。
2024-01-13归属地:北京1 - 听雨老师,我下载到了window下的子Linux中运行,报OS error。请问是不是不支持在这里面运行啊
作者回复: 我在wsl中测过,可以的。如果想要wsl支持图形界面应用,需要update到最新版wsl。
2023-12-23归属地:四川1 - Geek_3b58b9Candle 要是支持 ROCm 就更好了
作者回复: 对的,可以做这方面的工作
2024-02-04归属地:江苏 - tanWSL: linker `cc` not found 处理方式: sudo apt update && sudo apt install build-essential
作者回复: 👍
2024-01-15归属地:重庆 - eriklee老师能对比下candle和burn吗? 另外,感觉rust优势是边缘端推理,毕竟边缘侧资源紧张. 服务器端推理,毕竟还是比不过python生态
作者回复: 你的分析中短期内一定是对的。在学术界rust一定干不过python。 burn也很优秀,但是背后资源没有candle多。两个框架都希望能快点发展起来。
2024-01-13归属地:北京 - 鸠摩智老师,请问一下,可以下载别人训练好的模型,通过candle 来实现根据需求描述自动生成测试用例的这种功能吗?
作者回复: 这个方向可以尝试的,需要用到code 生成的模型。这是个非常有趣的方向。
2024-01-06归属地:江苏 - superggnmac 2021 款 intel 芯片, 系统版本 Montery 12.5.1 会卡住, model built 之后输入一个 hello 就不动了, 要过 5 分钟以上才会有回复
作者回复: 对电脑要求有点高
2024-01-02归属地:北京 - Geek_54dac1该模型在 Candle 中还暂时不支持在 GPU 上运行,因为 Quantized models on Cuda 还不支持,参考:https://github.com/huggingface/candle/issues/1250;避免大家挖坑
作者回复: 很棒的探索和分享👍
2023-12-15归属地:四川 - 无限可能老师好,大模型小白有几个问题。通过 huggingface-cli scan-cache,扫描了一下 huggingface 下载过的文件,都是 7G 或者更大: 1. 这些模型文件里主要是什么内容,是包括了数据么?为啥会这么大? 2. 类似这么大的文件,一定要下载到本地么,是否可以云部署之类,可以用完销毁。 3. 我理解,我想要运行本节课的demo,这 7G 的空间就是要长期规划出去了吧
作者回复: 1。主要是预训练神经网络模型权重数据 2。要下载到本地,要加载到显存或者内存中运行 3。是的
2023-12-15归属地:北京3