同求教程。杜甫 发表于 2025-4-12 13:55
同求教程。
不过我试P106-100 6G显卡+48G内存也可以跑32B啊,只是很慢

shc 发表于 2025-4-12 13:57
楼主是只有核显,还是有独显再开核显?
记得以前看过你博客的一篇教程。吊打华伪 发表于 2025-4-12 14:28
你比我还慢。。。准确的说慢多了。
pcie, 你矿卡才1.1*16,你理论值才4GB/s 比我慢多了。双通道内存带宽 ...
杜甫 发表于 2025-4-12 14:43
刚试了下,
跑deepseek-coder-v2 16B 这个模型
速度有9token/秒,不知道把P106拔下来后有多少
杜甫 发表于 2025-4-12 14:43
刚试了下,
跑deepseek-coder-v2 16B 这个模型
速度有9token/秒,不知道把P106拔下来后有多少
吊打华伪 发表于 2025-4-12 15:04
你跑的时最小的吧,几GB的那种。 单凡你跑个10GB的, 就不可能有这个速度。
理论最好的情况10-6=4GB要传 ...
杜甫 发表于 2025-4-12 15:30
16B,模型大小8.9G
吊打华伪 发表于 2025-4-12 16:07
你这个是moe的,每次只读取激活的权重,远远小于8.9. 大概率都小于6GB.
其他模型每次都要读取8.9GB. ...
杜甫 发表于 2025-4-12 16:15
不懂。
128G的内存,能跑32B的模型了吧
吊打华伪 发表于 2025-4-12 17:03
能是能,就是超级慢。 你也不用折腾了,就跑i现在这个moe最合适了,换其他的8.9G 最多2token/s.
换更大 ...
杜甫 发表于 2025-4-12 17:11
就是说去掉烂显卡,反而会快很多?
吊打华伪 发表于 2025-4-12 14:35
香菇肥牛,有印象 记得以前看过你博客的一篇教程。
没有独显,纯核显。
| 欢迎光临 全球主机交流论坛 (https://loc.fffk.eu.org/) | Powered by Discuz! X3.4 |