数据

模型系列 参数量 发布者 量化方式 最大GPU加载 速度
Qwen-3.5 35B-A3B lmstudio-community Q4_K_M 28/40 12
Qwen-3.5 35B-A3B unsloth UD-IQ3_XXS max 35
Qwen-3.5 27B unsloth Q3_K_M max 9
Qwen-3.5 9B lmstudio-community Q8_0 max 26
GPT-OSS 20B unsloth UD-Q8_K_XL max 55
GLM-4.7 Flash 30B-A3B lmstudio-community Q4_K_M 42/47 27
GLM-4.7 Flash 30B-A3B unsloth UD-Q3_K_XL max 36
GLM-4.7 Flash REAP 23B-A3B unsloth UD-Q4_K_XL max 38

版权声明

作者: Cheyne Xie

链接: https://chaim.eu.org/posts/telsa-p100%E5%A4%A7%E6%A8%A1%E5%9E%8B%E6%B5%8B%E8%AF%95/

许可证: CC BY-NC-SA 4.0

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. Please attribute the source, use non-commercially, and maintain the same license.

开始搜索

输入关键词搜索文章内容

↑↓
ESC
⌘K 快捷键