DeepSeek发布精简版R1模型可单GPU运行性能超越Gemini Flash@feaOS

DeepSeek发布精简版R1模型可单GPU运行性能超越Gemini Flash

2025年05月30日来源：techcrunch 人工智能

大多数支持

中国AI研究实验室DeepSeek近日推出其R1推理模型的精简版本——DeepSeek-R1-0528-Qwen3-8B。该模型基于阿里巴巴5月发布的Qwen3-8B，并经过R1生成数据的蒸馏训练，在AIME 2025数学测试中超越谷歌Gemini 2.5 Flash，在HMMT测试中接近微软Phi-4 Reasoning+表现。虽然计算能力较完整版R1有限，但其对硬件要求显著降低，仅需单张40GB-80GB显存的GPU即可运行。该模型已通过MIT协议开源，并已在Hugging Face和LM Studio等平台提供API服务，适用于学术研究与小规模工业开发。

推荐内容

[较早]DeepSeek推出开源推理模型R1，挑战OpenAI的o1性能

[较早]Betaworks第三支基金完成6600万美元募资专注早期AI初创公司

[较早]苹果发布新AI编程模型DiffuCoder：告别逐字生成，支持“乱序写码”

[较早]扎克伯格豪掷重金猛追AI巨头却被指“抄袭OpenAI”

DeepSeek发布精简版R1模型 可单GPU运行 性能超越Gemini Flash

推荐内容

DeepSeek发布精简版R1模型可单GPU运行性能超越Gemini Flash