微博推出 VibeThinker-1.5B,低成本 AI 模型挑战大型语言模型
来自:www.oschina.net 收录时间:2025-11-13
微博的人工智能部门推出了开源的 VibeThinker-1.5B,这是一个拥有15亿参数的大型语言模型(LLM),基于阿里巴巴的 Qwen2.5-Math-1.5B 进行的精细调整。 尽管 VibeThinker-1.5B 体积小,但在数学和代码任务上表现出色,达到了行业领先的推理性能,甚至超越了体量达6710亿参数的竞争对手 DeepSeek 的 R1模型。该模型还与 ...
阅读更多