大陸產經:Chatbot Arena公布全球模型榜單,阿里Qwen2.5-Max超越DeepSeek V3
財訊新聞 2025/02/05 11:28

【財訊快報/陳孟朔】三方基準測試平臺Chatbot Arena週二(4日)宣布最新大模型盲測榜單,Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,以1332分居全球第七名,也是非推理類的中國大模型冠軍。同時,Qwen2.5-Max在數學和編程等單項能力上排名第一,在硬提示(Hard prompts)方面排名第二。硬提示是指直接將人類編寫的文本插入到輸入序列中,模型需要理解並回應這些文本。