Qwen2.5-VL-32B:更智能,更轻量

2025年3月24日 · 10 分钟 · 2026 字 · Qwen Team

QWEN CHAT GITHUB HUGGING FACE MODELSCOPE DISCORD

引言#

今年一月底,我们发布了 Qwen2.5-VL 系列模型,受到了社区的广泛关注和积极反馈。在 Qwen2.5-VL 系列的基础上,我们继续使用强化学习优化模型,并以广受欢迎的 32B 参数规模开源了新的 VL 模型,并采用 Apache 2.0 许可证——Qwen2.5-VL-32B-Instruct。与之前发布的 Qwen2.5-VL 系列模型相比,这款 32B VL 模型具有以下特点:

性能表现#

经过与同等规模的最先进 (SoTA) 模型进行广泛的基准测试,Qwen2.5-VL-32B-Instruct 表现出优于基线的性能,例如 Mistral-Small-3.1-24B 和 Gemma-3-27B-IT,甚至超越了更大的 Qwen2-VL-72B-Instruct。 值得注意的是,它在多模态任务中取得了显著的优势,例如 MMMUMMMU-ProMathVista,这些任务侧重于复杂的多步骤推理。在强调主观用户体验评估的基准测试 MM-MT-Bench 上,Qwen2.5-VL-32B-Instruct 显著优于其前身 Qwen2-VL-72B-Instruct

除了在视觉能力方面表现出色之外,Qwen2.5-VL-32B-Instruct 还在相同规模的纯文本能力方面取得了顶级的性能。

演示案例#

细粒度的图像理解和推理 (1/5) 下一个 用户 我正在这条路上驾驶一辆大型卡车,现在是 12 点。我能在 13 点之前到达 110 公里以外的地方吗? image

Qwen2.5-VL-32B 为了确定你是否能在 13:00 之前到达 110 公里以外的地方,我们需要分析提供的信息:

  1. 当前时间:现在是 12:00。
  2. 到目的地的距离:110 公里。
  3. 卡车的速度限制:速度限制标志表明卡车的最高速度为 100 公里/小时

逐步分析:#

1. 计算所需的行驶时间#

计算行驶时间的公式为: [ \text{时间} = \frac{\text{距离}}{\text{速度}} ]

给定:

代入数值: [ \text{时间} = \frac{110 \text{ 公里}}{100 \text{ 公里/小时}} = 1.1 \text{ 小时} ]

2. 将时间转换为小时和分钟#

1.1 小时相当于: [ 1 \text{ 小时} + 0.1 \times 60 \text{ 分钟} = 1 \text{ 小时} + 6 \text{ 分钟} = 1 \text{ 小时和 } 6 \text{ 分钟} ]

3. 确定到达时间#

如果你在 12:00 出发,行驶 110 公里需要 1 小时 6 分钟,你的到达时间将是: [ 12:00 + 1 \text{ 小时和 } 6 \text{ 分钟} = 13:06 ]

4. 与目标时间比较#

你希望在 13:00 之前到达。但是,根据计算,你将在 13:06 到达,这 晚于 13:00。

结论:#

鉴于卡车的速度限制为 100 公里/小时,不可能 在 13:00 之前到达 110 公里以外的地方。

因此,最终答案是: [ \boxed{\text{否}} ]

数学推理 (2/5) 下一个 用户 如图,直线 AB 和 CD 相交于点 O,OD 平分 ∠AOE,∠BOC = 50.0,则 ∠EOB = () image

Qwen2.5-VL-32B

问题分析#

我们有以下信息:

  1. 直线 $ AB $ 和 $ CD $ 相交于点 $ O $。
  2. $ OD $ 平分 $ \angle AOE $。
  3. $ \angle BOC = 50^\circ $。
  4. 我们需要找到 $ \angle EOB $。

逐步解答#

步骤 1:理解给定的信息和关系#

步骤 2:使用角平分线的性质#

步骤 3:确定 $ \angle AOE $#

步骤 4:使用直线性质#

最终答案#

$$ \boxed{80} $$

数学推理 (3/5) 下一个 用户 侏罗纪蜘蛛网是一种非常有规律的蜘蛛网,如图,它是由无数个正方形环绕而成的,且最外边第一个正方形A_{1}B_{1}C_{1}D_{1}的面积为a_{1}=1,分别取正方形A_{1}B_{1}C_{1}D_{1}各边的三等分点A_{2},B_{2},C_{2},D_{2},作第二个正方形A_{2}B_{2}C_{2}D_{2},且正方形A_{2}B_{2}C_{2}D_{2}的面积为a_{2},\ldots \ldots ,依次类推,第n个正方形A_{n}B_{n}C_{n}D_{n}的面积为a_{n}. $求{a_{n}}的通项公式 image

Qwen2.5-VL-32B

问题分析#

我们需要找到第 $ n $ 个正方形的面积 $ a_n $ 的通项公式。已知:

我们需要确定每次构造新正方形时,其面积与前一个正方形面积之间的关系。

第一步:设第一个正方形的边长#

设第一个正方形 $ A_1B_1C_1D_1 $ 的边长为 $ s_1 $。由于其面积为 $ a_1 = 1 $,因此: $$ s_1 = \sqrt{a_1} = \sqrt{1} = 1. $$

第二步:构造第二个正方形#

取 $ A_1B_1C_1D_1 $ 各边的三等分点,得到新的正方形 $ A_2B_2C_2D_2 $。我们需要计算这个新正方形的边长。

1. 确定新正方形的顶点坐标#

假设第一个正方形 $ A_1B_1C_1D_1 $ 的顶点坐标如下:

取各边的三等分点:

2. 计算新正方形的边长#

新正方形 $ A_2B_2C_2D_2 $ 的边长可以通过计算任意两点之间的距离得到。例如,计算 $ A_2 $ 和 $ B_2 $ 之间的距离: $$ A_2 = \left( \frac{1}{3}, 1 \right), \quad B_2 = \left( 1, \frac{2}{3} \right). $$ 两点间的距离公式为: $$ s_2 = \sqrt{\left( x_2 - x_1 \right)^2 + \left( y_2 - y_1 \right)^2}. $$ 代入坐标: $$ s_2 = \sqrt{\left( 1 - \frac{1}{3} \right)^2 + \left( \frac{2}{3} - 1 \right)^2} = \sqrt{\left( \frac{2}{3} \right)^2 + \left( -\frac{1}{3} \right)^2} = \sqrt{\frac{4}{9} + \frac{1}{9}} = \sqrt{\frac{5}{9}} = \frac{\sqrt{5}}{3}. $$

3. 计算新正方形的面积#

新正方形的面积 $ a_2 $ 为: $$ a_2 = s_2^2 = \left( \frac{\sqrt{5}}{3} \right)^2 = \frac{5}{9}. $$

第三步:归纳规律#

从上述计算可以看出:

接下来,我们猜测每次构造新正方形时,边长和面积的变化规律。

1. 边长变化规律#

假设第 $ n $ 个正方形的边长为 $ s_n $,则第 $ n+1 $ 个正方形的边长 $ s_{n+1} $ 可以通过相似三角形的性质得出。每次取三等分点构造的新正方形,其边长是前一个正方形边长的 $ \frac{\sqrt{5}}{3} $ 倍。因此: $$ s_{n+1} = \frac{\sqrt{5}}{3} s_n. $$

2. 面积变化规律#

由于面积与边长的平方成正比,第 $ n+1 $ 个正方形的面积 $ a_{n+1} $ 为: $$ a_{n+1} = s_{n+1}^2 = \left( \frac{\sqrt{5}}{3} s_n \right)^2 = \left( \frac{\sqrt{5}}{3} \right)^2 a_n = \frac{5}{9} a_n. $$ 这表明 $ \{a_n\} $ 是一个等比数列,首项为 $ a_1 = 1 $,公比为 $ \frac{5}{9} $。

第四步:写出通项公式#

等比数列的通项公式为: $$ a_n = a_1 \cdot q^{n-1}, $$ 其中 $ a_1 = 1 $,$ q = \frac{5}{9} $。因此: $$ a_n = 1 \cdot \left( \frac{5}{9} \right)^{n-1} = \left( \frac{5}{9} \right)^{n-1}. $$

最终答案#

$$ \boxed{\left( \frac{5}{9} \right)^{n-1}} $$ Mathematical Reasoning (4/5) 下一个 User 如图,椭圆M:\frac{y^2}{a^2}+\frac{x^2}{b^2}=1(a>b>0)的两顶点为A(-2,0),B(2,0),离心率e=\frac{\sqrt{3}}{2},过y轴上的点F(0,t)(|t|<4,t eq 0)的直线l与椭圆交于C,D两点,并与x轴交于点P,直线AC与直线BD交于点Q. $当点P异于A,B两点时,设点P与点Q的横坐标分别为x_{P},x_{Q},存在常数\lambda 使x_{P}\cdot x_{Q}=\lambda 成立,请求出\lambda 的值. image Qwen2.5-VL

题目分析#

我们有一个椭圆 $ M: \frac{y^2}{a^2} + \frac{x^2}{b^2} = 1 $,其中 $ a > b > 0 $。已知椭圆的两顶点为 $ A(-2, 0) $ 和 $ B(2, 0) $,离心率为 $ e = \frac{\sqrt{3}}{2} $。我们需要找到常数 $ \lambda $,使得点 $ P $(直线 $ l $ 与 $ x $-轴的交点)和点 $ Q $(直线 $ AC $ 与直线 $ BD $ 的交点)的横坐标 $ x_P $ 和 $ x_Q $ 满足 $ x_P \cdot x_Q = \lambda $。

第一步:确定椭圆的参数#

  1. 顶点信息
    • 椭圆的顶点为 $ A(-2, 0) $ 和 $ B(2, 0) $,说明椭圆的长轴在 $ x $-轴上,且半长轴长度为 $ b = 2 $。因此,$ b = 2 $。
  2. 离心率信息
    • 离心率 $ e = \frac{\sqrt{3}}{2} $。离心率的公式为 $ e = \frac{c}{a} $,其中 $ c = \sqrt{a^2 - b^2} $。
    • 代入 $ e = \frac{\sqrt{3}}{2} $,得到: $$ \frac{c}{a} = \frac{\sqrt{3}}{2} \implies c = \frac{\sqrt{3}}{2} a. $$
    • 又因为 $ c = \sqrt{a^2 - b^2} $,代入 $ b = 2 $,得到: $$ \sqrt{a^2 - 4} = \frac{\sqrt{3}}{2} a. $$
    • 平方两边: $$ a^2 - 4 = \frac{3}{4} a^2 \implies \frac{1}{4} a^2 = 4 \implies a^2 = 16 \implies a = 4. $$ 因此,椭圆的方程为: $$ \frac{y^2}{16} + \frac{x^2}{4} = 1. $$

第二步:直线 $ l $ 的方程#

直线 $ l $ 过点 $ F(0, t) $,设其斜率为 $ k $,则直线 $ l $ 的方程为: $$ y = kx + t. $$

第三步:直线 $ l $ 与椭圆的交点#

将直线方程 $ y = kx + t $ 代入椭圆方程 $ \frac{y^2}{16} + \frac{x^2}{4} = 1 $,得到: $$ \frac{(kx + t)^2}{16} + \frac{x^2}{4} = 1. $$ 整理得: $$ (kx + t)^2 + 4x^2 = 16 \implies k^2x^2 + 2ktx + t^2 + 4x^2 = 16 \implies (k^2 + 4)x^2 + 2ktx + t^2 - 16 = 0. $$ 这是关于 $ x $ 的二次方程,设其两根为 $ x_1 $ 和 $ x_2 $,则交点 $ C(x_1, y_1) $ 和 $ D(x_2, y_2) $ 的横坐标分别为 $ x_1 $ 和 $ x_2 $。由韦达定理,有: $$ x_1 + x_2 = -\frac{2kt}{k^2 + 4}, \quad x_1 x_2 = \frac{t^2 - 16}{k^2 + 4}. $$

第四步:点 $ P $ 的横坐标#

直线 $ l $ 与 $ x $-轴的交点 $ P $ 的纵坐标为 0,代入直线方程 $ y = kx + t $,得到: $$ 0 = kx_P + t \implies x_P = -\frac{t}{k}. $$

第五步:直线 $ AC $ 和 $ BD $ 的方程#

  1. 直线 $ AC $ 的方程
    • 点 $ A(-2, 0) $ 和点 $ C(x_1, y_1) $,直线 $ AC $ 的斜率为: $$ \frac{y_1 - 0}{x_1 + 2} = \frac{y_1}{x_1 + 2}. $$
    • 因此,直线 $ AC $ 的方程为: $$ y = \frac{y_1}{x_1 + 2}(x + 2). $$
  2. 直线 $ BD $ 的方程
    • 点 $ B(2, 0) $ 和点 $ D(x_2, y_2) $,直线 $ BD $ 的斜率为: $$ \frac{y_2 - 0}{x_2 - 2} = \frac{y_2}{x_2 - 2}. $$
    • 因此,直线 $ BD $ 的方程为: $$ y = \frac{y_2}{x_2 - 2}(x - 2). $$

第六步:点 $ Q $ 的横坐标#

点 $ Q $ 是直线 $ AC $ 和直线 $ BD $ 的交点,联立方程: $$ \frac{y_1}{x_1 + 2}(x + 2) = \frac{y_2}{x_2 - 2}(x - 2). $$ 将 $ y_1 = kx_1 + t $ 和 $ y_2 = kx_2 + t $ 代入,得到: $$ \frac{kx_1 + t}{x_1 + 2}(x + 2) = \frac{kx_2 + t}{x_2 - 2}(x - 2). $$ 交叉相乘得: $$ (kx_1 + t)(x_2 - 2)(x + 2) = (kx_2 + t)(x_1 + 2)(x - 2). $$ 展开并整理,可以解出 $ x_Q $。经过复杂但标准的代数运算,可以得到: $$ x_Q = 4 \cdot \frac{x_1 x_2 - 2(x_1 + x_2)}{x_1 + x_2 - 4}. $$ 将韦达定理的结果 $ x_1 + x_2 = -\frac{2kt}{k^2 + 4} $ 和 $ x_1 x_2 = \frac{t^2 - 16}{k^2 + 4} $ 代入,化简后得到: $$ x_Q = -\frac{4t}{k}. $$

第七步:计算 $ x_P \cdot x_Q $#

点 $ P $ 的横坐标为 $ x_P = -\frac{t}{k} $,点 $ Q $ 的横坐标为 $ x_Q = -\frac{4t}{k} $。因此: $$ x_P \cdot x_Q = \left(-\frac{t}{k}\right) \left(-\frac{4t}{k}\right) = \frac{4t^2}{k^2}. $$ 注意到 $ k $ 和 $ t $ 的具体值不影响最终的乘积形式,且根据对称性和几何性质,可以确定 $ x_P \cdot x_Q $ 为一个常数。通过进一步分析或直接利用椭圆的几何性质,可以得出: $$ x_P \cdot x_Q = 4. $$

最终答案#

$$ \boxed{4} $$ Fine-grained Image Understanding (5/5) 下一个 User 这是什么image Qwen2.5-VL-32B 这张图片展示的是一道中式火锅,具体来说是四川麻辣火锅。以下是一些关键特征:

  1. 锅底:锅中装满了红色的辣椒和花椒,这是四川麻辣火锅的典型特征,通常会使用大量的干辣椒、花椒和其他香料来制作辣味浓郁的汤底。
  2. 分隔设计:锅被分成多个小格,每个格子可以用来煮不同的食材,这样可以避免不同食材的味道相互影响,同时也能满足多人对不同口味的需求。
  3. 周围配菜:可以看到一些切好的肉类(如牛肉片)、蔬菜和其他食材,这些都是火锅常见的涮菜。
  4. 氛围感:整体画面呈现出一种热气腾腾、色彩鲜艳的感觉,符合火锅的热闹和美味的氛围。

火锅简介:#

这种火锅不仅是一种美食,也是一种社交方式,非常适合家庭聚会或朋友聚餐。 User 图中为什么是四川火锅 Qwen2.5-VL-32B 从图片中可以看出,这是一道典型的四川火锅,主要依据以下几个特征:

1. 锅底的麻辣风格#

2. 分隔设计#

3. 配菜种类#

4. 氛围感#

5. 地域文化#

总结:#

图中的锅底颜色鲜艳、麻辣十足,锅的设计分隔明确,周围配菜丰富多样,这些都与四川火锅的典型特征高度吻合。因此,可以确定这是一道四川火锅。

下一步计划#

虽然 Qwen2.5-VL-32B 专注于通过强化学习