这些业务场景,Qwen2.5-VL-32B模型超给力!

近日,优刻得云平台上线「Qwen2.5-VL-32B-Instruct」大模型镜像,为企业和开发者提供更丰富的大模型选择!

Qwen2.5-VL-32B-Instruct是通义千问团队使用Apache 2.0协议开源的一款更小尺寸的视觉理解模型,相较于Qwen2.5-VL系列其他模型(3B、7B、72B),32B版本进一步兼顾了尺寸和性能,可在本地运行。

该模型创新性的采用快思考模式,对用户的主观体验和数学推理能力进行了优化,模型表现在三个方面改进显著:

● 回答更符合人类主观偏好,调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好;
● 拥有更强的数学推理能力,复杂数学问题求解的准确性显著提升;
● 在图像解析、内容识别以及视觉逻辑推导等任务中,表现出更强的准确性和细粒度分析能力
基于Qwen2.5-VL-32B模型的场景实践 

1.  结构化数据处理
在当今数据爆炸的时代,大量结构化数据以表格、图片的形式存在。借助Qwen2.5-VL-32B模型,能够精准识别表格中的各类数据,包括数字、文字标注等,并快速将其转化为可编辑的电子表格格式。
  • 测试数据:有具体数据纸质表格的图片
  • 数据特点:两类金额指标,手写非打印的时间,以及具体场景备注
  • 测试范围:识别并分析上传图片内容
  • 测试结果:机打文字及数字识别正确率极高,手写时间效果一般(未介入微调)
2.  文档解析
 
丰富多样的内容呈现形式,在传媒、广告等行业广泛应用。Qwen2.5-VL 设计了一种名为QwenVL HTML格式的独特文档解析格式,能够提取基于 HTML的布局信息,适用于杂志、研究论文、网页甚至手机截图等场景。
  • 测试数据:单页面里多内容模块的简报(图来自中国气象报)
  • 数据特点:存在不规则段落、图片分布等元素
  • 测试范围:分析总结上述图片信息
  • 测试结果:对于排版复杂、包含多种字体和格式的文档,识别效果显著,并且能提取各个分段关键信息以更易懂的模式输出

如何在优刻得云平台快速调用?

  • 企业用户

步骤一:注册并登录UCloud云平台

步骤二:选择镜像

选择GPU云主机和模型镜像并创建:选择场景「大模型专区」,选择机型「高性价比显卡6」,并在镜像市场选择镜像,搜索「Qwen2.5-VL-32B-Instruct」

推荐四卡及以上配置体验哦~

步骤三:立即体验

登陆机器后根据提示文案进行操作后,即可通过访问http://{云主机EIP}:端口(8080)体验(若访问不通,则需要更换云主机防火墙放行8080端口)

  • 个人用户

步骤一:注册并登录「优云智算」算力共享平台

步骤二:选择镜像并创建实例

打开已发布镜像🔗:https://www.compshare.cn/images/compshareImage-1aaurezup1i5,使用该镜像创建实例,点击「使用该镜像创建实例」后,即可创建完成。

推荐四卡及以上配置体验哦~

步骤三:立即体验

根据镜像详情说明完成配置后,即可通过访问http://{云主机EIP}:端口(8080)体验

优刻得一直致力于简化热门模型的部署和调用流程,对于DeepSeek、通义千问等超多主流大模型,开发者只需简单几步操作,就能在云平台上快速搭建基于该模型的推理环境,实现模型的快速部署和体验,大大降低了模型应用开发的门槛。

无论是企业用户还是个人开发者,都可以根据自身业务需求,在优刻得平台上选择合适的模型镜像,并灵活选择云端或本地私有化部署方式。依托优刻得海量多元的算力资源,以及专业的模型微调服务,轻松搭建贴合业务场景的企业级 AI 应用,加速企业的智能化转型进程。

为您推荐