文档备案控制台

开发者社区通义大模型正文

RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

RTX5060Ti16G使用的CUDA12.8+CUDNN9.8+Pytorch 2.11.dev，用的8B，运行一张640x480的简单图片，输出耗时54s

但是同样的图片，在RTX4060 12G使用的CUDA11.8+CUDNN9.6+Pytorch2.9，用的4B输出耗时只有4s。
专门测试了2B、4B、8B的5060Ti，基本都在40s以上。
图片是一张3.png

但是未找到任何文字。

未曝出任何错误。

展开

收起

游客2s2fjn5luntxa 2025年12月16日 16:55:14 191 分享版权

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

0 条回答

写回答

取消提交回答

问答分类:

算法框架/工具 PyTorch 大模型服务平台百炼

问答地址:

开发者社区 > 通义大模型 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌?

84633

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

4242

2

0

【阿里云运维部署工具AppDeploy详细教程】之4:应用部署

39239

6

0

重启Docker后报错:Error response from daemon

2681

0

0

域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?

61319

32

0

阿里云服务器续费后一直处于启动中状态,服务器打不开了怎么解决???

35860

6

0

this xml file does not appear to have any style in

52413

10

0

OSS的endpoint如何查看

37751

6

0

如何加速中国访问美国云的服务器访问速度

31418

8

0

sql server的用户名和密码怎么查啊?

37937

21

0

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

相关文章

神经辐射场NeRF入门:3D视图合成的原理与PyTorch代码实现

深入理解 HTTPS RSA 握手:从原理到流程的完整解析

【开发者专属福利】智能眼镜Agent开发Workshop限时招募!50席位,先到先得!

HTTPS ECDHE 握手全解析

论文被拒往往不是因为数据差,而是逻辑崩了:用这条指令重塑你的学术骨架

热门讨论

热门文章

VSCode中无法登录通义灵码

通义灵码提问的历史记录查看问题

发送excel文件,在钉钉上打开报错误。OfficeImportErrorDomain错误912

大模型的token是怎么计算的?

在idea中有时候暂时不用,如何临时关闭自动提示和补全呢?

idea2023.3版本中插件通义灵码无反应

vscode 的通义灵码插件cpu占用高

关于通义千问Qwen-7B-Chat模型下载后模型文件保存的目录的问题

RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

IDEA插件通义灵码1.3.12不回答问题

展开全部

MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!

【完全免费】VS Code 最好用的 12 款 AI 代码提示插件!!!

通义听悟--一个懂你的AI助理

Agent与大模型的区别

【2026亲测】彻底禁止Windows 10/11自动更新,让电脑暂停更新10年!

ollama + qwen2.5-coder + VS Code + Continue 实现本地AI 辅助写代码

全新开源通义千问Qwen3,它来了!

基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API

深度解析智能体工作流(Agentic Workflows):核心概念、模式与应用

三分钟让Dify接入Ollama部署的本地大模型!

展开全部

还有其他疑问?