近日,由中国科学院自动化研究所联合武汉人工智能研究院研发的紫东太初4.0多模态推理大模型发布。自2021年首次推出以来,紫东太初已完成4次迭代,实现了从"纯文本思考""简单操作带图思考"到"细粒度多模态语义思考"的跃迁,迈向多模态深度推理的新阶段。
中国科学院自动化研究所研究员、武汉人工智能研究院院长王金桥介绍,"细粒度多模态语义思考"是指大模型能像人一样主动深度思考,不仅能动态适应和处理更复杂的任务,还能在视觉语义层面展现出清晰且可解释的推理过程,实现"边看、边识、边思"。
"比如在音频理解中,用户对紫东太初说‘我想挂一个呼吸科的号’,它能自动操作APP并根据症状选择门诊;在视频理解中,它能对180分钟的长视频进行片段精准定位和内容总结。"王金桥说,此外,它还能在真实场景中通过汽车、机器人等"动手操作"。
据了解,紫东太初已在具身智能、低空经济、智慧医疗等多个产业中实现布局,为城市基础设施与行业需求提供定制化解决方案。
分享让更多人看到
人民日报社概况 | 关于人民网 | 报社招聘 | 招聘英才 | 广告服务 | 合作加盟 | 版权服务 | 数据服务 | 网站声明 | 网站律师 | 信息保护 | 联系我们
人民日报违法和不良信息举报电话:010-65363263 举报邮箱:jubao@people.cn
人民网服务邮箱:kf@people.cn 违法和不良信息举报电话:010-65363636 举报邮箱:rmwjubao@people.cn
互联网新闻信息服务许可证10120170001 | 增值电信业务经营许可证B1-20060139 | 广播电视节目制作经营许可证(广媒)字第172号 | 京ICP备12004265号-13
信息网络传播视听节目许可证0104065 | 网络文化经营许可证 京网文[2023]4961-141号 | 网络出版服务许可证(京)字121号 | 京ICP证000006号 | 京公网安备11000002000008号
人 民 网 股 份 有 限 公 司 版 权 所 有 ,未 经 书 面 授 权 禁 止 使 用
Copyright © 1997-2025 by www.people.com.cn. all rights reserved