2026-05-23 · AI行业日报

千问大模型更新多模态能力，支持工厂图纸直接生成操作视频 | 量子位

企业数字化来源：量子位

千问大模型多模态能力升级：工厂图纸直接生成操作视频背景与影响：近日，千问大模型完成重要更新，新增多模态理解与生成能力，能够直接解析工厂图纸（如CAD、工艺流程图等），并自动生成对应的操作视频。这一突破将传统工业培训与指导模式推向智能化新阶段。以往，工厂图纸需依赖工程师人工解读，再制作成培训视频或操作手册，耗时耗力且易出错。千问大模型通过融合视觉理解、知识推理与视频生成技术，实现了从“静态图纸”到“动态演示”的端到端自动化，大幅降低工业知识传递的门槛。意义：该能力对工业领域具有多重深远意义。首先，显著提升生产效率：一线工人可即时获取直观的操作指导，减少误操作与培训周期，尤其适用于复杂装配、设备维护等场景。其次，推动工业知识数字化沉淀：图纸中的隐性经验被转化为可复用的视频资产，助力企业标准化管理。此外，该技术有望加速智能制造与工业4.0落地，为远程协作、柔性生产提供底层支持。从AI发展角度看，千问大模型在垂直场景的多模态应用，验证了通用大模型向专业领域渗透的可行性，为工业AI开辟了新路径。

搜索相关文章 →

← 上一条下一条 →