AI应用榜首页行业百科AI视觉大模型震撼来袭

AI视觉大模型震撼来袭

分类:行业百科

2025-06-20 16:33:54

58

一、视频生成领域

1. 淘宝星辰·图生视频

阿里推出的商用级工具,通过静态图片+文字描述即可生成5秒电影级视频,自动适配商品展示方式,已对淘宝商家开放。

2. 通义万相

阿里自研的免费视频生成工具,支持5秒720P视频生成,特别擅长中国风内容创作,如古风人物动态效果。

3. Vidu

清华大学与生数科技联合研发的国产视频大模型,支持4-8秒1080P视频生成,30秒即可完成创作,具备角色一致性等特色功能。

4. VideoWorld

豆包团队发布的纯视觉认知模型,无需语言模型辅助即可理解视觉信息,开辟了AI视觉新赛道。

二、3D内容生成

  • 腾讯混元3D 2.0
  • 升级后的几何与纹理大模型可生成媲美手工建模的3D白模,配套的一站式创作平台支持文/图生3D、游戏资产生成等全流程。

    三、多模态突破

  • 某新型多模态模型(未公开名称)在专业测试中超越DALL-E 3,支持384x384高精度图像生成,跨模态理解能力突出。
  • 四、工业应用

  • AI大模型通过零样本输入、强泛化能力正重塑工业视觉检测,显著提升复杂场景下的识别效率和实时性。
  • 当前技术趋势显示,视觉大模型正朝着更高一致性(如角色保持)、更短生成耗时(如Vidu的30秒生成)、更垂直场景(如电商、游戏)三大方向快速演进。

    Copyright Your agent-dapaihang.Some Rights Reserved.求知大排行网备案号: 津ICP备2023000475号-9