阿里达摩院上线“文本生成视频大模型”

阿里达摩院已在AI模型社区“魔搭”ModelScope上线了“文本生成视频大模型”。根据介绍，整体模型参数约17亿，目前只支持英文输入。扩散模型采用Unet3D结构，通过从纯高斯噪声视频中，迭代去噪的过程，实现视频生成的功能。据了解，“魔搭”是阿里达摩院联手CCF开源发展委员会在2022云栖大会推出的AI模型社区，首批开源模型超过300个，包括视觉、语音、自然语言处理、多模态等AI主要方向。

（文章来源：财联社）

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：https://www.sunbala.cn/article/354755.html

阿里达摩院上线“文本生成视频大模型”

相关推荐