#今日论文推荐#清华提出CogVideo:最大的文本生成视频模型
代码即将开源!
·
#今日论文推荐#清华提出CogVideo:最大的文本生成视频模型
一周不到,AI画师又“进阶”了,还是一个大跨步——
直接1句话生成视频的那种。
输入“一个下午在海滩上奔跑的女人”,立刻就蹦出一个4秒32帧的小片段:又或是输入“一颗燃烧的心”,就能看见一只被火焰包裹的心:这个最新的文本-视频生成AI,是清华&智源研究院出品的模型CogVideo。
论文题目:CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers
详细解读:https://www.aminer.cn/research_report/62a164d07cb68b460fcdf89a?download=falsehttps://www.aminer.cn/research_report/62a164d07cb68b460fcdf89a?download=false
AMiner链接:https://www.aminer.cn/?f=cs

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)