音频驱动人脸2d显示
音频驱动人脸2d显示
目录
字节提出OmniHuman-1!单阶段pose加音频驱动的高保真人类视频生成!
字节提出OmniHuman-1!单阶段pose加音频驱动的高保真人类视频生成!
代码还没测
https://github.com/johndpope/OmniHuman-1-hack/tree/main
video-retalking
驱动后渲染成2d人脸
提供下载模型
deep_3drecon/BFM/
├── 01_MorphableModel.mat
├── BFM_exp_idx.mat
├── BFM_front_idx.mat
├── BFM_model_front.mat
├── Exp_Pca.bin
├── facemodel_info.mat
├── index_mp468_from_mesh35709.npy
├── mediapipe_in_bfm53201.npy
└── std_exp.txt
Pre-trained Real3D-Portrait
Download Pre-trained Real3D-Portrait:Google Drive or BaiduYun Disk with Password 6x4f
Put the zip files in checkpoints and unzip them, the file structure will be like this:
checkpoints/
├── 240210_real3dportrait_orig
│ ├── audio2secc_vae
│ │ ├── config.yaml
│ │ └── model_ckpt_steps_400000.ckpt
│ └── secc2plane_torso_orig
│ ├── config.yaml
│ └── model_ckpt_steps_100000.ckpt
└── pretrained_ckpts
└── mit_b0.pth
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)