Multi-Modal Celeba-HQ数据集
创建MM celeba-hq数据集
第一步
CelebAMask-HQ数据集,这个是人脸+掩码,进入百度网盘 或谷歌下载数据集。
第二步(text)
下载生成图片caption代码(链接)。我们要使用其中的create_caption.py 文件生成。
Text
Please download celeba-hq-attribute.txt (CelebAMask-HQ-attribute-anno.txt) and run the following script.
python create_caption.py
The generated textual descriptions can be found at ./celeba_caption.
在之前我们下载的数据集中,有文件CelebAMask-HQ-attribute-anno.txt,复制一个到当前项目下,改名为celeba-hq-attribute.txt,然后直接运行,就可以在celeba_caption文件夹下找到text了!
每张图片会生成十句话。
第三步
此时,数据集中只有人脸+不同部位的mask,还要用这个链接的的代码生成mask。这里我们用的主要是face-parsing文件夹下的代码,可以看readme。
Move the mask folder, the image folder, and CelebA-HQ-to-CelebA-mapping.txt ( remove 1st line in advance ) under ./Data_preprocessing
Run python g_mask.py
把先前下好的数据集中的CelebAMask-HQ-mask-anno文件夹、CelebA-HQ-img文件夹和CelebA-HQ-to-CelebA-mapping.txt复制到Data_preprocessing文件夹下
注意:1. 要将CelebA-HQ-to-CelebA-mapping.txt文件的第一行删掉
2. g_mask.py中folder_base = ‘CelebAMask-HQ-mask-anno’,文件名称要对应
安装opencv库
pip install opencv-python
第四步
运行g_mask.py 生成黑不溜秋的mask
第五步
运行g_color.py生成彩色mask
注意:1. 文件名称是否对应
2. img_num=30000
想划分test和train可以再使用g_partition.py

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)