0. 说明:

从 Hugging Face 上手动下载预训练的蛋白质语言模型(以ProstT5为例),用模型中的 encoder 部分对蛋白质进行编码,得到 embedding features,用于下游的任务。

【ps. 除了手动下载之外,还可以用其他的下载方式,详情可见 https://zhuanlan.zhihu.com/p/663712983】
【ps. 如果是自动下载,默认下载位置在 ~/.cache/huggingface/

1. 手动下载与训练模型:

直接从 Hugging Face 网站上下载所有的文件,如下图所示(以 ProstT5 为例,URL = https://huggingface.co/Rostlab/prot_t5_xl_half_uniref50-enc/tree/main):

在这里插入图片描述

2. 将下载的预训练模型保存到服务器并加载模型:

将上述所有文件放到一个文件夹中,然后上传到服务器上。

加载模型的时候,直接将路径放到T5Tokenizer.from_pretrained()T5EncoderModel.from_pretrained()中的第一个参数位置即可。

3. 关于模型的使用,可以见 Hugging Face 上提供的案例

PS. 如果有其他问题,会更新本文 . . .

参考:

[1]. https://zhuanlan.zhihu.com/p/663712983

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐