通过代理服务器连接 huggingface下载数据集或模型
通过代理服务器连接 huggingface下载数据集或模型
·
有些huggingface的数据集或者模型在镜像网站("https://hf-mirror.com")上不存在,因此在国内只能通过代理服务器来下载,下面是下载的代码示例:
import os
os.environ["http_proxy"] = "http://127.0.0.1:7890" # 代理设置
os.environ["https_proxy"] = "http://127.0.0.1:7890" # 代理设置
from huggingface_hub import snapshot_download
# repo_id 模型id
# local_dir 下载地址
# endpoint 镜像地址
# resume_download (中断后)继续下载
snapshot_download(repo_id="gengyuanmax/WikiTiLo", local_dir="F:\LLM",
local_dir_use_symlinks=False,
repo_type="dataset",
resume_download=True,
token='hf_xxxxxxxxxxxxxxxxxxxxxxxxxxxxx')
token 参数对于一些需要访问权限的库是必须的(如下这个库), 否则可以删除该参数。

这里需要特别注意一点,就是对于需要token的库,还需要去token设置(https://huggingface.co/settings)Access Tokens 里配置相应的Repositories permissions权限!否则会报错无法定位这个库!!!

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)