• 读取挂载数据中的数据集

具体代码如下: 

# 步骤1:
!ls datalab/

# 步骤2:
import os
os.chdir('/home/tianchi/datalab/75057')
print(os.getcwd())

# 步骤3:
import pandas as pd
import os
# 挂载数据中的数据集读取
os.chdir('/mnt/file/opensearch/documents/75057')
df=pd.read_excel('dataset-1.xlsx',sheet_name='Sheet1')
#获取最大行,最大列
nrows=df.shape[0]
ncols=df.columns.size
print('Max Rows:'+str(nrows))
print('Max Columns'+str(ncols))

核心是路径的写法:这里挂载数据不能直接找到文件名,需要去找到文件夹,才能找到具体数据集文件,所有实验室的数据访问都在/home/tianchi/tianchilab路径下 

  • 读取个人空间中的数据集

前提:在个人空间中新建文件夹:dataset,在该文件夹下上传数据集文件,名称为:dataset-1.xlsx

具体代码:

import pandas as pd
# 个人空间中的数据集读取
sExcelFile='/home/tianchi/myspace/dataset/dataset-1.xlsx'
df = pd.read_excel(sExcelFile,sheet_name='Sheet1')
#获取最大行,最大列
nrows=df.shape[0]
ncols=df.columns.size
print('Max Rows:'+str(nrows))
print('Max Columns'+str(ncols))

核心是路径的写法:/home/tianchi/myspace/dataset/dataset-1.xlsx,个人空间的数据都在/home/tianchi/myspace路径下

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐