我希望这能证明有用,我有这样一个数据帧:#!/usr/bin/python

from numpy import nan

import pandas as pd

my_df=pd.DataFrame({'ID':['Sample1', 'Sample1', 'Sample1', 'Sample1', 'Sample2', 'Sample2', 'Sample2', 'Sample2', 'Sample3', 'Sample3'],

'Purchase':[4, 5, 6, 7, 8, 9, 10, 11, 12, 13],'item':['Item1', 'Item2', nan, 'Item4', 'Item5', 'Item6', 'Item7', nan, nan, nan],})

my_df

ID Purchase item

0 Sample1 4 Item1

1 Sample1 5 Item2

2 Sample1 6 NaN

3 Sample1 7 Item4

4 Sample2 8 Item5

5 Sample2 9 Item6

6 Sample2 10 Item7

7 Sample2 11 NaN

8 Sample3 12 NaN

9 Sample3 13 NaN

第一列中具有重复值的示例可以提取到字典中,然后提取到单独的csv文件中,这些文件也可以与excel一起使用:

^{pr2}$

这将根据第一列中重复的值生成csv文件。在

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐