1.背景介绍

前列腺癌是全球第二大男性恶性肿瘤,随着人口老龄化和生活方式的改变,我国的前列腺癌发病率已跃居男性恶性肿瘤的第六位,成为泌尿外科中发病率最高的肿瘤,前列腺癌不仅给患者家庭,也给国民经济发展带来了沉重的负担。前列腺癌数据集收录了大量前列腺患者的检查,诊断和治疗数据,包括血清前列腺特异抗原(PSA)数据,各项生化检查数据等,为了解和分析前列腺发生,发展的规律提供数据支持,为制定和规范前列腺临床诊疗的方案提供决策依据。

2.数据库介绍

数据采集单位:中国人民解放军总医院

数据存储位置:国家人口健康科学数据中心数据仓储(PHDA)

数据库名称:共享杯版_前列腺肿瘤预警数据集

数据库链接:

国家人口健康科学数据中心icon-default.png?t=M666https://www.ncmi.cn/phda/dataDetails.do?id=CSTR:A0006.11.A0005.202006.001019-V1.0

记录数:455条

数据字段数量与名称:4+33

表1 前列腺肿瘤病理指标数据字典

字段/变量名称 字段/变量含义 是否必填性
CASE_ID 序号
LABEL 标签
DESCRIPTION 描述
IMPRESSION 诊断

表2 前列腺肿瘤病理指标样例数据

 表3 前列腺肿瘤生理指标数据字典

字段/变量名称 字段/变量含义 字段/变量名称 字段/变量含义 字段/变量名称 字段/变量含义
Case_ID 序号 '305003A' 脑利钠肽前体 '308003' 乳酸脱氢酶
LABEL 标签 '302002' 球蛋白 '308005' 肌酸激酶
AGE 年龄 '308009' 碱性磷酸酶 '302023' 肌酐
BODY_HEIGHT 身高 '308006' 肌酸激酶同工酶 '302025' 血清尿酸
BODY_WEIGHT 体重 '411007' PSA(游离) '302029' #N/A
'010005' 载脂蛋白AⅡ '411008' PSA(总) '304003' 甘油三酯
'010006' 载脂蛋白C2 '305003' '304007' 高密度脂蛋白胆固醇
'010007' 载脂蛋白C3 '305005' '304009' 低密度脂蛋白胆固醇
'010009' 载脂蛋白E '305008' 氯化物 '304012' 载脂蛋白A1
'308006A'

肌酸激酶同工酶

定量测定

'305010' 无机磷 '304013' 载脂蛋白B
'304002.01' 磷脂 '305023' 游离钙 '305001'

表4 前列腺肿瘤生理指标样例数据

Case_ID LABEL AGE BODY_HEIGHT BODY_WEIGHT '302002' '308009' '308006' '411007' '411008' '305003' '305005' '305008' '305010' '305023' '308003' '308005'
1 1 81 175.0 81.00 38.6 51.4 10.7 0.73 2.43 141.0 2.14 103.3 0.91 1.10 111.9 26.2
2 2 75 162.0 62.00 49.1 87.1 20.0 0.65 6.65 142.1 2.35 103.6 0.91 1.15 118.7 37.6
3 1 73 172.0 84.00 39.3 80.2 10.0 139.2 2.18 101.3 0.97 1.09 134.0 99.5
4 1 80 162.0 64.50 40.1 109.0 8.8 144.9 2.32 103.2 1.06 1.11 173.9 42.3
5 1 72 163.0 62.00 41.4 79.9 11.5 1.09 5.08 143.3 2.14 106.1 1.04 1.14 157.1 85.4
6 3 80 166.0 70.00 43.2 78.8 18.4 0.37 3.9 142.8 2.39 107.8 0.94 1.04 147.6 87.3
7 3 78 165.0 56.00 49.7 57.6 19.3 0.09 0.19 144.2 2.42 103.1 1.05 1.14 184.9 104.0
8 2 75 165.0 72.00
9 1 60 170.0 75.00 39.5 45.6 12.9 144.4 2.28 100.9 1.22 1.20 115.1 93.2
10 1 77 165.0 80.00 41.0 53.9 12.1 1.920 12.280 144.8 2.11 103.6 1.06 1.14 196.4 110.4
11 1 72 168.0 64.00 42.8 64.3 10.5 143.7 2.29 104.1 1.00 1.11 153.1 60.7
12 3 79 166.0 55.00 34.8 50.1 11.8 1.51 17.1 140.2 2.00 106.5 0.71 1.13 129.9 61.9
13 1 77 168.0 71.00 39.7 59.6 9.9 0.255 5.00 146.7 2.21 103.9 0.97 1.18 162.6 168.7
14 1 76 167.0 73.00 37.7 61.0 22.6 0.378 1.18 142.0 2.31 103.2 1.32 1.21 87.2 194.9
15 1 80 160.0 60.00 43.4 54.7 0.046 0.331 140.4 2.20 101.9 0.80 1.17 165.8 93.0
16 3 72 167.0 74.00 43.3 59.2 19.4 0.881 4.22 140.9 2.22 100.9 1.22 1.17 177.2 160.9
17 1 82 157.0 49.00 42.3 27.8 140.5 2.29 107.4 1.08 185.3 86.1
18 1 76 161.0 69.00 39.6 66.4 3.07 11.8 145.2 106.3 137.1
19 1 76 168.0 62.00 34.4 109.3 14.2 1.26 5.71 141.9 2.14 106.7 0.93 1.09 327.1 67.8
20 3 78 174.0 84.00 45.6 83.4 5.6 2.42 36.2 141.8 2.39 106.4 1.06 1.19 170.6 36.8
21 1 79 168.0 67.00 42.1 78.4 55.3 0.76 4.42 139.8 2.20 102.4 1.03 1.08 171.1 135.9
22 2 79 166.0 62.00 41.3 56.8 13.8 0.61 3.25 140.4 2.24 101.0 1.00 1.08 162.9 96.8

3. 数据获取与使用 

数据获取地址: 共享杯版_前列腺肿瘤预警数据集

数据库链接:https://www.ncmi.cn/phda/dataDetails.do?id=CSTR:A0006.11.A0005.201905.000282

数据使用方式:申请使用后,通过国家人口健康科学数据中心大数据分析平台进行分析挖掘

数据引用格式:中国人民解放军总医院.糖尿病并发症预警数据集.国家人口健康科学数据中心数据仓储PHDA,2022.https://doi.org/. 

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐