本文共 1225 字,大约阅读时间需要 4 分钟。
raw_data_1 = { 'subject_id': ['1', '2', '3', '4', '5'], 'first_name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 'last_name': ['Anderson', 'Ackerman', 'Ali', 'Aoni', 'Atiches']}raw_data_2 = { 'subject_id': ['4', '5', '6', '7', '8'], 'first_name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']}raw_data_3 = { 'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'], 'test_id': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]}
data1 = pd.DataFrame(raw_data_1)data2 = pd.DataFrame(raw_data_2)data3 = pd.DataFrame(raw_data_3)
all_data = pd.concat([data1,data2],axis=0)
all_data_col = pd.concat([data1,data2],axis=1)
print(data3)
print(pd.merge(all_data,data3,on='subject_id'))
print(pd.merge(data1,data2,on='subject_id'))
print(pd.merge(data1,data2,on='subject_id',how='outer'))
这部分案例主要介绍的是pandas的DataFrame的生成以及pandas中的merge()方法合并数据集,可以将其看做是sql中的表连接,相关内容参见本人博客:、。
转载地址:http://eghq.baihongyu.com/