博客
关于我
【Python数据分析与处理 实训05】--- 探索虚拟姓名数据(数据合并)
阅读量:317 次
发布时间:2019-03-04

本文共 1225 字,大约阅读时间需要 4 分钟。

【Python数据分析与处理 实训05】— 处理分析虚拟姓名数据(数据合并)


探索虚拟姓名数据

1.声明数据

raw_data_1 = {    'subject_id': ['1', '2', '3', '4', '5'], 'first_name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 'last_name': ['Anderson', 'Ackerman', 'Ali', 'Aoni', 'Atiches']}raw_data_2 = {    'subject_id': ['4', '5', '6', '7', '8'], 'first_name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']}raw_data_3 = {    'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'], 'test_id': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]}

2.将上述的数据转为DataFrame并分别命名为data1,data2,data3

data1 = pd.DataFrame(raw_data_1)data2 = pd.DataFrame(raw_data_2)data3 = pd.DataFrame(raw_data_3)

在这里插入图片描述


3.将data1和data2两个数据框按照行的维度进行合并,命名为all_data

all_data = pd.concat([data1,data2],axis=0)

在这里插入图片描述


4.将data1和data2两个数据框按照列的维度进行合并,命名为all_data_col

all_data_col = pd.concat([data1,data2],axis=1)

在这里插入图片描述


5.打印data3

print(data3)

在这里插入图片描述


6.按照subject_id的值对all_data和data3进行合并

print(pd.merge(all_data,data3,on='subject_id'))

在这里插入图片描述


7.对data1和data2按照subject_id做连接

print(pd.merge(data1,data2,on='subject_id'))

在这里插入图片描述


8.找到data1和data2合并之后的所有匹配结果

print(pd.merge(data1,data2,on='subject_id',how='outer'))

在这里插入图片描述

这部分案例主要介绍的是pandas的DataFrame的生成以及pandas中的merge()方法合并数据集,可以将其看做是sql中的表连接,相关内容参见本人博客:、。


转载地址:http://eghq.baihongyu.com/

你可能感兴趣的文章
第七周 4.12-4.18
查看>>
ArduPilot源码极速下载手册(一文告别github慢速问题)
查看>>
聊一聊那些应该了解的大佬(飞控,人工智能方向)
查看>>
px4调试bug--添加mavlink_log_info信息
查看>>
redis替换字符串命令
查看>>
redis向数组中添加值并查看数组长度
查看>>
python3基础梳理11python中模块和包
查看>>
JS编写一个函数,计算三个不同数字的大小,按从小到大顺序打印(穷举法)
查看>>
mybatis中like的注意
查看>>
sqlplus的基本使用
查看>>
oracle删除表重复数据
查看>>
EditText获取焦点并显示软键盘,Textview字间距,EditText输入监听判断不大于,处理倒计时
查看>>
Oracle删除主表数据
查看>>
js中两种定时器,setTimeout和setInterval实现验证码发送
查看>>
Oracle常用SQL
查看>>
技术美术面试问题整理
查看>>
Redis分布式锁原理
查看>>
C++学习记录 五、C++提高编程(2)
查看>>
自学linux毕业shell面试题
查看>>
4 Java 访问控制符号的范围
查看>>