前言:
两个表中的数据,要根据关键字段,进行合并。
在Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。
pd.concat 函数:
1 2 |
#导入需要的包 import pandas as pd |
1 2 3 4 |
#创建需要的数据集:产品表 dict1={"产品编号":["CP13","CP14","CP15","CP16","CP17"],"产品名称":["产品A003","产品A004","产品A005","产品A006","产品A007"]} df1 = pd.DataFrame(dict1) df1 |
1 2 3 4 5 6 7 |
#创建需要的数据集:详情表 dict2={"订单编号":["20220913","20220914","20220915","20220915"], "产品编号":["CP13","CP14","CP15","CP16"], "产品销量":[13,24,45,32], "负责人":["张三","赵六","李八","李八"]} df2 = pd.DataFrame(dict2) df2 |
1 |
pd.concat([df1,df2])#默认上下拼接,拼接依据是列名;默认外联,保留两个表都有的索引信息 |
1 |
pd.concat([df1,df2],ignore_index=True)#重置行索引 |
1 2 |
#左右拼接的依据是行索引 axis默认是0上下拼接,1为左右拼接;默认外联(join = 'outer') pd.concat([df1,df2],axis=1) |
1 2 |
#join指定了拼接方法,内联,表示保留两个表共有的行索引 pd.concat([df1,df2],axis=1,join="inner") |
和concat上下拼接的结果类似
1 |
df1.append(df2) |
1 2 |
#left_on写左表进行拼接的字段,right_on写右表要进行拼接的字段 pd.merge(df1,df2,left_on="产品编号",right_on="产品编号",how = 'right') |
1 2 |
#若两表拼接字段名完全一样,可写一个on pd.merge(df1,df2,on="产品编号") |
和concat左右拼接的结果类似
1 |
df1.join(df2, lsuffix='_b', rsuffix='_a') |