pandas是一个流行的Python开放的流行库,用于处理和有效地操纵数据。在其许多功能中,最强大的功能之一是结合,组合和合并数据框架的能力。 DataFrames单元允许您组合来自不同来源的信息,从而使数据速率更加完整和准确。
在本文中,我们还将探索熊猫提供的不同妈妈以团结数据范围,除了说明每种类型的联合。
。准备环境
在开始之前,重要的是要在Python环境中安装熊猫。如果您仍然拥有它,则可以通过PIP分配:
pip install pandas
接下来,让我们导入大熊猫开始:
import pandas as pd
将数据框与大熊猫团结起来
pandas根据数据的特征以及我们想要结合信息的方式,提供了纽约市的母亲©所有以团结数据范围。联盟的主要妈妈是:
-
pd.concat()
:沿轴(线或列)的Concatena DataPhrames。 -
pd.merge()
:根据数据框架之间的常见列执行联盟。 -
df.join()
:执行与pd.merge()
相似的结合,但使用dataframes。 -
df.append()
:将数据框的行添加到另一个数据框架。
1. pd.concat()
母亲©所有pd.concat()
用于沿轴沿线或列来串联数据框。按模式,串联沿0(线)轴发生,创建较大的数据帧。让我们看一个例子:
# Criando dois DataFrames de exemplo
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})
# Concatenando ao longo do eixo 0 (linhas)
result_concat = pd.concat([df1, df2])
print(result_concat)
结果将是:
A B
0 1 4
1 2 5
2 3 6
0 7 10
1 8 11
2 9 12
请注意,已保留了ândices。如果要重新定义âdices,则可以在Koud0上使用Koud6参数。
2. PD.Merge()
母亲©所有pd.merge()
用于基于常见列团结数据范围。它的工作原理类似于SQL表的连接。让我们看看一个例子:
# Criando dois DataFrames de exemplo
df1 = pd.DataFrame({'Key': ['A', 'B', 'C'], 'Value1': [1, 2, 3]})
df2 = pd.DataFrame({'Key': ['B', 'C', 'D'], 'Value2': [4, 5, 6]})
# Realizando a união com base na coluna 'Key'
result_merge = pd.merge(df1, df2, on='Key')
print(result_merge)
结果将是:
Key Value1 Value2
0 B 2 4
1 C 3 5
在这里,两个数据范围中的“键”的记录等于“ b”和“ c”,而带有'键”的记录等于df1
中的'a”,而'key”等于“与'd”等于“ d”。 koud10没有出现在结果中。
3. df.join()
母亲©All df.join()
与pd.merge()
相似,但使用数据框而不是常见列进行操作。让我们看看一个例子:
# Criando dois DataFrames de exemplo
df1 = pd.DataFrame({'Value1': [1, 2, 3]}, index=['A', 'B', 'C'])
df2 = pd.DataFrame({'Value2': [4, 5, 6]}, index=['B', 'C', 'D'])
# Realizando a união com base nos índices
result_join = df1.join(df2, lsuffix='_left', rsuffix='_right')
print(result_join)
结果将是:
Value1 Value2
A 1 NaN
B 2 4.0
C 3 5.0
请注意,“ B”和“ C”的记录是团结的,而“ A”和“ D”在两个数据范围内都不相应。
4. df.append()
母亲©所有df.append()
用于将数据框架的行添加到另一个数据框架中。它在另一个末尾打包了一个数据框。让我们看看一个例子:
# Criando dois DataFrames de exemplo
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})
# Adicionando as linhas de df2 em df1
result_append = df1.append(df2)
print(result_append)
结果将是:
A B
0 1 4
1 2 5
2 3 6
0 7 10
1 8 11
2 9 12
包括£o
pandas提供了各种有力的母亲来团结数据范围,从而可以结合来自数据结构中不同来源的信息。在本文中,我们探讨了联盟的主要母亲:Koud0,Koud1,Koud2和Koud4。每个整体都有其特征性的实践和观察用途,并且重要的是选择最适合每种风景的最重要的。
通过掌握这些妈妈,您可能会执行更高级,更完整的,更高级的数据处理潜力。请记住,请咨询大熊猫的官方文件,以获取有关每个母亲及其选择的更多详细信息。