熊猫简介:团结数据框架
#编程 #python #datascience #pandas

pandas是一个流行的Python开放的流行库,用于处理和有效地操纵数据。在其许多功能中,最强大的功能之一是结合,组合和合并数据框架的能力。 DataFrames单元允许您组合来自不同来源的信息,从而使数据速率更加完整和准确。

在本文中,我们还将探索熊猫提供的不同妈妈以团结数据范围,除了说明每种类型的联合。

准备环境

在开始之前,重要的是要在Python环境中安装熊猫。如果您仍然拥有它,则可以通过PIP分配:

pip install pandas

接下来,让我们导入大熊猫开始:

import pandas as pd

将数据框与大熊猫团结起来

pandas根据数据的特征以及我们想要结合信息的方式,提供了纽约市的母亲©所有以团结数据范围。联盟的主要妈妈是:

  1. pd.concat():沿轴(线或列)的Concatena DataPhrames。
  2. pd.merge():根据数据框架之间的常见列执行联盟。
  3. df.join():执行与pd.merge()相似的结合,但使用dataframes。
  4. df.append():将数据框的行添加到另一个数据框架。

1. pd.concat()

母亲©所有pd.concat()用于沿轴沿线或列来串联数据框。按模式,串联沿0(线)轴发生,创建较大的数据帧。让我们看一个例子:

# Criando dois DataFrames de exemplo
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})

# Concatenando ao longo do eixo 0 (linhas)
result_concat = pd.concat([df1, df2])

print(result_concat)

结果将是:

   A   B
0  1   4
1  2   5
2  3   6
0  7  10
1  8  11
2  9  12

请注意,已保留了ândices。如果要重新定义âdices,则可以在Koud0上使用Koud6参数。

2. PD.Merge()

母亲©所有pd.merge()用于基于常见列团结数据范围。它的工作原理类似于SQL表的连接。让我们看看一个例子:

# Criando dois DataFrames de exemplo
df1 = pd.DataFrame({'Key': ['A', 'B', 'C'], 'Value1': [1, 2, 3]})
df2 = pd.DataFrame({'Key': ['B', 'C', 'D'], 'Value2': [4, 5, 6]})

# Realizando a união com base na coluna 'Key'
result_merge = pd.merge(df1, df2, on='Key')

print(result_merge)

结果将是:

  Key  Value1  Value2
0   B       2       4
1   C       3       5

在这里,两个数据范围中的“键”的记录等于“ b”和“ c”,而带有'键”的记录等于df1中的'a”,而'key”等于“与'd”等于“ d”。 koud10没有出现在结果中。

3. df.join()

母亲©All df.join()pd.merge()相似,但使用数据框而不是常见列进行操作。让我们看看一个例子:

# Criando dois DataFrames de exemplo
df1 = pd.DataFrame({'Value1': [1, 2, 3]}, index=['A', 'B', 'C'])
df2 = pd.DataFrame({'Value2': [4, 5, 6]}, index=['B', 'C', 'D'])

# Realizando a união com base nos índices
result_join = df1.join(df2, lsuffix='_left', rsuffix='_right')

print(result_join)

结果将是:

   Value1  Value2
A       1     NaN
B       2     4.0
C       3     5.0

请注意,“ B”和“ C”的记录是团结的,而“ A”和“ D”在两个数据范围内都不相应。

4. df.append()

母亲©所有df.append()用于将数据框架的行添加到另一个数据框架中。它在另一个末尾打包了一个数据框。让我们看看一个例子:

# Criando dois DataFrames de exemplo
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})

# Adicionando as linhas de df2 em df1
result_append = df1.append(df2)

print(result_append)

结果将是:

   A   B
0  1   4
1  2   5
2  3   6
0  7  10
1  8  11
2  9  12

包括£o

pandas提供了各种有力的母亲来团结数据范围,从而可以结合来自数据结构中不同来源的信息。在本文中,我们探讨了联盟的主要母亲:Koud0,Koud1,Koud2和Koud4。每个整体都有其特征性的实践和观察用途,并且重要的是选择最适合每种风景的最重要的。

通过掌握这些妈妈,您可能会执行更高级,更完整的,更高级的数据处理潜力。请记住,请咨询大熊猫的官方文件,以获取有关每个母亲及其选择的更多详细信息。