大熊猫剪下母亲:一个有力的数据分割工具
#编程 #python #datascience #pandas
Pandas是一个广泛用于数据矮人和操纵的库,提供了一系列功能,使其更容易与复杂的数据集一起使用。这些功能之一是母亲©Toda cut,它提供了一种以自定义间隔进行分割和分组数据的方便方法。在本文中,我们将详细探讨整个cut,讨论其语法,资源并提供实践示例以证明其有用性。

介绍

母亲©All cut是PANDAS库的一部分,用于以特定的时间间隔进行众多数据。这是您想从包含数据创建类别的时候,使矮人更易于理解,并允许在这些类别上应用汇总操作。

基本语法

母亲的基本语法©All cut如下:

pandas.cut(x, bins, labels=None, right=True, include_lowest=False, ...)
  • x:s
  • bins:用于分割的间隔的限制。
  • labels:由此产生类别的可选标签。
  • right:指示间隔是否应正确关闭(包括正确的限制)还是。
  • include_lowest:如果为true,则在第一个间隔中包括下限。​​

整个cut使用的示例

现在,让我们探索一些示例,以了解母亲©所有cut在实用中的工作。

示例1:笔记的分割

假设我们有一组学生的成绩,我们希望将它们分割为“ A”,“ B”,“ C”,等。让我们使用母亲©所有cut来完成此任务:

import pandas as pd

notas = [78, 92, 65, 88, 95, 70, 82, 60, 78, 85]
bins = [0, 60, 70, 80, 90, 100]
categorias = ['F', 'D', 'C', 'B', 'A']

notas_segmentadas = pd.cut(notas, bins, labels=categorias)

print(notas_segmentadas)

在此示例中,注释根据bins中提供的间隔分组为类别,并标记为相应的类别。

示例2:eTãria乐队的年龄

让我们考虑一个场景,在该场景中,我们有一个非洲年龄的列表,我们想在道德群体中对它们进行分类:

idades = [25, 32, 50, 18, 65, 40, 28, 72, 55, 30]
faixas_etarias = [0, 18, 30, 50, 100]
categorias_idades = ['<18', '18-30', '31-50', '51+']

idades_categorizadas = pd.cut(idades, faixas_etarias, labels=categorias_idades, right=False)

print(idades_categorizadas)

在此示例中,我们正在根据提供的间隔为不同的道德组创建类别。定义right=False时,我们保证不包括间隔的正确限制,从而导致相互排斥的类别。

包括£o

pandas母亲©All cut是一种极其以个性化间隔分段和分类数据编号的工具。这有助于矮人和信息的聚集,从而更清楚地了解数据。通过使用TODA KOUD0,数据分析师可以将包含数据的类别转换为重要类别,从而简化了决策过程和洞察发现。

在本文中,我们探讨了所有cut的语法,并在不同场景中使用了其使用的实际示例。有了这些示例的了解,您准备将整个cut应用于您自己的数据数据,利用这种强大的熊猫功能。