介绍:
可视化数据可能是一种以简单而引人入胜的方式传达复杂信息的有力方法。当涉及到长期趋势或模式时,例如25年内房地产价格的上涨,传统的静态图表或图形可能无法有效地捕获数据的动态性质。通过创建一个视觉表示形式,该表示显示了整个25年期间,每月逐月的房地产价格变化,我们可以将价格波动描述为不断的信息流,使观众能够掌握整体趋势并观察到如何观察这些年来价格上涨和下跌。
软件包:
bar_chart_race ,用于创建条形图的Python软件包
pip install bar_chart_race
import bar_chart_race as bcr
数据源:
英国房价指数(英国HPI)捕获了区域级别的住宅物业价值的变化。
数据pre Proces :
预处理将包括将“日期”列转换为DateTime格式,并使用“ distached_averation_price_price”列的平均值创建一个枢轴表(PVDATA),使用'date'作为索引和'region_name'作为列。
df['Date'] = pd.to_datetime(df['Date'])
pvdata = df.pivot_table("Detached_Average_Price", index = "Date",columns = ["Region_Name"], aggfunc = np.average)
下一步将是对索引进行排序,填充丢失的值,添加“月_年”列,将其设置为新索引,将索引重置为数值索引,最后按月按月分组并计算平均值。
pvdata.sort_index(inplace=True, ascending=True)
pvdata = pvdata.fillna(0)
pvdata['month_year'] = pvdata.index.strftime('%Y-%m')
pvdata_month = pvdata.set_index("month_year")
pvdata_month.reset_index()
pvdata_monthgr = pvdata_month.groupby('month_year').mean()
可视化数据 :
bcr.bar_chart_race(df = pvdata_monthgr,
filename = "growthbyregion.gif",
filter_column_colors = True,
cmap = "prism",
title = "Average House Price By Months")
摘要:
动画可以传达一种运动和进步感,比静态图表或图形提供了对数据的更直观,更引人入胜的理解,并使观众可以轻松地掌握复杂的信息并从数据中获得宝贵的见解
参考 :