使用Amazon Codewhisperer探索悉尼犯罪数据 - 从AWS上开始生成AI-第3部分
#aws #教程 #python #generativeai

探索性数据分析对于数据科学或分析至关重要

让我们删除繁重的提升数据预处理,以加快“数据理解”和“数据准备”步骤,以便您可以修复任何数据异常并使数据清洁

现在,您对最近两期的生成AI有了更多了解,让我们与Python在VS代码中亲身实践Amazon Codewhisperer,以探索犯罪数据集。

学习目标

在本课程中,您将使用一个真实数据集来:

  • 导入Python库
  • 加载数据集
  • 探索数据集
  • 使用描述性统计信息总结数据集
  • 检查缺少数据
  • 使用Amazon Codewhisperer感到舒适
  • 了解与AWS在2023年5月10日宣布的Jupyter笔记本集成的新生成功能

数据集

这个开源Quarterly crime recorded dataset由新南威尔士州犯罪统计局和研究局通过data.gov.nsw.au提供。

元数据包括6列:

  • 进攻 - 文字
  • 2018年 - 整数
  • 2019年 - 整数
  • 2020年 - 整数
  • 2021年 - 整数
  • 2022年 - 整数

如何将Amazon CodeWhisperer用作您的AI编码伴侣?

这里有一些提示:

  • 在VS代码中打开一个新的Python文件
  • 开始键入几个单词,例如导入...
  • 写评论#导入Python库...
  • 通过单击选项卡键接受代码建议,然后在键盘上单击 Enter

Amazon CodeWhisperer将开始从您输入的单词或学习并通过阅读评论来预测您要实现的内容的代码。

教程1:与Amazon CodeWhisperer的Python中的探索性数据分析

Amazon Codewhisperer将帮助您作为数据科学家或数据分析师准备一个逻辑流以进行分析,并帮助您调试并提供代码建议,因为它可以了解您可能从大型语言模型体系结构中包含的自然语言处理中思考的内容。

步骤1:确保您在VS代码中连接到Amazon Builder ID。

步骤2:开始在python中键入几个单词或评论

步骤3:导入流行的Python库并加载数据集

import

步骤4:检查数据框的前5行。当您输入评论时,Amazon Whispererer将尝试预测您想要实现的目标,并建议您是否想查看数据的前5行。

head

步骤5:您可能想了解数据框的形状,例如数据集中有多少列和行。
在评论中,开始键入“ Shape”一词,Amazon Codewhisperer将尝试完成并预测您要实现的目标。

shape

步骤6:总结数据集并提供描述性统计信息。只需开始键入“描述”一词,而Amazon Codewhisperer记得上一行的代码行,并且建议您是否要汇总数据。

summazirie

步骤7:您可能需要查看有关数据的总体信息并开始键入“信息”一词。

info

步骤8:您可能需要检查任何缺失的值。您可能会在评论中开始键入“丢失”一词,而Amazon Codewhisperer将尝试生成所需的代码。

Imissing

在下一行代码上,Amazon CodeWhisperer将尝试猜测您的下一步,并询问您是否要检查任何重复的值。您可以单击选项卡 inter 接受代码建议,也可以拒绝建议。

duplicateon

步骤9:您可能还需要使用不同变量的直方图理解和可视化数据。如果您开始在评论中键入“历史”一词,那么Amazon Codewhisperer将迅速预测并提供您可能想到的代码建议。这很聪明!从所有代码注释中学习以及您从大型语言模型中键入的内容。

histogram

步骤10:当您标记到下一行代码时,Amazon Codewhisperer已经试图猜测您要编写用于构建框图的代码。

box

步骤11:在新线路上,您可以输入python评论“绘制条形图”。 Amazon Codewhisperer将迅速向您建议您需要的正确代码。

bar

这个快速的探索性分析大纲花了10分钟来编写工作流程和思考过程。

教程2:使用Amazon CodeWhisperer在Jupyter笔记本中的2018年至2022年新南威尔士州犯罪的探索性数据分析

(注意:请在下面阅读新的 AWS机器学习博客,以获取与Jupter一起在2023年5月10日宣布的本博客结束时与Jupter的新公告)。

步骤1:在Python 3中打开Jupyter笔记本的实例,并确保您将dataset保存在目录中。

步骤2:您可以快速将Amazon Codewhisperer代码建议应用于Jupyter笔记本,以便您可以看到输入代码和输出。

jupytern

步骤3:为每个行代码运行jupter笔记本,以便您检查输出。

ru  head

步骤4:检查数据框的描述性统计

check stats

步骤5:用形状检查数据框的尺寸。有62列和6列或功能。

features

步骤6:检查数据框中的任何丢失值。数据框中没有丢失的值。

missing

步骤7:检查数据框的详细信息,包括数据类型以及是否有任何空值或空值。所有数据类型都是数据框中的对象。

datatype

步骤8:检查任何重复值。

中没有重复的记录。

dup

结论

您已经学会了如何通过接受或拒绝实时学习的预测单词和评论来在15分钟内使用Amazon CodeWhisperer作为您的ML驱动的编码伴侣。您还在10分钟内完成了Jupyter笔记本中的探索性分析,以帮助实现数据分析或数据科学的数据探索阶段。

资源

新闻快闪 - 2023年5月10日在媒体上热门! ð

我很高兴与您分享,媒体热门。 AWS的新闻闪光。请阅读AWS的最新公告,宣布AWS通过民主化AI和Scale ML Workloads来宣布新的Jupyter捐款。

New features用于生成AI包括:

  • 引入两个生成AI扩展名jupyter
  • Jupyter AI,一个开源项目,将生成AI带到Jupyter Notebooks
  • Amazon Codewhisperer jupyter扩展程序以构建,训练和部署ML模型
  • 笔记本安排
  • SageMaker开源分销

请阅读布莱恩·格兰杰(Brian Granger)在AWS Machine Learning Blog上撰写的最新公告,今天5月10日宣布。

new

本月 - AWS她建立了5月31日关闭全球指导申请

aws她构建了应用程序

申请参加她构建指导计划的免费AWS -APJ,EMEA或我们。学习云计算 -

如果您渴望成为技术女性或有兴趣了解有关云计算的更多信息,则必须在2023年5月31日之前提交您的申请。早起的鸟得到蠕虫!您可以在此link

申请

seh builds

下个月 - AWS回复:Inforce 2023,6月13日至14日

您准备好了AWS RE:今年Inforce吗?加入AWS社区亲自学习两天的学习,与同龄人建立联系,以进一步学习安全性,创新和主题演讲的最新公告。

我希望您能够加入AWS CISO CJ Moses的主题演讲,即下个月的AWS安全社区,并在此link上注册。在300和400级的领导会议,合作伙伴会议和专家会议上都是集中学习和互动会议的。

next month

您可以从AWS:Inforce 2022中观看keynote,也可以关注Twitter上的#AWSREINFORCE主题标签

直到下一课,学习愉快! ð