什么是MindsDB?
生活在数据库中的数据是宝贵的资产。 MindSDB使您可以使用数据并进行预测。它通过将机器学习带入数据库来加快ML开发过程。
使用MindSDB,您无需其他平台即可构建,训练,优化和部署ML模型。为了获得预测,只需查询您的数据和ML模型即可。阅读以查看一些示例。
什么是AI表?
MindSDB通过采用AI表的概念将机器学习带入数据库中。
AI表是存储在数据库中的虚拟表的机器学习模型。它们有助于根据您的数据进行预测。您可以在数据库中执行时间序列,回归和分类预测,并通过查询使用简单SQL语句的AI表即可立即获取输出。
在本教程中,我们将学习什么?
第1部分:设置要求
首先,我们将准备我们的设置,这对于开始使用MindSDB和Mongoapi进行预测至关重要。
- 下载mongodb和mongodb指南针
- 开始使用MindSDB
- 将MindSDB与MongoDB集成
第2部分:生成ML模型
我们将看到如何在数据库中创建和训练ML模型。在本教程中,我们将使用this dataset预测能量使用。
- 准备数据库
- 了解我们的问题陈述
- 创建预测变量模型
- 查询预测变量模型
第1部分:设置要求
我们将简要解释本节,以便我们继续进行预测。
下载mongodb和mongodb指南针
要开始,我们必须同时安装MongoDB Community Edition和MongoDB Compass并在我们的系统中工作。
完成了MongoDB和MongoDB指南针的安装后,我们就可以使用教程进行。
从MindSDB开始
MindSDB为所有用户提供免费的MindSDB云版本,他们可以访问其数据库上的预测。您可以按照setup guide遵循免费的MindsDB Cloud Version注册。验证您的电子邮件并登录到您的帐户,您已经准备好了。完成后,您应该看到这样的页面: 如果您愿意,可以选择使用Docker Image或使用PyPI在本地系统上安装MindSDB。但是,我们将在本教程中与Minds DB Cloud合作。 将MindSDB与MongoDB集成 MindSDB为我们提供了使用MongoApi与MongoDB集成的能力。我们可以按照给定的步骤来做到这一点。 打开您的MongoDB指南针。在左侧导航面板上,您将有一个新连接的选项。单击该选项,将为您提供连接的详细信息。 在URI部分中输入以下内容: 单击高级连接选项下拉列表。在这里,您的主机将被检测为MindSDB云。 在“身份验证”选项中,输入您的MindSDB用户名和密码。然后单击保存并连接,给您的连接一个名称并选择和颜色。 如果您成功创建了一个连接,则将显示一个类似于此的页面: 在此页面的底部面板中,您将看到Mongo Shell栏,放大并键入以下查询,然后单击Enter。 如果您得到这样的结果,则意味着我们成功地将MindSDB与MongoDB集成在一起。现在,让我们转到我们将生成ML模型的教程的第二部分。 准备数据库 我们将准备我们的数据库,我们可以在其中运行查询并执行预测。在MindSDB云控制台上,单击左导航栏中的最后一个图标。您将看到一个“选择数据源”页面。我们可以添加各种数据源,但是,对于本教程,我们将使用.csv文件。 转到文件部分,然后单击导入文件。导入您的CSV文件,并为您的数据库表提供一个名称,其中将存储.csv文件的内容。单击保存并继续。 现在,我们必须保存刚刚在MongoDB数据库中创建的数据库。我们可以为此目的使用databases.insertone()命令。 要这样做,转到mongo shell并键入以下命令: 单击Enter时,您必须收到以下答复: 如果您得到了这样的响应,则意味着您的数据库已成功创建! 了解我们的问题陈述 我们之前看到,我们将使用此Kaggle dataset预测家庭能源的使用情况。让我们仔细研究我们已经设置的数据库。我们的数据库由以下字段组成: 我们可以在MindSDB控制台中运行以下查询,以查看我们可以看到所有字段的数据库: 这就是将显示的内容: 现在让我们了解我们要预测的内容。为我们提供了一个由各个字段组成的数据库,我们希望根据其功能预测能量使用。我们将培训一种ML模型,该模型了解房屋的能源使用方式如何根据功能变化。一旦我们培训了模型,我们就可以输入房屋的细节,而我们的ML模型将预测其能源的使用方式。 听起来像是一项艰巨的任务?让我们看看MindSDB如何在简单的查询中为我们做到这一点! 创建预测变量模型 现在我们的数据库已经准备好,我们可以继续创建我们的ML模型。如我们所见,预测变量模型基本上是一个受过训练的机器学习模型,可用于预测或预测称为目标变量或目标值的特定值。 我们使用创建预测命令来创建和训练ML模型。在您的MindSDB控制台中输入以下命令: 这里的energy_usage_predictor是我们的预测模型的名称,用法是我们要预测的目标值。我们想预测考虑所有其他属性的房价。单击运行或按Shift+Enter运行我们的查询。如果没有打ic,我们将成功完成查询。 就是这样!我们已经通过单个查询创建并培训了机器学习模型!那是Mindsdb! 查询预测变量模型 我们可以通过在Mongo Shell中键入以下命令来查看我们的机器学习模型规格: 当我们按ENTER时,我们获得了预测模型的所有详细信息,例如其状态,准确性,目标值和错误。 现在,我们最终可以查询我们的ML模型以预测特定条目的目标值。 相同的查询是: 和lo,看见!我们的模型根据我们输入的属性预测房屋的价格: 使用MindSDB,我们在数据库中成功创建并培训了机器学习模型,并解锁了生成数据库预测的能力。您可以访问MindsDB Documentation了解Mindsdb的各种功能。 如果您喜欢跟随本教程,请确保注册免费的MindsDB Cloud account并继续探索! Kaggle是找到类似数据集的绝佳资源,您可以在MindSDB的帮助下创建和培训自己的ML模型。您也可以在GitHub上检查它们。
mongodb://cloud.mindsdb.com/
> use mindsdb
> show collections
第2部分:生成ML模型
db.databases.insertOne({
name: "HousePricingDB", // database name
engine: "mongodb", // database engine
connection_args: {
"port": 27017, // default connection port
"host": "mongodb://cloud.mindsdb.com:27017", // connection host
"database": "files" // database connection
}
});
SELECT * FROM files.houshold_energy LIMIT 10;
CREATE PREDICTOR mindsdb.energy_usage_predictor
FROM files
(SELECT * FROM houshold_energy)
PREDICT USAGE;
db.predictors.find({name:"energy_usage_predictor"})
SELECT USAGE, USAGE_explain
FROM mindsdb.energy_usage_predictor
WHERE TYPE = "Electric usage"
AND DATE = "10/23/2016"
AND STARTTIME = "2:00"
AND ENDTIME = "2:30"
AND UNITS = "kWh"
AND COST = "$0.01"
AND NOTES = "null";
结论 :
接下来是什么?