在本教程中,我们将学习:
ð将MongoDB数据库连接到MindSDB。
ð训练模型以根据标题和描述来预测书籍的流派。
ð从给定某些输入参数的模型中获取预测。
我们将使用可以从here下载的书籍类型数据集ð。您也可以自由使用自己的数据集并遵循教程。
#£先决条件
- 本教程主要是关于
MindsDB
的,因此预计读者对MongoDB Atlas有一定程度的熟悉程度。 - 简而言之,MongoDB Atlas是一个数据库(DAAS),我们将使用它来旋转MongoDB数据库群集并加载我们的数据集。
- 从here下载书籍类型数据集的副本。
- 您也有望在
MindsDB Cloud
上拥有一个帐户。如果没有,请转到https://cloud.mindsdb.com/并创建一个帐户。几乎不需要几分钟。 â - 我们还需要MongoDB指南针将数据集加载到集合中。它可以从here下载。
#关于MindSDB
MindsDB
是一个预测平台,它使数据库易于使用智能和机器学习。它允许数据分析师通过SQL构建和可视化BI仪表板中的预测,而无需经历ML管道的复杂性。它还通过为数据库机器学习提供高级仪器来帮助数据科学家简化MLOP,并通过声明的JSON-AI语法优化ML工作流程。
尽管仅提及SQL,但也支持MongoDB。
#!£数据集概述
数据集包含有关书名,流派和书籍摘要的信息。
#!£在MongoDB Atlas上建立一个集群
-
前往https://cloud.mongodb.com/并创建一个名为
booksdb
的新项目,并在其中一个名为cluster0
的新数据库群集。通常,提供一个群集需要一两分钟。完成后,您应该有这样的东西:
-
在下一步中,选择“使用mongodb指南针连接”。复制应该看起来像这样的连接字符串:
mongodb://cloud.mindsdb.com/
和从高级连接选项中,选择身份验证方法作为“用户名/密码”,然后输入您的Mindsdb云凭据。
现在,我们将从MongoDB指南针连接到我们的数据库并加载我们的数据集。
#!£用MongoDB指南针加载数据集
-
前往https://cloud.mindsdb.com/,登录后单击“添加数据”以从CSV文件导入数据。
此导入的数据将在文件数据库中可用。 -
现在在MongoDB指南针中打开Mongosh终端,输入以下命令以插入MindSDB的数据库。
db.databases.insertOne({
name: "BooksDB", // name of database
engine: "mongodb", // databaase engine to use,
connection_args: {
"port": 27017, // connection port
"host": "mongodb://cloud.mindsdb.com:27017", // connection host
"database": "files" // connecting database
}
});
现在,我们准备训练ML模型,以使用MindsDB
进行预测books_genre
。
#训练ML模型
- 前往MindsDB cloud创建预测因子。输入下面的命令并执行。
CREATE PREDICTOR mindsdb.books_genre_predictor
FROM files
(SELECT * FROM books)
PREDICT genre;
- 这就是MINSDB的ML模型的简单训练。现在,您要做的就是等待几分钟才能接受培训,然后您可以运行查询并在Books_genre上获得预测。
#!£运行查询以获取预测
db.books_genre_predictor.find({title:"Yendi", summary:"Six months after he took control of his own territory in the criminal"})
在这里,我们想知道一本书的类型,其中包含以下细节。
- 我们可以看到,该模型以99.9%的信心预测,给定书籍细节的类型是“幻想”。
您可以使用输入并进行更多查询并观察结果。
感谢您阅读本文。如果您喜欢它,请喜欢并与他人分享。如果您想了解有关MindsDB
的更多信息,请访问他们的官方文件和/或在Slack上与背后的团队交谈。
在我的下一篇文章中见到您! ð