使用MindSDB [Mongo API]预测书籍类型的教程
#hacktoberfest #machinelearning #mongodb #mindsdb

Image description

在本教程中,我们将学习:
ð将MongoDB数据库连接到MindSDB。
ð训练模型以根据标题和描述来预测书籍的流派。
ð从给定某些输入参数的模型中获取预测。

我们将使用可以从here下载的书籍类型数据集ð。您也可以自由使用自己的数据集并遵循教程。

#£先决条件

  1. 本教程主要是关于MindsDB的,因此预计读者对MongoDB Atlas有一定程度的熟悉程度。
  2. 简而言之,MongoDB Atlas是一个数据库(DAAS),我们将使用它来旋转MongoDB数据库群集并加载我们的数据集。
  3. here下载书籍类型数据集的副本。
  4. 您也有望在MindsDB Cloud上拥有一个帐户。如果没有,请转到https://cloud.mindsdb.com/并创建一个帐户。几乎不需要几分钟。 â
  5. 我们还需要MongoDB指南针将数据集加载到集合中。它可以从here下载。

#关于MindSDB

MindsDB是一个预测平台,它使数据库易于使用智能和机器学习。它允许数据分析师通过SQL构建和可视化BI仪表板中的预测,而无需经历ML管道的复杂性。它还通过为数据库机器学习提供高级仪器来帮助数据科学家简化MLOP,并通过声明的JSON-AI语法优化ML工作流程。
尽管仅提及SQL,但也支持MongoDB。

#!£数据集概述

数据集包含有关书名,流派和书籍摘要的信息。

#!£在MongoDB Atlas上建立一个集群

  1. 前往https://cloud.mongodb.com/并创建一个名为booksdb的新项目,并在其中一个名为cluster0的新数据库群集。通常,提供一个群集需要一两分钟。完成后,您应该有这样的东西:
    Image description

  2. 单击“连接”按钮。在弹出模式中,您将被要求选择一种与群集交互的工具。对于本教程,我选择MongoDB指南针进行连接。
    Image description

  3. 接下来,您将被要求选择连接方法。
    Image description

  4. 之后,将要求您创建一个新的数据库用户。提供用户名和密码后,单击“创建数据库用户”按钮。
    Image description

  5. 在下一步中,选择“使用mongodb指南针连接”。复制应该看起来像这样的连接字符串:

mongodb://cloud.mindsdb.com/

和从高级连接选项中,选择身份验证方法作为“用户名/密码”,然后输入您的Mindsdb云凭据。

现在,我们将从MongoDB指南针连接到我们的数据库并加载我们的数据集。

#!£用MongoDB指南针加载数据集

  1. 前往https://cloud.mindsdb.com/,登录后单击“添加数据”以从CSV文件导入数据。
    Image description
    此导入的数据将在文件数据库中可用。

  2. 打开mongodb指南针。粘贴连接字符串,然后单击“连接”。关于成功的身份验证,您将受到此屏幕的欢迎。
    Image description

  3. 现在在MongoDB指南针中打开Mongosh终端,输入以下命令以插入MindSDB的数据库。

db.databases.insertOne({
    name: "BooksDB", // name of database
    engine: "mongodb", // databaase engine to use,
    connection_args: {
        "port": 27017, // connection port
        "host": "mongodb://cloud.mindsdb.com:27017", // connection host
        "database": "files" // connecting database           
    }
});

Image description
现在,我们准备训练ML模型,以使用MindsDB进行预测books_genre

#训练ML模型

  1. 前往MindsDB cloud创建预测因子。输入下面的命令并执行。
CREATE PREDICTOR mindsdb.books_genre_predictor
FROM files
(SELECT * FROM books)
PREDICT genre;

Image description

  1. 这就是MINSDB的ML模型的简单训练。现在,您要做的就是等待几分钟才能接受培训,然后您可以运行查询并在Books_genre上获得预测。

#!£运行查询以获取预测

  1. 一旦状态更改完成,这意味着我们的模型现在已经准备好,我们可以开始获得预测。
    Image description
    我们可以看到该模型的精度为98.8%,令人印象深刻!

  2. 要开始预测,请在终端中输入以下查询:

db.books_genre_predictor.find({title:"Yendi", summary:"Six months after he took control of his own territory in the criminal"})

在这里,我们想知道一本书的类型,其中包含以下细节。

  1. 我们可以看到,该模型以99.9%的信心预测,给定书籍细节的类型是“幻想”。 Image description

您可以使用输入并进行更多查询并观察结果。
感谢您阅读本文。如果您喜欢它,请喜欢并与他人分享。如果您想了解有关MindsDB的更多信息,请访问他们的官方文件和/或在Slack上与背后的团队交谈。

在我的下一篇文章中见到您! ð