从满足音频的情况下确定销售见解
#python #speechtotext #insights #sales

您刚刚开始在Dunder Mifflin Paper Company,Inc。的第一天开始担任Python开发人员。销售总裁迫切要求您,将销售会议从语音转录到本文经理迈克尔·斯科特(Michael Scott)。

这不仅是任何销售会议。登陆该客户可以确定公司的健康和未来。您会看到,迈克尔·斯科特(Michael Scott)有点傻,在重要的销售电话期间开玩笑的习惯过多,因此销售副总裁Jan被派去观看他。

销售总裁无法弄清楚为什么这位客户没有签订合同。

甚至达成了交易?

迈克尔没有完成交易吗?

或迈克尔通过告诉la脚的笑话吓到客户了?

他需要尽快销售见解,而他可以通过使用AI语音识别和Python来获得销售见解。

您现在可能已经猜到了,但是如果您没有,这是热门情景喜剧办公室的经典场景。

如果您想要完整的代码示例,以识别从Meeting Audio中识别销售见解,请跳至底部。如果您想知道愚人接下来会发生什么,请继续阅读。

在办公室的销售电话中,迈克尔·斯科特(Michael Scott)未经任何人的许可就将会议移至Chili的餐厅。由于这集是在2000年代中期发行的,因此我们要快速前进到2022年。让我们说这次会议不是在餐厅发生的,这是在每个人的最爱中发生的,视频称呼。

您向销售总裁解释说,可以记录会议,然后上传以使用Python和语音到文本进行转录。您详细说明可以使用某些功能来收集会议音频的销售见解。

您问总统他们需要什么类型的见解。他们需要快速摘要成绩单,而不是阅读整个内容,以及搜索成绩单以确定迈克尔·斯科特(Michael Scott)是否提到了业务,交易或笑话的能力。

对话智能和销售见解从满足音频

ou具有语音识别提供商Deepgram的完美解决方案。您可以使用其Python SDK进行编码。

您要做的第一件事是抓住API键here

然后创建一个带有python文件的目录。您使用pip安装deepgram pip install deepgram-sdk

使用此代码很容易使用:

from deepgram import Deepgram
import json

DEEPGRAM_API_KEY = YOUR_API_KEY_GOES_HERE
PATH_TO_FILE = 'audio/the-office-meeting.mp3'

def main():
   # Initializes the Deepgram SDK
   deepgram = Deepgram(DEEPGRAM_API_KEY)
   # Open the audio file
   with open(PATH_TO_FILE, 'rb') as audio:
       # ...or replace mimetype as appropriate
       source = {'buffer': audio, 'mimetype': 'audio/mp3'}
       options = {
           'summarize': True,
           'search': ['business', 'deal', 'joke']
       }

       response = deepgram.transcription.sync_prerecorded(source, options)
       print(json.dumps(response, indent=4))

main()

您在顶部导入库:

from deepgram import Deepgram
import json

将深色API键复制并粘贴到代码中,并将路径添加到要转录的文件中:

DEEPGRAM_API_KEY = YOUR_API_KEY_GOES_HERE
PATH_TO_FILE = 'audio/the-office-meeting.mp3'

main函数内部,您可以重新初始化DeepGram SDK。然后,您打开音频文件with open(PATH_TO_FILE, 'rb') as audio:。由于要转录的文件是MP3,因此您将音频传递到Python字典时,它将其设置为mimetypesource = {'buffer': audio, 'mimetype': 'audio/mp3'}

您通过使用这些参数创建一个选项对象来利用它们的摘要和搜索功能。

options = {
           'summarize': True,
           'search': ['business', 'deal', 'joke']
       }

最后,此行response = deepgram.transcription.sync_prerecorded(source, options)将呈现音频和功能并进行转录。然后将使用以下print(json.dumps(response, indent=4))打印结果。

您将收到带有成绩单,摘要和搜索结果的JSON响应。看起来像这样:

摘要

"summaries": [
                            {
                                "summary": "Lack of one county has not been immune to the slow economic growth over the past five years. So for us, the name of the game is budget reduction.",
                                "start_word": 0,
                                "end_word": 597
                            }
]

搜索

"search": [
                    {
                        "query": "business",
                          "hits": [
                            {
                                "confidence": 1.0,
                                "start": 231.305,
                                "end": 231.705,
                                "snippet": "business"
                            },
                        "query": "deal",
                         "hits": [
                            {
                                "confidence": 0.7395834,
                                "start": 86.13901,
                                "end": 86.298805,
                                "snippet": "i'll"
                            },
                        "query": "joke",
                         "hits": [
                            {
                                "confidence": 1.0,
                                "start": 82.125,
                                "end": 82.284996,
                                "snippet": "one joke"
                            },

您在销售会议上的见解。从摘要中看,客户似乎想降低成本,搜索信心表明迈克尔·斯科特(Michael Scott)谈论了业务,没有太多讨论交易,并告诉了一些笑话。

您与销售总裁分享。现在,他们可以更好地了解销售电话中发生的情况,如何指导迈克尔·斯科特(Michael Scott)完成未来的销售交易以及如何跟进客户。

向前迈进,记录了所有Dunder Mifflin的销售会议,并使用Deepgram得出了洞察力,以提高绩效并最大程度地提高收入。只有在帮助与客户建立关系的情况下,才允许他们的笑话。

结束。

这是整个代码样本:

from deepgram import Deepgram
import json

DEEPGRAM_API_KEY = YOUR_API_KEY_GOES_HERE
PATH_TO_FILE = 'audio/the-office-meeting.mp3'

def main():
   # Initializes the Deepgram SDK
   deepgram = Deepgram(DEEPGRAM_API_KEY)
   # Open the audio file
   with open(PATH_TO_FILE, 'rb') as audio:
       # ...or replace mimetype as appropriate
       source = {'buffer': audio, 'mimetype': 'audio/mp3'}
       options = {
           'summarize': True,
           'search': ['business', 'deal', 'joke']
       }

       response = deepgram.transcription.sync_prerecorded(source, options)
       print(json.dumps(response, indent=4))

main()

如果您对此帖子或Deepgram周围的其他任何反馈,我们很乐意收到您的来信。请在我们的GitHub discussions中告诉我们