如何使用Python将情感分析整合到战略计划中
#python #datascience #data #sentimental

您是否在了解客户需要什么方面面临困难?不知道如何启动分析以在将来吸引更多客户?将情感分析整合到您的战略计划中是了解客户偏好和需求的最佳方法。

在本文中,我们将使用Python来展示如何使用情感分析进行战略分析。如果没有程序示例和有关如何向相关的利益相关者提出的模型音频演示,本文将不会启发。

所以,让我们开始。

目录

什么是战略规划?
战略规划的好处是什么?
为什么感性分析?
情感分析演练
模型音频演示
音频演示

什么是战略规划?

策略计划是评估组织当前职位和绩效的过程,以制定有效的策略,以帮助组织在现有市场中占有一致。它涉及组织的整体和长期方向。

战略规划的好处是什么?

降低风险:战略规划可帮助组织确定对其运营和性能的潜在威胁。这些威胁可以是内部的或外部的。在确定了潜在问题之后,组织制定了缓解风险的策略,以应对当前或将来的挑战。

评估竞争:通过战略规划,组织可以了解他们面临的竞争格局,并确定可以确保其实质利润率的机会。

明确的方向:战略规划确保组织与当前的市场趋势保持一致,以实现其设定的目标和目标。

资源优化。战略规划使组织能够确定需要更多资源的领域以及削减其他领域以避免浪费的领域。

战略规划最终利益是制定决定性的计划,该计划与组织的优势保持一致,同时减轻潜在的弱点和威胁。战略规划过程是动态和持续的,因为随着行业格局的不断发展,组织需要适应战略。

为什么要感性分析?

情感分析使组织和企业能够利用其文本数据做出明智的决策,改善销售和客户体验,以保持其现有行业的竞争力。这是您可以在战略计划中使用的重要分析工具包,因此提供了有价值的见解,由于大量的文本信息,这本来可以挑战的。

情感分析演练

让我们深入研究真实的动作ð

要开始使用Python,我们将使用所选数据很大程度上对组织的数据具有情感。

使用Excel开始数据分析,以避免运行Python代码时的错误密钥错误。

步骤1:打开excel并粘贴数据

Screenshot 1

步骤2:突出显示列A,单击数据和文本到列

Screenshot 2

步骤3:选择逗号,空间,然后应用。这些值将自动排列在正确的列和行中。

Screenshot 3

完成步骤后,请确保将值正确布置在列和行上。用.csv扩展名保存。

输出:

Screenshot 4

接下来,我们需要在jupyter笔记本中上传我们保存的文件,以启动简单的情感分析过程,考虑到假设利益相关者的需求和要求。

指导我们的研究问题:

  1. 哪个位置最正面和负面评论?
  2. 哪个消息来源最正面和负面评论?
  3. 产品或服务的平均置信度评分是多少?

让我们开始。

您可以找到此分析的笔记本工作here

1.校准库

pandas-一个方便的python库,提供数据结构,使数据操纵和分析变得容易。

seaborn- python库,简化了可视化过程。

matplotlib.pyplot-强大的绘图库

正则表达式(re) - 与正则表达式匹配的Python模块

os- Python模块,用于文件/文件夹操纵和环境相关操作等任务。

sys- SYS模块提供的允许操纵系统运行时环境并提供对命令行参数的访问。

AST-模块允许您通过编程分析和修改Python代码。

运行以下代码。

import pandas as pd
import seaborn as sns
import re
import os
import sys
import ast
import matplotlib.pyplot as plt 
%matplotlib inline

2.Text处理

文本预处理是指清洁和将原始文本数据转换为适合进一步分析和自然语言处理(NLP)任务的格式的过程。我们将删除标点符号,令牌化,停止单词,交接收缩,窃听以及茎和删除特殊字符。

所以让S安装TextLob库执行以下任务:

!pip install textblob

您现在可以导入potwords,textlob和word:

from nltk.corpus import stopwords 
from textblob import TextBlob
from textblob import Word

因此,让我们使用lambda函数删除标点并降低外壳:

df[‘Text’] = df[‘Text’].apply(lambda x: “ “.join(x.lower() for
x in x.split()))

删除停止词:

stop = stopwords.words(‘english’)
df[‘Text’] = df[‘Text’].apply(lambda x: “ “.join(x for x in
x.split() if x not in stop))
df[‘Text’].head()

接下来,您必须确保拼写正确:

df[‘Text’] = df[‘Text’].apply(lambda x: str(TextBlob(x).
correct()))
df[‘Text’].head()

现在,让我们处理收缩。在这里,像“不会变成”这样的词:

def expand_contractions(text):
 # Define contraction mappings
 contractions = {
 “i’m”: “i am”,

#Add more contractions as needed
 }
 # Split text into words and expand contractions
 words = text.split()
 expanded_words = [contractions[word] if word in contractions else word for word in words]
 #Join words back into a single string
 expanded_text = “ “.join(expanded_words)
 return expanded_text
 # Apply the custom function to expand contractions and then perform spelling correction
df[‘Text’] = df[‘Text’].apply(lambda x: str(TextBlob(expand_contractions(x)).correct()))
 #Display the first few rows of the updated ‘Text’ column
 print(df[‘Text’].head())


您可以通过对文本进行训练来完成处理。在这里,目的是找到单词的基本形式。例如,睡眠的基本形式是睡眠:

df[‘Text’] = df[‘Text’].apply(lambda x: “ “.join([Word(word).lemmatize() for word in x.split()]))
df.Text.head()

3.使用WordCloud检查文本

现在处理了处理,您可以继续检查最突出的术语。

您将使用WordCloud检查这些单词。 WordCloud是文本数据的视觉表示。它显示一个单词列表,每个用字体大小或颜色显示的每个要素的重要性。

首先,让我们安装WordCloud:

!pip install wordcloud

然后,让我们定义一个您将使用的变量来检查主要术语:

score_1 = reviews[reviews[‘Confidence Score’] == 1]
score_2 = reviews[reviews[‘Confidence Score’] == 2]
score_3 = reviews[reviews[‘Confidence Score’] == 3]
score_4 = reviews[reviews[‘Confidence Score’] == 4]
score_5 = reviews[reviews[‘Confidence Score’] == 5]
reviews_sample = pd.concat([score_1,score_2,score_3,score_4,score_5],axis=0)
reviews_sample.reset_index(drop=True,inplace=True)

你在附近!通过使用word_tokenize:
确保文本在一个字符串中

from nltk.tokenize import word_tokenize
words = []
for text in df[‘Text’]:
words.extend(word_tokenize(text))
# If the list of words is empty, add a placeholder word to ensure there’s at least one word for the word cloud
if not words:
words = [‘NoWords’]
#similarly you can build for Text column
reviews_str = reviews_sample.Text.str.cat()
wordcloud = 
plt.figure(figsize=(10,10))
plt.imshow(wordcloud,interpolation=’bilinear’)
plt.axis(“off”)
plt.show()

输出:

Screenshot 5

音频模型演示

数据讲故事是分析的重要组成部分。您的利益相关者不在乎您在分析过程中使用的工具。练习沟通技巧对于能够分享您的发现很重要。以下是我和我的朋友(我们的练习例程ð)为情感分析准备的模型音频演示。您的数据讲故事不必长。专注于您的发现。

单击here观看它。

结论

本文向您介绍了基本的情感分析,可以在战略计划中做出明智的决定。首先,我们使用Excel将数据排列在列和行上。然后,我们在文本上进行了前进,删除了停止单词,递给收缩,诱人和茎。接下来,我们可视化数据中经常发生反馈。最后,我们向理想的利益相关者进行了模拟音频演示。