“超越星星:“有用的评分系统”ð超出传统的5星评论!
#python #datascience #discuss #分析

大纲

背景ð

在那里,我再次被一个电子商务平台的另一个骗局所吸引,该平台拥有看似可靠的5星级评级。一个太熟悉的场景已经发生了很多次。在报仇的行为和迫切需要找到解决方案的情况下,我开始对骗子产品及其真正的来源进行评论。

这是我对传统五星级评级系统的日益怀疑的起源。为了应对这些欺骗性的做法,我开始炮制一种新食谱,不仅考虑了评分,而且还整合了其他关键元素,例如“有帮助的反馈”和“卖方答复”。让我分解:

  1. 有用的反馈:这可以量化发现特定评论有用的人数,无论其情感如何 -
  2. 卖方回复:此布尔值表示卖方是否对审查做出了回应,无论其情感如何正面或负面,都可以阐明他们与客户的互动。
  3. 评级:我们都知道的传统1至5星级评级系统。

当我深入研究这些想法时,他们到处都跟随我,甚至到浴室。在我看来,尽管骗子可以召集一组假高级评论,但诚实的评论者仍然拥有对抗他们的权力。他们可以提交低评分的评论,推荐类似的经验,并提供我们现在称为“有用的反馈”。

“我如何扩大这些无名英雄的声音,这些诚实的评论者,以产生重大影响?” 我对自己想。而且,本着这种韧性的精神,我确实做到了!

这个想法是将这三个组件融合在一起,从而伪造了一种新颖的评级系统,该系统可能会将骗局与诚实的商店区分开。尽管我最初的尝试,但平衡并不完美。我尝试了所有三种组合,将它们分为“高”和“低”类,但没有成功。您可以在Appendix中看到所有这些尝试。

但是,我仍然没有避免。这个系统不仅仅是数学模型。这是一个被欺骗的声音,一个欺骗性的明星海中的诚实灯塔。这证明了真正的反馈和响应式卖家的力量 - 电子商务的真正支柱。

目前,这是一项正在进行的工作。这是一个出于必要的想法,并在怀疑主义的坩埚中得到了完善。这不是结束;这仅仅是个开始。有了我的经验以及电子商务评级,有用的反馈和卖方的这三个支柱 - 我冒险进入了一个新的边境,试图将这种复杂的问题转变为可管理的问题。在这里,我发现了一个有趣的必要性,弹性和启发式方法的交集。这种独特的元素融合最终导致了一种新颖的概念 - 一种针对我们电子商务评级问题的启发式方法。

一种启发式方法:有用的评级系统ðÖ

Heuristic,源自希腊语 word εὑρίσκω,意思是“ 我发现,发现”,是数学优化和计算机科学的概念。它涉及在传统方法不足或找到精确解决方案时更快地解决问题。这通常涉及交易精度或速度的精度。从本质上讲,启发式是捷径,提供了足够好的解决方案来解决手头的问题,并且可以更快地获得。

考虑到这个概念,我开发了“ 有用的评级系统”,将人们的反馈优先于仅仅是星级评级。为了确保有用的反馈对新评级的影响,我遵循以下规则:

  1. 对于每个发现特定评论有帮助的人,它将与评论本身相同。这意味着,无论评论是正面还是负面,它都会乘以发现有用的人数。
  2. 不仅要计算撰写评论的人,而且还会花时间进行其他评论,他们觉得有帮助的其他评论。

在以下各节中,我们将使用诚实商店和骗局的数据集探索有用的评级系统的实现。我们利用Polars library执行我们的计算和数据操作。

我们使用的数据集是我的web scraping project的产物,包括诚实和骗局的不同评论。以下是每个数据集中的前五个样本:

诚实的商店数据集:

honest head 5

骗局存储数据集:

scam head 5

从这些数据集中,我们仅考虑两个组件ratinghelpful_feedback,不包括is_seller_reply。我们还创建了一个新列rating * (1 + helpful_feedback)来结合这两个因素:

在这里,我们将评级乘以1 + helpful_feedback。这背后的想法是给其他用户认为更有帮助的评分的重量更高。

对于诚实的商店,我们的新数据帧看起来像:

new honest store dataframe

对于骗局,它是:

new scam store dataframe

接下来,我们计算两种商店的平均评分:

平均评分的结果是:

诚实商店:

4.903765690376569

骗局:

4.091059602649007

现在,我们将介绍有用的评分系统此系统仅可见用户,增加了一层复杂性,这使骗子操纵更具挑战性。我们观察到,当使用此系统时,诚实的商店通常得分高于骗局

平均有用的评分是:

诚实商店:

4.7317073170731705

骗局:

2.9344413665743305

F1-score中汲取灵感,它考虑了两个基本组成部分(precisionrecall),我以类似的方式制定了有用的评分系统评分:

类似F1的有用评分系统分数为:

诚实商店:

4.816200300790103

骗局:

3.4175426304044842

为了更深入的外观,您可以找到完整的笔记本here。它可以在本地或在Google Colab上运行。

比较ð

传统的评级系统和拟议的有用评级系统具有不同的目标,并具有不同的优势。现在,我们将这两个系统并列,以了解其性能,有效性和韧性,以应对恶意演员的操纵。

系统 诚实的商店平均 骗局平均
传统评分ð 4.903765690376569 4.091059602649007
有用的评分系统ð 4.7317073170731705 2.9344413665743305

虽然数值评级提供了比较的快速快照,但它们仅代表故事的一部分。当我们在更广泛的背景下探索时,有用的评级系统的微妙和潜在含义就会揭示:

  • 抵御操纵的弹性:传统评级系统以简单性很容易利用骗子。他们可以人为地夸大其评级,从而使用户难以区分诚实的商店和骗局。相比之下,有用的评级系统通过考虑审查的“有益性”来引入额外的复杂性。这方面使骗子操纵系统更具挑战性。

  • 表示客户满意度的表示:在传统评级系统中,每个评级都具有相同的权重。但是,有用的评分系统可以使其他用户“有用”的评级更大。这种方法意味着更民主和以客户为中心的系统,因为它更好地代表了较大的客户群的情感。

  • 存储信誉:虽然传统系统仅提供平均评级,但有用的评分系统反映了社区的反馈。更有帮助的评分代表了更多人的情绪。因此,有用的评级系统可以提供更准确的商店信誉。

  • 可伸缩性:,由于引入“帮助性”因素,有用的评分系统似乎更为复杂,但同样可扩展。这两个系统都可以处理大型数据集,使其适用于大型电子商务平台。

有用的评分系统是对传统系统的重大改进。它给用户评论和评分带来了更细微的理解,使骗子更难操纵,并为客户提供对商店声誉的更准确的了解。尽管数值等级在某种程度上反映了这一点,但在考虑这些更广泛的方面时,有用的评级系统的实际价值变得很明显。

但是,正如每个硬币都有两个方面一样,我们的有用的评分系统也会提出某些权衡和潜在的陷阱。尽管它比传统的评级系统具有许多优势,但我们也必须承认和解决一些可能的考虑和可能的案例。

权衡和陷阱ð

像任何系统一样,有用的评分系统并非没有其潜在缺点和边缘案例。虽然它提出了一种创新的方法来打击欺诈性评级并向集体用户的情感发出声音,但重要的是要了解可能出现的潜在问题:

  1. 一旦有用的评级系统成为主流,骗子可能会设计新的方法来操纵它。
  2. 竞争对手可能会向大批人支付负面评论并将其标记为有益,使一家真正的商店看起来欺诈。
  3. 如果没有有用的评级可用于审查,则确定商店是否真实的挑战。
  4. 无法立即识别骗子。我们需要受害者的诚实,低评级评论,并需要来自其他用户的有益投票才能识别它们。
  5. 严重依赖“卖方答复”因素可能并不总是表明商店的真实性,因为及时答复可以自动化并且缺乏真正的互动。
  6. 该系统可能不成比例地喜欢具有更多客户互动和评论的较大商店,从而使小型或新业务更难建立信誉。
  7. 存在“有用的反馈”偏见的潜力,因为个人可能对使审查“有帮助”的原因有所不同。
  8. 该系统可能会为有一些不良评论的真正商店创建负面反馈循环,因为这些循环可能会受到投票和认为有用,从而不公平地损害了商店的整体评级。

未来的工作ð

有用的评级系统的开发和实施为将来的工作提供了许多机会。尽管它表现出令人鼓舞的结果,但重要的是要注意,系统仍在进行中。这个初步阶段为更广泛的研究和增强功能提供了跳板,可以进一步完善和优化系统。以下是未来工作可能会考虑的几个领域:

  1. 广泛的测试:有用的评分系统需要使用较大数据集进行严格的测试,其中包括评级和有用的反馈信息。理想情况下,这些数据集还应包括标记将商店识别为诚实或骗局的标签,以准确评估系统的有效性。

  2. 现实世界应用程序:未来的工作可能涉及在实际在线市场中实施有用的评级系统。这将为系统如何在现实世界环境中运行,用户对系统的响应及其对购买决策的影响提供宝贵的见解。

  3. 用户研究:了解用户的观点至关重要。未来的工作可能涉及进行调查或访谈以衡量用户对有用评级系统的理解,接受和信任。

  4. 系统增强功能:与任何系统一样,总有改进的余地。未来的工作可能会探索有用的评级系统的潜在增强功能。这可能包括将其他因素纳入评级,例如审阅者的声誉或审核发布以来的时间。

  5. 处理操纵尝试:鉴于骗子可能会设计一种方法来操纵新系统后,它成为主流,未来的工作可以探索潜在的对策。这可能涉及开发算法以检测“有用”投票的异常模式。

  6. 评估指标:未来的工作也可能涉及定义新指标以评估有用的评级系统。这些可能旨在衡量系统对操纵的抵抗,评级的准确性或对用户购买行为的影响。

我邀请读者了解相关数据集或有兴趣在未来的方向上合作以在评论部分中伸出或分享他们的想法。让我们一起工作,使在线购物更安全,更值得信赖!

结论ð

我们了解“有用的评级系统” 是通过提供用户反馈的整体评估来区分诚实供应商和骗子的强大工具。作为一名专门的数据分析师,我发现共享这些发现并将其打开以进行进一步讨论时发现了巨大的价值。本着这种精神,我热情鼓励您分享或参考这项研究。新的观点只能增强该系统,谁知道,它甚至可以帮助分析师(像我一样!)获得曝光并潜在地降落工作ð。

这里提供的见解很感兴趣吗?还有更多!当我继续完善该系统并研究新项目时,我邀请您加入我的旅程。您可以关注我的进度并在此处查看我的投资组合存储库

GitHub logo ranggakd / DAIly

一堆数据分析 +AI笔记本我几乎每天都在工作

DAIly

A bunch of Data Analysis and Artificial Intelligence notebooks 🤖 I'd worked on almost a daiLY basis 👨‍💻

Ideas

This directory might contain notes or outlines of potential data analysis or AI projects that I'm considering working on in the future. These might be in the form of brainstorming notebooks, rough outlines powerpoint of project ideas, or notes on interesting data sources or tools that I want to explore further

Goodbye Average Rating System Hello Helpful Rating System

通过考虑人们的反馈

重新定义平均评级系统

back to

提示

该目录可能包含更多实用信息,例如我发现对数据分析和AI工作有用的代码段或教程。这些可能是有关如何使用特定库或工具,如何预处理数据进行分析或如何处理常见数据分析或AI任务的技巧

Fantastic

让我们继续探索和创新!

ranggakd - Link in Bio & Creator Tools | Beacons

@ranggakd |中心详细信息摘要摘要哦,您好,我是一个程序员AI Tech Writer Data Suctioner数据实践者数学瘾君子开源贡献者量子计算爱好者详细信息中心。

favicon 信标

附录ð

在本节中,我们深入研究了一些初始概念,并尝试制定有用的评分系统。尽管他们没有完全达到目标,但他们提供了宝贵的见解和学习机会。它们代表曾经探索过的路径,仍然可以对未来的迭代或解决问题的替代方法保持诺言。必须考虑这些“失败”的尝试不是死胡同,而是将石头踏上更精致和强大的解决方案。创新之路经常被试验和错误铺平,每个人都带领我们更接近我们寻求的解决方案。

每个评论都包含以下内容:

功能 范围
ð´等级 [1,5] [1,2] [3,5]
ðº卖方回复 是或错误 false true
ð人发现这个有用的人 [0,n] [min,中位数1] [中位数,最大]

基于低(0) - 高(1)组类别的案例总组合:2*2*2 = 8

案例 ð´等级 ðº卖方回复 ¥¥的人发现这个有帮助的人
案例0ﶣ 低(0) 低(0) 低(0)
案例1︣ 低(0) 低(0) 高(1)
案例2ﶣ 低(0) 高(1) 低(0)
案例3ﶣ 低(0) 高(1) 高(1)
案例4ﶣ 高(1) 低(0) 低(0)
案例5ﶣ 高(1) 低(0) 高(1)
案例6ﶣ 高(1) 高(1) 低(0)
案例7ﶣ 高(1) 高(1) 高(1)

优先级:

🟥 People who find this helpful > 🔺 Seller reply > 🔴 Rating 

骗子滥用评级系统的可能模式:

案例 ¥¥的人发现这个有帮助的人 ðº卖方回复 ð´等级 解释
7 最坏的骗局:高评分(潜在的假),高卖家回复(可能试图控制叙事)和高帮助(其他支持评论的潜在骗子)
5 高评分(潜在的假),没有卖方答复(疏忽)和高帮助(其他支持评论的潜在骗子)
6 高评分(可能是假的),高卖家的回复(试图控制叙述),但较低的帮助(客户不同意)
4 骗局的最佳案例:高评分(可能是假货),没有卖方答复(过失)和低帮助的帮助(客户不同意)

可能的客户模式试图警告他人有关骗子的信息:

案例 ¥¥的人发现这个有帮助的人 ðº卖方回复 ð´等级 解释
3 最佳警告案件:低评级(突出服务差),高卖家答复(防御能力)和高帮助(客户同意评论)
1 低评级(突出服务差),没有卖方答复(过失)和高帮助(客户同意评论)
2 低评级(突出服务差),高销售商的答复(防御能力),但较低的帮助(客户不同意或未看过评论)
0 最糟糕的警告案件:低评级(突出服务差),没有卖方答复(过失)和低帮助的帮助(客户不同意或未看过评论)

来自此author's data的案例分布的示例数据:

案例 诚实的频率 骗局频率
#0 0 17
#1 0 96
#2 2 3
#3 1 13
#4 0 20
#5 0 17
#6 214 432
#7 22 6