欧宝平台登录:Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘

发布时间:2022-08-26 18:13:42 来源:欧宝体育直播nba 作者:欧宝体育手机版app直播

  原标题:Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘

  作为数据挖掘的一个重要研究方向—关联规则用于发现数据项之间隐含的深层次的关联,如Apriori模型可以通过对客户需求进行深入的分析来发现数据之间的潜在联系,为我们提供自动决策支持。

  关联规则是数据挖掘算法中主要技术之一,是在无指导学习系统中挖掘本地模式的最普便形式。在数据挖掘中,常见的关联规则挖掘模型有AIS、SETM、Apriori、DHP、MLT2L1、ML-TML1等。其中,Apriori算法是一种最有影响的挖掘关联规则频繁项集的模型。

  Apriori算法通过多次扫描事务数据库来产生频繁项目集,我们称这种方法为逐层搜索迭代法。具体地说,该算法的基本思想是通过对数据库的多次扫描来发现所有的频繁项集。首先第1遍扫描事务数据库生成频繁1项集,记为L1;然后基于L1第2遍扫描事务数据库生成频繁2项集,记为L2;依此迭代,基于L(k-1)第k遍扫描事务数据库生成频繁k项集,记为Lk。在后续的扫描中,首先以前一次所发现的所有频繁项集为基础,生成所有新的候选项集(Candidate Item sets),然后扫描数据库,计算这些候选项集的支持度,最后确定候选项集中哪些可成为频繁项集。重复上述过程直到再也产生不出新的频繁项集。

  由此可见,Apriori算法是一种通过多次扫描事务数据库统计不同项的发生次数,以此来抽取频繁模式的过程。由于Apriori算法需要大量扫描事务数据库,因此利用Apriori算法的相关性质对其进行搜索空间压缩。

  Apriori算法的性质如下:频繁项集中的所有非空子集也是频繁的。该属性可以通过如下方式证明:若A是非频繁的,那么集合A∪B也是非频繁的,即构成集合的子集是非频繁的,则该集合也是非频繁项集。Apriori算法的这一属性为反单调性,在实际挖掘过程中,如果一个集合不能通过测试,那么它的所有超集也都不能通过相同的测试。基于此,我们通过“连接”操作由现有频繁项集构造超集,通过“剪枝”操作过滤掉不能通过测试的超集,从而压缩下一次迭代的系统开销。

  为了验证Apriori模型在DSS数据挖掘中应用的可行性,本文在Spss Modeler软件平台上对Apriori模型进行仿真。实验数据为某超市的DSS系统中的顾客及购买商品数据。数据包括1000条购买事务记录,每条购买事务记录中包含两大部分内容:第一部分是顾客的个人信息,主要变量有会员卡号、消费金额、支付方式、性别、年龄、收入等;第二部分是顾客一次购买商品的信息,主要变量有果蔬、鲜肉、奶制品等,均为二分类型变量,取值T表示购买,F表示未购买,下表为部分顾客购买数据。本文结合Apriori模型分析DSS中的顾客信息及购买数据分析哪些商品最有可能同时购买。

  本文分别用Apriori算法和Carma算法对数据进行处理挖掘,具体结果如下所示。

  采用了46243条顾客在超市购买的数据进行分析,涉及意大利面、牛奶、水、面包饼干、咖啡、奶油蛋糕、酸奶、冷藏蔬菜、金枪鱼、啤酒、番茄酱、可乐、大米、果汁、咸饼干、油、冰冻鱼、冰淇淋、奶酪、罐装肉多种商品,如果顾客购买了该商品,则记为1,如果没有购买该商品,则记为0。

  虽然 Apriori 算法可以直接挖掘生成表中的交易数据集,但是为了关联挖掘其他算法的需要先把交易数据集转换成分析数据集。

  通过格式转换,发现数据源有二十种商品,设最低条件支持度为15%,最小规则置信度为30%,最大前项数为5,选择专家模式,挖掘出大类商品的15条关联规则,如图所示。生成的15条规则如下所示:

  通过Spss Modeler使用Apriori模型对某超市DSS数据的分析,实验结果如表所示,实验产生了三条置信度和支持度最高的关联规则:分别为啤酒和罐头蔬菜→冷冻食品(S=14.6%,C=87.4%);啤酒和冷冻食品→罐头蔬菜(S=14.6%,C=85.9%);冷冻食品和罐头蔬菜→啤酒(S=14.6%,C=84.4%)。同时,三条关联规则的提升值都可以接受。因此,啤酒、罐头蔬菜、冷冻食品是最可能连带销售的商品。因此,在实际销售或者在商品的摆放过程中,可以将这些商品进行捆绑销售。

  同时,本实验结果的商品销售关系网状图如图所示,表明了顾客可能同时购买的所有商品之间的联系,其中网状图中的不同点分别代表着不同的商品,点与点之间的连线代表着同时被顾客购买的联系。通过设定商品同时出售的频数的阈值,可以得到一些顾客同时购买机率较大的商品。可以看到,网状图的结论与Apriori模型挖掘的关联规则结论是一致的。

  然后,本文对不同性别、年龄的顾客购买的商品之间的销售关系进行了Apriori模型的关联规则挖掘。实验结果如表所示,其中性别与购买商品的联系如图所示,(a)为不同性别顾客可能同时购买的所有商品之间的联系,其中网状图上方的两个点F、M分别代表着男性顾客与女性顾客,网状图下方的点分别代表不同的商品,点与点之间的连线代表着购买关系。通过设定商品同时出售的频数的阈值,可以得到不同性别的顾客同时购买的概率比较大的商品(b)。由图可知,男性最有可能同时购买饮料、牛奶、罐头蔬菜、甜食、冷冻熟食、果熟等商品,而女性则最有可能同时购买饮料、甜食、牛奶、罐头蔬菜等,因此,商家在推销其商品时可以针对不同性别的顾客制定不同的营销策略。

  分析及建议: 通过图可以清晰的看到购买牛奶、意大利面、水、咖啡的顾客比较多,建议超市可以加大对这些商品的采购,由上述结果可知,同时购买牛奶、意大利面的情况占总订单数的46.132%,水和牛奶或意大利面和水分别占总订单数的27.851%,购买牛奶的人有45.855%会购买意大利面,46.704%的人会购买水,购买意大利面的人有34.824%会购买牛奶,有34.296%的人会购买水,由此可见,意大利面、水、牛奶这三种商品关联度较高,可以将意大利面、水、牛奶摆放在一块,从而增加销量。此外,在符合支持度和置信度的条件下没有顾客购买冷冻食、果汁等,建议有关人员减少这几种商品的进货量,但为了保持商品的多样性,还是要适当地进货。

  该实验数据仍采用上述数据,商品种类涵盖意大利面、牛奶、水、面包饼干、咖啡、奶油蛋糕、酸奶、冷藏蔬菜、金枪鱼、啤酒、番茄酱、可乐、大米、果汁、咸饼干、油、冰冻鱼、冰淇淋、奶酪、罐装肉,如果顾客购买了该商品,则记为T,如果没有购买该商品,则记为F。将Carma节点最小支持度设为7.0%,最小置信度设为15.0%,大小规则为5,Carma算法数据流如图3所示,由其生成的商品关联规则所示。生成16条规则如下所示:

  分析及建议: 通过上述规则可以清晰的看到顾客同时购买牛奶、意大利面、水、饼干的比较多,建议超市可以将这些商品放在同一货架上进行销售。Carma算法所得结果相比Apriori算法略有不同,它比Apriori算法更加精准。商家可以多进牛奶、意大利面、水、酸奶、奶油蛋糕、饼干等商品,而对于冰冻食品,则可以减少进货量。

  数据挖掘所得到的信息资源无论是对于企业的管理人员还是员工来说都是十分有价值的,它使企业能够充分利用现有的信息资源,在激烈的社会竞争中取得区别于其他企业的独特优势。本文使用关联规则算法中的Apriori模型对企业DSS数据进行关联规则挖掘,首先详细说明了Apriori模型的具体原理和实施步骤,然后,通过实例研究和对实验结果的分析,进一步明确了数据挖掘技术在以客户为中心的电子商务时代扮演着越来越重要的角色,随着数据挖掘理论的进一步发展和深化,必然会带给DSS更为广泛的应用前景和市场价值,同时提高企业的竞争力。

  2.R语言绘制生存曲线估计生存分析如何R作生存曲线.用关联规则数据挖掘探索药物配伍中的规律

上一篇:数据科学与大数据技术专业课程有哪些?需求职业前景就业方向
下一篇:常见的打卡渠道都被微信点名 年轻人为啥喜爱“打卡”

相关信息

  • 常见的打卡渠道都被微信点名 年轻人为啥喜爱“打卡”

    常见的打卡渠道都被微信点名 年轻人为啥喜爱“打卡”

    微信安全中心发布关于威逼共享朋友圈打卡的处理公告,常见的打卡渠道都被点名。依据标准,“微信制止经过利益引诱,诱导用户共享、传达外链内容或许微信大众帐号文章。”比方咱们常见的朋友圈打卡99天返膏火,以及朋友圈共享某文章能够收取现金等都归于被禁的领域。 当然,返现、赚取奖品是许多广告主诱导共享的办法。学员为了获取奖赏而自动共享也是一大原因。微信朋友圈的共享是一种简直零本钱、功率却极高的传达手法。但自动帮商家“达到营销行为”和初始朴实的“呈现自我”行为发生了新的对立,终究,很少有人真的愿意在朋友圈建立“为了100元,我做什么都能够”的人设。“打卡文明”背面终究躲藏了什么? 狭义来讲,微信朋友圈呈现的“学习类打卡”首要包含英语单词打卡、阅览打卡、白话打卡等。但广义来说,网红景点打卡、展览馆打卡、健身房打卡等“地址类打卡”,以群内报到为主的“报到类打卡”,都属打卡文明的领域。使用打卡催促本身、构建形象、记载成果逐步成为年轻人打卡的重要动力。 美国传达学家戈夫曼以为,人际传达的本质是人们使用符号进行自我扮演的进程。在人际交互中,咱们每一个人都依照必定的人物要求在舞
  • 大国点名没你不可!第七次人口普查可网上自主填写流程攻略看这儿!

    大国点名没你不可!第七次人口普查可网上自主填写流程攻略看这儿!

    原标题:大国点名,没你不可!第七次人口普查可网上自主填写,流程攻略看这儿! 第七次全国人口普查是新时代一次严重国情国力查询,与每一位公民休戚相关,普查数据将为完善基础设施、公共服务供应、社会保证体系供给重要参阅根据。 第七次全国人口普查了解作业于10月11日开端进行,到时居委和普查员会到您家中入户挂号寓居人员信息,请您提早准备好户口本(身份证),假如您想防止入户打扰,您能够带上手机和户口本(身份证)到寓居地居委会进行填写挂号,到时普查员会生成一个自主申报二维码,您只需要扫描二维码填写自己及家庭成员的普查信息,填写截止至11月5日。 第七次全国人口普查现已开端,与往次普查作业比较,第七次全国人口普查作业除了将全面选用电子设备收集并联网实时上报普查数据外,初次倡议普查目标挑选经过互联网自主填写的方法,东漖街鼓舞我们运用微信小程序在手机等移动终端自主填写个人和家庭信息。 据悉,“自主填写”是此次人口普查新推出的一种挂号信息的方式,即经过住户的自行填写获取相关人口普查数据,以削减数据在传输和交流过程中的少登、漏登和丢掉等状况,保证数据的正确和保密性。
  • 微信点名钉钉、腾讯朋友拉取联系链、诱导下载等违规行为

    微信点名钉钉、腾讯朋友拉取联系链、诱导下载等违规行为

    微信发布近期渠道违规公示,部分第三方 App经过共享等行为,涉嫌拉取微信联系链、涉嫌诱导下载,对用户隐私安全形成了要挟,微信已依据渠道规矩进行“强提示”,需求跳转拜访。 公告,上述违规行为中,触及腾讯朋友、钉钉等运用,“健康码”的拜访不受影响。 微信表明,关于此类违规链接,微信内仍然能够进行正常的展现和发送,但出于安全原因不再做直接跳转,用户可经过 “仿制链接在浏览器中翻开” 的办法进行拜访。 近期,经用户投诉和渠道主动发现,有第三方App经过拉群、共享等涉嫌获取微信联系链的办法,来微信“串门”。在用户不知情的状况下,用户隐私信息或许就走漏了。 微信一直对联系链隐私进行严厉维护。依据《微信外部链接内容管理规范》,关于此类链接,微信内仍然能够正常的展现和发送,但依据安全原因不支撑直接跳转,用户能够经过“仿制链接在浏览器中翻开”的办法拜访此类 App 。 正值疫情期间复工复产的机遇,这些 App 完全能够在自身体系内为用户供给服务,微信也支撑契合规范的第三方 App 为用户继续供给优质服务,为咱们护航。 除了上面提到的,还有一
  • 职业速报  餐饮支撑方针来了!7位国际大厨为援鄂医护研制14套养分餐、小程序奶茶订单暴升744%!

    职业速报  餐饮支撑方针来了!7位国际大厨为援鄂医护研制14套养分餐、小程序奶茶订单暴升744%!

    原标题:职业速报 餐饮支撑方针来了!7位国际大厨为援鄂医护研制14套养分餐、小程序奶茶订单暴升744%! 海外疫情日趋严峻,据世卫安排3月23日发布的最新数据,到中部欧洲时刻23日10时,全球确诊病例共332930例。受疫情影响,国际奥委会泄漏,2020年东京奥运会或将推延至2021年。 相较国外,国内状况现已好转,首要谨防境外输入,各援鄂医疗队也连续回家。餐饮职业内近期也热门事情频发。 这两天,上海援鄂医疗队队员在圆满完成各项医疗救治使命后连续回到上海,不过,他们暂时还不能与家人聚会,需要在酒店阻隔休整14天。 医疗队凯旋归来,阻隔期间由锦江国际牵头确保食宿,七位国际级大厨精心研制14套养分餐,送上“春天的滋味”。 网友爆出一份上海援鄂医疗队返沪的阻隔菜单:红酒炖牛排、雪汁豆腐鱼、宫保鹅肝、蟹肉锅贴、粢饭糕……中餐西餐、日料韩料、小吃甜品顿顿不重样、天天有惊喜,近邻小孩都馋哭了!!! 各地援鄂医疗队连续回家,没有什么能比和家人从头聚在一起安安心心吃一顿团圆饭更适意更美好了。 3月24日,商务部办公厅、国家开展变

手机扫一扫添加微信