加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据挖掘中的模式发现(五)挖掘多样频繁模式

发布时间:2020-12-24 20:06:14 所属栏目:大数据 来源:网络整理
导读:挖掘多层次的关联规则(Mining Multi-Level Associations) 定义 项经常形成层次。 如图所示 那么我们可以根据项的细化分类得到更多有趣的模式,发现更多细节的特性。 Level-reduced min-support 使用的是Level-reduced min-support方法来设置最低支持度,即,

s(x)是给出了X的所有项统计独立的概率估计。如果它的支持度小于使用统计独立性假设计算出的期望支持度。s(X)越小,模式就越负相关。简单来说,就是这两个事件不太会同时发生。

基于Kulczynski测量的定义

如果两个项集A和B,有如下关系

P(A|B)+P(B+A)2<?

则称其为负相关。(其中 ? 是人为设置的负相关的阈值)

负相关关联规则

规则 X→Y 是负相关的,如果

s(X∪Y)<s(X)s(Y)

其中 X∩Y=? ,这里定义的X和Y中的项的负相关部分条件,负相关的完全条件为

s(X∩Y)<∏is(xi)∏js(yj)

其中 xi∈X yi∈Y 。因为X或Y中的项通常是正相关的,因此使用部分条件而不是完全条件来定义负相关关联规则更实际。如规则

眼镜,镜头清洁剂→隐形眼镜,盐溶液

是负相关的,但是其中项集内的项之间是负相关的,眼镜盒镜头清洁剂是负相关的,如果使用完全条件,可能就不能发现该规则了。

负相关条件也可以用正项集和负项集的支持度表示

s(X∪Y)?s(X)s(Y)=s(X∪Y)?[s(X∪Y)+s(X∪Yˉˉˉ)][s(X∪Y)+s(Xˉˉˉ∪Y)]=s(X∪Y)s(Xˉˉˉ∪Yˉˉˉ)?s(X∪Yˉˉˉ)s(Xˉˉˉ∪Y)

可以得到负相关的条件为

s(X∪Y)s(Xˉˉˉ∪Yˉˉˉ)<s(X∪Yˉˉˉ)s(Xˉˉˉ∪Y)

负相关项集和负相关关联规则统称为负相关模式(negatively correlated pattern)。

挖掘压缩模式(Mining Compressed Patterns)

我们在进行数据挖掘的时候,会发现大量的模式,但是其中有不少的模式会有一些相似的地方,所以你得出这些规则并没有太多的意义。

图3

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读