读书人

序列形式挖掘

发布时间: 2012-06-26 10:04:13 作者: rapoo

序列模式挖掘

?

library(arulesSequences) data(zaki) s1 <- cspade(zaki, parameter = list(support = 0.4), control   = list(verbose = TRUE)) summary(s1) as(s1, "data.frame") s2 <- cspade(zaki, parameter = list(support = 0.4, maxwin = 5)) as(s2, "data.frame")

第2行导入数据库zaki,它的结构类似于图1所示的那种序列-事件集,第3行设定最小支持度为0.4,并用无约束的SPADE算法搜索频繁序列模式,第6行引入了时间窗的限制,用cSPADE算法进行搜索。整个过程十分简洁明了。

更多使用的例子可在R的终端用?cspade命令查看。

参考文献:
Sequence Mining in Categorical Domains: Incorporating Constraints, Mohammed J. Zaki, 2000 ACM

?

1 楼 zangwenyang 2011-12-20 常见的序列模式挖掘算法
1GSP算法
2prefixspan
3disc-all
4exante

读书人网 >开源软件

热点推荐