您的位置:首页 > 论文索引
基于已发现序列模式的序列聚类研究
作者:胡学钢1,张圆圆1,2? 日期:2008-01-28

 

(1.合肥工业大学 计算机与信息学院,安徽 合肥230009 2. 安徽电视台 技术办公室,安徽 合肥230066)

摘要:文章研究了利用序列模式的挖掘结果对序列数据库进行再发现的问题,提出一种利用已发现序列模式对数据库中的数据序列进行聚类的方法SPSC。该方法利用发现的序列模式定义了数据序列之间相似度函数和数据序列分组的平均值,使得经典聚类方法??k??-means可以应用于序列型数据,实现了对包含相似模式的数据序列进行聚类;理论分析和实验表明,与已有的序列聚类方法相比,该文所提出的方法不仅可以得到更加优化的聚类,而且效率更高。

关键词:数据挖掘; 序列模式; 聚类

中图分类号:TP182文献标识码:A文章编号:1003-5060(2008)01-0009-04

 

Clustering sequences  using sequential patterns

 

HU Xue-gang1,ZHANG Yuan-yuan12??

(1.School of Computer and Information,  Hefei University of Technology, Hefei 230009, China; 2.Department of Technology, Anhui Television, Hefei 230066, China)

Abstract:The paper deals with the problem of farther discovering in the sequence database on the basis of the results of sequential pattern mining, and a sequence clustering method using sequential patterns achieved is proposed. The definition of the similarity of data sequences and the mean of the data sequence cluster are given, so that the ??k??-means method can be applied to the sequence data and a set of high quality data sequence clusters with similar sequential patterns can be discovered. Theoretic analysis and experiments prove that the method not only generates optimal clusters but also exhibits good efficiency.

Key words:data mining; sequential pattern; cluster

 

     
 
 友情链接: 合肥工业大学 工大学报社会科学版        
 
 

Copyright © 2007 合肥工业大学学报社 All Right Reserved 地址:合肥工业大学三立苑三楼东
电话:0551-62905621 0551-62905638 62901306(自然科学版) 62901307(社会科学版)
Email:xbzk@hfut.edu.cn、xbsk@hfut.edu.cn