[1]易倩,滕少华,张巍.基于马氏距离的K均值聚类算法的入侵检测[J].江西师范大学学报(自然科学版),2012,(03):284-287.
 YI Qian,TENG Shao-hua,ZHANG Wei.Mahalanobis Distance-Based K-Means Clustering Algorithm for Intrusion Detection[J].,2012,(03):284-287.
点击复制

基于马氏距离的K均值聚类算法的入侵检测()
分享到:

《江西师范大学学报》(自然科学版)[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2012年03期
页码:
284-287
栏目:
出版日期:
2012-05-01

文章信息/Info

Title:
Mahalanobis Distance-Based K-Means Clustering Algorithm for Intrusion Detection
作者:
易倩;滕少华;张巍
广东工业大学计算机学院,广东广州510006
Author(s):
YI Qian TENG Shao-hua ZHANG Wei
关键词:
K 均值马氏距离聚类入侵检测
Keywords:
K-mean Mahalanobis distance clustering intrusion detection
分类号:
TP393.08
文献标志码:
A
摘要:
经典的 K 均值聚类算法是基于欧式距离的,它只适用于球形结构的聚类,而且在处理数据时不考虑变量之间的相关性和各变量的重要性差异.针对以上问题改进了 K 均值聚类算法,将马氏距离与 K 均值相结合,并在目标函数中增加变量权重因子和协方差矩阵调节因子,利用马氏距离优点有效地解决了 K 均值聚类算法的缺陷,最后通过实验证实了该方法的可行性和有效性
Abstract:
The classic K-means clustering algorithm is based on the Euclidean distance, it applies only to spherical structure clustering and in the processing of data without regard to the correlation between variables and differences in the importance of each variable. To solve the above problem, this paper propose a feasible clustering algorithm, it combines Mahalanobis distance with the K-means and adds a variable weighting factor and a regulating factor of covariance matrix to each class in the objective function. Using the advantage of Mahalanobis distance, it effectively solves the shortcomings of K-means clustering algorithm. Experimental results of date clustering illustrate its feasibility and effectiveness.

参考文献/References:

[1] 罗军生, 李永忠, 杜晓. 基于模糊C均值聚类算法的入侵检测 [J]. 计算机技术与发展, 2008, 18(1): 178-180.
[2] 陈媛媛, 屈志毅, 张恒龙, 等. 一种初值优化的K-均值文档聚类算法 [J]. 江西师范大学学报: 自然科学报, 2008, 32(2): 206-210.
[3] 田彦山. 基于山峰聚类的聚类上限确定方法 [J]. 江西师范大学学报: 自然科学报, 2007, 31(2): 134-137.
[4] 朱惠倩. 聚类分析的一种改进方法 [J]. 湖南文理学院学报: 自然科学版, 2005, 17(3): 7-9.
[5] Xiang Shiming, Nie Feiping, Zhang Changshui. Learing a mahalanobis distance metric for data clustering and classification [J]. Pattern Recognition, 2008, 42(12): 3600-3612.
[6] 吴香华, 牛生杰, 吴诚鸥, 等. 马氏距离聚类分析中协方差矩阵估算的改进 [J]. 数理统计与管理, 2011, 30(2): 240-245.
[7] 张翔, 王士同. 一种基于马氏距离的可能性聚类方法 [J]. 数据采集与处理, 2011, 23(8): 86-88.
[8] 王晓峰, 沈庆浩. 利用聚类算法找出新的攻击 [J]. 华东理工大学学报: 自然科学版, 2004, 30(3): 288-291.
[9] 张尧庭, 方开泰. 多元统计分析引论 [M]. 北京: 科学出版社, 1982.
[10] KDD99 Cup Dataset [EB/OL].
[2011-12-11]. http: //kdd. ics. uci. edu/databases/ kddcup99/kddcup99.html.
[11] Mukkamala S, Janoski G, Sung A H. Intrusion detection using suppoa vector machines and neural networks [EB/OL].
[2011-12- 20]. http: //www. cs. uiuc. edu/class/fa05/cs591han/papers/mukk CNN02.pdf.
[12] Han Jiawei, Micheline Kambe. 数据挖掘概念与技术 [M]. 2版. 北京: 机械工业出版社, 2006: 252-264.

更新日期/Last Update: 1900-01-01