[1]郑立山,滕少华.改进的页面与时间阈值的会话识别法[J].江西师范大学学报(自然科学版),2012,(04):395-398.
 ZHENG Li-shan,TENG Shao-hua.Improved Method of Session Identification Based on Page and Time Threshold[J].,2012,(04):395-398.
点击复制

改进的页面与时间阈值的会话识别法()
分享到:

《江西师范大学学报》(自然科学版)[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2012年04期
页码:
395-398
栏目:
出版日期:
2012-08-01

文章信息/Info

Title:
Improved Method of Session Identification Based on Page and Time Threshold
作者:
郑立山;滕少华
广东工业大学计算机学院, 广东 广州 510006
Author(s):
ZHENG Li-shan TENG Shao-hua
关键词:
Web日志挖掘数据预处理用户会话识别动态阈值
Keywords:
Web mining data preprocessing user session identification dynamic threshold
分类号:
TP301
文献标志码:
A
摘要:
在常用的计算时间阈值识别方法的基础上,提出了一种改进的基于 URL 页面类型、页面信息量和访问时间的平均阈值识别方法.针对不同的页面类型采用不同的阈值计算方法设置时间阈值,相对于已有的对所有用户页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高.
Abstract:
Based on the commonly used method of computing time threshold method, an improved method of session identification which based on page type, page size, visiting time is brought forward. For different page types, different threshold calculation methods are used to set the time threshold. Relative to the existing use of a single priori threshold and current dynamic threshold computing method, the method can give more realistic reflection of the session situation and the accuracy has been greatly improved.

参考文献/References:

[1] 蔡浩, 贾宇波, 黄程伟. Web日志挖掘中的会话识别算法 [J]. 计算机工程与设计, 2009, 30(6): 1321-1323.
[2] 方元康, 胡学钢, 夏启寿. Web日志预处理中优化的会话识别方法 [J]. 计算机工程, 2009, 35(7): 47-51.
[3] 殷贤亮, 张为. Web使用挖掘中的一种改进的会话识别方法 [J]. 华中科技大学学报: 自然科学版, 2006, 34(7): 33-35.
[4] 周爱武, 程博. Web日志挖掘中的会话识别方法 [J]. 计算机工程与设计, 2010, 31(5): 936-938.
[5] 李燕, 冯博琴. Web日志挖掘中的数据预处理技术 [J]. 计算机工程, 2009, 35(22): 44-49.
[6] 范纯龙, 姜宏飞. 利用图片类日志信息改进会话识别质量 [J]. 计算机应用, 2010, 30(4): 1056-1058.
[7] 杨富华. 网络日志预处理中优化的会话识别算法 [J]. 计算机仿真, 2011, 28(4): 123-125.
[8] 方元康, 王汝传. 优化的Web日志会话识别方法 [J]. 计算机工程与设计, 2009, 30(7): 1688-1690.
[9] Spiliopoulou M, Mobasher B, Berendt B, et al. A framework for the evaluation of session reconstruction heuristics in web usage analysis [J]. Informs Journal of Computing, 2003, 15(2): 171-179.
[10] Facca F M, Lanzi P L. Mining interesting knowledge from web logs: a survey [J]. Data and Knowledge Engineering, 2005, 53(3): 225-241.
[11] Sucitanek F M, Ifrim G, Gerhard W, et al. Combining linguistic and statistical analysis to extract relations from Web documents [C]. New York: ACM, 2006: 712-717.
[12] He Xinhua, Wang Qiong. Dynamic timeout-based a session identification algorithm [EB/OL].
[2012-01-12].http://ieeexplore.ieee. org/xpl/article Details.jsp?arnumber=5777587.

更新日期/Last Update: 1900-01-01