[1]徐雄飞,徐凡,王明文,等.中文微博句子倾向性分类中特征抽取研究[J].江西师范大学学报(自然科学版),2015,(03):290-296.
 XU Xiongfei,XU Fan,WANG Mingwen,et al.The Research on Feature Extraction of Polarity Classification of Chinese Micro Blogging[J].,2015,(03):290-296.
点击复制

中文微博句子倾向性分类中特征抽取研究()
分享到:

《江西师范大学学报》(自然科学版)[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2015年03期
页码:
290-296
栏目:
出版日期:
2015-05-31

文章信息/Info

Title:
The Research on Feature Extraction of Polarity Classification of Chinese Micro Blogging
作者:
徐雄飞;徐凡;王明文;左家莉;罗文兵
江西师范大学计算机信息工程学院,江西 南昌 330022
Author(s):
XU XiongfeiXU FanWANG MingwenZUO JialiLUO Wenbing
关键词:
中文微博 句子倾向性 特征抽取 分类
Keywords:
Chinese micro blogging sentence polarity feature extraction classification
分类号:
TP 391
文献标志码:
A
摘要:
针对中文微博句子倾向性分类问题,在充分降低由于情感词典的扩充工作带来系统开销的基础上,抽取了中文微博句子中标点符号、情感词权重、词汇级和句法级等新型平面和结构化特征,探索了有效的特征选择方法.在基准COAE和NLP&CC中文微博语料上进行双向交叉和独立实验,并研究了有效的不平衡性语料的处理方法.实验结果表明:采用该文提出的特征后,中文微博句子倾向性分类的性能得到显著提升.
Abstract:
According to Chinese micro blogging sentence polarity identification problem,while fully reducing due to the emotional lexicon expansion work brought on the basis of system overhead,many novel flat and structural features,e.g.punctuation,sentiment word weighting,lexical and syntactic level information,from Chinese micro blogging,together with the effective feature selection method has been extracted.In-depth bidirectional and independent experiments on both COAE and NLP&CC,along with the effective imbalance corpus handling method has been conducted.Evaluation results show that the effectiveness of our novel features.Its also show that the model significantly outperforms existing model currently in the research field.

参考文献/References:

[1] 陈晨,王厚峰.中文跨文本人名同名同指消解研究 [J].江西师范大学学报:自然科学版,2015,39(2):111-116.
[2] 钱鹏,黄萱菁.中国古诗统计建模与宏观分析 [J].江西师范大学学报:自然科学版,2015,39(2):117-123.
[3] 周胜臣,瞿文婷,石英子,等.中文微博情感分析研究综述 [J].计算机应用与软件,2013,30(3):161-164.
[4] 张艳辉,杜文韬,刘培玉,等.基于词典的微博的倾向性分析 [C].第5届中文倾向性分析评测研讨会,2013:50-52.
[5] 李岩,徐蔚然,陈光.PRIS_COAE COAE2013评测报告 [C].第5届中文倾向性分析评测研讨会,2013:53-69.
[6] 王文远,王大玲,冯时,等.一种面向情感分析的微博表情情感词典构建及应用 [J].计算机与数字工程,2012,40(11):6-9.
[7] 王勇,吕学强,姬连春,等.基于极性词典的中文微博客情感分类 [J].计算机应用与软件,2014,31(1):34-37.
[8] 谢丽星,周明,孙茂松.基于层次结构的多策略中文微博情感分析和特征抽取 [J].中文信息学报,2012,26(1):73-83.
[9] 罗凌,陈毅东,曹茂元.微博观点句识别的话题影响研究 [J].电脑知识与技术,2014,10(1):123-127.
[10] 戴敏,庞磊,李寿山.基于机器学习方法的中文微博情感分类方法研究 [J].语文研究与创作,2011(15):1-13.
[11] 杜振雷,张仰森,李文坤,等.基于多特征融合的中文微博情感分类方法研究 [C].第5届中文倾向性分析评测研讨会,2013:44-49.
[12] 刘志广,董喜双,关毅.中文微博情感倾向性研究 [C].第5届中文倾向性分析评测研讨会,2013:81-87.
[13] 朱艳辉,杜锐,鲁琳,等.中文文本情感分析与比较句的识别研究 [C].第5届中文倾向性分析评测研讨会,2013:34-43.
[14] 徐琳宏,林鸿飞,潘宇,等.情感词汇本体的构造 [J].情报学报,2008,27(2):180-185.
[15] Caruana R,Freitag D.Greedy attribute selection [C].Proceedings of the 11th International Conference on Machine Learning,1994:28-36.
[16] Li Shoushan,Xia Rui,Zong Chengqing,et al.A framework of feature selection methods for text categorization [C].Proceedings of the ACL-IJCNLP,2009:692-700.
[17] Chang Chih-Chung,Lin Chih-Jen.LIBSVM: a library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology(TIST),2011,2(3): 27.

备注/Memo

备注/Memo:
国家自然科学基金(61272212,61163006,61203313,61365002,61462045)
更新日期/Last Update: 1900-01-01