基于用户行为序列模式的性别分析与预测
- 文章编号:
- 2096-1618(2016)增-0007-04
- 摘要:
- 为了分析手机用户访问站点的行为与用户的性别特征的关系,通过分析处理手机用户访问站点的行为的历史数据,将用户的行为数据转化为序列的形式计算用户之间的相似度,并使用改进的编辑距离的k近邻序列分类算法完成性别的预测。结果表明采用序列的形式对行为数据进行处理均可以提高男女性别预测的准确率和召回率,从而证明手机用户访问站点的行为具有性别的特征。
参考文献/References:
[1] M. Deshpande and G. Karypis. Evaluation of techniques for classifying biological sequences[A]. In PAKDD'02: Proceedings of the 6th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining,2002:417–431.
[2] T Lane,C E Brodley.Temporal sequence learning and data reduction for anomaly detection[J].ACM Trans.Inf.Syst.Secur.,1999,2(3):295–331.
[3] 苏晨. 基于维基百科知识的文本分类技术研究[D]. 咸阳:西北农林科技大学, 2013.
[4] 徐璘俊. 智能分类算法在银行客户洗钱风险评估中的应用研究[D]. 浙江:浙江大学, 2010.
[5] 王金龙. 全局和局部相结合的数据挖掘方法及应用研究[D].杭州:浙江大学, 2007.
[6] E.J.Keogh and M.J.Pazzani.Scaling up dynamic time warping for datamining applications. In KDD'00: Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining,2000:285-289.
[7] 孙磊. 健康管理中时序数据挖掘相关问题研究与应用[D]. 北京:清华大学, 2012.
[8] Pavel P Kuksa. Biological sequence analysis with multivariate string kernels[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2013.
[9] 车高营, 张磊, 张禄旭. 基于序列模式的用户浏览行为提取与分析[J]. 计算机技术与发展, 2012,(9):9-12.
[10] Shasha Z D. Simple Fast Algorithms for the Editing Distance Between Trees and Related Problems[J]. Siam Journal on Computing, 1989, 18(6):1245-1262.
[11] Campana S E.Accuracy,precision and quality control in age determination,including a review of the use and abuse of age validation methods[J].Journal of FishBiology,2001,59(2):197-242.
[12] 王映龙, 杨炳儒, 宋泽锋,等. 基因序列相似程度的LCS算法研究[J]. 计算机工程与应用, 2007, 43(31):45-47.
[13] 罗俊勤. 大众行为下社会网络的服务推荐研究[D]. 广州:华南理工大学, 2012.
[14] 刘春, 梁光磊, 谭国平. 基于用户兴趣变化融合的个性化推荐模型[J]. 计算机工程与设计, 2013, 34(8):2944-2950.
[15] 贺露. 基于社交网络的用户性格与行为分析[D]. 北京:北京邮电大学, 2014.
相似文献/References:
[1]黄冠英,郑皎凌.基于变长隐马尔科夫模型的维基词条编辑微过程挖掘[J].成都信息工程大学学报,2018,(01):34.[doi:10.16836/j.cnki.jcuit.2018.01.007]
HUANG Guan-ying,ZHENG Jiao-ling.Wikipedia Entries Editing Micro-process Mining based onVariable Length Hidden Markov Model[J].Journal of Chengdu University of Information Technology,2018,(增刊1):34.[doi:10.16836/j.cnki.jcuit.2018.01.007]
[2]陈胜娣,何冰倩,陈思宇,等.基于时空兴趣点的人体动作识别[J].成都信息工程大学学报,2018,(02):143.[doi:10.16836/j.cnki.jcuit.2018.02.007]
CHEN Sheng-di,HE Bing-qian,CHEN Si-yu,et al.Human Action Recognition based on Spatio-Temporal Interest Point[J].Journal of Chengdu University of Information Technology,2018,(增刊1):143.[doi:10.16836/j.cnki.jcuit.2018.02.007]
[3]赵锦阳,卢会国,蒋娟萍,等.基于改进决策树的故障诊断方法研究[J].成都信息工程大学学报,2018,(06):624.[doi:10.16836/j.cnki.jcuit.2018.06.005]
ZHAO Jin-yang,LU Hui-guo,JIANG Juan-ping,et al.Research on Fault Diagnosis Method based on Improved Decision Tree[J].Journal of Chengdu University of Information Technology,2018,(增刊1):624.[doi:10.16836/j.cnki.jcuit.2018.06.005]
[4]冯丽君,王 燮,王小东.基于FAHP的气象仿真服务逼真度评价研究[J].成都信息工程大学学报,2016,(02):168.
FENG Li-jun,WANG Xie,WANG Xiao-dong.Evaluation of Meteorological Simulation Service Fidelity based on Fuzzy AHP[J].Journal of Chengdu University of Information Technology,2016,(增刊1):168.
[5]李宝林,周 坤,李仕伟.一种基于M-Bisearch的最大频繁项集挖掘算法研究[J].成都信息工程大学学报,2016,(05):463.
LI Bao-lin,ZHOU Kun,LI Shi-wei.Research on Mining Algorithm of Maximal Frequent Itemsets based on M-blsearch[J].Journal of Chengdu University of Information Technology,2016,(增刊1):463.
[6]杨 頔,文成玉.结合关联规则的情感分析模型研究[J].成都信息工程大学学报,2019,(05):501.[doi:10.16836/j.cnki.jcuit.2019.05.011]
YANG Di,WEN Chengyu.Research on Emotional Analysis Model based on Association Rules[J].Journal of Chengdu University of Information Technology,2019,(增刊1):501.[doi:10.16836/j.cnki.jcuit.2019.05.011]
备注/Memo
收稿日期:2015-07-30 基金项目:成都信息工程大学引进人才启动科研资助项目(KYTZ 201323)