闵帆,博士、教授、博导,机器学习研究中心主任,SCI B类期刊IJAR副主编,四川省学术技术带头人后备人选,CAAI粒计算与知识发现专委会常委。完成国家自然科学基金面上项目一项。发表SCI收录论文40余篇,其中5篇被引过百。为二十几余个SCI期刊审稿。研究兴趣包括代价敏感学习、推荐系统、主动学习、油田大数据等。
一、 国家自然科学基金面上项目《代价敏感学习的粗糙集方法》
粗糙集理论作为数据挖掘的重要分支,需要多层次、多角度的扩展,以满足不同应用的需求。本项目考虑测试代价、误分类代价、教师代价、时间代价,从数据模型、计算模型、问题、算法四个层次,建立了代价敏感粗糙集理论与方法。主要研究内容包括:1)代价敏感属性约简;2)代价敏感推荐系统;3)代价敏感主动学习;4)离散化、名词型属性值分组等泛化约简。通过解决其中的关键问题,建立代价敏感粗糙集理论体系,针对具体问题设计出高性能算法,为实际应用提供高效率、低成本、低风险的数据挖掘方案。
基于该项目成果,已发表SCI 收录期刊论文 30 篇(2篇为 ESI 高被引论文),CSCD中文期刊论文 6 篇。论文开源程序网址为: fansmale.com/software.html与github.com/fansmale.
二、 高被引论文及热点论文
[1] 闵帆, 何华平, 钱宇华, 祝峰, Test-cost-sensitive attribute reduction, Information Sciences, 181(22), pp. 4928-4942, 2011. ESI, 被引279次(首次提出“代价敏感约简”)
[2] 张恒汝, 闵帆, Three-way recommender systems based on random forests, Knowledge-Based Systems 91 (2016) 275–286. ESI,被引153次(首次提出“三支推荐系统”)
[3] 闵帆, 胡清华, 祝峰, Feature selection with test cost constraint, International Journal of Approximate Reasoning 55 (1) (2014), 167-179. ESI, 被引140次
[4] 闵帆, 祝峰, Attribute reduction of data with error ranges and test costs, Information Sciences 211 (2012) 48–67. ESI, 被引125次
[5] 闵帆, 刘启和, A hierarchical model for test-cost-sensitive decision systems, Information Sciences 179 (2009) 2442–2452. ESI, 被引113次
[6] 张恒汝, 闵帆, 石兵, Regression-based three-way recommendation, Information Sciences 378 (2017) 444–461. ESI, 被引85次
[7] 闵帆, 张智恒,翟文杰, 沈蓉萍. Frequent pattern discovery with tri-partition alphabets. Information Sciences. 热点论文, 被引39次(首次提出“三分模式挖掘”)
三、 近期主要工作
1、提出了代价敏感三支推荐系统的概念,在推荐、不推荐两种选择基础上,增加了促销(即发优惠券)选项,获得了更适合商业场景的推荐算法。
图1 基于随机森林的代价敏感推荐系统
2、提出了三支主动学习的概念,通过用户与系统多次交互,在减少标签需求量的同时,保证了分类算法的性能,也获得了标记代价与误分类代价良好的折衷。
图2 代价敏感三支主动学习
3、提出了三分模式挖掘的概念,使用强、中、弱字符,开发的算法在文本挖掘、时序分析、生物序列分析方面都有很好的结果。
图3 三分模式挖掘
4、将情感分析与矩阵分解相结合,根据用户评论数据、用户评分数据,挖掘用户的偏好,获得了更为准确的结果。
图4 融合情感分析与矩阵分解推荐系统