报告题目:基于熵的特征选择方法研究 报 告 人:孙占全 时 间:2016年7月21日上午10:00 地 点:文理楼254 报告内容简介: 随着信息技术的飞速发展,各领域积累的数据集不论是在数量上还是特征变量数上都变得越来越大,这给很多机器学习方法的可扩展性和学习性能带来严重的问题。特征选择是高维数据降维的有效手段之一,也是机器学习领域的重要研究内容之一。本报告对基于熵的特征选择方法进行研究,包括有监督特征选择和无监督特征选择,并基于MapReduce技术,实现分布式的特征选择,可处理大规模数据,该方法用于大规模文本特征变量的选择。 报告人简介: 孙占全,男,博士,山东省计算中心(国家超级计算济南中心)副研究员,山东省电子政务大数据工程技术研究中心副主任,2007年博士毕业于中科院自动化所,毕业至今工作于山东省计算中心(国家超级计算济南中心),2011年到美国印第安纳大学伯明顿分校访学1年,主要研究方向大规模数据挖掘、云计算、智能交通等。主持参与科研项目10余项,发表学术论文60多篇,专著1本、授权发明专利4项,获济南市科技进步三等奖1项。 金沙8888js官方 2016-07-18 |