首页 推荐 图说视频经济公司金融专栏智库人文活动中经实时报
深兰科技荣获IEEE ISI冠军,推动AutoML对于复杂场景的适应性进展
2019-07-02 17:29 来源:搜狐

近日,IEEE ISI 2019国际大数据分析竞赛结果出炉,深兰科技DeepBlueAI团队分别取得了一项冠军和一项季军的优异成绩。

IEEE 电气和电子工程师协会(全称Institute of Electrical and Electronics Engineers)是目前世界上最大的非营利性专业技术学会,会员遍布160多个国家,在国际计算机、电信、生物医学、电力及消费性电子产品等学术领域中都是主要的权威。在电气及电子工程、计算机及控制技术领域中,IEEE 发表的文献占了全球近三分之一。IEEE ISI年度国际会议是安全信息学领域的旗舰会议,在过去的16年中,IEEE ISI会议已经从传统的智能和安全领域发展到多领域联合研究与创新。今年,第17届IEEE ISI会议在中国深圳于7月1日至3日召开。

IEEE ISI——World Cup 2019深兰科技团队夺得冠军

为了促进人工智能分析行业的发展,也为了给学术交流和技术讨论提供一个良好的平台,IEEE ISI会议发起了此次国际大数据分析竞赛(IEEE ISI 2019年世界杯,IWC 2019),并面向全球高校、研究机构、企业、政府开放。本次大赛总计参赛人数逾千人,三百多支参赛队伍分别来自中国、美国、巴基斯坦、英国、德国等7个国家。

今年IEEE ISI大赛分为:投资价值评估和法律诉讼类型预测两个赛题。在企业投资价值评估赛题中深兰科技DeepBlueAI团队以较大领先优势获得冠军。

赛题一:企业投资价值评估排行榜

本次比赛提供了基于3500家上市公司全量信息,描述公司在财务、法务、股权、经营状况、舆论等方面的属性特征,数据均来自于官方统计平台,真实可信。每一家企业对应一个类目ID,参赛选手需要合理运用现有数据集材料,筛选出对竞赛有价值的信息进行特征构建和模型训练。

相较以往,数据维度广、信息复杂、数据特征类型丰富以及数据量小是赛程中主要的几大难点。基于这些难点,深兰科技团队成员采用了自研的AutoML系统进行建模,该系统包括了自动数据清洗、自动特征工程、自动特征选择、自动模型调参、自动模型融合等步骤,能极大提高任务建模的效率,并且在竞赛中也大幅度提升效果,最终深兰以3.2585的好成绩夺冠,以绝对优势领先第二名(成绩3.3626),并且使用纯AutoML的单模型就可以获得冠军。据了解,一般竞赛中Top队伍的得分都非常接近,往往都需要综合考虑多方面的因素,包括细致的数据分析,特征和算法模型优化等,想要拉开距离难乎其难。本次深兰团队的领先优势明显,充分说明团队算法具有较强的领先性。

这项AutoML技术,除了能够节省大量人力物力财力,并且还能更加快速和安全地搭建出一个优于大多数算法工程师搭建的机器学习系统。目前AutoML已经广泛应用在精准营销、金融风控、自动驾驶、疾病预测等业务场景中,做出了接近甚至超过数据科学家的模型效果,决策精准度超过人类专家规则数倍。

就本次比赛而言,深兰团队的模型通过提取企业各个维度的信息,通过采用自研的AutoML系统挖掘各业务字段间的复杂关系,自动提取高阶特征,给企业价值评估提供了新颖的更加精准的解决方案。据深兰科技DeepBlueAI团队介绍“在赛事上,该技术获得了一次十分不错的尝试,同时也验证了该系统的稳定性和可行性。未来,通过不断优化改良,可以设计出更多针对不同业务场景的特征,比如数据挖掘,信息抽取,网络舆情等领域。从而更好地进行实际场景落地应用。深兰科技对AI基础技术的全面投入可以帮助AutoML进入更多产业领域。“


*除《中国经营报》署名文章外,其他文章为作者独立观点,不代表中国经营网立场。