AI 技术内参
洪亮劼
Etsy 数据科学主管,前雅虎研究院资深科学家
33454 人已学习
新⼈⾸单¥98
登录后,你可以任选6讲全文学习
课程目录
已完结/共 166 讲
开篇词 (1讲)
人工智能国际顶级会议 (31讲)
搜索核心技术 (28讲)
推荐系统核心技术 (22讲)
数据科学家与数据科学团队养成 (25讲)
AI 技术内参
15
15
1.0x
00:00/00:00
登录|注册

003 | 精读2017年KDD最佳应用数据科学论文

1998年创立了公司
科摩多(Comodo)的CEO
2009年于清华大学博士毕业
香港科技大学计算机系助理教授
2010年从厦门大学博士毕业
西弗吉尼亚大学计算机科学与电气工程系助理教授
西弗吉尼亚大学计算机科学与电气工程系博士生
多核学习方法是否必需?是否可以换成其他方法?
方法验证了在科摩多的数据集上比其他方法更加有效
提出了基于结构性异构信息网络的方法,使用元路径定义复杂关系,采用多核学习方法完成恶意软件的判别
论文解决了如何有效监测安卓手机系统下的恶意软件的问题
文章提到的方法比其他流行方法和商业软件的准确度更高
结合了16个定义好的元路径的多核学习能够实现高达98%的F1值
使用科摩多的数据集,验证方法的有效性
多核学习:学习一个线性的分类器,特征是每个App到某一个核的一个非线性转换
使用元路径:提供描述性的模板语言来定义高阶关系
引入异构信息网络:表达多种不同实体和实体关系的一种建模工具
构建矩阵:表达API和App之间的基本特征
软件代码分析:将安卓的程序代码转换为可分析的形式
验证方法有效性:使用科摩多的数据集
采用多核学习方法完成恶意软件的判别
使用元路径定义复杂关系
提出新方法:基于结构性异构信息网络的方法,理解安卓程序的语义
解决问题:有效监测安卓手机系统下的恶意软件
最后一位作者:米勒夫·阿杜勒哈尤格鲁(Melih Abdulhayoğlu)
第三作者:宋阳秋(Yangqiu Song)
第二作者:叶艳芳(Yanfang Ye)
第一作者:Shifu Hou
思考题
小结
方法的实验效果
论文的核心方法
论文的主要贡献
作者群信息介绍
KDD 2017最佳应用数据科学论文

该思维导图由 AI 生成,仅供参考

周一我们讲了 2017 年 KDD 最佳研究论文,今天我们继续来聊今年的 KDD 最佳应用数据科学论文。
与研究类论文不同的是,KDD 的应用类学术论文更加强调论文所描述的方法或者系统在实际应用中发挥的作用。比如,很多论文都是对现有的已部署的系统进行总结,对工业界的很多研究人员和工程师往往都有不小的借鉴意义。和研究类论文一样,从阅读经典文献和学习最新研究成果的角度,我们都应该认真分析和探讨每年的最佳应用类论文。
2017 年 KDD 最佳应用数据科学论文题目是,《HinDroid:基于结构性异构信息网络的智能安卓恶意软件检测系统》(HinDroid: An Intelligent Android Malware Detection System Based on Structured Heterogeneous Information Network)。可以说 2017 年是信息安全备受关注的一年,2016 年美国大选过程中传出了种种关于俄罗斯利用黑客入侵大选候选人的新闻,让整个社会对信息安全的话题变得异常敏感。这是一篇有关如何智能地分析安卓恶意软件的论文,真是非常应景。

作者群信息介绍

文章的第一作者和第二作者都来自西弗吉尼亚大学(West Virginia University)的计算机科学与电气工程系。第一作者 Shifu Hou 是该系的博士生,先后发表过多篇论文。第二作者叶艳芳(Yanfang Ye)是该系的助理教授。叶艳芳 2010 年从厦门大学博士毕业,先后在金山公司和科摩多(Comodo Security Solutions)从事信息安全方面的研究和开发工作。2013 年,她加入西弗吉尼亚大学任教。这篇 KDD 论文因为第一作者也是在读学生,因此也是最佳学生论文。
第三作者宋阳秋(Yangqiu Song)是来自香港科技大学的计算机系助理教授。宋阳秋有丰富的学术和工业界经历。2016 年加入香港科技大学,在这之前曾经在西弗吉尼亚大学任教。2012 年到 2015 年之间他曾在伊利诺伊大学香槟分校、香港科技大学、华为诺亚方舟实验室等地访问。2009 年到 2012 年曾在微软亚洲研究院和 IBM 研究院工作。2009 年于清华大学博士毕业。
最后一位作者是土耳其企业家米勒夫·阿杜勒哈尤格鲁(Melih Abdulhayoğlu)。他是科摩多(Comodo)的 CEO,于 1998 年创立了公司。这篇论文挂了他的名字是因为使用了科摩多的数据。

论文的主要贡献

我们首先来看一下这篇文章的主要贡献。类似地,按照我们周一分析最佳研究论文的思路,首先必需弄明白,这篇文章主要解决了什么场景下的问题。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

《HinDroid:基于结构性异构信息网络的智能安卓恶意软件检测系统》是2017年KDD最佳应用数据科学论文,介绍了一种新的方法来有效监测安卓手机系统下的恶意软件。该论文的主要贡献在于提出了基于结构性异构信息网络的智能检测系统,并采用多核学习方法对安卓程序的API模式进行复杂建模和分类。作者首先将安卓程序代码转换为可分析的形式,然后构建了四类矩阵来表达API和App之间的基本特征,并引入了异构信息网络和元路径来描述程序的语义表达。最后,采用多核学习的思想进行恶意软件的判别,取得了较高的准确度,远优于现有方法。该方法已在科摩多的产品中部署,展现出了良好的应用前景。该论文的技术特点在于结合了异构信息网络和多核学习方法,为安卓恶意软件检测提供了一种新的有效途径。实验结果显示,结合了16个定义好的元路径的多核学习能够实现高达98%的F1值,远超过其他流行方法和商业软件的准确度。总之,该论文提出的方法在恶意软件检测领域具有显著的技术优势,为安卓手机系统的安全提供了重要的技术支持。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 技术内参》
新⼈⾸单¥98
立即购买
登录 后留言

全部留言(2)

  • 最新
  • 精选
  • huan
    既然作者使用非线性的转换,而且我理解此阶段的响应变量已经是常规的向量了,那么应该可以通用的分类器都可以做分类,比如SVM, NN和决策树都行。如果没有很好的分类数据,是否可以直接使用无监督的kNN来聚类完成。(初级的AI爱好者,请拍砖)
    2017-11-01
    6
  • Newt
    是否可以详细说明以下,数据集的类型,因为在涉及到深度学习的的时候,将categorical data转到numerical data是一个比较的步骤,文章是否有这方面的说明呢。其次一旦转化到numerical data,在进行分类的时候,贝叶斯就是去它的优势,其次因为涉及到特征之间的Correlation,采用类似贝叶斯这种assume feature independence 的算法就不太合适,为什么要实验这种算法呢?
    2020-05-20
收起评论
显示
设置
留言
2
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部