电子科技大学卓中流:巧用“基因检测” 破解网
“基因检测”算法可以运用于网站“指纹”的精准识别?这个跨度的确有点大!但并非全无可能。电子科技大学计算机科学与工程学院(网络空间安全学院)2013级直博生卓中流受到生物医学领域的基因序列检测算法的启发,提出了一种高效的网站指纹检测算法,弥补了传统模型无法对多级页面跳转进行建模的缺陷,同时提高了单一网页的检测准确率。
这项成果是基因序列检测算法在网络流量识别和针对僵尸网、暗网等检测方面的初次运用,为流量识别领域和网站指纹检测领域提供了新思路。相关论文已经发表在了信息安全领域顶级期刊《IEEE Transactions on Information Forensics andSecurity》。卓中流为第一作者,明尼苏达大学双城分校Zhi-li Zhang教授为共同作者,电子科技大学计算机科学与工程学院(网络空间安全学院)张小松教授为论文通讯作者。
网站“指纹”:亟待突破“实战”瓶颈
从“比特币”到海外代购,跨境交流和贸易往来从未像今天这样方便快捷。然而,随之而来的网络犯罪、境外网络诈骗等案件也如影随形,危害十分严重。因此,暗网和僵尸网检测成为现代社会网络安全重要议题。
然而,随着隐私保护技术的不断深入,暗网、僵尸网络技术得到快速发展。由于通信内容和通信双方都被隐藏,很难依靠传统手段进行网络检测。于是,研究者们提出了一种新的解决思路——网站“指纹”识别。所谓网站“指纹”,指的是访问该网站时发送和接收数据包产生的特有信道特征。
传统的网络行为分析大多基于流量分析。当前广泛使用的基于数据包载荷特征的流量分析技术在数据载荷是明文的情况下具有很高的识别精度,但在对加密流量的分析中面临着极大的挑战。网页指纹识别是对加密流量进行分析的一种实际应用。
然而,这种技术目前距离“实战”还有较大的距离。总体来说,它还处于未完全成熟的状态,尤其是在面对网页的“多级页面跳转”等问题时依然束手无策。如何进一步提高网站指纹识别的能力,卓中流发现了一个新方法!
突发奇想:借用“基因检测”算法
2016年3月,卓中流无意间看到一篇SCI四区的论文,研究的是如何用“生物基因序列”来做应用识别。他隐约感到,既然都是用于“识别”,那么,“生物基因序列”的方法很可能与网站指纹识别有一定的交集。
本来这只是一个灵光乍现的念头,但这个念头并没有像流星一样稍纵即逝。此后的五个月里,他查询了大量参考文献和资料。由于在准备申请公派留学,他就没有太多时间去做实验验证,直到参加了联合培养项目,于2016年10月到美国明尼苏达大学双城分校,他才真正地开始深入研究。