- 针对恶意JavaScript识别的降维方法
- 点击次数:
- 发表刊物:计算机工程与应用
- 关键字:降维; TF-IDF-like模型; 特征差异度; JavaScript; 主成分分析(PCA);
- 摘要:针对将JavaScript代码N-gram处理后识别算法特征维度较高的问题,提出一种高效的降维方法。该方法利用TF-IDF-like模型分别计算特征在正常样本和恶意样本中的权重,基于特征权重在两类样本中的差异度进行降维。基于多个识别算法,将提出的降维方法与基于主成分分析(Principal Component Analysis,PCA)的降维方法进行比较,实验结果表明:当识别算法维度相同时,基于本文所给降维方法的识别算法在识别效果方面优于基于PCA的识别算法;当降维后识别算法的维度超过某个阈值时,随着识别算法维度的增长,本降维方法的时间开销增长速率远低于PCA方法。
- 全部作者:宋礼鹏
- 第一作者:刘鹏睿
- 卷号:54
- 期号:21
- 页面范围:20-24+36
- ISSN号:1002-8331
- 是否译文:否
- CN号:11-2127/TP
- 发表时间:2018-11-01