哈希游戏- 哈希游戏平台- 哈希游戏官方网站
专利摘要显示,本发明公开一种适用于不同编程语言的高效代码特征提取方法,包括:从指定的项目路径中加载不同编程语言配置文件,通过预定义的语言解析规则映射器解析语言配置文件,生成适用于不同编程语言的语言规则映射表;识别编程语言类型,按类型创建多任务队列并分配任务线程;依据语言规则映射表,对源代码预处理后进行分词和标记,对分词结果归一化后生成归一化后的源代码文件;对归一化后的源代码文件按给定的窗口和步长大小进行代码块分割并生成哈希值作为特征值,获得以哈希值序列为特征指纹的代码文件;将以哈希值序列为特征指纹的代码文件以及标记内容按标准化格式进行序列化存储并输出。本发明能够提高代码分析的效率和准确性。