哈希游戏- 哈希游戏平台- 哈希游戏官方网站
哈希编码是一种将实数向量表示为二进制数向量的方法,用二进制数向量的检索替代对实数向量的检索能够减少计算量。多模态数据是指不同类型的实数向量,例如用于表示图像的sift(scale-invariantfeaturetransform,尺度不变特征变换)特征的是一个128维的实数向量,用于表示文字的lda(latentdirichletallocation,文档主题生成模型)特征是一个10维的实数向量,这两组实数向量就是两种不同模态的数据。
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
多模态哈希编码是将多组成对实数向量用同一组二进制数向量表示,从而实现跨模态的检索。例如从社交网络上抓取的图像及其文字标签信息就是成对的,通过多模态哈希编码,可以实现用文字标签检索图像,或者用图像检索文字标签。半监督,是指数据中只有一部分是有标记的。标记是指数据的类别标识,一般是二进制向量。例如,一个生物数据集中,用标记(0,1)表示动物,用标记(1,0)表示植物。半监督多模态哈希编码,是指利用部分标记,提高多模态数据哈希编码效果的方法。
首先,给定一个检索样本集合,此处使用mirflickr数据集,mirflickr是一个包含25000对图像和文字标签的多模态数据集。对数据集中的图像提取gist特征,将图像表示为一个512维的实数向量,所有图像的gist特征可以组成一个25000×512的矩阵x1。将数据集中的文字标签先用一个1366维的二进制向量表示,向量中每个位置表示一个单词,如果该标签中包含某个单词,则二进制向量对应位置的值为1,否则为0;随后,对文字标签的二进制向量进行降维,用主成分分析法(pca)将其降维成500维的实数向量。所有文字标签的实数向量可以组成一个25000×500的矩阵x2。
以上实施例二和实施例三中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。例如,本实施例的计算机可读存储介质包括u盘、移动硬盘、只读存储器(read-onlymemory,简称rom)、随机存取存储器(randomaccessmemory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。