专利内容由知识产权出版社提供
专利名称:一种基于多层局部敏感哈希的k最近邻近似查询方
法
专利类型:发明专利发明人:张岩峰
申请号:CN201910728763.0申请日:20190808公开号:CN1104419A公开日:20191122
摘要:本发明属于数据分析领域,涉及一种基于多层局部敏感哈希的k最近邻近似查询方法。所述的方法先评估映射到各个哈希桶的数据点数量,根据每个哈希桶中数据点数量的大小确定过载哈希桶和欠载哈希桶,然后对过载哈希桶进一步哈希划分成若干子桶,同时对欠载哈希桶进行合并。对于重划分后仍然过载的子桶再递归进行重哈希,经过多次重哈希后,使多个哈希桶的大小尽量均衡。LSH索引结构就变成了一个多层的类似树状的结构。本发明对初始构建的LSH哈希表进行重构,提升密集区域查询点的kNN搜索效率和稀疏区域查询点的kNN搜索的准确率。多层局部敏感哈希结构中的哈希桶大小分布比较均匀,在其上对倾斜分布大数据进行kNN搜索时优势十分明显。
申请人:东北大学
地址:110819 辽宁省沈阳市和平区文化路三巷11号
国籍:CN
代理机构:大连理工大学专利中心
更多信息请下载全文后查看