数据库|向量将死,哈希是 AI 未来( 二 )


一般研究用于密集信息检索近似最近邻 (ANN)时,往往可以使用向量表示来搜索信息,这样可以帮助用户找到概念上相似的一些东西。但是,哈希中的局部敏感性却拥有更加强大的优势。

4

密集信息检索
互联网时代,数据库是不可计数的,但搜索索引却寥寥无几,而且大多数索引都是基于相同的老技术,这主要是因为历史上语言是一个基于规则的问题。
标记、同义词、词干提取、词形还原等问题占据了许多天才的整个职业生涯,但仍未完全解决。
谷歌创始人拉里佩奇(Larry Page)曾说过,在我们的有生之年,“搜索”并不能得到解决。
数据库|向量将死,哈希是 AI 未来
文章插图
想想看,这一代如此绝顶聪明的人,投资数十亿美元为何还得不到解决?
很明显,搜索技术落后于数据库主要是由于语言问题,我们在过去几年中看到了语言处理方面的革命,而且还在加速。并且从技术角度来看,我们还将看到基于神经的哈希消除搜索和数据库技术的障碍。
参考来源:https://medium.com/@hamishogilvy/vectors-are-over-hashes-are-the-future-of-ai-98c4dc33d8ee

数据库|向量将死,哈希是 AI 未来
文章插图
数据库|向量将死,哈希是 AI 未来】雷锋网雷锋网雷锋网