写在前面

本文隶属于专栏《100个问题搞定大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和文献引用请见100个问题搞定大数据理论体系

解答

在一个未经处理的数据库中,一般以文档ID作为索引,以文档内容作为记录。
而倒排索引(Inverted Index)指的是将单词或记录作为索引,将文档ID作为记录,这样便可以方便地通过单词或记录査找到其所在的文档。

Q.E.D.


大数据开发工程师,精通 Spark,擅长 Java 和 Scala