为什么 Elasticsearch 中高基数字段上的聚合是一个坏主意以及如何优化它
Elasticsearch 是分布式搜索和分析引擎,是满足搜索和聚合需求的最受欢迎的选择。Elasticsearch 将 keyword 存储为 doc values 中的序数,以获得更紧凑的表示。这种映射的工作原理是根据每个术语的字典顺序为每个术语分配一个增量整数或“序数(ordinal)”。该字段的 doc values 仅存储每个文档的序数而不是原始术语,并具有单独的查找结构来在序数和术语之间进行转换。
CSDN · 2023-09-12 08:45:00