ElasticSearch-数据建模

IT学习笔记

发布日期: 2024-06-13

文章字数: 449

阅读时长: 1 分

阅读次数:

处理关联关系
- Object: 优先考虑反范式（Denormalization）
- Nested: 当数据包含多数值对象，同时有查询需求
- Child/Parent：关联文档更新非常频繁时
避免过多字段
- 一个文档中，最好避免大量的字段
  - 过多的字段数不容易维护
  - Mapping 信息保存在 Cluster State 中，数据量过大，对集群性能会有影响
  - 删除或者修改数据需要reindex
- 默认最大字段数是1000，可以设置index.mapping.total_fields.limit限定最大字段数
- 生产环境中，尽量不要打开 Dynamic，可以使用Strict控制新增字段的加入
  - true ：未知字段会被自动加入
  - false ：新字段不会被索引，但是会保存在_source
  - strict ：新增字段不会被索引，文档写入失败
- 对于多属性的字段，比如cookie，商品属性，可以考虑使用Nested
避免正则，通配符，前缀查询
- 正则，通配符查询，前缀查询属于Term查询，但是性能不够好
- 特别是将通配符放在开头，会导致性能的灾难
避免空值引起的聚合不准

PUT /scores
{"mappings":{"properties":{"score":{"type":"float","null_value":0}}}}

PUT /my_index
{"mappings":{"_meta":{"index_version_mapping":"1.1"}}}

钱不寒

https://jxch.github.io/2024/06/13/architect/elasticsearch/elasticsearch-shu-ju-jian-mo/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源钱不寒 !

ElasticSearch

2024-06-13 IT学习笔记

ElasticSearch

2024-06-13 IT学习笔记

ElasticSearch