跳到主要内容
跳到主要内容

半结构化类型概览

针对 JSON 半结构化数据,支持 3 类不同场景的半结构化数据类型:

  1. 支持嵌套的固定 schema,适合分析的数据类型 ARRAYMAP STRUCT:常用于用户行为和画像分析,湖仓一体查询数据湖中 Parquet 等格式的数据等场景。由于 schema 相对固定,没有动态 schema 推断的开销,写入和分析性能很高。

  2. 支持嵌套的不固定 schema,适合分析的数据类型 VARIANT:常用于 Log, Trace, IoT 等分析场景,schema 灵活可以写入任何合法的 JSON 数据,并自动展开成子列采用列式存储,存储压缩率高,聚合 过滤 排序等分析性能很好。

  3. 支持嵌套的不固定 schema,适合点查的数据类型 JSON:常用于高并发点查场景,schema 灵活可以写入任何合法的 JSON 数据,采用二进制格式存储,提取字段的性能比普通 JSON String 快 2 倍以上。