企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持知识库和私有化部署方案 广告
:-: ![](https://img.kancloud.cn/94/b3/94b3dcb41a0a173c4dc9c44ba9b0b0e4_1150x538.png) 文件存储格式比较 **存储格式选择:** 写:一般写入时间并不是最重要 读: 1、Avro——查询随时间变化的数据集 2、Parquet ——适合在宽表上查询少数列 3、Parquet & ORC以牺牲写性能为代价优化读取性能 4、TextFile读起来很慢 <br/> **Hive 查询(快->慢):** ``` ORC -> Parquet -> Text -> Avro -> SequenceFile ```