ORC 文件格式详解

2021-10-05 warehouse

简介

Optimized Row Columnar, ORC 其元数据通过 ProtoBuffer 保存,详细可以参考 Apache ORC Proto 中的定义。

----- 解析依赖protobuf包
pip install protobuf
----- 会生成一个orc_pb2.py包
protoc --python_out=. orc.proto