发布数据标准:业务数据标准描述公司层面共同遵守的“属性层”数据含义和业务规则,一旦发布,就作为标准在企业内被共同遵守。
a. 数据资产目录:主题域分组、主题域、业务对象、逻辑数据实体、业务属性
b. 定义与规则:引用的数据标准、业务定义、业务规则、数据类型、数据长度、允许值、数据示例、同义词、标准应用范围
c. 责任主体:业务规则责任主体、数据维护责任主体、数据质量监控责任主体
5种技术方案:
a. 批量集成:用于进行复杂数据清理和转换且数据量较大的场景,不适合数据延迟和高灵活性的场景。
b. 数据复制同步:用于需要高可用性和对数据源影响小的场景,不适合处理各种数据结构以及需要清理和转换复杂数据的场景。
c. 消息集成:通常通过API或提取数据,适用于处理不同数据结构以及需要高可用性和复杂转换的场景,不适合处理大量数据的场景。
d. 流集成:主要关注流数据的采集和处理,满足数据实时集成需求,处理每秒数万甚至数十万个(百万)事件流,不适合需要复杂数据清理和转换的场景。
e. 数据虚拟化:需要低数据延迟、高灵活性和临时模式的消费场景,不适合需要处理大量数据的场景。