数仓知识06:什么是元数据?

1. 概念

元数据Metadata),又称中介数据中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。

举几个简单例子:

  • 如果一本书是一个“数据",那么它的书名、封面、出版社、作者、总页码就是它的“元数据”。
  • 如果一个电影是一个“数据”,那么它的总时长、制作人、总导演、演员列表就是它的“元数据”。
  • 如果数据库中某个表是一个”数据”,那么它的列名、列类型、列长度、表注释就是它的"元数据"。

只要有一类"事物",就可以定义它的“元数据”。

大多数时候,元数据可以根据代表意义的不同分为业务元数据技术元数据(有时还会有[管理元数据]的概念)

2. 基本特点

元数据一经建立,便可共享。

元数据首先是一种编码体系。

3. 业务元数据、技术元数据和管理元数据

  • 业务元数据

业务元数据主要描述 ”数据”背后的业务含义;从业务角度描述业务领域的相关概念、关系——包括业务术语和业务规则。

业务元数据,在实际业务中,需要不断的进行维护且与业务方进行沟通确认。

  • 技术元数据

指技术细节相关的概念、关系和规则,包括对数据结构、数据处理方面的描述。以及数据仓库、ETL、前端展现等技术细节的信息。

数据仓库中的技术元数据一般包含以下 4 大系统:数据源元数据ETL 元数据数据仓库元数据BI 元数据

  • 管理元数据

管理领域相关,包括管理流程、人员组织、角色职责等。

也有很多观点建议将 管理元数据拆分融入 业务元数据和技术元数据中。

4. 在数据仓库中的应用

在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:

  1. 描述哪些数据在数据仓库中;
  2. 定义要进入数据仓库中的数据和从数据仓库中产生的数据;
  3. 记录根据业务事件发生而随之进行的数据抽取工作时间安排;
  4. 记录并检测系统数据一致性的要求和执行情况;
  5. 衡量数据质量。

参考资料:

百度百科:元数据

什么是元数据?为何需要元数据?

浅谈数仓的元数据管理

版权声明:程序员胖胖胖虎阿 发表于 2023年9月2日 下午1:32。
转载请注明:数仓知识06:什么是元数据? | 胖虎的工具箱-编程导航

相关文章

暂无评论

暂无评论...