# 名词解释
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
AI
人工智能(Artificial Intelligence),它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
BIM模型
建筑信息模型 (Building Information Modeling) 是一种基于智能三维模型的流程,能够使工程建设专业人员获取相关洞察分析和工具,从而更高效地规划、设计、构建和管理建筑及基础设施。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
大数据
包含关键的业务过程数据,往往用于描述在某一个时间点上业务系统发生的行为,用于纪录特定业务事件,如质安巡检记录、人员进出场记录、设备传感器记录等。
多源异构数据
在企业信息化建设过程中,由于各业务系统建设和实施数据管理系统的阶段性、技术性以及其它经济和人为因素等因素影响,导致企业在发展过程中积累了大量采用不同存储方式的业务数据,包括采用的数据管理系统也大不相同,从简单的文件数据库到复杂的网络数据库,它们构成了企业的多源异构数据的现状。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
ETL
ETL(Extract-Transform-Load的缩写)是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
GIS
GIS(Geographic Information System)是地理信息系统的简称,GIS是以地理空间数据为基础,采用地理模型分析方法,适时地提供多种空间和动态的地理信息,是一种为地理研究和地理决策服务的计算机技术系统。其主要特征是存储、管理、分析与位置有关的信息。
关系型数据
关系型数据是以关系数学模型来表示的数据。关系数学模型中以二维表的形式来描述数据。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
Hadoop
Hadoop是一个开源框架,允许使用简单的编程模型在跨计算机集群的分布式环境中存储和处理大数据。它的设计是从单个服务器扩展到数千个机器,每个都提供本地计算和存储。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
静态关联/动态关联
静态关联代表业务实体之间稳定的,可预测的关联关系,如项目和租户之间通过租户 id 进行的关联。 静态关联和关系型数据库中的表关联类似,是轻量级的建模,占用较少的存储空间和处理资源。
动态关联代表业务实体之间发现式的,动态的关联关系,如一张塔机的图片和塔机实体之间的关联,摄像头在某个时刻与劳务工人的关联。 动态关联是任意具体数据间的关联,可以动态创建,删除。这类关联可以为关联添加随机的业务逻辑。例如可以把一条 塔机 的数据与一条 工人 的数据动态关联,标示一个 驾驶 或者 维修 的关系。 动态关联占用较多的存储和处理资源,适合对随机关系,非关系型实体间关系进行建模,如通过知识图谱算法,AI 算法发崛的关联关系。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
领域(Domain)
领域是对一类业务范畴内的知识,术语和关系的抽象,由一个业务范畴内密切相关的实体和他们之间的关系组成。Domain 内的数据模型原则上独立存储,但可以互相关联和引用。Domain 是平面结构,一个Domain不应包含其他Domain,Domain 之间的包含关系通过类型引用实现。
典型的业务领域如项目管理,安全管理,物料管理,甲方监管,物联网等。
领域是模型的容器,例如地铁域包含线路、站点等模型,而项目、租户等模型则在项目信息域里。
流程模板
流程模板是在创建一个新的数据集成任务时需要选择的任务预先配置的一套组件信息。比如MySQL到PostgreSQL流程模板就会包含一个MySQL读取组件和一个PostgreSQL写入组件。模板只是创建一个新任务的初始状态,基于流程模板创建后,还可以在任务的流程配置页面对任务流程所包含的组件进行新增和删除。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
视图(View)
视图代表对资源模型的不同服务形态,通过引入视图,对同样的资源模型,开发者可根据需要组织不同 API 形式。 视图是由视图模板(View Template)生成的,是根据模型的关联关系动态创建关联树。
时序数据
即时间序列数据。依赖于时间而变化,可以用数值来反映其变化程度的数据。
数据仓库/数据集市
数据仓库(Data Warehouse) 是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合用于支持管理决策。
数据集市是企业级数据仓库的一个子集,主要面向部门级业务,并且只面向某个特定的主题。为了解决灵活性和性能之间的矛盾,数据集市就是数据仓库体系结构中增加的一种小型的部门或工作组级别的数据仓库。数据集市存储为特定用户预先计算好的数据,从而满足用户对性能的需求。
数据集成任务/任务
数据集成任务就等于数据集成模块下面的任务,指的是能完成一个完整的数据集成/数据迁移/数据接入的任务。任务下面会有基本信息、流程、调度、日志等属性。
数据血缘/数据质量/数据地图
数据血缘属于数据数据治理中的一个概念,是在数据溯源的过程中找到相关数据之间的联系,是一个逻辑概念。
数据质量是相对于数据接入、清洗的一个相关概念,一般数据接入的质量不高,都要通过对原数据的清洗跟业务理解从而对数据进行归类、汇总,保证后期数据分析出来的结果更准确。
数据地图是从多维数据分析衍生过来的一个概念,多源异构的数据经过清洗、ETL相关操作之后,形成相互关联的数据形态,可以便于数据表的使用者和拥有者更好地管理数据、协作开发。
数据源/数据来源/数据目标
数据源(Data Source)指的是各种类型的数据存储实质。按照数据生产和数据消费又可以分为数据来源(数据的生产方)和数据目标(数据的消费方)。
数据智能
数据智能是指基于大数据引擎,通过大规模机器学习和深度学习等技术,对海量数据进行处理、分析和挖掘,提取数据中所包含的有价值的信息和知识,使数据具有“智能”,并通过建立模型寻求现有问题的解决方案以及实现预测等。
数据资源目录
是对数据存储对象的描述,可理解为主数据管理+元数据管理,实现数据的查询、定位、使用和数据的交换共享。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
物联网
物联网( IoT ,Internet of things )即“万物相连的互联网”,是互联网基础上的延伸和扩展的网络,将各种信息传感设备与互联网结合起来而形成的一个巨大网络,实现在任何时间、任何地点,人、机、物的互联互通。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
业务数据
包含关键的业务过程数据,往往用于描述在某一个时间点上业务系统发生的行为,用于纪录特定业务事件,如质安巡检记录、人员进出场记录、设备传感器记录等。
用户画像
用户画像,即用户信息标签化,企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,抽象出一个用户的商业全貌。用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。
元数据
即关于数据的数据,用以描述数据类型、数据定义、约束、数据关系、数据所处的系统等信息。
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
资源模型
一个资源模型代表一个可供访问的数据资源,如劳务人员,安全巡检记录,BIM模型等。
知识图谱
知识图谱是Google用于增强其搜索引擎功能的知识库。本质上, 知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。现在的知识图谱已被用来泛指各种大规模的知识库。在知识图谱辅助下,搜索引擎可以洞察到用户查询背后的一个语义信息,然后返回更为精准结构化的信息,从而更大可能的去满足用户的一个查询需求。
主数据
主数据(Master Data)定义企业核心业务对象,如项目,人员,物料,设备,位置,BIM模型等,与业务数据不同,主数据一旦被记录到数据库中,需要经常对其进行维护,从而确保其时效性和准确性;主数据还包括关系数据,用以描述主数据之间的关系,如项目与人员的关系、设备与位置的关系、BIM模型与人员的关系、人员与人员的关系等。
组件/流程组件
(流程)组件指的是一个数据集成任务中的最小单元,按照组件的类型不同可以分为输入组件、输出组件、转换组件等。一个或者多个组件组成了整个数据集成任务。
← 产品介绍 数据资源与控制台说明文档 →