1. 数据虚拟化服务 1.1. 趋势 1.1.1. 与数据集相关联的多语言数据模型1.1.1.1. 多语言持久化既适用于数据湖,也适用于应用程序事务型数据 1.1.2. 查询...

1. 数据虚拟化服务 1.1. 趋势 1.1.1. 与数据集相关联的多语言数据模型1.1.1.1. 多语言持久化既适用于数据湖,也适用于应用程序事务型数据 1.1.2. 查询...
1. 数据权限治理服务 1.1. 大部分用于提取洞察的数据都是直接或间接地从客户交互中收集的,所以如果数据集包含客户的详细信息,特别是PII(如姓名、地址、社保号等),则企业...
1. 数据整理服务 1.1. 数据整理是一个迭代的过程,涉及处理错误值、异常值、缺失值、估算值、数据不平衡和数据编码 1.1.1. 包括结构化、清洗、丰富和验证数据 1.1....
1. 数据湖管理服务 1.1. 数据聚合在数据湖中,数据湖已经成为聚合PB级数据的中央数据存储库,这些数据包括结构化数据、半结构化数据和非结构化数据 1.2. 痛点 1.2....
1. 点击流跟踪服务 1.1. 在构建洞察的过程中,一项越来越重要的工作是收集、分析和聚合行为数据,即点击流数据 1.2. 点击流是代表用户在应用程序或网站中操作的事件序列,...
1. 数据迁移服务 1.1. 通常,必须将来自不同数据仓库或应用数据库的数据属性进行聚合以构建洞察 1.2. 数据迁移的痛点 1.2.1. 在异构数据源之间协调数据移动、持续...
1. 特征存储服务 1.1. 在机器学习模型中,还有一个额外的步骤是发现特征 1.1.1. 在机器学习模型中使用某个特征时需要数据属性的历史值 1.2. 特征是一种数据属性,...
1. 搜索服务 1.1. 重点是在开发洞察的迭代过程中找到相关的数据集(表、视图、模式、文件、流和事件)和工件(指标、仪表盘、模型、ETL和即席查询) 1.2. 搜索服务简化...
1. 元数据目录服务 1.1. 通过与数据分析师和科学家交谈,用户发现了一个包含客户账单记录相关细节的数据集 1.2. 企业内部并不缺乏数据,但是如何使用数据来解决业务问题是...
1. 定义洞察耗时记分卡 1.1. 洞察耗时是度量从原始数据到提取洞察所需时间的总体指标 1.2. 每个企业在与提取洞察相关的痛点上有所不同 1.2.1. 由于现有流程的成熟...
1. 数据介绍 1.1. 数据是新的石油 1.1.1. 当今的企业拥有丰富的数据,但缺乏数据洞察力 1.1.2. 目前,企业内部的结构化数据、半结构化数据以及非结构化数据的数...
1. 基本信息 DAMA数据管理知识体系指南(原书第2版) 数据管理协会 (DAMA国际) 著 ; DAMA中国分会翻译组 译 机械工业出版社,2020年06月出版 1.1....
1. 变革的秘诀 1.1. 有效描述变革最著名的方法之一是变革平衡公式(Gleicher公式),它描述了组织需要在适当的地方克服变革阻力的因素 1.2. Gleicher公式...
1. 阻碍变革管理的一些常见因素 1.1. 内向型文化 1.2. 瘫痪的官僚机构 1.3. 狭隘性政治 1.4. 信任度低 1.5. 缺乏团队合作 1.6. 狂妄自大 1.7...
1. 数据管理和组织变革管理 1.1. 对于大多数组织而言,改进数据管理实践需要改变人们协作的方式和对组织中数据所起作用的理解,以及他们使用数据和部署技术来支持组织流程的方式...
1. 建立数据管理组织 1.1. 识别当前的数据管理参与者 1.1.1. 在实施运营模式时,从已经参与数据管理活动的团队开始 1.1.2. 将最大限度地减少对组织的影响,并有...
1. 数据管理组织 1.1. 随着数据领域的快速发展,组织需要改进管理和治理数据的方式 1.2. 由于数据数量和种类的增加,加剧了数据管理的复杂性 1.3. 数据消费者要求更...
1. 活动 1.1. 数据管理成熟度评估需要计划 1.2. 确保实际可行的结果,应在计划内留出时间准备材料和评估结果,评估应在规定的短时间内进行 1.3. 目的是揭露当前的优...
1. 成熟度模型 1.1. 能力成熟度评估(Capability Maturity Assessment, CMA)是一种基于能力成熟度模型(Capability Matur...
1. 方法 1.1. 解析建模 1.1.1. 实时访问可以解决批处理中的许多延迟问题 1.1.2. Apache Mahout是一个开源项目,旨在创建一个机器学习库 1.1....