Azure权限范围内的数据源(包括Microsoft和非Microsoft)的高级视图可以集成到其数据地图和目录中。
经过近十个月的预览和数年的缓慢运行,以及动力不足的Azure数据目录服务,Microsoft今天终于进入了数据治理的黄金时间,具有Azure权限的通用性(GA)。由底层数据管理/治理平台和在其上运行的新数据目录应用程序组成,Purview旨在满足企业组织的双重需求,即保持其数据的可发现性,并根据全球多个司法管辖区的数据保护法规管理其使用。
另请阅读:Microsoft推出Azure Purview数据目录;宣布Synapse Analytics的GA
ZDNet与微软数据治理与管理总经理Mike Flasko交谈;隐私平台,以便更准确地了解Azure的功能、技术基础、定价结构和路线图。Flasko提供了所有这些方面的全面细节;他还很好地描述了Azure Perview的体系结构,以及它对服务的实际影响。
Perview并非狭隘的Perview集成了大量Microsoft产品和服务,包括云端和内部部署。其中包括Azure Synapse Analytics、Azure SQL、Azure Data Factory、Power BI、SQL Server甚至Microsoft信息保护。但是,Perview也为非Microsoft属性提供了连接器,如Amazon Web Services的S3存储服务、Snowflake和Oracle数据库。
另请阅读:在Microsoft Ignite,扩展Azure ML&;权限,当ZDNet和微软对话时,Power BI Premium的权限有36个连接器;Flasko表示,新的连接器将每月发布。今天,除了Azure权限GA本身之外,微软还宣布了上述AWS S3支持的GA,以及Erwin、IBM DB2、Salesforce、Google BigQuery、Looker、,和Cassandra。
模块化体系结构与一些数据目录平台不同,这些平台将业务词汇表和数据集注释等功能与连接和扫描数据源紧密结合,Azure Purview采用了更模块化的方法。权限服务可以自动扫描数据源、收集其元数据、检测沿袭信息并对敏感数据进行分类,填充Microsoft称之为“数据地图”(以及其他数据目录供应商可能称之为知识图)的内容。数据映射可以通过用户界面或通过开源ApacheAlas项目定义的应用程序编程接口(API)来构建、访问和维护。Azure权限还为创建新的数据源连接器和新的数据分类器提供扩展点。
Microsoft还可以编写在该平台上运行的应用程序,这正是Microsoft实现Azure权限数据目录的方式。微软将提供其他应用程序和功能,以实现其他数据管理功能(数据质量评估,作为可选扫描过程实现,是Flasko提到的一个具体示例)。第三方独立软件供应商可以以类似的方式与权限服务集成。例如,微软与总部位于佐治亚州的Alpharetta Profisee合作,在Azure权限平台上提供主数据管理(MDM)功能。
这是一个合适的合作关系,因为Profisee领导团队的各个成员(包括其首席执行官伊恩·埃亨)曾经营Strature,这是微软在2007年收购的一家公司,其核心技术成为SQL Server主数据服务。看起来,正如Azure Data Factory已经成为SQL Server Integration Services(SSIS)的现代云本机继承者一样,Azure权限将直接或间接地作为SQL Server主数据服务(MDS)和数据质量服务(DQS)的现代继承者的平台.
另请阅读:Azure Data Factory v2:动手操作概述
定价和可用性由于Purview的模块化、多头架构,那些计划在平台上花费的人将需要做一些计算。根据Microsoft的Azure权限定价页面,计算Azure权限定价基本上归结为数据地图成本+扫描成本+资源集成本。
根据定价页面,资源集是,“数据映射的内置功能,用于优化数据池中与分区文件关联的数据资产的存储和搜索。“资源集和扫描操作的定价基于所使用的vCore小时数,尽管每vCore小时的价格以及资源集和扫描操作所涉及的vCore数量有所不同。
运行数据地图所涉及的实际计算按所使用的“容量单位”计费,其中一个这样的单元以超过2GB数据的无限容量提供服务。这些容量单位按“始终”计费(而不是按使用量计费),并且计费将一直持续到数据映射被拆除为止。同时,Azure权限目录应用程序的使用是免费的。
Azure权限通常立即生效,可在14个Azure地区使用。这包括三个新区域-美国西部2、美国中西部和;北欧-这不是预览的一部分。对于那些想要了解权限(包括其最新功能)的人,微软将从2021年10月6日开始,在有限的时间内每周发布博客,在Azure Perview TechCommunity网站上。
Domino Data Lab的新版本推动了MLOps的发展
Confluent宣布了流式数据治理
Databricks筹集了16亿美元的H系列融资回合
Sisense Extense框架和应用程序深度嵌入分析