亚马逊云科技发布全新数据管理服务Amazon DataZone

近日——亚马逊云科技在2022 re:Invent全球大会上宣布,推出一项全新的数据管理服务Amazon DataZone,它可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。Amazon DataZone使工程师、数据科学家、产品经理、分析师和业务用户可以轻松访问整个组织的数据,从而发现、使用数据,通过数据进行协作来获得洞察。

当前,企业收集的数据达到PB甚至EB级别,这些数据来自多个部门、多项云服务、众多本地数据库以及第三方数据源(如来自合作伙伴解决方案和公共数据集)。在企业可以释放数据的全部价值之前,管理员和数据管理者作为数据生产者与管理者,需要在保障数据的管控和治理的前提下允许数据访问,确保数据只能由正确的人在正确的情境下访问。另一方面,整个公司的员工(如数据消费者)都希望发现和分析来自数据生产者的信息,以推动决策制定。数据需要被管控以保证安全,产生新的洞察需要允许数据访问,企业必须在二者之间寻求平衡。然而企业内数据多样,部门林立,用例不同,这些都对治理策略的落实提出挑战。一些企业通过建立目录来管理信息,但这些目录系统维护起来相当耗时,需要数据生产者手动标记每个数据集,额外添加来源或描述等情境信息来保证数据可以被检索和发现,同时缺乏内嵌的访问控制来简化数据治理。企业很难保持数据分级分类的一致性,以及各个数据生产者必须保持自己的信息实时更新,这使得在整个企业中搜索数据变得非常困难,并可能导致数据过时。在这种情况下,数据消费者即使找到了所需信息,也无法快速通过目录直接向数据所有者请求访问权限,也就无法加载数据分析服务以及与他人协作。最终,决策者无法及时获得所需信息,或者可能根据不完整或过时的数据做出欠佳的决策。

Amazon DataZone是一种全新的数据管理服务,它助力数据生产者轻松管理和控制数据访问,使数据消费者能够发现和使用数据、开展数据协作以获取业务洞察。数据生产者可以通过Amazon DataZone定义数据分级分类,配置治理策略,连接一系列亚马逊云科技服务(如Amazon S3和Amazon Redshift)、合作伙伴解决方案(如Salesforce和ServiceNow)和本地系统,从而创建自己的业务数据目录。Amazon DataZone使用机器学习为每个数据集收集和建议元数据信息(如数据来源和数据类型),并根据客户的分级分类和偏好进行模型训练,不断优化,从而消除数据目录维护的繁重工作。设置目录后,数据消费者可以使用 Amazon DataZone搜索和发现数据资产,检查元数据使用情境,请求数据集访问权限。当数据消费者开始分析数据,他们会创建一个Amazon DataZone数据项目,即门户系统中的一个共享空间,用户可以在其中提取不同的数据集、与同事共享访问权限、进行分析协作。Amazon DataZone与Amazon Redshift、Amazon Athena和Amazon QuickSight等亚马逊云科技数据分析服务进行了集成,数据消费者能够在其数据项目的情境中访问这些服务,他们的数据在这些服务中自动可用、无需单独的登录凭证。Amazon DataZone还提供应用程序编程接口(API)以与自定义解决方案或与DataBricks、Snowflake和Tableau等合作伙伴进行集成,因此,客户可以轻松发布、搜索和使用其所有的数据资产。

“良好的治理是整个组织都可以访问数据的基础,但我们经常听客户说,在使数据可发现和保持控制之间很难取得适当的平衡。”亚马逊云科技数据库、数据分析和机器学习副总裁Swami Sivasubramanian表示,“借助 Amazon DataZone,客户可以使用单一服务在强大的治理控制和简化的数据访问之间取得平衡,从而轻松查找、组织数据,使用数据进行协作。Amazon DataZone在整个企业内解放了数据的束缚,每个员工都可以帮助推动获取新的洞察,最大限度地发挥数据价值。”

ENGIE是一家全球能源公司,专注于可再生能源和分布式低碳能源基础设施,帮助客户实现脱碳目标。“我们ENGIE的主要优先事项是统一所有业务的数据,允许数据共享,以提高绩效,大规模创造价值。为了实现这一目标,我们在内部构建了公共数据平台,这在很大程度上解决了这一挑战。”Data@ENGIE首席技术官Gregory Wolowiec表示,“我们没有自建和维护一个平台来进行数据共享和治理。在过去六个月里,我们作为测试版本客户,一直与Amazon DataZone团队合作,为创建这项亚马逊云科技原生服务提供意见。我们期待着使用Amazon DataZone在整个公司内共享数据,简化对亚马逊云科技分析服务和治理工具的访问。这将使我们的分析师和业务线领导能够开启创新项目,根据数据驱动做出决策。我们很高兴将Amazon DataZone融入到我们的业务运营,利用其强大的功能实现数据共享,利用大数据创造价值。”

福克斯公司是一家领先的内容制作商和发行商,旗下拥有体育、新闻和娱乐等品牌。“在福克斯,统一所有的业务数据,打造安全、可信、规模化的数据发现、发布、访问和共享能力至关重要。我们希望业务团队能够安全地发现和共享数据,无需做深入的技术工作。”福克斯公司数据基础设施副总裁Alex Tverdohleb表示,“Amazon DataZone有助于我们简化、自动化数据发现和共享,保持适当的数据治理,因此我们可以确保在正确的时间使用正确的工具访问数据。”

伊塔乌联合银行(Itaú)是一家全球金融服务公司,也是拉丁美洲最大的私营金融机构。“打造数据驱动力是我们的主要企业目标之一,但我们在使用亚马逊云科技分析服务的过程中,必须不断平衡数据访问与治理及合规政策之间的关系,这使得团队难以快速行动。”伊塔乌联合银行数据和分析工程平台负责人Roberto Figueira表示,“我们很高兴能够测试使用Amazon DataZone,因为它将简化数据治理,使跨业务部门的数据访问变得更容易。借助Amazon DataZone,我们将能够快速轻松地为分析师、工程师和数据科学家团队设置精细的访问权限,帮助他们在各种业务场景中验证数据假设。”

为您推荐