您現在的位置是:首頁 >互聯網 > 2021-01-14 11:39:28 來源:
Okera將智能模式管理引入S3數據湖
Okera Inc.是由Cloudera Inc.的兩位前高管創建的一家初創公司,旨在簡化大規模異構數據存儲的管理。今天,Okera Inc.推出了一種架構管理工具,旨在使公司更容易從流行數據中查找,訪問和構建數據在Amazon Web Services Inc.的S3云存儲服務之上運行的分析工具。
該公司 于5月份以隱身模式啟動,獲得了1,460萬美元的風險融資,專門從事數據湖的數據治理,這些數據湖是未按架構進行組織的,很大程度上是非結構化數據的集合,是對架構的直觀表示。數據庫中表之間的關系。模式通常在生產中使用之前先應用于結構化數據,但是非結構化數據可以克服這種嚴格的分類。
Okera首席執行官Amandeep Khurana說:“數據湖已經失去了我們在關系數據庫領域已經習慣的所有功能。” “我們正在提供該功能。”
Okera的Active Data Access Platform新版本具有公司所謂的“智能模式管理”功能,該功能使數據管理員能夠自動發現新數據集,推斷其模式并在細粒度級別分配通用訪問權限。
它還具有一名新的文件系統經理,該公司表示,該文件經理簡化了S3數據存儲中非結構化數據的發現,訪問,治理和使用。支持的分析平臺包括Amazon的Elastic Map Reduce,Apache Hive,Apache Presto,Apache Spark和Tableau Software Inc.,Birst Inc.和Qlik Inc.的商業智能軟件。
該平臺類似于數據目錄,因為它使數據能夠根據分配的元數據集進行注冊和管理。但是,“大多數目錄都集中在業務元數據上。我們是技術和運營的元數據,”庫拉納說。“借助模式提取,我們使加入數據集的數據生產者的工作變得更加輕松。”
數據湖由于缺乏提供結構和訪問控制的工具而備受困擾,這兩種工具對于執行可靠的分析而不會有無意披露的風險都是必不可少的。
Okera表示,其平臺不僅使管理員可以在一處跟蹤所有數據,還可以強制執行訪問規則直至現場。Okera表示,它可以大規模自動化這些管理程序,并且已經在為客戶管理數PB的數據湖。
定價基于使用情況,但Okera沒有提供詳細信息。