1. Lakeflow Expectationとは?品質ルールをYAMLで定義する仕組み DatabricksのLakeflowでは、データ品質を宣言的に管理するための仕組みとして「Expectation」が用意されています。 これは「どんなデータを正とみなすか」をYAML構成で定義し、違反したレコードを自動的 ...
Databricksは、カルフォルニア州立大学バークレー校において、CEO兼共同設立者のアリ・ゴディシ(Ali Ghodsi)氏をはじめ、データとAIなどを研究するOSSの分散処理フレームワーク「Apache Spark」のクリエイター20人により、2013年にサンフランシスコで創業した。
前回はDatabricksの「データの取り込み」から「データの処理」までの内容について簡単に説明しました。 今回はいよいよ最終回!DatabricksでのETL作成方式とAWSでデータレイクを構築することに対する比較について説明します。 この章では、DatabricksでETLを作成 ...