データ基盤では「大量のデータを集める」ことよりも「正しいデータを維持する」ことが最重要です。Databricksでは NOT NULL, CHECK, UNIQUE といったSQL標準の制約に加え、Expectation句(DLTの品質ルール) を利用してデータ品質を担保できます。 NOT NULL:必須項目 ...
本書は『Software Design』のデータベースに関連する特集記事を再収録した書籍です。 プロダクトに依存しないデータモデリングの基本をはじめ, 基本命令文はもちろん, 複雑な集計を行うSQLの書き方, MySQLを扱う際に必須となるデータ型/ インデックス ...
SQLのJOINが複雑になる構造的な理由と、それを解決するセマンティックデータグラフという新しいアプローチ データモデリングツールの「分断問題」――BIツールでは便利なのにSQLユーザーが恩恵を受けられない矛盾と、その解決策 Shute, J., Zheng, C., & Kudtarkar, R.