SnowparkによるPython処理の進化:Databricksの牙城を崩せるか? Databricksが圧倒的な存在感を持っていました。 理由は明確です。 SQL中心の世界でした。 Pythonでの高度な処理は 外部システムへデータを持ち出す必要があり、 ここに大きな断絶が存在していました。
DatabricksのDeclarative Pipelineでは、データ品質を担保するためのルール(Expectations)を宣言的に定義できます。ただ、実装方法として「SQL(YAMLに近い形式)」と「Python(DLTなどを活用)」の2つの選択肢があり、どちらを選ぶべきか迷う方も多いのではない ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する