前回の記事では、 Azure HDInsightサービスの概要に関してお伝えしました。 今回は、 実際にHDInsightのクラスタを作り、 いくつかの方法でジョブを動かす方法をご覧いただこうと思います。ぜひ、 お手元のマシンで実際にお試しください。 作業環境の準備 さて ...
Apache Hadoopとは、 Doug Cutting (@cutting) 氏によって生み出された、 分散データ処理基盤の定番と言えるオープンソースソフトウェアであり、 現在はApache Software Foundationにおけるトップレベルプロジェクトの1つです。 Yahoo!やFacebook, 楽天など、 大量のデータ ...
Databricksは、カルフォルニア州立大学バークレー校において、CEO兼共同設立者のアリ・ゴディシ(Ali Ghodsi)氏をはじめ、データとAIなどを研究するOSSの分散処理フレームワーク「Apache Spark」のクリエイター20人により、2013年にサンフランシスコで創業した。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する