Apache Hadoopとは、 Doug Cutting (@cutting) 氏によって生み出された、 分散データ処理基盤の定番と言えるオープンソースソフトウェアであり、 現在はApache Software Foundationにおけるトップレベルプロジェクトの1つです。 Yahoo!やFacebook, 楽天など、 大量のデータ ...
前回の記事では、 Azure HDInsightサービスの概要に関してお伝えしました。 今回は、 実際にHDInsightのクラスタを作り、 いくつかの方法でジョブを動かす方法をご覧いただこうと思います。ぜひ、 お手元のマシンで実際にお試しください。 作業環境の準備 さて ...
Microsoftは2017年4月4日(以下すべて現地時間)、同社のエンタープライズ向けApache Hadoop及びSparkクラウドサービスであるAzure HDInsight 3.6がGA(一般提供版)に達したことを、公式ブログで明らかにした。Apache Spark 2.1をAzure Event Hubに統合し、Apache Kafkaの構造化 ...