Hadoop and MapReduce, the parallel programming paradigm and API originally behind Hadoop, used to be synonymous. Nowadays when we talk about Hadoop, we mostly talk about an ecosystem of tools built ...
This report focuses on how to tune a Spark application to run on a cluster of instances. We define the concepts for the cluster/Spark parameters, and explain how to configure them given a specific set ...
インプレスグループで電子出版事業を手がける株式会社インプレスR&Dは、『Apache Spark ビッグデータクエリチューニング』(著者:三上 威)を発行いたします。 最新の知見を発信する『技術の泉シリーズ』は、「技術書典」や「技術書同人誌博覧会」を ...
上新卓也氏:これでLogical Planにキャッシュを使うプランが含まれてきたので、その次の処理としてはOptimizerですね。 これは今までプランの書き換えなどはやってこなかったんですが、ここからプランをガシガシと書き換えていってより効率のよい処理が ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する