エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure y... Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 「NetflixはSparkでペタバイト級の集計をやってるらしいですね〜」(2015年の発表) 「AWSのEMRとかGCPのDataprocあたりでSpark環境を用意してみました。ふふん」 「とりまクラスタ立ててみましたけど、全然パフォーマンスでないんですけど?」 「っていうか何が起きてるかよく分からないし......分散処理とか馴染みないし......」 という感じの方が、とりあえずSpark SQLの実行計画やWeb UIの情報をざっくり読みとってチューニングできるようになるための道筋を示すことが本記事の目的です。 Sparkの良い解説記事は沢山