MapReduce

MapReduce(マップリデュース)は、コンピュータ機器のクラスター上での巨大なデータセットに対する分散コンピューティングを支援する目的で、Googleによって2004年に導入されたプログラミングモデルである。

このフレームワークは関数型言語でよく使われるMap関数とReduce関数からヒントを得て作られているが、フレームワークにおけるそれらの用いられ方は元々のものと同じではない。

MapReduceのライブラリ群は、C++、C#、Erlang、Java、OCaml、Perl、Python、PHP、Ruby、F#、R言語、MATLAB等のプログラミング言語で実装されている。

概要

MapReduceは巨大なデータセットを持つ高度に並列可能な問題に対して、多数のコンピュータ(ノード)の集合であるクラスター(各ノードが同じハードウェア構成を持つ場合)もしくはグリッド(各ノードが違うハードウェア構成を持つ場合)を用いて並列処理させるためのフレームワークである。処理は、ファイルシステム(非構造的)もしくはデータベース(構造的)に格納されたデータに対して行うことができる。

Map ステップ - マスターノードは、入力データを受け取り、それをより細かい単位に分割し、複数のワーカーノードに配置する。受け取ったワーカーノードが、更に細かい単位に分割し、他の複数のワーカーノードに配置するという、より深い階層構造の分割を行うこともある。そして、各ワーカーノードは、その細かい単位のデータを処理し、処理結果を、マスターノードへと返す。

Reduce ステップ - 続いて、マスターノードが、Mapステップでの処理結果を集約し、目的としていた問題に対する答え(結果)を何らかの方法によって出力する。

MapReduceの特徴は、MapとReduceの各ステップで並列処理が可能なことである。それぞれのMap処理は、他のMap処理と完全独立であり、理論的に全て並列実行することができる(実際には、データソースやCPUの数により制限がかかる)。続くReduceステップでは、Mapステップでの処理結果がキーごとにまとめられてReduce処理に送られることになるが、これも同様に並列処理が可能である。

MapReduce による一連の処理は、逐次実行アルゴリズムと比較してしばしば非効率にみえるが、MapReduce は一般の汎用サーバが取り扱うことが可能なデータ量をはるかに超える大きなデータセットに対しても適用することができる。多数のサーバを持っていれば、MapReduce を使いペタバイト級のデータの並べ替えをわずか数時間で行うことも可能である。

また、処理が並列的であることで、複数あるサーバやストレージの一部に障害が起こり、Map処理やReduce処理が実行できないノードが発生した場合でも、入力データがまだ利用可能である場合は、処理を再スケジュールして実行させることが可能となる。これにより、障害に対して、しばしば処理継続中のリカバリーが可能になる。

参考文献

[編集 ]

日経BP出版局著「クラウド大全サービス詳細から基盤技術まで」2009年 ISBN 9784822283889

関連事項

[編集 ]

Google

Alphabet・歴史・サービス

企業

イベント・取り組み

Android
Doodle4Google
Code-in
Code Jam (英語版)
Developer Day (英語版)
Developers Live (英語版)
I/O
Lunar X Prize ^*
Science Fair (英語版)
Summer of Code
Talks at Google
取り組み・プロジェクト
- ATAP (英語版)
- ドラゴンフライ ^*
- Made with Code (英語版)
- Project Sunroof (英語版)
- Cultural Institute
- 「邪悪になるな」
- OKR

人物

デビッド・チェリトンアル・ゴアアラン・ユースタスアラン・ムラーリーアミット・シングハル (英語版) アン・メイザー (英語版) デビッド・ドラモンド (英語版) エリック・シュミットジェフ・ディーンジョン・ドーアジョン・ハンケジョン・ヘネシークリシュナ・バハラット (英語版) マット・カッツパトリック・ピシェットポール・オッテリーニオミッド・コーデスタニレイチェル・ウェッツトン (英語版) ラム・シュリラムレイ・カーツワイルサラー・カマンガーサンジェイ・ゲマワット (英語版) シャーリー・ティルマン (英語版) スーザン・ウォジスキウルス・ヘルツル (英語版) ヴィントン・サーフハル・ヴァリアンニール・モーハン
役員	スンダー・ピチャイ (CEO) アナト・アシュケナージ (CFO) ルース・ポラット (CIO)
創業者	ラリー・ペイジセルゲイ・ブリン

部門

Android Glass Google Ads (広告) Google AI Google Chrome Google Cloud Google Health Google Maps (マップ) Google Nest Google Pixel Google Search (検索) YouTube
不動産	111 Eighth Avenue (英語版) チェルシーマーケット (英語版) Googleplex Data Centers (英語版)

開発

オペレーティングシステム	Android Automotive TV Wear ChromeOS Chromium OS Fuchsia Glass OS (英語版)
ライブラリ・フレームワーク	AMP Angular Angular AngularJS ARCore APIs (英語版) Charts (英語版) Dialogflow (英語版) FLoC Flutter Guava Guice Polymer Web Components (英語版) Tango (英語版)^* TensorFlow
ツール	Android Studio App Inventor App Maker (英語版) Closure Tools Developers Gadgets API (英語版) GData (英語版) Lighthouse Native Client ^* OpenRefine PageSpeed Insights (英語版) reCAPTCHA Search Console (英語版) Swiffy (英語版)^* Web Toolkit
探索アルゴリズム	ページランク Hummingbird (英語版) Panda Penguin Pigeon (英語版) RankBrain (英語版)
ファイルフォーマット	APK KML VP9 AV1 WebM WebP
その他	Chrome Experiments Cloud App Engine BigTable Cloud Spanner Data Transfer Project (英語版) DeepMind Fiber Gears ^* GFS Health Labs ^* マテリアルデザイン MapReduce OpenSocial Public DNS Web Server Google Coral プログラミング言語 Dart Go Sawzall (英語版)^*

サービス

娯楽	Chromecast Play ブックスゲームムービーミュージック ^* ニューススタンド ^* ポッドキャスト ^* サンタを追いかけよう Stadia ^* Google TV VEVO YouTube Gaming^* Kids Music YouTubeシアター
伝達・交流	Chat Contacts Duo ^* Gmail グループハングアウトトーク ^* IME 日本語入力ピンイン入力 Inbox ^* Meet メッセージ Orkut ^* Spaces (英語版)^* 翻訳ボイス Google+ ^*
検索	アラートブログ検索 (英語版)^* ブックス Ngram Viewer データセット検索 Dictionary (英語版) フライト (英語版) Finance Googlebot 画像検索マップストリートビューマップメーカー ^* ビルディングメーカー ^* ニュース News Archive Search ^* Patents Google Public Data Explorer Scholar 検索ナレッジグラフパーソナライズド検索 (英語版) セーフサーチ音声検索 (Google) ショッピングソースコード検索 ^* デスクトップ ^* Find Hub トレンド Insights for Search (英語版)^* ビデオ GOOG-411 ^* 谷歌 (中国版Google) Gemini
組織・管理	カレンダータスク (英語版) フォトドライブドキュメントエディタドキュメントスプレッドシートスライドフォーム図形描画 Keep ノートブック ^* NotebookLM One Workspace
ビジネス・金融	広告 Ad Manager (英語版) AdSense マーケティングプラットフォームアナリティクス Pay ウォレット^* Checkout ^* Primer (英語版)^*
その他	Arts & Culture アシスタント Chrome Chromium Classroom クラウドプリント ^* クラウドソース Google Doodle Earth Express (英語版)^* Fi (英語版) Fit Gboard Google.org iGoogle ^* Now パック ^* リーダー ^* セーフブラウジング (英語版) SketchUp Station (英語版)^* TalkBack URL Shortener ^* VirusTotal 画像・写真カメラレンズ Snapseed (英語版) フォト Goggles ^* Panoramio ^* Picasa ^* 出版 Blogger Google Domains ^* FeedBurner サイト Quickoffice ^* フォント Noto 源ノ角ゴシック JotSpot ^* Knol ^*

ハードウェア

Nexus

表話編歴 Google Nexus
スマートフォン	Nexus One Nexus S Galaxy Nexus/SC-04D Nexus 4 Nexus 5/EM01L Nexus 6 Nexus 5X Nexus 6P
タブレット	Nexus 7 (2012) Nexus 7 (2013) Nexus 10 Nexus 9
その他	Nexus Q Nexus Player