コンテンツにスキップ
Wikipedia

データブリックス

出典: フリー百科事典『ウィキペディア(Wikipedia)』
この記事は広告・宣伝活動のような記述内容になっています。 ウィキペディアの方針に沿った中立的な観点の記述内容に、この記事を修正してください。露骨な広告宣伝活動には{{即時削除/全般4}}を使用して、即時削除の対象とすることができます。 (2020年7月)
この記事は英語版の対応するページを翻訳することにより充実させることができます。(2020年9月)
翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
  • 英語版記事を日本語へ機械翻訳したバージョン(Google翻訳)。
  • 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。
  • 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。
  • 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。
  • 翻訳後、{{翻訳告知|en|Databricks|...}}ノートに追加することもできます。
  • Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明があります。
データブリックス
Databricks Inc.
種類 株式会社
本社所在地 アメリカ合衆国 カリフォルニア州 サンフランシスコ
設立 2013年
業種 ソフトウェア開発
事業内容 AI、及び機械学習向け統合データ・アナリティクス・プラットフォームの提供
代表者 Ali Ghodsi(CEO)
外部リンク https://databricks.com/
テンプレートを表示

Databricksは、Apache Sparkの生みの親であるマテイ・ザハリアと共に、アリ・ゴディシが2013年に設立した企業である[1]

AI/機械学習をはじめとするビッグデータを扱うためのクラウド型の統合データ分析基盤である「レイクハウス・プラットフォーム」を提供しており、データエンジニアリング、データサイエンス/機械学習、データ分析の領域に強みがある。

2022年に上場予定と言われているユニコーン企業であり、2021年8月に発表したシリーズHの資金調達後の市場価値は約4兆円となっている。[2] 。2021年12月現在、世界で7,000社を超える企業に利用されており[3] 、テクノロジー販売パートナーは約450社となっている[4]

2021年ガートナーマジッククアドラント」において、データサイエンスおよび機械学習プラットフォーム部門のリーダーとして評価されている[5] 。また、2021年9月、ガートナー社のTechnology Hype Cycleのチャートには、「レイクハウス」が、Innovation Triggerのカテゴリーに分類された。

Apache SparkDelta LakeMLflow、Redashといった自社ソフト(もしくは創業メンバーが過去に開発したソフト)を組み合わせ、大規模なデータエンジニアリングとコラボレーション型データサイエンスのためのクラウドプラットフォームを開発しており、開発したソフトウェアの多くをオープンソース化し、オープンソースコミュニティとして維持していることもDatabricksの特徴。

データブリックス・ジャパン株式会社
Databricks Japan K.K.
種類 株式会社
本社所在地 東京都 港区 六本木1丁目4-5 アークヒルズサウスタワー16階
設立 2018年
業種 ソフトウェア開発
代表者 グレッグ・テイラー(社長)
外部リンク https://databricks.com/jp/
テンプレートを表示

日本法人はデータブリックス・ジャパン株式会社。

創業メンバー

[編集 ]
  • Ali Ghodsi, CEO, カリフォルニア大学バークレー校非常勤教授
  • Andy Konwinski、元バークレー大学博士課程の学生でApache Sparkのコミッター
  • Scott Shenker, Board Member, カリフォルニア大学バークレー校教授、Niciraの共同設立者で元CEO
  • Ion Stoica、カリフォルニア大学バークレー校教授、エグゼクティブチェアマン、Convivaの共同設立者兼CTO
  • Patrick Wendell、元バークレー校博士課程の学生でApache Sparkのコミッター
  • Reynold Xin, バークレー校の元博士課程の学生でApache Sparkのコミッター
  • Matei Zaharia, カリフォルニア大学バークレー校のPh.D.候補生時代にApache Sparkを作成し、現在はスタンフォード大学の教授

沿革

[編集 ]

2013年9月、DatabricksはAndreessen Horowitzから1390万ドルを調達したことを発表し、GoogleのMapReduceシステムに代わるものを提供することを目指していると述べた[6] [7] 同社は2014年に3300万ドル、2016年に6000万ドル、2017年に1億4000万ドル、2019年2月に2億5000万ドル[8] 、2019年10月に4億ドルを追加調達した[9] 。2021年2月に、シリーズGとして、Capital G(Goole)、Microsoft、AWS、SalesforceのクラウドBig4からの10億ドルの資金調達を発表し[10] 、2021年9月には、16億ドルのシリーズHの資金調達を実施、市場価値が約4兆円に到達した。[11]

関連ソフトウェア

[編集 ]
この節は検証可能参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?"データブリックス" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL
(2021年5月)

Apache Spark

[編集 ]

Apache Sparkは、ビッグデータと機械学習のための非常に高速なオープンソースのクラスタコンピューティングフレームワークである。Sparkのインタフェースを使うと、暗黙のデータ並列性と耐故障性を備えたクラスタ全体をプログラミングできる。Scala, Java, Python, R用のハイレベルなAPIや、データ分析用の一般的なコンピュテーショングラフをサポートする最適化エンジンを提供する。SQLやDataFrames向けのSpark SQL, 機械学習向けのMLlib, グラフ処理向けのGraphX, ストリーミング処理向けの Structured Streamingも提供する。

Delta Lake

[編集 ]

オープンソースのストレージレイヤー。非構造化、構造化、半構造化データも全て一括して格納する次世代型のデータレイク・データウェアハウスである。Apache Sparkや他ビッグデータエンジンに対して、拡張性やACIDトランザクション機能を提供する。

MLflow

[編集 ]

オープンソースのプラットフォーム。実験、再現性確認、デプロイメント、一元的なモデルのレジストリーなどの機械学習のライフサイクルの管理を容易にする。

Koalas

[編集 ]

オープンソースプロジェクト。pandas DataFrame APIをApache Spark上に実装することで、データサイエンティストがビッグデータを扱う際の生産性を向上する。

Pandas

[編集 ]

プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する。

脚注

[編集 ]
  1. ^ Dwoskin (June 9, 2016). "This is where the real action in artificial intelligence takes place". Washington Post. 2016年8月16日閲覧。
  2. ^ Kenrick, Cai. "Databricks Reaches 38ドル Billion Valuation After New 1ドル.6 Billion Injection". Forbes. 2021年8月31日閲覧。
  3. ^ "AIユニコーン企業のDatabricksが日本市場に本格参入 マーケターが注目すべきポイントは?". ITmedia マーケティング. 2020年11月12日閲覧。
  4. ^ https://it.impress.co.jp/articles/-/19496
  5. ^ https://databricks.com/jp/blog/2020/02/17/databricks-named-leader-in-gartner-magic-quadrant-for-data-science-and-machine-learning-platforms.html
  6. ^ https://gigaom.com/2013/09/25/databricks-raises-14m-from-andreessen-horowitz-wants-to-take-on-mapreduce-with-spark/
  7. ^ http://radar.oreilly.com/2013/09/databricks-aims-to-build-next-generation-analytic-tools-for-big-data.html
  8. ^ https://databricks.com/company/newsroom/press-releases/databricks-250-million-funding-supports-explosive-growth-and-global-demand-for-unified-analytics-brings-valuation-to-2-75-billion
  9. ^ https://techcrunch.com/2019/10/22/databricks-announces-400m-round-on-6-2b-valuation-as-analytics-platform-continues-to-grow/?guccounter=1&guce_referrer=aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnLw&guce_referrer_sig=AQAAAHel91F6Bdmi8j8V7Ey7_b7sjHcg1Djf5k6BU0HNNmjOOWPvcz209vZtb9zqBANxh9dhTsi4H59a4Bs9ACCQqvjT5veKWNV5JqamAsHsRn9481pIHv2m2vK3qy7rIg8AxR-PBJNrM2tb9bt5o7tfDA4Up6onLROJv2z-9b3FP712
  10. ^ ASCII. "米Databricks社、10億ドルのシリーズG投資により、評価額が280億ドルに". ASCII.jp. 2021年9月9日閲覧。
  11. ^ "データブリックス、16億ドルの資金調達で企業価値評価は380億ドルに". EnterpriseZine. 2021年9月9日閲覧。

AltStyle によって変換されたページ (->オリジナル) /