エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
導入 AWS Glue を使えば、S3 に保存された RDS スナップショットのデータを簡単に読み込み、複数のテー... 導入 AWS Glue を使えば、S3 に保存された RDS スナップショットのデータを簡単に読み込み、複数のテーブルを JOIN して分析に適した形式へ変換できます。 この記事では、Glue を使って以下のような処理を実現する方法を紹介します。 この記事でできること S3 にエクスポートされた RDS のデータを Parquet 形式で読み込み ユーザー情報・投稿・閲覧ログ・いいね・タグ情報を結合 閲覧時間の算出、いいね日時の抽出など軽い加工処理 結果を CSV に変換し S3 に保存 前提条件 RDS スナップショットを S3 にエクスポート済み(Parquet形式) AWS Glue ジョブの IAM ロールに S3 アクセス権限があること Glue ジョブは Spark (Python) で作成されていること コード全体(Glue ジョブ) import sys from awsg