[フレーム]
1 - 40 件 / 71件
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに この記事では、私がこれまでXで発信してきたデータサイエンスに関わるさまざまな分野のチートシートを一挙にまとめました。前処理、可視化、機械学習、深層学習、ベイズ・統計、さらにはその他の関連トピックまで、私が作成したものからネット上のものまで多岐にわたる内容を網羅しています。 それぞれのセクションでは、実践的かつ即戦力となる情報が詰まったチートシートを紹介しており、初心者から上級者まで幅広い層に役立つ内容を目指しました。 日頃からX(旧Twitter)を通じて、データサイエンスに関する知識や役立つリソースを共有していますが、今回の
概要 pysocviz が提供する機能 ggplot2 と同じようにできないところとその対策 aes() にクオートされてない変数を指定できない R のように改行できない ggplot2 で使えた色名が使えない ggplot2 で使えた linetype が使えない 文字化けの回避 ggrepel パッケージの利用 scales::percent などの単位・スケール指定 テーマや色パレットのプリセットを変更したい場合 subtitle/caption が表示されない 複数のグラフを連結できない hjust/vjust が使えない グラフ内の図形やテキストの大きさのバランスがおかしい geom_smooth/stat_smooth で一般化加法モデル (GAM) による平滑化ができない geom_quantile の method 指定ができない geom_smooth/stat_smoo
ExcelのPythonJupyter Notebook JupyterをMicrosoftExcelに埋め込み、VBAの代わりにPythonを記述します 以前は、ExcelとPython JupyterNotebooksの間の「どちらか/または」の選択でした。PyXLL-Jupyterパッケージの導入により、両方を並べて使用できるようになりました。 この記事では、Excel内で実行されるJupyterNotebookをセットアップする方法を紹介します。2つの間でデータを共有し、ExcelワークブックからJupyterノートブックに記述されたPython関数を呼び出すこともできます。 入門 まず、ExcelでPythonコードを実行するには、PyXLLアドインが必要です。PyXLLアドインを使用すると、PythonをExcelに統合し、VBAの代わりにPythonを使用できます。PyXLL
import numpy as np import scipy from scipy.stats import binom %matplotlib inline %config InlineBackend.figure_format = 'svg' import matplotlib import matplotlib.pyplot as plt import seaborn as sns print("numpy version :", np.__version__) print("matplotlib version :", matplotlib.__version__) print("sns version :",sns.__version__) numpy version : 1.18.1 matplotlib version : 2.2.2 sns version : 0.8.1
Pythonグラフ入門# このPythonグラフ入門では、プログラミング言語Pythonを使ってグラフを描画する方法を解説しています。対象としている方は、ある程度Pythonに触れている人(リストやNumPyを使った配列を理解できるレベル)です。 本サイトの特徴# このサイトは、Jupyter LabでPythonコードを実行した結果を、Jupyter Bookを用いてHTMLファイルに変換したものです。そのため、お手元の環境でもライブラリなどのバージョンを揃えた上でコードを実行すれば、同じ結果が得られます。 サイト内の検索は、ページ右上の虫メガネのアイコン、または左側のメニュー上部の検索窓から行えます(ウィンドウの幅によって異なります)。 このサイトで検証したPythonと各ライブラリのバージョンは以下の通りです。 Python 3.12.4 Matplotlib 3.9.1 Seabo
最近、とある興味 *1 から量子力学(とりわけ量子化学)の勉強をしています。 水素原子の電子の軌道を計算すると、s軌道とかp軌道とかd軌道とかの計算が載っていて、対応する図が教科書に載っていたりしますよね。 こういうやつです: Wikipedia「球面調和関数」より引用 Attribution: I, Sarxos 個人的な体験ですが、予備校の頃は先生の影響で「化学」に大ハマりしていました *2。 ここから「Emanの物理学」というサイトの影響で「物理」に目覚め、そこからなぜか「数学」に目覚めて現在に至ります。そういった経緯もあって、化学には大変思い入れがあります。 特にこの水素原子の軌道の図は当時から気になっていて、自分で描いてみたいと思っていました。先日ようやく理解でき、実際に自分で描画できるまでになりました。以下がその画像です: これはタイトルにもある「球面調和関数」と呼ばれる関数を
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
tl;dr 2020年1年間のはてなブックマークの人気エントリー3万件をもとに技術トレンドを分析。 その結論とPythonでグラフ化した手順を書き記します。 ※(注記)ご指摘がありましたが、技術トレンドというよりitニューストレンドと言った方が正しいかもしれません。踏まえてお読みください。 前置き 手元に2020年の1年間ではてなブックマークの技術カテゴリーにおいて人気エントリーに一度でも乗ったことのある記事のタイトルデータが3万件ほどあったため、形態素解析を行い単語の出現頻度順に並べてみました。欠損の割合としては多くても1割程度、つまり少なくとも9割程度のデータは揃っているはずなので精度はかなり高いと思います。 (※(注記)はてなブックマークはNewsPicksみたくインターネット上の記事をブックマーク・コメントでき、より多くブックマークされた記事が人気エントリーとしてピックアップされるサービスです。w
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
こんにちは、優勝しました。 背景 Juliaを使おうとしたら様々な環境構築時のトラブルに見舞われました。終わりです。 使えるけどストレスなところ グラフの描画が遅い matplotlibと比較してしまう PyPlotが使えない -> ローカルPCのpyenvのせい Plotsを使うことにした グラフを描画しても画像に焼いてブラウザから見るしかなかった 困ったこと pkgのインストールにたまに失敗する すでに削除したはずのpkgが原因で実行時にエラーがこびりつく これらは全部ローカル環境でJuliaを使おうとしているために起こる問題です。原因解決するのも時間かかるし、将来的なことを考えてDockerを使うことを決意しました。 Dockerの構成 全部Jupyter Labに投げる方針です。Jupyter公式のイメージを持ってくるだけで、Python、Julia、Rが使えるらしいです。 Doc
import matplotlib.pyplot as plt n_row, n_col = 2, 2 fig, ax = plt.subplots(n_row, n_col, figsize=(8, 6)) # 描画領域が1列 or 1行のときaxはベクトルですが、それ以外は行列になるので # 各要素へのアクセス方法に注意 for i in range(n_row): for j in range(n_col): ax[i, j].plot([1, 2, 3, 4, 5]) ax[i, j].set_title(f"ax[{i}, {j}]") fig.suptitle("Main title") fig.tight_layout() plt.savefig("multi_plots.png") import matplotlib.pyplot as plt fig, ax = plt.
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
Pythonでグラフを描くときは、Matplotlibを使うことが多いですが、 グラフの「この要素」を変更するには、「どのメソッド」を使えばいいのかわからない...。 検索するのが大変で、もうMatplotlib使いたくない! という方のために、 Matplotlibの軸・目盛り・目盛り線の設定 について総まとめしました。 私自身も今回紹介する内容を覚えてからは、Matplotlibの軸周りの設定はある程度自力でできるようになっています。 軸・目盛り・目盛り線の設定サマリーチャート 時間軸の設定 軸周りの設定の前に... pltメソッドとオブジェクト指向 基本のグラフ 軸ラベルの設定 軸ラベルの表示 軸ラベルの見た目変更 軸の最大値・最小値の設定 目盛の表示値を変更 リストで目盛りを指定:xticks([目盛り値のリスト]) np.arangeで値を指定:xticks( np.arange(sta
データの可視化はなぜ必要なのでしょうか。それは、そのデータを生み出している事象をより正確に理解したり、機械学習での予測に用いる際に、使うべきデータを適切に選んだりするためです。そのためにはまず、データを可視化することによって、データの大まかな特徴をつかんだり、データ同士の相関関係を知ることが必要なのです。 さて、Pythonでデータを可視化する際には、まず、Pandasでデータを集計・加工します。その上で、matplotlib(マットプロットリブ)や今回ご紹介するseaborn(シーボーン)というライブラリで可視化を行います。seabornは特に、手軽に美しく可視化ができるライブラリなので、本稿でseabornがいかに魅力的なライブラリであるかを学びましょう。 seabornの特徴 seabornとは、Pythonのデータ可視化ライブラリで、同じPythonの可視化ライブラリであるmatp
Jupyter Notebookでmatplotlibを使用する場合には、インポートする前に %matplotlib inline と記述しますよね?では... なぜinlineと入力しているのでしょうか? 入力し忘れても動くことがあるのはなぜでしょうか? %matplotlib notebookというコマンドもあるのをご存じでしょうか? この記事では、matplotlib inlineの謎について解説していきたいと思います! Jupyte Notebookのmatplotlibの読み込み|%matplotlib inline %matplotlib inlineを指定したときの挙動 グラフがアウトプット行に出力される plt.show()を省略してもグラフが出力される plt.show()でアウトプット行に2つのグラフ表示 %matplotlib inlineの意味はバックエンドの指定 バッ
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 温度を視覚的に表現するためのカラーマップは、低温側に寒色、高温側に暖色を配したものが最も一般的かつ直感的 です。その一方で、多くのソフトが標準で準備している rainbow カラーマップは、視覚的な理想から遠い存在 となっています。 matplotlib は様々なカラーマップを提供しており、その一覧は Choosing Colormaps in Matplotlib にまとめられています。ここにあるカラーマップの中でも、特に気温や海面水温といった温度を表現する際によく用いられるものとして、 RdYlBu_r 、 jet 、 t
いよいよ 分子軌道 を計算してみたいと思います。 今回の記事の内容を理解するとエチレンやブタジエンやベンゼンなどの分子軌道が計算でき、それをPythonのプログラムで可視化できるようになります。 これまで3回に渡って書いてきた「日曜化学シリーズ」の記事ですが、今回がまさに集大成となっています。 過去の記事を前提にお話しますので、まだの方はシリーズの過去記事をご覧になってください。 tsujimotter.hatenablog.com (番外編の日曜化学(2.5)は読まなくても、今回の内容については大丈夫です。) 前回までの記事で計算したのは、水素様原子という 原子核が1つ・電子が1つ のものでした。 そうなると、原子核が2つ以上で電子が1つ の状況(つまり分子)を計算したくなると思います。 上記の状況はポテンシャルによって表すことができますので、ハミルトニアンに反映させればシュレーディンガ
データ読み込み データは2つのエクセルファイルから読み込みます。 ファイル calvert.xlsx 1つめのデータは下に示すもので、作例グラフの緑線を描くためのもの。 エクセルで以下のような形で収納されています。これは自分でデータを打ち込んだので、打ち込みやすいよう、日付(dd)、月(mm)、年(yy)、値(Q) という並びにしています。 欠測期間が長く、グラフの線を連続させたくない場合は、欠測期間中のある一日の日付とデータとして nan をいれることにより、グラフの線を結ばないで描画してくれます。 ファイル v-notch.xlsx 2つめのデータは下に示すもので、作例グラフの濃い青線を描くためのもの。 これは既存のエクセルファイルがあったのでそれを用いていますが、ここで使用するのは、カラム A (Date)とカラム N (RWL) だけです。 エクセルファイルからのデータ読み込み エ
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Pythonでグラフを描くときにはMatplotlibを使用することが多いですが... FigureとかAxesとかMatplotlib独特の単語が多くてよくわからない! Figureを作った後、結局どうやってプロットすればいいの? Figureを作ると、グラフの何を設定できるの? という方のために、 FigureとAxesの関係性は? FigureにAxes(サブプロット)を追加する方法厳選3パターン 覚えておきたいFigureの設定・操作(サイズ変更、レイアウト調整など) を図解付きで解説していきます。 これでFigureとAxesの関係がばっちりわかって、グラフも自由に操作できるようになってくると思います! Matplotlibの描画領域Figureと座標軸Axes Figureにプロットを追加する方法3選 plt.plot()で追加 fig.add_subplot()で追加 fig.s
PythonのMatplotlibで描いたグラフを、NumPyのndarrayに変換して、OpenCVやPillowで使えるようにします。 目次 Matplotlibのグラフをndarrayに変換するサンプルのグラフの作成グラフをndarrayに変換してPillow(PIL)で表示するグラフをndarrayに変換してOpenCVで表示するMatplotlibのグラフをndarrayに変換する Matplotlibはグラフを描いて表示して保存するだけなら非常に便利なのですが、出力をいじろうとするとなかなか難しいものです。 公式のチュートリアル を参考にしましたが、APIのマニュアルを読んでもよくわからないところがあります。 本投稿の環境は、Python 3.7とmatplotlib 3.1.1です。動作しないようでしたら、matplotlibのバージョンを確認してみてください。 手順は次の通
Pythonのグラフ描画ライブラリMatplotlibではアニメーションも作成できますが、初めての人には少し複雑です...。 そこで、今回は Matplotlibでアニメーションを描きたいけど、よくわからない! 試しにやってみたけど、アニメーションが動かない...。 という方のために、 Matplotlibでアニメーションを超簡単に作成・保存する方法 アニメーション作成用の超基本テンプレ を画像・サンプルコード付きで紹介していきます! 今回は、初心者の方向けにArtistAnimationでサクッとアニメーションを作成する方法を紹介しています。 Matplotlibでアニメーションを作成する2つの方法 Jupyter Notebookの場合の注意点 ArtistAnimationでアニメーション作成 ArtistAnimationの基本形 引数によるアニメーションの詳細設定 【応用編】複数要素を同
こんにちは、GMOアドマーケティングのS.Rです。 Matplotlibはデータ可視化のために機械学習エンジニアによく使われているツールです。ただデフォルトの環境ではMatplotlibで作成された図は日本語を正しく表示できません。 デフォルトの環境で例の図を作成 今回は三角関数sinを例として図を作成します。サンプルのコードは下記です。 import numpy as np import matplotlib.pyplot as plt t = np.arange(0.0, 2.0, 0.01) s = np.sin(2*np.pi*t) plt.plot(t, s) plt.title("三角関数sin") plt.xlabel('x') plt.ylabel('sin') plt.show()
import matplotlib.pyplot as plt import numpy as np # データを作成する。 def f(x, y): return np.sin(x) ** 10 + np.cos(10 + y * x) * np.cos(x) x = np.linspace(0, 5, 50) y = np.linspace(0, 5, 40) X, Y = np.meshgrid(x, y) Z = f(X, Y) # 等高線を作成する。 fig, ax = plt.subplots() c = ax.contourf(X, Y, Z, 20, cmap="jet") fig.colorbar(c) plt.show() matplotlib で利用できるカラーマップ matplotlib で利用できるカラーマップ一覧は以下の記事で解説しています。 [blogcard
import matplotlib.pyplot as plt import seaborn as sns # タイタニック号のサンプルデータを読み込む df = sns.load_dataset('titanic') # チケットクラスごとの生存率を横棒グラフで可視化する g = sns.catplot(data=df, x='survived', y='class', kind='bar', ci=None) # 見た目の設定 fig, ax = (g.fig, g.ax) ax.set_title('チケットクラスごとの生存率')
この記事で紹介するたったの 1行 プログラムを追加するだけの方法で、作成した図に モダン(今風) なデザインを適用することができます。 視覚化を意識した図を作ることには向いていませんが、 サクッと良い感じのデザインにしたい ときにオススメです。
Pythonのデータ可視化ライブラリといえば、Matplotlibですね。Matplotlibで作成した画像は様々なファイル形式で保存することができます。しかし、実際に画像を保存しようとすると、次のような問題に直面することも... 1 画像として保存するにはどのメソッドを...
今回は、時系列データグラフにおいて日付フォーマットや表示を変更する方法。 matplotlibで折れ線グラフを描いたとき、横軸の文字が重なって塗り潰れることがあります。 時系列データの横軸(日付)に限定ですが、日付を短く表示しそれを解消する方法のメモ。 結論から書くと、 DataFrameインデックスを横軸をdatetime型日付にした後、 グラフ作成で次の「追加」文を加える。 # 時系列データの時間軸用を追加すること! import matplotlib.dates as mdates plt.plot(データ) # 普通にグラフを描く # フォーマット変更はこれ追加 / ("%y/%m")をいじる plt.gca().xaxis.set_major_formatter(mdates.DateFormatter("%y/%m")) # 目盛のインターバル変更はこれ追加 /(interva
Pythonでデータを可視化するライブラリはいくつかありますが、Pandasだけでも結構なんとかなります。 Pandasを使った可視化はメソッドチェーンで完結できるので、無秩序に一時変数が散乱することを僅かながら防ぐことができます。 この記事では、私が実務でよく使うものを中心に、可視化のレシピを紹介します。 準備 環境 Python: 3.6.8 Pandas: 1.0.4 データ 今回は次の2つのデータをお借りします。 Titanic: Machine Learning from Disaster | Kaggle Crimes in Boston | Kaggle それぞれtitanicとcrimeというDataFrameにします。 import pandas as pd import zipfile # 便利ジェネレータ def read_zipcsv(file, **kwargs)
幸か不幸か、ビジネス系のデータの多くは時系列データです。売上データもホームーページのアクセスログもセンサーデータも時系列データです。 時系列データを手にしたとき、どのようなデータなのか見てみたい、ということは多々あります。 多くの場合、折れ線グラフを描き傾向を掴む、ということをやります。 折れ線グラフを眺めると、トレンド(上昇傾向や下降傾向)や季節性などが見て取れるケースがあります。 そこで、サクッとトレンドや季節性などを掴む手法がSTL分解(Seasonal Decomposition Of Time Series By Loess)です。 STL分解(Seasonal Decomposition Of Time Series By Loess)を実施することで、元データをトレンド、季節性、残差に分解することができます。 元データ = トレンド + 季節性 + 残差 STL分解(Seas
plt.show()で表示したプロットは、ウィンドウの上にあるフロッピーのアイコンから保存できますが、スクリプトから直接保存することもできます。 plt.savefigを使うとファイルに直接出力できます。 sin_savefig.py import numpy as np import matplotlib.pyplot as plt x = np.arange(-5, 5, 0.1) y = np.sin(x) plt.plot(x, y) plt.savefig("sin.png") # プロットしたグラフをファイルsin.pngに保存する plt.show()
問題点 matplotlib の散布図などのプロットの際に、各点にラベルを付けてプロットしたい場合、下の図のようにラベルが重なってしまうため、ラベル付きプロットを諦めることが多々ありました。 図1: 散布図 (Before) 解決方法 ラベルの配置を制御する方法を探していたら、adjustTextというモジュールと出会いました。 github.com なんとラベルの重なりを最小限にし、スマートに配置してくれるモジュールとのこと。早速使ってみました。 図2: adjustTextと適用した散布図(アロー無し) 重なりが最小限になり、かなり見やすくなりました! さらに、アローを付けることもできます。 図3: adjustTextと適用した散布図(アロー付き さすがにプロットする点数が数百点ともなると処理に時間がかかる&最適化しても重なってしまうため、50±30点くらいの時に使うのが良さそうです
本記事では、配列を視覚的に図示するヒートマップをPythonのmatplotlibを利用して作成する方法を紹介していきます。 今回は、matplotlibのimshowを使用して簡単にヒートマップを作成していきます! 本記事を読むことで、カラーバーつきの綺麗なヒートマップが作成できること間違いなしです。 *本記事ではmatplotlibを一度は触ったことがあることを前提に記事を作成しています(一度も触ったことがない方は下記を参考にしてください) 【15分】Pythonでグラフを作成する方法|matplotlibの基本をマスターPythonでグラフを書くことが難しそうだと思っていませんか?実は、Pythonを使用したグラフ作成は、excelより便利で簡単です。この記事では、初心者でもグラフが書けるように丁寧にpythonのグラフの作成法を説明します。...
matplotlib は自由度が高すぎるがゆえに、何をどういじれば思い描いたグラフを作ることができるのか、今日も多くの人が細かい調整に多大な時間を奪われているに違いありません。かく言う私もその一人でした。 グラフの専門用語もあいまいで、そもそも自分がやりたい視覚化は 何という箇所をいじれば良いのか? を調べるところから始まります。公式リファレンスを覗こうにも、英語で書かれたグラフの専門用語の洗礼を受けるので十中八九挫折するでしょう。 まずは 日本語と英語の専門用語を結びつけること からはじめてみてください。そして、次に matplotlib の中核をなす Artist について理解して、少しずつ慣れていきましょう。 本記事では、以下のモジュールを読み込んで進めるものとします。
Lambda上でmatplotlibを使ってグラフを作成したいとき、Lambdaには日本語フォントが含まれていないため日本語が豆腐になってしまいます。この記事では、日本語対応するための方法について説明します。 前提 matplotlibは別途利用できるようにレイヤーなどで用意する必要があります。 やり方 Lambdaレイヤーに日本語フォント用のレイヤーを登録 Lambda関数に日本語フォント用のレイヤーを追加 matplotlibでフォント読み込み 1.Lambdaレイヤーに日本語フォント用のレイヤーを作成 日本語フォントなら基本的に何でもOKと思いますが、今回はIPAexゴシック(ipaexg.ttf)をダウンロードして使いました。 ダウンロードしたttfファイルを適宜ディレクトリ(例えばfontsなど)に入れてzip圧縮します。 Lambdaのレイヤーページから「レイヤーの作成」にて作
import numpy as np from matplotlib import pyplot def arrow(): fig = pyplot.figure() ax = fig.add_subplot(111) point = { 'start': [10, 10], 'end': [90, 90] } ax.plot(*point['start'], 'o', color="red") ax.plot(*point['end'], 'o', color="blue") ax.annotate('', xy=point['end'], xytext=point['start'], arrowprops=dict(shrink=0, width=1, headwidth=8, headlength=10, connectionstyle='arc3', facecolor='gray
Seaborn (シーボーン) とは、ニューヨーク大学の研究者 Michael Waskom 氏によってPythonの可視化ライブラリの一つです。Seaborn は Matplotlib ベースで作られているため、散布図や折れ線グラフなどの基本的なグラフ描画は Matplotlib の機能を利用している特徴があります。 本サイトで取り扱う Seaborn の活用例 本サイトでは以下のようなデータを可視化手順についてを紹介します。 Seaborn のインストール PyCharm を使って Seaborn のグラフを出力する Seaborn で件数や平均値を棒グラフで可視化する Seaborn で散布図・回帰モデルを可視化する Seaborn でヒートマップを作成する 上記以外のグラフについては、Seabornのチュートリアル (英語) や Seaborn の Gallery ページ (英語)
Matplotlibを使用して画像を3Dグラフの平面として表示する方法を詳細に解説。様々な向き(X、Y、Z軸平行面)に画像をプロットする柔軟な実装方法と、RGB/グレースケール画像対応のカスタム関数を提供。可視化の応用例と実装上の注意点も含む。
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く