[フレーム]

サクサク読めて、
アプリ限定の機能も多数!

はてなブックマーク
テクノロジー
画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

気に入った記事をブックマーク

気に入った記事を保存できます
保存した記事の一覧は、はてなブックマークで確認・編集ができます
記事を読んだ感想やメモを書き残せます
非公開でブックマークすることもできます

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

テクノロジーカテゴリーの変更を依頼記事元:qiita.com/omiita

適切な情報に変更

エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます

コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

次回からTwitterへ自動リダイレクト

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

439users がブックマークコメント 13

ゲスト

コメントするにはログインが必要ですブックマークを追加

ブックマークを追加

よく使うタグ

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

439 users qiita.com/omiita

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページへ

記事へのコメント13件

注目コメント
新着コメント

stealthinu

stealthinu Transformerの構造をほぼそのまま使って画像認識。Transformerには画像の位置情報を有効利用するような構造が埋め込まれてない分不利だと思うのにSOTAになってる。

2020年10月12日リンク

その他

sds-page

sds-page GPT-3もそうだけど巨大なデータセットと巨大な計算機で解決してるから個人だと自前で実装できないしクラウドサービスでAPI利用みたいな形になるんかな

2020年10月13日リンク

その他

hachiking

hachiking CNNのパーツの有無は理解するけど、相対的な関係を理解してないって部分を、Enbeddingと位置エンコーディング、アテンションで何か改善されたのかなぁーみたいな浅い理解。

2020年12月22日リンク

その他

bigchu

bigchu State of The Art たっせい

2020年10月21日リンク

その他

kowa

kowa "SoTA"って訳さないでほしい。ググれないし最高性能で十分しょ。

2020年10月13日リンク

その他

misshiki

misshiki 通称Vit。"Transformer[拙著解説]をほぼそのまま画像分類タスクに用いることで、ImageNet/ImageNet-ReaL/CIFAR-100/VTABでSoTAモデルと同程度またはそれを上回る性能を達成した"とのこと。

2020年10月13日リンク

その他

knok

knok 当たり前だけどNSPに相当するものはないのね

2020年10月13日リンク

その他

sds-page

2020年10月13日リンク

その他

urd0401

urd0401 アカデミアの話だった

2020年10月13日リンク

その他

dgwingtong

dgwingtong 結局何が出来るのだ?

2020年10月13日リンク

その他

degage122

degage122 "SoTAを上回る性能を約115115の計算コストで得られたよ"事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ"

あとで読む

2020年10月13日リンク

その他

mn_kun

mn_kun とうとうNLP以外にもTransformerが使われだした。

2020年10月13日リンク

その他

imaizm

imaizm [ML/DL]

AI
202010

2020年10月12日リンク

その他

stealthinu

2020年10月12日リンク

その他

h_taiji

h_taiji よく読む

2020年10月12日リンク

その他

ゲスト

コメントするにはログインが必要ですログインしてコメント

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

[<a href="https://b.hatena.ne.jp/entry.parts?url=https%3A%2F%2Fqiita.com%2Fomiita%2Fitems%2F0049ade809c4817670d7">フレーム</a>]

プレビュー

[フレーム]

はてなブックマークボタンを作成して埋め込むこともできます

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック!

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

usersに達しました!

さんが1番目にブックマークした記事「画像認識の大革命...」が注目されています。

気持ちをシェアしよう

ツイートする

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

0. 忙しい方へ完全に畳み込みとさようならしてSoTA達成したよ Vision Transf ormerの重要なことは次の3... 0. 忙しい方へ完全に畳み込みとさようならしてSoTA達成したよ Vision Transf ormerの重要なことは次の3つだよ画像パッチを単語のように扱うよアーキテクチャはTransf ormerのエンコーダー部分だよ巨大なデータセットJFT-300Mで事前学習するよ SoTAを上回る性能を約$\frac{1}{15}$の計算コストで得られたよ事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ 1. Vision Transf ormerの解説 Vision Transf ormer(=ViT)の重要な部分は次の3つです。入力画像アーキテクチャ事前学習とファインチューニングそれぞれについて見ていきましょう。 1.1 入力画像まず入力画像についてです。ViTはTransf ormerをベースとしたモデル(というより一部を丸々使っている)ですが、

ブックマークしたユーザー

shunmatsu2025年02月14日 shunmatsu
knj29182024年07月10日 knj2918
tivichoco2024年02月25日 tivichoco
hirotomo884452023年11月19日 hirotomo88445
techtech05212023年05月07日 techtech0521
NEXTAltair2022年11月23日 NEXTAltair
imyutaro2021年10月08日 imyutaro
qualitas2021年09月15日 qualitas
y-kamiya2021年06月06日 y-kamiya
digitaltan2021年06月03日 digitaltan
harist2021年04月18日 harist
mtanaka10112021年04月14日 mtanaka1011
summer4an2021年03月18日 summer4an
urza3582021年01月17日 urza358
hachiking2020年12月22日 hachiking
tuuukamo2020年12月18日 tuuukamo
thotentry_hatebu1972020年12月12日 thotentry_hatebu197
jelkawasaki2020年11月27日 jelkawasaki

気に入った記事をブックマーク

エントリーの編集

タイトルガイドライン

ブックマークしました

おすすめタグタグについて

よく使うタグすべて表示

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

おすすめタグタグについて

よく使うタグすべて表示

はてなブックマークで関心をシェアしよう

記事へのコメント13件

リンクを埋め込む

プレビュー

関連記事

usersに達しました!

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

ブックマークしたユーザー

ブックマークしたすべてのユーザー

同時期にブックマークされた記事

公式Twitter

はてなのサービス

よく使うタグ

よく使うタグ

はてなブックマークで
関心をシェアしよう