[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

439users がブックマーク コメント 13

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

439 users qiita.com/omiita

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント13

  • 注目コメント
  • 新着コメント
stealthinu
Transformerの構造をほぼそのまま使って画像認識。Transformerには画像の位置情報を有効利用するような構造が埋め込まれてない分不利だと思うのにSOTAになってる。

その他
sds-page
GPT-3もそうだけど巨大なデータセットと巨大な計算機で解決してるから個人だと自前で実装できないしクラウドサービスでAPI利用みたいな形になるんかな

その他
hachiking
CNNのパーツの有無は理解するけど、相対的な関係を理解してないって部分を、Enbeddingと位置エンコーディング、アテンションで何か改善されたのかなぁーみたいな浅い理解。

その他
bigchu
State of The Art たっせい

その他
kowa
"SoTA"って訳さないでほしい。ググれないし最高性能で十分しょ。

その他
misshiki
通称Vit。"Transformer[拙著解説]をほぼそのまま画像分類タスクに用いることで、ImageNet/ImageNet-ReaL/CIFAR-100/VTABでSoTAモデルと同程度またはそれを上回る性能を達成した"とのこと。

その他
knok
当たり前だけどNSPに相当するものはないのね

その他
sds-page
sds-page GPT-3もそうだけど巨大なデータセットと巨大な計算機で解決してるから個人だと自前で実装できないしクラウドサービスでAPI利用みたいな形になるんかな

2020年10月13日 リンク

その他
urd0401
アカデミアの話だった

その他
dgwingtong
結局何が出来るのだ?

その他
degage122
"SoTAを上回る性能を約115115の計算コストで得られたよ"事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ"

その他
mn_kun
とうとうNLP以外にもTransformerが使われだした。

その他
imaizm
[ML/DL]

その他
stealthinu
stealthinu Transformerの構造をほぼそのまま使って画像認識。Transformerには画像の位置情報を有効利用するような構造が埋め込まれてない分不利だと思うのにSOTAになってる。

2020年10月12日 リンク

その他
h_taiji
よく読む

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「画像認識の大革命...」が注目されています。

気持ちをシェアしよう

ツイートする

画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita

0. 忙しい方へ 完全に畳み込みとさようならしてSoTA達成したよ Vision Transf ormerの重要なことは次の3... 0. 忙しい方へ 完全に畳み込みとさようならしてSoTA達成したよ Vision Transf ormerの重要なことは次の3つだよ 画像パッチを単語のように扱うよ アーキテクチャはTransf ormerのエンコーダー部分だよ 巨大なデータセットJFT-300Mで事前学習するよ SoTAを上回る性能を約$\frac{1}{15}$の計算コストで得られたよ 事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ 1. Vision Transf ormerの解説 Vision Transf ormer(=ViT)の重要な部分は次の3つです。 入力画像 アーキテクチャ 事前学習とファインチューニング それぞれについて見ていきましょう。 1.1 入力画像 まず入力画像についてです。ViTはTransf ormerをベースとしたモデル(というより一部を丸々使っている)ですが、

ブックマークしたユーザー

  • shunmatsu2025年02月14日 shunmatsu
  • knj29182024年07月10日 knj2918
  • tivichoco2024年02月25日 tivichoco
  • hirotomo884452023年11月19日 hirotomo88445
  • techtech05212023年05月07日 techtech0521
  • NEXTAltair2022年11月23日 NEXTAltair
  • imyutaro2021年10月08日 imyutaro
  • qualitas2021年09月15日 qualitas
  • y-kamiya2021年06月06日 y-kamiya
  • digitaltan2021年06月03日 digitaltan
  • harist2021年04月18日 harist
  • mtanaka10112021年04月14日 mtanaka1011
  • summer4an2021年03月18日 summer4an
  • urza3582021年01月17日 urza358
  • hachiking2020年12月22日 hachiking
  • tuuukamo2020年12月18日 tuuukamo
  • thotentry_hatebu1972020年12月12日 thotentry_hatebu197
  • jelkawasaki2020年11月27日 jelkawasaki
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /