エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
はじめに 遅ればせながら、DINOv3 について読んで動かしてみた記事です。 解説というほどではないですが... はじめに 遅ればせながら、DINOv3 について読んで動かしてみた記事です。 解説というほどではないですが、DINOシリーズの改善点や使い方のメモを残しています。 Meta AI DINOv3 より 前半は論文についての内容で、後半は実装についての内容です。 CV領域が専門ではないので間違っていたいらお許しください>< 背景:自己教師あり学習と画像基盤モデルでの発展 コンピュータビジョン(Computer Vision;CV) は「画像や映像をコンピュータに理解させる」ことを目指す分野です。身近な例では、スマートフォンの顔認証、SNSの画像検索、自動運転車の周囲認識などがあり、私たちの日常生活に深く浸透しています。これらの技術は「画像処理」や「機械学習」、特に近年では「深層学習(ディープラーニング)」によって支えられています。深層学習では大量のデータを入力し、ニューラルネットワークがその中