MathWorksは11月2日、都内でMATLAB EXPO 2011を開催し、MATLABおよびSimulinkの活用方法などの紹介を行った。また、それに併せて、同社Principal Technical Marketing ManagerのBruce Tannenbaum氏がコンピュータビジョン向けに2011年4月より提供を開始した研究開発ツール「Computer Vision ...
自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存 ...
Googleの機械学習モデル「Transformer」は、データを時系列に処理しなくても、自然言語などのデータを翻訳やテキスト要約することが可能で、ChatGPTなどの自然な会話が可能なチャットAIのベースとなっています。また、Transformerの手法を画像分野に応用した ...
東京工業大学の研究チームは、グーグルの画像処理モデル「ビジョン・トランスフォーマー(ViT)」を利用したレンズレスカメラの画像再構成処理を開発した。コンピューターによる画像再構成処理を応用することで、レンズを使用せずに画像を得る ...
※ 「Vision Transformer入門」 の 「はじめに」 から一部抜粋・ 編集して掲載しています。 2020年10月22日に論文共有サイトarXivに掲載された1本の論文がコンピュータビジョン分野に衝撃を与えました。ViT (Vision Transformer) [Dosovitskiy21]の提案論文である"An Image is ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する