日時:2023年3月24日(金) 17時10分〜18時30分
場所:ファカルティルーム(7号館3階)対面およびZoom配信
※Zoomにて参加の際,ご所属とお名前の表示をお願い致します
—-
このミーティングに事前登録する:
https://us02web.zoom.us/meeting/register/tZEqdu-rqzIiH9JMsfmAB0IJ9KwjuYka5Mr-
登録後,ミーティング参加に関する情報の確認メールが届きます。
—-
講師:菅沼 雅徳 氏(東北大学大学院情報科学研究科・助教)
<要旨>
Vision and Language(V&L)は、視覚と自然言語情報の両者を用いて問題解決を行う研究分野である。例えば、画像に関する質疑応答や、自然言語で指示した画像を生成するなど、幅広い応用が存在する。近年では、深層学習の急速な発展や大規模データの普及、計算機の性能向上などが相まって、V&Lの研究も劇的に進展している。
本講演では、現状のV&Lではどのようなことができるようになりつつあるのか、また核となる深層学習の方法論をいくつか紹介する。さらに、V&Lの特別な場合として、自然言語の情報を利用して画像認識の問題を解く最近の方法論についても紹介する。最後に、今後のV&Lの展望について述べる。