月別アーカイブ: 2023年8月

Whose Emotion Matters? Speaking Activity Localisation without Prior Knowledge

要約 会話中の感情認識 (ERC) のタスクは、たとえばビデオベースの Mult … 続きを読む

カテゴリー: 68T20, cs.CV, cs.LG, cs.NE, cs.SD, eess.AS, I.2.0 | Whose Emotion Matters? Speaking Activity Localisation without Prior Knowledge はコメントを受け付けていません

Memory-and-Anticipation Transformer for Online Action Understanding

要約 既存の予測システムのほとんどは、さまざまな記憶メカニズムを使用して人間の予 … 続きを読む

カテゴリー: cs.CV | Memory-and-Anticipation Transformer for Online Action Understanding はコメントを受け付けていません

Tirtha — An Automated Platform to Crowdsource Images and Create 3D Models of Heritage Sites

要約 文化遺産 (CH) のデジタル保存は、自然災害や人間の活動による被害から保 … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.LG, I.4.5 | Tirtha — An Automated Platform to Crowdsource Images and Create 3D Models of Heritage Sites はコメントを受け付けていません

A Foundation LAnguage-Image model of the Retina (FLAIR): Encoding expert knowledge in text supervision

要約 財団のビジョン言語モデルは現在、コンピューター ビジョンを変革しており、そ … 続きを読む

カテゴリー: cs.CV | A Foundation LAnguage-Image model of the Retina (FLAIR): Encoding expert knowledge in text supervision はコメントを受け付けていません

Relightable and Animatable Neural Avatar from Sparse-View Video

要約 この論文では、未知の照明の下で動的な人間のスパースビュー (または単眼) … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Relightable and Animatable Neural Avatar from Sparse-View Video はコメントを受け付けていません

Helping Hands: An Object-Aware Ego-Centric Video Recognition Model

要約 私たちは、エゴ中心のビデオにおける時空間表現のパフォーマンスを向上させるた … 続きを読む

カテゴリー: cs.CV | Helping Hands: An Object-Aware Ego-Centric Video Recognition Model はコメントを受け付けていません

Solving Challenging Math Word Problems Using GPT-4 Code Interpreter with Code-based Self-Verification

要約 GPT-4 や PaLM-2 などの大規模言語モデル (LLM) における … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Solving Challenging Math Word Problems Using GPT-4 Code Interpreter with Code-based Self-Verification はコメントを受け付けていません

CoDeF: Content Deformation Fields for Temporally Consistent Video Processing

要約 我々は、新しいタイプのビデオ表現としてコンテンツ変形フィールド CoDeF … 続きを読む

カテゴリー: cs.CV | CoDeF: Content Deformation Fields for Temporally Consistent Video Processing はコメントを受け付けていません

Multiscale Attention via Wavelet Neural Operators for Vision Transformers

要約 トランスフォーマーは、コンピューター ビジョンにおいて広く成功を収めてきま … 続きを読む

カテゴリー: cs.CV, cs.LG | Multiscale Attention via Wavelet Neural Operators for Vision Transformers はコメントを受け付けていません

Large Language Models for Information Retrieval: A Survey

要約 情報取得の主要な手段として、検索エンジンなどの情報検索 (IR) システム … 続きを読む

カテゴリー: cs.CL, cs.IR | Large Language Models for Information Retrieval: A Survey はコメントを受け付けていません