cs.AI」カテゴリーアーカイブ

Feature Fusion for Human Activity Recognition using Parameter-Optimized Multi-Stage Graph Convolutional Network and Transformer Models

要約 人間活動認識 (HAR) は、コンピューターとマシン ビジョン テクノロジ … 続きを読む

カテゴリー: cs.AI, cs.CV | Feature Fusion for Human Activity Recognition using Parameter-Optimized Multi-Stage Graph Convolutional Network and Transformer Models はコメントを受け付けていません

Vision-Language Consistency Guided Multi-modal Prompt Learning for Blind AI Generated Image Quality Assessment

要約 最近、テキスト プロンプト チューニングは、Contrastive Lan … 続きを読む

カテゴリー: cs.AI, cs.CV | Vision-Language Consistency Guided Multi-modal Prompt Learning for Blind AI Generated Image Quality Assessment はコメントを受け付けていません

A Systematic Review of Few-Shot Learning in Medical Imaging

要約 注釈付きの医療画像が不足すると、通常、大規模なラベル付きデータセットが必要 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.6 | A Systematic Review of Few-Shot Learning in Medical Imaging はコメントを受け付けていません

The Progression of Transformers from Language to Vision to MOT: A Literature Review on Multi-Object Tracking with Transformers

要約 トランスフォーマー ニューラル ネットワーク アーキテクチャでは、アテンシ … 続きを読む

カテゴリー: cs.AI, cs.CV | The Progression of Transformers from Language to Vision to MOT: A Literature Review on Multi-Object Tracking with Transformers はコメントを受け付けていません

Losing Visual Needles in Image Haystacks: Vision Language Models are Easily Distracted in Short and Long Contexts

要約 ビジョン言語モデル (VLM) におけるロングコンテキストの抽出推論を評価 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Losing Visual Needles in Image Haystacks: Vision Language Models are Easily Distracted in Short and Long Contexts はコメントを受け付けていません

StableNormal: Reducing Diffusion Variance for Stable and Sharp Normal

要約 この研究は、単眼カラーの入力 (つまり、画像やビデオ) からの高品質の表面 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | StableNormal: Reducing Diffusion Variance for Stable and Sharp Normal はコメントを受け付けていません

VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation

要約 近年、ビデオ生成において大きな進歩が見られます。 ただし、自動ビデオ指標の … 続きを読む

カテゴリー: cs.AI, cs.CV | VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation はコメントを受け付けていません

This actually looks like that: Proto-BagNets for local and global interpretability-by-design

要約 解釈可能性は、医療診断を含む一か八かのアプリケーションで機械学習モデルを使 … 続きを読む

カテゴリー: cs.AI | This actually looks like that: Proto-BagNets for local and global interpretability-by-design はコメントを受け付けていません

Investigating the impact of 2D gesture representation on co-speech gesture generation

要約 共同スピーチジェスチャーは、人間と身体的会話エージェント (ECA) との … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Investigating the impact of 2D gesture representation on co-speech gesture generation はコメントを受け付けていません

Adaptive Manipulation using Behavior Trees

要約 多くの操作タスクでは、バルブを締めたり緩めたりするためのひねり動作など、一 … 続きを読む

カテゴリー: cs.AI, cs.RO | Adaptive Manipulation using Behavior Trees はコメントを受け付けていません