cs.CV」カテゴリーアーカイブ

Target-driven Self-Distillation for Partial Observed Trajectories Forecasting

要約 交通エージェントの将来の軌跡の正確な予測は、安全な自律運転を確保するために … 続きを読む

カテゴリー: cs.CV | コメントする

Beyond-Labels: Advancing Open-Vocabulary Segmentation With Vision-Language Models

要約 自己学習学習は、効果的に訓練された場合、多数の画像または言語処理の問題を解 … 続きを読む

カテゴリー: cs.CV | コメントする

FlexMotion: Lightweight, Physics-Aware, and Controllable Human Motion Generation

要約 軽量で制御可能で、身体的にもっともらしい人間の動きの合成は、アニメーション … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントする

Conterfactual Generative Zero-Shot Semantic Segmentation

要約 ゼロショット学習は、コンピュータービジョンの重要な部分です。 古典的なダウ … 続きを読む

カテゴリー: 68T07, cs.CV, I.2.10 | コメントする

Exploring the Role of Explicit Temporal Modeling in Multimodal Large Language Models for Video Understanding

要約 マルチモーダル大手言語モデル(MLLM)をビデオ理解に適用することは、フレ … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

Slot-Guided Adaptation of Pre-trained Diffusion Models for Object-Centric Learning and Compositional Generation

要約 スロットベースのコンディショニングにアダプターを導入することにより、スロッ … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Dynamic Hypergraph Representation for Bone Metastasis Cancer Analysis

要約 骨転移分析は、病理学における重要な課題であり、患者の生活の質と治療戦略を決 … 続きを読む

カテゴリー: cs.CV | コメントする

RG-Attn: Radian Glue Attention for Multi-modality Multi-agent Cooperative Perception

要約 協同知覚は、複数のエージェントにわたるデータ共有と融合のための車両(V2X … 続きを読む

カテゴリー: cs.CV, cs.NI, cs.RO, eess.IV | コメントする

Audio-Visual Deepfake Detection With Local Temporal Inconsistencies

要約 このペーパーでは、オーディオと視覚モダリティの間のきめの細かい時間的矛盾を … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.MM, cs.SD, eess.AS | コメントする

Not Every Patch is Needed: Towards a More Efficient and Effective Backbone for Video-based Person Re-identification

要約 このペーパーでは、ビデオベースの人の再識別(Reid)のための新しい効果的 … 続きを読む

カテゴリー: cs.CV | コメントする