cs.CV」カテゴリーアーカイブ

Revisiting Medical Image Retrieval via Knowledge Consolidation

要約 人工知能とデジタル医学がますますヘルスケアシステムに浸透するにつれて、倫理 … 続きを読む

カテゴリー: cs.AI, cs.CV | Revisiting Medical Image Retrieval via Knowledge Consolidation はコメントを受け付けていません

Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition

要約 豚の行動の認識は、豚の賢い農業と福祉保証において重要な役割を果たします。 … 続きを読む

カテゴリー: cs.AI, cs.CV | Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition はコメントを受け付けていません

Close-up-GS: Enhancing Close-Up View Synthesis in 3D Gaussian Splatting with Progressive Self-Training

要約 3D Gaussian Splatting(3DGS)は、特定の視点でトレ … 続きを読む

カテゴリー: cs.AI, cs.CV | Close-up-GS: Enhancing Close-Up View Synthesis in 3D Gaussian Splatting with Progressive Self-Training はコメントを受け付けていません

ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation

要約 トランス、特にビジョントランス(VITS)は、大規模な画像分類で最先端のパ … 続きを読む

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation はコメントを受け付けていません

Object-Centric World Model for Language-Guided Manipulation

要約 エージェントが自律運転やロボット工学などのドメインで将来を予測し、計画する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Object-Centric World Model for Language-Guided Manipulation はコメントを受け付けていません

Multi-Agent Image Restoration

要約 画像修復(IR)は、実際の劣化の複雑さのために困難です。 多くの専門的でオ … 続きを読む

カテゴリー: cs.AI, cs.CV | Multi-Agent Image Restoration はコメントを受け付けていません

Probabilistic Language-Image Pre-Training

要約 ビジョン言語モデル(VLM)は、アライメントされた画像テキストペアをジョイ … 続きを読む

カテゴリー: cs.CV, cs.LG | Probabilistic Language-Image Pre-Training はコメントを受け付けていません

Text-to-3D Generation by 2D Editing

要約 ゲーム、フィルム、インテリアデザイン全体の3Dクリエイティブアプリケーショ … 続きを読む

カテゴリー: cs.CV | Text-to-3D Generation by 2D Editing はコメントを受け付けていません

OpenVidVRD: Open-Vocabulary Video Visual Relation Detection via Prompt-Driven Semantic Space Alignment

要約 ビデオ視覚関係検出(VIDVRD)タスクは、動的なコンテンツ、高い注釈コス … 続きを読む

カテゴリー: cs.CV | OpenVidVRD: Open-Vocabulary Video Visual Relation Detection via Prompt-Driven Semantic Space Alignment はコメントを受け付けていません

P3P: Pseudo-3D Pre-training for Scaling 3D Masked Autoencoders

要約 3Dの事前トレーニングは、3D認識タスクを進めるために極めて重要です。 た … 続きを読む

カテゴリー: cs.CV | P3P: Pseudo-3D Pre-training for Scaling 3D Masked Autoencoders はコメントを受け付けていません