「cs.CV」カテゴリーアーカイブ

Revisiting Medical Image Retrieval via Knowledge Consolidation

投稿日: 2025年3月13日作成者: jarxiv

要約人工知能とデジタル医学がますますヘルスケアシステムに浸透するにつれて、倫理 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition

投稿日: 2025年3月13日作成者: jarxiv

要約豚の行動の認識は、豚の賢い農業と福祉保証において重要な役割を果たします。 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Close-up-GS: Enhancing Close-Up View Synthesis in 3D Gaussian Splatting with Progressive Self-Training

投稿日: 2025年3月13日作成者: jarxiv

要約 3D Gaussian Splatting（3DGS）は、特定の視点でトレ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation

投稿日: 2025年3月13日作成者: jarxiv

要約トランス、特にビジョントランス（VITS）は、大規模な画像分類で最先端のパ … 続きを読む →

カテゴリー: 68T45, cs.AI, cs.CV, cs.LG, I.2.10 | コメントを受け付けていません

Object-Centric World Model for Language-Guided Manipulation

投稿日: 2025年3月13日作成者: jarxiv

要約エージェントが自律運転やロボット工学などのドメインで将来を予測し、計画する … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Multi-Agent Image Restoration

投稿日: 2025年3月13日作成者: jarxiv

要約画像修復（IR）は、実際の劣化の複雑さのために困難です。多くの専門的でオ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Probabilistic Language-Image Pre-Training

投稿日: 2025年3月13日作成者: jarxiv

要約ビジョン言語モデル（VLM）は、アライメントされた画像テキストペアをジョイ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Text-to-3D Generation by 2D Editing

投稿日: 2025年3月13日作成者: jarxiv

要約ゲーム、フィルム、インテリアデザイン全体の3Dクリエイティブアプリケーショ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

OpenVidVRD: Open-Vocabulary Video Visual Relation Detection via Prompt-Driven Semantic Space Alignment

投稿日: 2025年3月13日作成者: jarxiv

要約ビデオ視覚関係検出（VIDVRD）タスクは、動的なコンテンツ、高い注釈コス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

P3P: Pseudo-3D Pre-training for Scaling 3D Masked Autoencoders

投稿日: 2025年3月13日作成者: jarxiv

要約 3Dの事前トレーニングは、3D認識タスクを進めるために極めて重要です。た … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Revisiting Medical Image Retrieval via Knowledge Consolidation

Pig behavior dataset and Spatial-temporal perception and enhancement networks based on the attention mechanism for pig behavior recognition

Close-up-GS: Enhancing Close-Up View Synthesis in 3D Gaussian Splatting with Progressive Self-Training

ForAug: Recombining Foregrounds and Backgrounds to Improve Vision Transformer Training with Bias Mitigation

Object-Centric World Model for Language-Guided Manipulation

Multi-Agent Image Restoration

Probabilistic Language-Image Pre-Training

Text-to-3D Generation by 2D Editing

OpenVidVRD: Open-Vocabulary Video Visual Relation Detection via Prompt-Driven Semantic Space Alignment

P3P: Pseudo-3D Pre-training for Scaling 3D Masked Autoencoders

最近の投稿

最近のコメント

アーカイブ

カテゴリー