月別アーカイブ: 2024年8月

Planner3D: LLM-enhanced graph prior meets 3D indoor scene explicit regularization

要約 合成 3D シーン合成は、現実世界のマルチオブジェクト環境の複雑さを厳密に … 続きを読む

カテゴリー: cs.CV | Planner3D: LLM-enhanced graph prior meets 3D indoor scene explicit regularization はコメントを受け付けていません

Cascaded Temporal Updating Network for Efficient Video Super-Resolution

要約 既存のビデオ超解像度 (VSR) 手法は一般に、再帰伝播ネットワークを採用 … 続きを読む

カテゴリー: cs.CV | Cascaded Temporal Updating Network for Efficient Video Super-Resolution はコメントを受け付けていません

Interpretable Representation Learning of Cardiac MRI via Attribute Regularization

要約 臨床医が人工知能モデルを理解し、信頼できるようにするには、医療画像処理にお … 続きを読む

カテゴリー: cs.CV, eess.IV | Interpretable Representation Learning of Cardiac MRI via Attribute Regularization はコメントを受け付けていません

Beyond Few-shot Object Detection: A Detailed Survey

要約 物体検出は、画像やビデオ内の特定の物体を正確に識別して位置を特定することに … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | Beyond Few-shot Object Detection: A Detailed Survey はコメントを受け付けていません

Text3DAug — Prompted Instance Augmentation for LiDAR Perception

要約 都市シナリオの LiDAR データは、異質な特性や固有のクラスの不均衡など … 続きを読む

カテゴリー: cs.AI, cs.CV | Text3DAug — Prompted Instance Augmentation for LiDAR Perception はコメントを受け付けていません

VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection

要約 推論中に単一のカメラのみに依存する単眼 3D 物体検出は、費用対効果が高く … 続きを読む

カテゴリー: cs.CV | VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection はコメントを受け付けていません

1-Bit FQT: Pushing the Limit of Fully Quantized Training to 1-bit

要約 完全量子化トレーニング (FQT) は、アクティベーション、重み、勾配を低 … 続きを読む

カテゴリー: cs.CV, cs.LG | 1-Bit FQT: Pushing the Limit of Fully Quantized Training to 1-bit はコメントを受け付けていません

PDEBENCH: An Extensive Benchmark for Scientific Machine Learning

要約 近年、機械学習ベースの物理システムのモデリングへの関心が高まっています。 … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.flu-dyn, physics.geo-ph | PDEBENCH: An Extensive Benchmark for Scientific Machine Learning はコメントを受け付けていません

Reliable Multi-modal Medical Image-to-image Translation Independent of Pixel-wise Aligned Data

要約 現在主流のマルチモーダル医用画像間の変換方法は矛盾に直面しています。 優れ … 続きを読む

カテゴリー: cs.CV, eess.IV | Reliable Multi-modal Medical Image-to-image Translation Independent of Pixel-wise Aligned Data はコメントを受け付けていません

Filter & Align: Curating Image-Text Data with Human Knowledge

要約 画像とテキストのペアの利用可能性が高まったことにより、視覚言語基盤モデルの … 続きを読む

カテゴリー: cs.CV | Filter & Align: Curating Image-Text Data with Human Knowledge はコメントを受け付けていません