月別アーカイブ: 2024年8月

Planner3D: LLM-enhanced graph prior meets 3D indoor scene explicit regularization

投稿日: 2024年8月27日作成者: jarxiv

要約合成 3D シーン合成は、現実世界のマルチオブジェクト環境の複雑さを厳密に … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cascaded Temporal Updating Network for Efficient Video Super-Resolution

投稿日: 2024年8月27日作成者: jarxiv

要約既存のビデオ超解像度 (VSR) 手法は一般に、再帰伝播ネットワークを採用 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Interpretable Representation Learning of Cardiac MRI via Attribute Regularization

投稿日: 2024年8月27日作成者: jarxiv

要約臨床医が人工知能モデルを理解し、信頼できるようにするには、医療画像処理にお … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Beyond Few-shot Object Detection: A Detailed Survey

投稿日: 2024年8月27日作成者: jarxiv

要約物体検出は、画像やビデオ内の特定の物体を正確に識別して位置を特定することに … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.2.10 | コメントを受け付けていません

Text3DAug — Prompted Instance Augmentation for LiDAR Perception

投稿日: 2024年8月27日作成者: jarxiv

要約都市シナリオの LiDAR データは、異質な特性や固有のクラスの不均衡など … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection

投稿日: 2024年8月27日作成者: jarxiv

要約推論中に単一のカメラのみに依存する単眼 3D 物体検出は、費用対効果が高く … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

1-Bit FQT: Pushing the Limit of Fully Quantized Training to 1-bit

投稿日: 2024年8月27日作成者: jarxiv

要約完全量子化トレーニング (FQT) は、アクティベーション、重み、勾配を低 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

PDEBENCH: An Extensive Benchmark for Scientific Machine Learning

投稿日: 2024年8月27日作成者: jarxiv

要約近年、機械学習ベースの物理システムのモデリングへの関心が高まっています。 … 続きを読む →

カテゴリー: cs.CV, cs.LG, physics.flu-dyn, physics.geo-ph | コメントを受け付けていません

Reliable Multi-modal Medical Image-to-image Translation Independent of Pixel-wise Aligned Data

投稿日: 2024年8月27日作成者: jarxiv

要約現在主流のマルチモーダル医用画像間の変換方法は矛盾に直面しています。優れ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Filter & Align: Curating Image-Text Data with Human Knowledge

投稿日: 2024年8月27日作成者: jarxiv

要約画像とテキストのペアの利用可能性が高まったことにより、視覚言語基盤モデルの … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年8月

Planner3D: LLM-enhanced graph prior meets 3D indoor scene explicit regularization

Cascaded Temporal Updating Network for Efficient Video Super-Resolution

Interpretable Representation Learning of Cardiac MRI via Attribute Regularization

Beyond Few-shot Object Detection: A Detailed Survey

Text3DAug — Prompted Instance Augmentation for LiDAR Perception

VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection

1-Bit FQT: Pushing the Limit of Fully Quantized Training to 1-bit

PDEBENCH: An Extensive Benchmark for Scientific Machine Learning

Reliable Multi-modal Medical Image-to-image Translation Independent of Pixel-wise Aligned Data

Filter & Align: Curating Image-Text Data with Human Knowledge

最近の投稿

最近のコメント

アーカイブ

カテゴリー