月別アーカイブ: 2024年8月

DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection

要約 赤外線可視物体検出は、赤外線画像と可視画像のペアの補完情報を活用することで … 続きを読む

カテゴリー: cs.CV, cs.MM | DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection はコメントを受け付けていません

MLAAN: Scaling Supervised Local Learning with Multilaminar Leap Augmented Auxiliary Network

要約 ディープ ニューラル ネットワーク (DNN) は通常、エンドツーエンド … 続きを読む

カテゴリー: cs.CV | MLAAN: Scaling Supervised Local Learning with Multilaminar Leap Augmented Auxiliary Network はコメントを受け付けていません

MR3D-Net: Dynamic Multi-Resolution 3D Sparse Voxel Grid Fusion for LiDAR-Based Collective Perception

要約 自動運転車の安全な運行は、環境を総合的に認識する能力にかかっています。 た … 続きを読む

カテゴリー: cs.CV | MR3D-Net: Dynamic Multi-Resolution 3D Sparse Voxel Grid Fusion for LiDAR-Based Collective Perception はコメントを受け付けていません

Efficient and Scalable Point Cloud Generation with Sparse Point-Voxel Diffusion Models

要約 我々は、高速な生成時間を維持しながら高品質で多様な 3D 形状を生成できる … 続きを読む

カテゴリー: cs.CV | Efficient and Scalable Point Cloud Generation with Sparse Point-Voxel Diffusion Models はコメントを受け付けていません

Palantir: Towards Efficient Super Resolution for Ultra-high-definition Live Streaming

要約 超解像度ディープ ニューラル ネットワークによるニューラルの強化により、既 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.NI | Palantir: Towards Efficient Super Resolution for Ultra-high-definition Live Streaming はコメントを受け付けていません

ViscoNet: Bridging and Harmonizing Visual and Textual Conditioning for ControlNet

要約 この文書では、空間と視覚を同時に調整するための新しい 1 ブランチ アダプ … 続きを読む

カテゴリー: cs.AI, cs.CV | ViscoNet: Bridging and Harmonizing Visual and Textual Conditioning for ControlNet はコメントを受け付けていません

Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance

要約 最近の 3D ノベル ビュー合成 (NVS) 手法は、新しい視点から生成さ … 続きを読む

カテゴリー: cs.CV | Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance はコメントを受け付けていません

OmniCLIP: Adapting CLIP for Video Recognition with Spatial-Temporal Omni-Scale Feature Learning

要約 最近の視覚言語モデル (VLM) \textit{e.g.} CLIP は … 続きを読む

カテゴリー: cs.CV | OmniCLIP: Adapting CLIP for Video Recognition with Spatial-Temporal Omni-Scale Feature Learning はコメントを受け付けていません

ACCELERATION: Sequentially-scanning DECT Imaging Using High Temporal Resolution Image Reconstruction And Temporal Extrapolation

要約 デュアルエネルギーコンピュータ断層撮影法 (DECT) は、個別化された正 … 続きを読む

カテゴリー: cs.AI, cs.CV, physics.ins-det, physics.med-ph | ACCELERATION: Sequentially-scanning DECT Imaging Using High Temporal Resolution Image Reconstruction And Temporal Extrapolation はコメントを受け付けていません

MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains

要約 ビジョンと言語ナビゲーション (VLN) タスクでは、エージェントは自然言 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains はコメントを受け付けていません