-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection
要約 赤外線可視物体検出は、赤外線画像と可視画像のペアの補完情報を活用することで … 続きを読む
MLAAN: Scaling Supervised Local Learning with Multilaminar Leap Augmented Auxiliary Network
要約 ディープ ニューラル ネットワーク (DNN) は通常、エンドツーエンド … 続きを読む
カテゴリー: cs.CV
MLAAN: Scaling Supervised Local Learning with Multilaminar Leap Augmented Auxiliary Network はコメントを受け付けていません
MR3D-Net: Dynamic Multi-Resolution 3D Sparse Voxel Grid Fusion for LiDAR-Based Collective Perception
要約 自動運転車の安全な運行は、環境を総合的に認識する能力にかかっています。 た … 続きを読む
カテゴリー: cs.CV
MR3D-Net: Dynamic Multi-Resolution 3D Sparse Voxel Grid Fusion for LiDAR-Based Collective Perception はコメントを受け付けていません
Efficient and Scalable Point Cloud Generation with Sparse Point-Voxel Diffusion Models
要約 我々は、高速な生成時間を維持しながら高品質で多様な 3D 形状を生成できる … 続きを読む
カテゴリー: cs.CV
Efficient and Scalable Point Cloud Generation with Sparse Point-Voxel Diffusion Models はコメントを受け付けていません
Palantir: Towards Efficient Super Resolution for Ultra-high-definition Live Streaming
要約 超解像度ディープ ニューラル ネットワークによるニューラルの強化により、既 … 続きを読む
ViscoNet: Bridging and Harmonizing Visual and Textual Conditioning for ControlNet
要約 この文書では、空間と視覚を同時に調整するための新しい 1 ブランチ アダプ … 続きを読む
Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance
要約 最近の 3D ノベル ビュー合成 (NVS) 手法は、新しい視点から生成さ … 続きを読む
カテゴリー: cs.CV
Novel View Synthesis from a Single Image with Pretrained Diffusion Guidance はコメントを受け付けていません
OmniCLIP: Adapting CLIP for Video Recognition with Spatial-Temporal Omni-Scale Feature Learning
要約 最近の視覚言語モデル (VLM) \textit{e.g.} CLIP は … 続きを読む
カテゴリー: cs.CV
OmniCLIP: Adapting CLIP for Video Recognition with Spatial-Temporal Omni-Scale Feature Learning はコメントを受け付けていません
ACCELERATION: Sequentially-scanning DECT Imaging Using High Temporal Resolution Image Reconstruction And Temporal Extrapolation
要約 デュアルエネルギーコンピュータ断層撮影法 (DECT) は、個別化された正 … 続きを読む
カテゴリー: cs.AI, cs.CV, physics.ins-det, physics.med-ph
ACCELERATION: Sequentially-scanning DECT Imaging Using High Temporal Resolution Image Reconstruction And Temporal Extrapolation はコメントを受け付けていません
MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains
要約 ビジョンと言語ナビゲーション (VLN) タスクでは、エージェントは自然言 … 続きを読む