-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
SITReg: Multi-resolution architecture for symmetric, inverse consistent, and topology preserving image registration
要約 ディープ ラーニングは、2 つの画像の座標系間のマッピングを見つけることが … 続きを読む
カテゴリー: cs.CV
SITReg: Multi-resolution architecture for symmetric, inverse consistent, and topology preserving image registration はコメントを受け付けていません
Demystify Mamba in Vision: A Linear Attention Perspective
要約 Mamba は、線形計算の複雑さを備えた効果的な状態空間モデルです。 最近 … 続きを読む
カテゴリー: cs.CV
Demystify Mamba in Vision: A Linear Attention Perspective はコメントを受け付けていません
PAR: Prompt-Aware Token Reduction Method for Efficient Large Multimodal Models
要約 マルチモーダル大規模言語モデル (MLLM) は、ビジュアル タスク全体で … 続きを読む
FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models
要約 視覚言語モデル (VLM) は、さまざまな応用において目覚ましい進歩を遂げ … 続きを読む
カテゴリー: cs.CV
FIRE: A Dataset for Feedback Integration and Refinement Evaluation of Multimodal Models はコメントを受け付けていません
ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models
要約 幻覚は、マルチモーダル大規模言語モデル (MLLM) に永続的な課題をもた … 続きを読む
Scaling nnU-Net for CBCT Segmentation
要約 この論文では、特に ToothFairy2 チャレンジの範囲において、コー … 続きを読む
カテゴリー: cs.CV
Scaling nnU-Net for CBCT Segmentation はコメントを受け付けていません
MVBoost: Boost 3D Reconstruction with Multi-View Refinement
要約 3D オブジェクトの再構築における最近の進歩は目覚ましいものですが、現在の … 続きを読む
Enhancing the automatic segmentation and analysis of 3D liver vasculature models
要約 肝臓がん患者の外科的評価には、医療画像から血管樹を識別する必要があります。 … 続きを読む
Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds
要約 テキストから画像への拡散モデルは、任意のテキスト プロンプトからリアルな画 … 続きを読む
Video-Driven Graph Network-Based Simulators
要約 デザイン、映画撮影、ゲームにおける本物のようなビジュアライゼーションは、正 … 続きを読む