-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
SurGen: Text-Guided Diffusion Model for Surgical Video Generation
要約 拡散ベースのビデオ生成モデルは大幅な進歩を遂げ、視覚的な忠実度、時間的一貫 … 続きを読む
Monkey: Image Resolution and Text Label Are Important Things for Large Multi-modal Models
要約 大規模マルチモーダル モデル (LMM) は、視覚言語タスクでは有望である … 続きを読む
Explaining Vision-Language Similarities in Dual Encoders with Feature-Pair Attributions
要約 CLIP モデルのようなデュアル エンコーダ アーキテクチャは、2 種類の … 続きを読む
MagicMan: Generative Novel View Synthesis of Humans with 3D-Aware Diffusion and Iterative Refinement
要約 単一画像による人間の再構成に関する既存の研究は、トレーニング データが不十 … 続きを読む
TC-PDM: Temporally Consistent Patch Diffusion Models for Infrared-to-Visible Video Translation
要約 赤外線イメージングは、物体の温度を捕捉することで、変化する照明条件に対 … 続きを読む
カテゴリー: cs.CV
TC-PDM: Temporally Consistent Patch Diffusion Models for Infrared-to-Visible Video Translation はコメントを受け付けていません
Gallery-Aware Uncertainty Estimation For Open-Set Face Recognition
要約 画質の正確な推定とモデルの堅牢性の向上は、制約のない顔認識における重要な課 … 続きを読む
LF Tracy: A Unified Single-Pipeline Approach for Salient Object Detection in Light Field Cameras
要約 豊富な情報を活用することは、高密度の予測タスクにとって非常に重要です。 ラ … 続きを読む
Planner3D: LLM-enhanced graph prior meets 3D indoor scene explicit regularization
要約 合成 3D シーン合成は、現実世界のマルチオブジェクト環境の複雑さを厳密に … 続きを読む
カテゴリー: cs.CV
Planner3D: LLM-enhanced graph prior meets 3D indoor scene explicit regularization はコメントを受け付けていません
Cascaded Temporal Updating Network for Efficient Video Super-Resolution
要約 既存のビデオ超解像度 (VSR) 手法は一般に、再帰伝播ネットワークを採用 … 続きを読む
カテゴリー: cs.CV
Cascaded Temporal Updating Network for Efficient Video Super-Resolution はコメントを受け付けていません
Interpretable Representation Learning of Cardiac MRI via Attribute Regularization
要約 臨床医が人工知能モデルを理解し、信頼できるようにするには、医療画像処理にお … 続きを読む