-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Diffusion-based Visual Anagram as Multi-task Learning
要約 視覚的アナグラムとは、反転や回転などの変換によって外観が変化する画像のこと … 続きを読む
カテゴリー: cs.CV
Diffusion-based Visual Anagram as Multi-task Learning はコメントを受け付けていません
Motion Prompting: Controlling Video Generation with Motion Trajectories
要約 モーション制御は、表現力豊かで魅力的な映像コンテンツを生成するために極めて … 続きを読む
カテゴリー: cs.CV
Motion Prompting: Controlling Video Generation with Motion Trajectories はコメントを受け付けていません
FaVoR: Features via Voxel Rendering for Camera Relocalization
要約 カメラの再位置推定方法は、密な画像の位置合わせからクエリ画像からの直接的な … 続きを読む
Good Grasps Only: A data engine for self-supervised fine-tuning of pose estimation using grasp poses for verification
要約 この論文では、姿勢推定の自己教師あり微調整のための新しい方法を紹介します。 … 続きを読む
PACA: Perspective-Aware Cross-Attention Representation for Zero-Shot Scene Rearrangement
要約 テーブルの整理整頓と同様に、シーンの再配置は、さまざまなオブジェクトの配置 … 続きを読む
Right Place, Right Time! Generalizing ObjectNav to Dynamic Environments with Portable Targets
要約 ObjectNav は、エージェントが目に見えない環境にあるターゲット オ … 続きを読む
Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning
要約 ビジョン言語モデル (VLM) は、マルチモーダル推論タスクにおいて目覚ま … 続きを読む
NoisyNN: Exploring the Impact of Information Entropy Change in Learning Systems
要約 私たちは、埋め込み空間や画像など、さまざまなレベルでのノイズ注入による深層 … 続きを読む
From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models
要約 チャート形式のデータ視覚化はデータ分析において極めて重要な役割を果たし、重 … 続きを読む
Visual Cue Enhancement and Dual Low-Rank Adaptation for Efficient Visual Instruction Fine-Tuning
要約 パラメーター効率の高い微調整マルチモーダル大規模言語モデル (MLLM) … 続きを読む