-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
GRAM: Global Reasoning for Multi-Page VQA
要約 トランスフォーマーベースの大規模言語モデルの使用が増加しているため、長いシ … 続きを読む
Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception
要約 マルチビュービデオを受け入れるビデオベースのアクション認識モデルをトレーニ … 続きを読む
カテゴリー: cs.CV
Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception はコメントを受け付けていません
Hybrid Reasoning Based on Large Language Models for Autonomous Car Driving
要約 大規模言語モデル (LLM) は、テキストと画像を理解し、人間のようなテキ … 続きを読む
Matching Non-Identical Objects
要約 全く同じではありませんが、似たような物体は世界中のどこにでも存在します。 … 続きを読む
カテゴリー: cs.CV
Matching Non-Identical Objects はコメントを受け付けていません
GaussNav: Gaussian Splatting for Visual Navigation
要約 身体化されたビジョンでは、インスタンス イメージゴール ナビゲーション ( … 続きを読む
カテゴリー: cs.CV
GaussNav: Gaussian Splatting for Visual Navigation はコメントを受け付けていません
QEAN: Quaternion-Enhanced Attention Network for Visual Dance Generation
要約 音楽生成ダンスの研究は、斬新かつ挑戦的なイメージ生成タスクです。 音楽とシ … 続きを読む
LoRA-Composer: Leveraging Low-Rank Adaptation for Multi-Concept Customization in Training-Free Diffusion Models
要約 カスタマイズ生成技術により、さまざまなコンテキストにわたる特定の概念の統合 … 続きを読む
カテゴリー: cs.CV
LoRA-Composer: Leveraging Low-Rank Adaptation for Multi-Concept Customization in Training-Free Diffusion Models はコメントを受け付けていません
Compositional Kronecker Context Optimization for Vision-Language Models
要約 コンテキスト最適化 (CoOp) は、CLIP のような視覚言語モデルを下 … 続きを読む
カテゴリー: cs.CV
Compositional Kronecker Context Optimization for Vision-Language Models はコメントを受け付けていません
Personalized 3D Human Pose and Shape Refinement
要約 最近、回帰ベースの手法が 3D 人間の姿勢と形状の推定の分野を支配していま … 続きを読む
カテゴリー: cs.CV
Personalized 3D Human Pose and Shape Refinement はコメントを受け付けていません
An Accurate and Real-time Relative Pose Estimation from Triple Point-line Images by Decoupling Rotation and Translation
要約 ライン フィーチャは、人工環境におけるポイント フィーチャを補完する有効な … 続きを読む