-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
ObjectClear: Complete Object Removal via Object-Effect Attention
要約 オブジェクトの削除には、ターゲットオブジェクトだけでなく、影や反射などの効 … 続きを読む
カテゴリー: cs.CV
ObjectClear: Complete Object Removal via Object-Effect Attention はコメントを受け付けていません
SPIRAL: Semantic-Aware Progressive LiDAR Scene Generation
要約 最近の拡散モデルを活用して、LIDARベースの大規模な3Dシーン生成は大き … 続きを読む
カテゴリー: cs.CV
SPIRAL: Semantic-Aware Progressive LiDAR Scene Generation はコメントを受け付けていません
Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation
要約 トーキングヘッドやトーキングボディジェネレーションなどのオーディオ駆動型の … 続きを読む
カテゴリー: cs.CV
Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation はコメントを受け付けていません
Sherlock: Self-Correcting Reasoning in Vision-Language Models
要約 推論ビジョン言語モデル(VLM)は、複雑なマルチモーダルタスクで有望なパフ … 続きを読む
VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models
要約 最近の大規模な視覚言語モデル(LVLMS)は、より細かい粒度の視覚的知覚と … 続きを読む
カテゴリー: cs.CV
VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models はコメントを受け付けていません
3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model
要約 人間は、時間的および空間的経験を越えて長期的なメモリを活用することにより、 … 続きを読む
Training Free Stylized Abstraction
要約 様式化された抽象化は、視覚的に誇張されているが意味的に忠実な被験者の表現を … 続きを読む
カテゴリー: cs.CV
Training Free Stylized Abstraction はコメントを受け付けていません
Zero-Shot Vision Encoder Grafting via LLM Surrogates
要約 ビジョン言語モデル(VLMS)は通常、控えめなサイズのビジョンエンコーダー … 続きを読む
カテゴリー: cs.CV
Zero-Shot Vision Encoder Grafting via LLM Surrogates はコメントを受け付けていません
GET: Goal-directed Exploration and Targeting for Large-Scale Unknown Environments
要約 大規模で構造化されていない環境でのオブジェクト検索は、特に屋外の自律探査な … 続きを読む
カテゴリー: cs.RO
GET: Goal-directed Exploration and Targeting for Large-Scale Unknown Environments はコメントを受け付けていません