-
最近の投稿
- Learning to Recover: Dynamic Reward Shaping with Wheel-Leg Coordination for Fallen Robots
- An Integrated Visual Servoing Framework for Precise Robotic Pruning Operations in Modern Commercial Orchard
- Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties
- TD-TOG Dataset: Benchmarking Zero-Shot and One-Shot Task-Oriented Grasping for Object Generalization
- Hierarchical Intention-Aware Expressive Motion Generation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (39326) cs.CL (29768) cs.CV (44705) cs.HC (2997) cs.LG (44251) cs.RO (23494) cs.SY (3583) eess.IV (5135) eess.SY (3575) stat.ML (5752)
月別アーカイブ: 2025年6月
Visual Graph Arena: Evaluating Visual Conceptualization of Vision and Multimodal Large Language Models
要約 マルチモーダルの大手言語モデルの最近の進歩は、視覚的な質問に応答するブレー … 続きを読む
LlavaGuard: An Open VLM-based Framework for Safeguarding Vision Datasets and Models
要約 このペーパーでは、大規模なデータとモデルの時代における信頼できるガードレー … 続きを読む
Sparse Autoencoders Learn Monosemantic Features in Vision-Language Models
要約 AIの安全性にとって解釈可能性と操縦性が重要であることを考えると、スパース … 続きを読む
Bridging Perspectives: A Survey on Cross-view Collaborative Intelligence with Egocentric-Exocentric Vision
要約 エゴセントリック(一人称)とエクソセントリック(サードパーソン)の両方の視 … 続きを読む
DPCore: Dynamic Prompt Coreset for Continual Test-Time Adaptation
要約 継続的なテスト時間適応(CTTA)は、事前に訓練されたモデルを継続的に変化 … 続きを読む
MimeQA: Towards Socially-Intelligent Nonverbal Foundation Models
要約 AIが人々の日常活動とより密接に統合されるようになるにつれて、日常生活で人 … 続きを読む
Normalizing Flows are Capable Generative Models
要約 正規化フロー(NFS)は、連続入力の尤度ベースのモデルです。 彼らは、密度 … 続きを読む
Sketched Equivariant Imaging Regularization and Deep Internal Learning for Inverse Problems
要約 Equivariant Imaging(EI)の正則化は、地上の真実データ … 続きを読む
Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks
要約 テキストが全体的な理解を導く中心的な視覚要素として機能するテキストが豊富な … 続きを読む
BecomingLit: Relightable Gaussian Avatars with Hybrid Neural Shading
要約 Interactiveレートで新しい視点からレンダリングできる、信頼性の高 … 続きを読む