-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
Interpretable Dynamic Graph Neural Networks for Small Occluded Object Detection and Tracking
要約 歩行者、自転車、バイクのような小さくて見えない物体の検出と追跡は、不規則な … 続きを読む
Database-Agnostic Gait Enrollment using SetTransformers
要約 歩行認識は、監視やモニタリングの用途で関連性が高まっている、控えめで長距離 … 続きを読む
カテゴリー: cs.CV
Database-Agnostic Gait Enrollment using SetTransformers はコメントを受け付けていません
MUSAR: Exploring Multi-Subject Customization from Single-Subject Dataset via Attention Routing
要約 現在の多被験者カスタマイズアプローチには、2つの重大な課題がある。それは、 … 続きを読む
カテゴリー: cs.CV
MUSAR: Exploring Multi-Subject Customization from Single-Subject Dataset via Attention Routing はコメントを受け付けていません
Towards Dataset Copyright Evasion Attack against Personalized Text-to-Image Diffusion Models
要約 テキストから画像への拡散(T2I)モデルは急速に進歩し、テキストによるプロ … 続きを読む
Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology
要約 コンピュータ・ビジョンの手法は、生態学的・生物学的ワークフローを合理化する … 続きを読む
カテゴリー: cs.CV
Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology はコメントを受け付けていません
AOR: Anatomical Ontology-Guided Reasoning for Medical Large Multimodal Model in Chest X-Ray Interpretation
要約 胸部 X 線(CXR)は臨床現場で最も頻繁に行われる画像検査である。最近の … 続きを読む
No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves
要約 最近の研究では、意味のある内部表現を学習することで、生成学習を高速化し、拡 … 続きを読む
カテゴリー: cs.CV
No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves はコメントを受け付けていません
TWIST: Teleoperated Whole-Body Imitation System
要約 ヒューマノイドロボットを全身で遠隔操作することは、汎用的なロボット知能を開 … 続きを読む
R1-Reward: Training Multimodal Reward Model Through Stable Reinforcement Learning
要約 マルチモーダル報酬モデル(MRM)は、マルチモーダル大規模言語モデル(ML … 続きを読む
Scenethesis: A Language and Vision Agentic Framework for 3D Scene Generation
要約 テキストからインタラクティブな3Dシーンを合成することは、ゲーム、バーチャ … 続きを読む
カテゴリー: cs.CV
Scenethesis: A Language and Vision Agentic Framework for 3D Scene Generation はコメントを受け付けていません