-
最近の投稿
- Learning to Recover: Dynamic Reward Shaping with Wheel-Leg Coordination for Fallen Robots
- An Integrated Visual Servoing Framework for Precise Robotic Pruning Operations in Modern Commercial Orchard
- Adaptive Locomotion on Mud through Proprioceptive Sensing of Substrate Properties
- TD-TOG Dataset: Benchmarking Zero-Shot and One-Shot Task-Oriented Grasping for Object Generalization
- Hierarchical Intention-Aware Expressive Motion Generation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (39326) cs.CL (29768) cs.CV (44705) cs.HC (2997) cs.LG (44251) cs.RO (23494) cs.SY (3583) eess.IV (5135) eess.SY (3575) stat.ML (5752)
月別アーカイブ: 2025年6月
Movie Facts and Fibs (MF$^2$): A Benchmark for Long Movie Understanding
要約 ビジョン言語モデル(VLMS)の最近の進歩にもかかわらず、現在のベンチマー … 続きを読む
STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis
要約 高解像度の画像合成で強力なパフォーマンスを達成する正規化フローに基づいたス … 続きを読む
ExAct: A Video-Language Benchmark for Expert Action Analysis
要約 熟練した身体的人間の活動を専門レベルの理解のための新しいビデオ言語ベンチマ … 続きを読む
CoMemo: LVLMs Need Image Context with Image Memory
要約 大規模な言語モデルに基づいて構築された大規模な視覚言語モデルの最近の進歩に … 続きを読む
TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation
要約 現代の地球観測(EO)は、センサーと地域全体で衛星画像のスケールと多様性を … 続きを読む
Exploring Diffusion Transformer Designs via Grafting
要約 モデルアーキテクチャの設計には、オペレーター(注意、畳み込みなど)や構成( … 続きを読む
Kinetics: Rethinking Test-Time Scaling Laws
要約 実用的な効率の観点からテスト時間のスケーリング法則を再考し、小さなモデルの … 続きを読む
Teaming in the AI Era: AI-Augmented Frameworks for Forming, Simulating, and Optimizing Human Teams
要約 効果的なチームワークは、多様なドメインで不可欠です。 チームの形成段階では … 続きを読む
Defurnishing with X-Ray Vision: Joint Removal of Furniture from Panoramas and Mesh
要約 テクスチャメッシュと対応するマルチビューパノラマ画像として表される屋内スペ … 続きを読む
Does It Make Sense to Speak of Introspection in Large Language Models?
要約 大規模な言語モデル(LLM)は、魅力的な言語行動を示し、時には自己報告を提 … 続きを読む