-
最近の投稿
- Experimental Study on The Effect of Multi-step Deep Reinforcement Learning in POMDPs
- AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning
- Embodied Scene Understanding for Vision Language Models via MetaVQA
- Estimation-Aware Trajectory Optimization with Set-Valued Measurement Uncertainties
- Combining Movement Primitives with Contraction Theory
-
最近のコメント
表示できるコメントはありません。 cs.AI (32387) cs.CL (24483) cs.CR (2509) cs.CV (38599) cs.LG (37256) cs.RO (18883) cs.SY (2886) eess.IV (4625) eess.SY (2880) stat.ML (4916)
月別アーカイブ: 2024年7月
Learn from the Learnt: Source-Free Active Domain Adaptation via Contrastive Sampling and Visual Persistence
要約 ドメイン アダプテーション (DA) は、ソース ドメインから関連するター … 続きを読む
A Scalable Quantum Non-local Neural Network for Image Classification
要約 非ローカル演算はコンピュータ ビジョンにおいて重要な役割を果たし、入力全体 … 続きを読む
SHIC: Shape-Image Correspondences with no Keypoint Supervision
要約 正準表面マッピングは、オブジェクトの各ピクセルを 3D テンプレート内の対 … 続きを読む
カテゴリー: cs.CV
SHIC: Shape-Image Correspondences with no Keypoint Supervision はコメントを受け付けていません
Wolf: Captioning Everything with a World Summarization Framework
要約 私たちは、正確なビデオキャプションを作成するための WOrLd 要約フレー … 続きを読む
UGG: Unified Generative Grasping
要約 器用な掴みは、高い掴み成功率で多様な掴み姿勢を生み出すことを目的としていま … 続きを読む
HRP: Human Affordances for Robotic Pre-Training
要約 現実のさまざまなタスクに「一般化」するために、ロボット エージェントには、 … 続きを読む
Floating No More: Object-Ground Reconstruction from a Single Image
要約 単一画像からの 3D オブジェクト再構成における最近の進歩は、主にオブジェ … 続きを読む
カテゴリー: cs.CV
Floating No More: Object-Ground Reconstruction from a Single Image はコメントを受け付けていません
Dallah: A Dialect-Aware Multimodal Large Language Model for Arabic
要約 最近の進歩により、画像からテキストへのコンテンツの生成と理解におけるマルチ … 続きを読む
Exploring Scaling Trends in LLM Robustness
要約 言語モデルの機能は、モデルのサイズとトレーニング データをスケーリングする … 続きを読む
Recursive Introspection: Teaching Language Model Agents How to Self-Improve
要約 基礎モデルでインテリジェントなエージェントの動作を可能にするための中心的な … 続きを読む