-
最近の投稿
- Multimodal Active Measurement for Human Mesh Recovery in Close Proximity
- An Algorithm for Distributed Computation of Reachable Sets for Multi-Agent Systems
- Meta-Learning Augmented MPC for Disturbance-Aware Motion Planning and Control of Quadrotors
- Solving Multi-Goal Robotic Tasks with Decision Transformer
- Context-Aware Command Understanding for Tabletop Scenarios
-
最近のコメント
表示できるコメントはありません。 cs.AI (27848) cs.CL (21045) cs.CR (2180) cs.CV (34554) cs.LG (32592) cs.RO (15968) cs.SY (2478) eess.IV (4238) eess.SY (2472) stat.ML (4364)
投稿者「jarxiv」のアーカイブ
Evaluating Perceptual Distance Models by Fitting Binomial Distributions to Two-Alternative Forced Choice Data
要約 2択強制選択(2AFC)実験法は、視覚知覚の文献でよく用いられている。実験 … 続きを読む
Generalizing Medical Image Representations via Quaternion Wavelet Networks
要約 ニューラルネットワークの汎化可能性は、様々なソースからの様々なタスクのデー … 続きを読む
Lie Algebra Canonicalization: Equivariant Neural Operators under arbitrary Lie Groups
要約 ロバストで汎化可能な機械学習モデルの探求は、等変量ニューラルネットワークを … 続きを読む
ControlAR: Controllable Image Generation with Autoregressive Models
要約 自己回帰(AR)モデルは、画像生成をネクストトーク予測として再構築し、顕著 … 続きを読む
LLaVA-Critic: Learning to Evaluate Multimodal Models
要約 LLaVA-Criticを紹介する。LLaVA-Criticは、幅広いマル … 続きを読む
Video Instruction Tuning With Synthetic Data
要約 動画ラージ・マルチモーダルモデル(LMM)の開発は、ウェブから大量の高品質 … 続きを読む
AlzhiNet: Traversing from 2DCNN to 3DCNN, Towards Early Detection and Diagnosis of Alzheimer’s Disease
要約 アルツハイマー病(AD)は進行性の神経変性疾患であり、高齢化社会の中で有病 … 続きを読む
Autoregressive Pre-Training on Pixels and Texts
要約 視覚情報とテキスト情報の統合は、言語モデルの進歩において有望な方向性を示し … 続きを読む
DivScene: Benchmarking LVLMs for Object Navigation with Diverse Scenes and Objects
要約 未知の環境におけるオブジェクトナビゲーションは、実世界のアプリケーションに … 続きを読む
Towards Foundation Models and Few-Shot Parameter-Efficient Fine-Tuning for Volumetric Organ Segmentation
要約 近年、基礎モデルや、大規模モデルを下流のタスクに転送する事前学習と適応のパ … 続きを読む