-
最近の投稿
- Solving Multi-Agent Safe Optimal Control with Distributed Epigraph Form MARL
- Nearly Optimal Nonlinear Safe Control with BaS-SDRE
- Field Report on Ground Penetrating Radar for Localization at the Mars Desert Research Station
- LAPP: Large Language Model Feedback for Preference-Driven Reinforcement Learning
- CityWalker: Learning Embodied Urban Navigation from Web-Scale Videos
-
最近のコメント
表示できるコメントはありません。 cs.AI (36968) cs.CL (27986) cs.CV (42734) cs.HC (2830) cs.LG (41908) cs.RO (21895) cs.SY (3335) eess.IV (4980) eess.SY (3327) stat.ML (5485)
投稿者「jarxiv」のアーカイブ
Survey of Video Diffusion Models: Foundations, Implementations, and Applications
要約 拡散モデルの最近の進歩により、ビデオ生成に革命をもたらし、従来の生成的敵対 … 続きを読む
MR. Video: ‘MapReduce’ is the Principle for Long Video Understanding
要約 MRを提案します。 ビデオ、長いビデオを処理するためのシンプルで効果的なM … 続きを読む
MMInference: Accelerating Pre-filling for Long-Context VLMs via Modality-Aware Permutation Sparse Attention
要約 長いコンテキスト機能と視覚的理解の統合は、ビジョン言語モデル(VLM)の前 … 続きを読む
Histogram-based Parameter-efficient Tuning for Passive Sonar Classification
要約 パラメーター効率の高い転送学習(PETL)メソッドは、モデル全体を微調整す … 続きを読む
Learning to Reason under Off-Policy Guidance
要約 大規模な推論モデル(LRMS)の最近の進歩は、マルチステップ推論や自己反省 … 続きを読む
Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws
要約 大規模な言語モデル(LLMS)は、多数のタスクにわたって顕著な能力を実証し … 続きを読む
Distribution-aware Forgetting Compensation for Exemplar-Free Lifelong Person Re-identification
要約 生涯にわたる人の再識別(LREID)は、新しい情報に適応しながら古い知識を … 続きを読む
Synergistic Weak-Strong Collaboration by Aligning Preferences
要約 現在の大規模な言語モデル(LLM)は、一般的な推論で優れていますが、独自ま … 続きを読む
VistaDepth: Frequency Modulation With Bias Reweighting For Enhanced Long-Range Depth Estimation
要約 単眼深度推定(MDE)は、単一のRGB画像からピクセルあたりの深度値を予測 … 続きを読む
DRAWER: Digital Reconstruction and Articulation With Environment Realism
要約 現実世界のデータから仮想デジタルレプリカを作成すると、ゲームやロボット工学 … 続きを読む