-
最近の投稿
- Topological mapping for traversability-aware long-range navigation in off-road terrain
- Equality Constrained Diffusion for Direct Trajectory Optimization
- Learning-Based Autonomous Navigation, Benchmark Environments and Simulation Framework for Endovascular Interventions
- Language Supervised Human Action Recognition with Salient Fusion: Construction Worker Action Recognition as a Use Case
- Bi-Level Motion Imitation for Humanoid Robots
-
最近のコメント
表示できるコメントはありません。 cs.AI (27641) cs.CL (20879) cs.CR (2167) cs.CV (34375) cs.LG (32373) cs.RO (15816) cs.SY (2460) eess.IV (4221) eess.SY (2454) stat.ML (4339)
投稿者「jarxiv」のアーカイブ
FakeShield: Explainable Image Forgery Detection and Localization via Multi-modal Large Language Models
要約 ジェネレーティブAIの急速な発展は、コンテンツ作成を容易にするだけでなく、 … 続きを読む
Vinoground: Scrutinizing LMMs over Dense Temporal Reasoning with Short Videos
要約 最近、最新の大規模マルチモーダルモデル(LMM)は、短編ビデオの理解に関連 … 続きを読む
$\mathcal{D(R,O)}$ Grasp: A Unified Representation of Robot and Object Interaction for Cross-Embodiment Dexterous Grasping
要約 器用な把持は、ロボットハンドと物体との間の正確な相互作用を必要とする、ロボ … 続きを読む
Quantifying Generalization Complexity for Large Language Models
要約 大規模言語モデル(LLM)は、複雑なクエリを理解し、高度なタスクを実行する … 続きを読む
Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks
要約 テキストリッチ画像は、テキストが全体的な理解を導く中心的な視覚要素として機 … 続きを読む
Fake It Until You Break It: On the Adversarial Robustness of AI-generated Image Detectors
要約 ジェネレーティブAI(GenAI)は創造的で生産的なタスクに無数の可能性を … 続きを読む
Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression
要約 何十年もの間、映像圧縮技術は著名な研究分野であった。従来のハイブリッド動画 … 続きを読む
MOREL: Enhancing Adversarial Robustness through Multi-Objective Representation Learning
要約 広範な研究により、ディープニューラルネットワーク(DNN)は、わずかな敵対 … 続きを読む
TopER: Topological Embeddings in Graph Representation Learning
要約 グラフ埋め込みはグラフ表現学習において重要な役割を果たし、機械学習モデルに … 続きを読む
Uncertainty Quantification with Bayesian Higher Order ReLU KANs
要約 我々は、コルモゴロフ・アーノルド・ネットワークの領域における最初の不確実性 … 続きを読む
カテゴリー: cs.AI, cs.LG, physics.data-an
コメントする