投稿者「jarxiv」のアーカイブ

Self-Supervised Learning for Robotic Leaf Manipulation: A Hybrid Geometric-Neural Approach

要約 農業環境での葉の操作の自動化は、植物の形態の変動や変形可能な葉の変動など、 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO, I.2.10 | コメントする

Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets

要約 一般に、ターゲットのダウンストリームタスクでデータセットを収集することによ … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Fill the Gap: Quantifying and Reducing the Modality Gap in Image-Text Representation Learning

要約 ビジョン言語モデル(VLM)により、共有表現スペースにテキストと画像を埋め … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

Adversarial Robustness of Deep Learning Models for Inland Water Body Segmentation from SAR Images

要約 合成開口レーダー(SAR)画像からの内陸水域のセグメンテーションは、洪水マ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | コメントする

DISARM++: Beyond scanner-free harmonization

要約 さまざまなスキャナーにわたるT1強調MR画像の調和は、神経画像研究の一貫性 … 続きを読む

カテゴリー: cs.CV | コメントする

UI-Vision: A Desktop-centric GUI Benchmark for Visual Perception and Interaction

要約 グラフィカルユーザーインターフェイス(GUI)をナビゲートしてドキュメント … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | コメントする

Visual Imitation Enables Contextual Humanoid Control

要約 ヒューマノイドに階段を登り、周囲の環境のコンテキストを使用して椅子に座るよ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

FlexiAct: Towards Flexible Action Control in Heterogeneous Scenarios

要約 アクションカスタマイズには、被験者が入力制御信号によって決定されるアクショ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | コメントする

Multi-Agent System for Comprehensive Soccer Understanding

要約 AI主導のサッカー理解における最近の進歩は急速な進歩を示していますが、既存 … 続きを読む

カテゴリー: cs.CV | コメントする

A Synergistic Framework of Nonlinear Acoustic Computing and Reinforcement Learning for Real-World Human-Robot Interaction

要約 このペーパーでは、非線形音響コンピューティングと強化学習を統合した新しいフ … 続きを読む

カテゴリー: 68T01, cs.AI, cs.RO, I.2.8, physics.app-ph | コメントする