投稿者「jarxiv」のアーカイブ

GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents

要約 グラフィカルユーザーインターフェイス(GUI)エージェントの構築における既 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.HC | GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents はコメントを受け付けていません

InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

要約 Native Multimodal Pre-Trainingパラダイムを備 … 続きを読む

カテゴリー: cs.CV | InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models はコメントを受け付けていません

VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge

要約 現在のマルチモーダルベンチマークは、多くの場合、推論とドメイン固有の知識を … 続きを読む

カテゴリー: cs.CL | VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge はコメントを受け付けていません

Unchecked and Overlooked: Addressing the Checkbox Blind Spot in Large Language Models with CheckboxQA

要約 チェックボックスは、ダニの有無がデータの抽出と意思決定プロセスを直接通知す … 続きを読む

カテゴリー: cs.CL | Unchecked and Overlooked: Addressing the Checkbox Blind Spot in Large Language Models with CheckboxQA はコメントを受け付けていません

Opinion: Revisiting synthetic data classifications from a privacy perspective

要約 合成データは、既存の知識から生成されるか、実際のデータから導出されたAI開 … 続きを読む

カテゴリー: cs.AI, cs.LG | Opinion: Revisiting synthetic data classifications from a privacy perspective はコメントを受け付けていません

Trade-offs in Privacy-Preserving Eye Tracking through Iris Obfuscation: A Benchmarking Study

要約 ハードウェア、コンピューターグラフィックス、AIの最近の開発により、AR/ … 続きを読む

カテゴリー: cs.CV | Trade-offs in Privacy-Preserving Eye Tracking through Iris Obfuscation: A Benchmarking Study はコメントを受け付けていません

Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments

要約 ゼロショット設定の下で、連続環境(VLN-CE)におけるビジョン言語ナビゲ … 続きを読む

カテゴリー: cs.CV, cs.RO | Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments はコメントを受け付けていません

GPS: Distilling Compact Memories via Grid-based Patch Sampling for Efficient Online Class-Incremental Learning

要約 オンラインクラスインクリメンタル学習は、壊滅的な忘却を緩和しながら、過去の … 続きを読む

カテゴリー: cs.CV | GPS: Distilling Compact Memories via Grid-based Patch Sampling for Efficient Online Class-Incremental Learning はコメントを受け付けていません

Bi-directional Momentum-based Haptic Feedback and Control System for In-Hand Dexterous Telemanipulation

要約 手元の器用なテレマニピュレーションには、ロボットの正確なリモートモーション … 続きを読む

カテゴリー: cs.RO | Bi-directional Momentum-based Haptic Feedback and Control System for In-Hand Dexterous Telemanipulation はコメントを受け付けていません

UruBots RoboCup Work Team Description Paper

要約 この作品は、Robocup Work Leagueのチーム説明論文を提示し … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY | UruBots RoboCup Work Team Description Paper はコメントを受け付けていません