cs.AI」カテゴリーアーカイブ

Inherently Faithful Attention Maps for Vision Transformers

要約 学習したバイナリ注意マスクを使用して、参加した画像領域のみが予測に影響を与 … 続きを読む

カテゴリー: cs.AI, cs.CV | Inherently Faithful Attention Maps for Vision Transformers はコメントを受け付けていません

Synthetic Data Augmentation for Table Detection: Re-evaluating TableNet’s Performance with Automatically Generated Document Images

要約 スマートフォンまたはスキャナーがキャプチャしたドキュメントページにはテーブ … 続きを読む

カテゴリー: cs.AI, cs.CV | Synthetic Data Augmentation for Table Detection: Re-evaluating TableNet’s Performance with Automatically Generated Document Images はコメントを受け付けていません

PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation

要約 既存の単眼3Dポーズ推定方法は、主に関節の位置の特徴に依存していますが、骨 … 続きを読む

カテゴリー: cs.AI, cs.CV | PoseGRAF: Geometric-Reinforced Adaptive Fusion for Monocular 3D Human Pose Estimation はコメントを受け付けていません

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

要約 マルチモーダル大手言語モデル(MLLMS)は、グラフィカルユーザーインター … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents はコメントを受け付けていません

Diverse Topology Optimization using Modulated Neural Fields

要約 トポロジの最適化(to)は、正式な問題の説明から最適に近い幾何学を導き出す … 続きを読む

カテゴリー: cond-mat.mtrl-sci, cs.AI, cs.CV, cs.LG | Diverse Topology Optimization using Modulated Neural Fields はコメントを受け付けていません

Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models

要約 GPT-4などの大規模な言語モデル(LLM)は、複数のドメインにまたがる膨 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models はコメントを受け付けていません

A Production Scheduling Framework for Reinforcement Learning Under Real-World Constraints

要約 クラシックジョブショップのスケジューリング問題(JSSP)は、決定論的制約 … 続きを読む

カテゴリー: cs.AI, cs.LG | A Production Scheduling Framework for Reinforcement Learning Under Real-World Constraints はコメントを受け付けていません

Prefix-Tuning+: Modernizing Prefix-Tuning by Decoupling the Prefix from Attention

要約 パラメーター効率の高い微調整(PEFT)メソッドは、大規模な言語モデル(L … 続きを読む

カテゴリー: cs.AI, cs.CL | Prefix-Tuning+: Modernizing Prefix-Tuning by Decoupling the Prefix from Attention はコメントを受け付けていません

IKDiffuser: Fast and Diverse Inverse Kinematics Solution Generation for Multi-arm Robotic Systems

要約 逆運動学(IK)の問題を解決することは、ロボット工学の基本ですが、主に単一 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | IKDiffuser: Fast and Diverse Inverse Kinematics Solution Generation for Multi-arm Robotic Systems はコメントを受け付けていません

ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models

要約 量子化は、大規模な言語モデル(LLM)のメモリ要件を減らすための効果的な手 … 続きを読む

カテゴリー: cs.AI, cs.CL | ROSAQ: Rotation-based Saliency-Aware Weight Quantization for Efficiently Compressing Large Language Models はコメントを受け付けていません