月別アーカイブ: 2024年3月

NPHardEval4V: A Dynamic Reasoning Benchmark of Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) の推論機能を理解することは、 … 続きを読む

カテゴリー: cs.CL, cs.CV | NPHardEval4V: A Dynamic Reasoning Benchmark of Multimodal Large Language Models はコメントを受け付けていません

Triple-CFN: Restructuring Conceptual Spaces for Enhancing Abstract Reasoning process

要約 抽象的な推論問題は人工知能アルゴリズムに大きな課題を与え、知覚タスクに要求 … 続きを読む

カテゴリー: cs.CV | Triple-CFN: Restructuring Conceptual Spaces for Enhancing Abstract Reasoning process はコメントを受け付けていません

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

要約 拡散モデルは、ノイズに向かうデータの前方経路を反転させることで、ノイズから … 続きを読む

カテゴリー: cs.CV | Scaling Rectified Flow Transformers for High-Resolution Image Synthesis はコメントを受け付けていません

Self-supervised 3D Patient Modeling with Multi-modal Attentive Fusion

要約 3D患者身体モデリングは、スマート医療スキャンや手術室での自動患者ポジショ … 続きを読む

カテゴリー: cs.CV | Self-supervised 3D Patient Modeling with Multi-modal Attentive Fusion はコメントを受け付けていません

FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation

要約 画像間の相対的なカメラ姿勢の推定は、コンピュータビジョンにおける中心的な問 … 続きを読む

カテゴリー: cs.CV | FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation はコメントを受け付けていません

LLaMoCo: Instruction Tuning of Large Language Models for Optimization Code Generation

要約 最近の研究では、大規模言語モデル(LLM)を用いて、LLMから次のステップ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.NE, cs.SE, math.OC | LLaMoCo: Instruction Tuning of Large Language Models for Optimization Code Generation はコメントを受け付けていません

PAC-FNO: Parallel-Structured All-Component Fourier Neural Operators for Recognizing Low-Quality Images

要約 画像認識モデルの開発における標準的なプラクティスは、特定の画像解像度でモデ … 続きを読む

カテゴリー: cs.AI, cs.CV | PAC-FNO: Parallel-Structured All-Component Fourier Neural Operators for Recognizing Low-Quality Images はコメントを受け付けていません

Primal-Dual iLQR

要約 本論文では、制約のない離散時間最適制御問題を解くための新しいアルゴリズムを … 続きを読む

カテゴリー: 49M15, cs.RO, G.1.6, math.OC | Primal-Dual iLQR はコメントを受け付けていません

On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics

要約 SACやTD3のようなリスクを考慮した強化学習(RL)アルゴリズムは、様々 … 続きを読む

カテゴリー: cs.LG | On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics はコメントを受け付けていません

LLMCRIT: Teaching Large Language Models to Use Criteria

要約 人間はタスクを実行する際にクライテリア(基準)に従っており、これらのクライ … 続きを読む

カテゴリー: cs.CL | LLMCRIT: Teaching Large Language Models to Use Criteria はコメントを受け付けていません