月別アーカイブ: 2024年3月

NPHardEval4V: A Dynamic Reasoning Benchmark of Multimodal Large Language Models

投稿日: 2024年3月6日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の推論機能を理解することは、 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Triple-CFN: Restructuring Conceptual Spaces for Enhancing Abstract Reasoning process

投稿日: 2024年3月6日作成者: jarxiv

要約抽象的な推論問題は人工知能アルゴリズムに大きな課題を与え、知覚タスクに要求 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

投稿日: 2024年3月6日作成者: jarxiv

要約拡散モデルは、ノイズに向かうデータの前方経路を反転させることで、ノイズから … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Self-supervised 3D Patient Modeling with Multi-modal Attentive Fusion

投稿日: 2024年3月6日作成者: jarxiv

要約 3D患者身体モデリングは、スマート医療スキャンや手術室での自動患者ポジショ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation

投稿日: 2024年3月6日作成者: jarxiv

要約画像間の相対的なカメラ姿勢の推定は、コンピュータビジョンにおける中心的な問 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

LLaMoCo: Instruction Tuning of Large Language Models for Optimization Code Generation

投稿日: 2024年3月6日作成者: jarxiv

要約最近の研究では、大規模言語モデル（LLM）を用いて、LLMから次のステップ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, cs.NE, cs.SE, math.OC | コメントを受け付けていません

PAC-FNO: Parallel-Structured All-Component Fourier Neural Operators for Recognizing Low-Quality Images

投稿日: 2024年3月6日作成者: jarxiv

要約画像認識モデルの開発における標準的なプラクティスは、特定の画像解像度でモデ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Primal-Dual iLQR

投稿日: 2024年3月6日作成者: jarxiv

要約本論文では、制約のない離散時間最適制御問題を解くための新しいアルゴリズムを … 続きを読む →

カテゴリー: 49M15, cs.RO, G.1.6, math.OC | コメントを受け付けていません

On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics

投稿日: 2024年3月5日作成者: jarxiv

要約 SACやTD3のようなリスクを考慮した強化学習(RL)アルゴリズムは、様々 … 続きを読む →

カテゴリー: cs.LG | コメントを受け付けていません

LLMCRIT: Teaching Large Language Models to Use Criteria

投稿日: 2024年3月5日作成者: jarxiv

要約人間はタスクを実行する際にクライテリア（基準）に従っており、これらのクライ … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

月別アーカイブ: 2024年3月

NPHardEval4V: A Dynamic Reasoning Benchmark of Multimodal Large Language Models

Triple-CFN: Restructuring Conceptual Spaces for Enhancing Abstract Reasoning process

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Self-supervised 3D Patient Modeling with Multi-modal Attentive Fusion

FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation

LLaMoCo: Instruction Tuning of Large Language Models for Optimization Code Generation

PAC-FNO: Parallel-Structured All-Component Fourier Neural Operators for Recognizing Low-Quality Images

Primal-Dual iLQR

On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics

LLMCRIT: Teaching Large Language Models to Use Criteria

最近の投稿

最近のコメント

アーカイブ

カテゴリー