cs.AI」カテゴリーアーカイブ

ProcessBench: Identifying Process Errors in Mathematical Reasoning

要約 言語モデルは数学の問題を解くときに定期的に間違いを犯すため、推論プロセスに … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ProcessBench: Identifying Process Errors in Mathematical Reasoning はコメントを受け付けていません

RL Zero: Zero-Shot Language to Behaviors without any Supervision

要約 人間は与えられた報酬関数の最適な動作を予測できないことが多く、貧弱な報酬設 … 続きを読む

カテゴリー: cs.AI, cs.GR, cs.LG, cs.RO | RL Zero: Zero-Shot Language to Behaviors without any Supervision はコメントを受け付けていません

Constrained Control for Autonomous Spacecraft Rendezvous: Learning-Based Time Shift Governor

要約 この論文では、二体問題の設定においてランデブーおよびドッキング (RD) … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Constrained Control for Autonomous Spacecraft Rendezvous: Learning-Based Time Shift Governor はコメントを受け付けていません

TrojanRobot: Backdoor Attacks Against LLM-based Embodied Robots in the Physical World

要約 ロボット操作とは、ロボット工学と人工知能の高度な技術を使用した、ロボットの … 続きを読む

カテゴリー: cs.AI, cs.RO | TrojanRobot: Backdoor Attacks Against LLM-based Embodied Robots in the Physical World はコメントを受け付けていません

GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion

要約 メトリック単眼深度推定の一般化は、その不適切な姿勢の性質により大きな課題を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion はコメントを受け付けていません

From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning

要約 大規模言語モデル (LLM) の優れた機能により、LLM はさまざまな自律 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.RO | From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning はコメントを受け付けていません

Words2Contact: Identifying Support Contacts from Verbal Instructions Using Foundation Models

要約 このペーパーでは、大規模言語モデルとビジョン言語モデルを活用した、言語ガイ … 続きを読む

カテゴリー: cs.AI, cs.RO | Words2Contact: Identifying Support Contacts from Verbal Instructions Using Foundation Models はコメントを受け付けていません

Large Language Model Benchmarks in Medical Tasks

要約 医療分野で大規模言語モデル (LLM) の適用が増えるにつれ、ベンチマーク … 続きを読む

カテゴリー: cs.AI, cs.CL | Large Language Model Benchmarks in Medical Tasks はコメントを受け付けていません

Improved GUI Grounding via Iterative Narrowing

要約 グラフィカル ユーザー インターフェイス (GUI) の基礎は、視覚言語モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Improved GUI Grounding via Iterative Narrowing はコメントを受け付けていません

GameArena: Evaluating LLM Reasoning through Live Computer Games

要約 大規模言語モデル (LLM) の推論能力を評価することは困難です。 既存の … 続きを読む

カテゴリー: cs.AI, cs.CL | GameArena: Evaluating LLM Reasoning through Live Computer Games はコメントを受け付けていません