cs.AI」カテゴリーアーカイブ

DifFRelight: Diffusion-Based Facial Performance Relighting

要約 拡散ベースの画像間の変換を使用した、自由視点の顔のパフォーマンスの再照明の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | DifFRelight: Diffusion-Based Facial Performance Relighting はコメントを受け付けていません

MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code

要約 コードは、その精度と精度により、大規模な言語モデルの数学的推論能力を強化す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code はコメントを受け付けていません

SPA: 3D Spatial-Awareness Enables Effective Embodied Representation

要約 この論文では、身体化された AI における 3D 空間認識の重要性を強調す … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | SPA: 3D Spatial-Awareness Enables Effective Embodied Representation はコメントを受け付けていません

Emerging Pixel Grounding in Large Multimodal Models Without Grounding Supervision

要約 現在の大規模マルチモーダル モデル (LMM) は、モデルが言語コンポーネ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Emerging Pixel Grounding in Large Multimodal Models Without Grounding Supervision はコメントを受け付けていません

PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object Detection

要約 単一点教師あり指向物体検出は注目を集め、コミュニティ内で初期の進歩を遂げま … 続きを読む

カテゴリー: cs.AI, cs.CV | PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object Detection はコメントを受け付けていません

LatteCLIP: Unsupervised CLIP Fine-Tuning via LMM-Synthetic Texts

要約 大規模ビジョン言語事前トレーニング (VLP) モデル (CLIP など) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | LatteCLIP: Unsupervised CLIP Fine-Tuning via LMM-Synthetic Texts はコメントを受け付けていません

Identifying and Addressing Delusions for Target-Directed Decision-Making

要約 私たちは、意思決定時の計画中に目標を生成し、行動を導き、評価中により良い一 … 続きを読む

カテゴリー: cs.AI | Identifying and Addressing Delusions for Target-Directed Decision-Making はコメントを受け付けていません

Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond

要約 近年、トレーニング データ アトリビューション (TDA) 手法が、ニュー … 続きを読む

カテゴリー: cs.AI, cs.LG | Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond はコメントを受け付けていません

Context-Aware Command Understanding for Tabletop Scenarios

要約 この論文では、卓上シナリオで人間の自然なコマンドを解釈するように設計された … 続きを読む

カテゴリー: cs.AI, cs.RO | Context-Aware Command Understanding for Tabletop Scenarios はコメントを受け付けていません

Grounding Robot Policies with Visuomotor Language Guidance

要約 自然言語処理とコンピューター ビジョンの分野における最近の進歩により、大規 … 続きを読む

カテゴリー: cs.AI, cs.RO | Grounding Robot Policies with Visuomotor Language Guidance はコメントを受け付けていません