cs.AI」カテゴリーアーカイブ

The ALCHEmist: Automated Labeling 500x CHEaper Than LLM Data Annotators

要約 事前に訓練された大規模なモデルをアノテーターとして使用することで、クラウド … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The ALCHEmist: Automated Labeling 500x CHEaper Than LLM Data Annotators はコメントを受け付けていません

The TIP of the Iceberg: Revealing a Hidden Class of Task-In-Prompt Adversarial Attacks on LLMs

要約 我々は、LLMに対する脱獄敵対的攻撃の新しいクラス、タスク・イン・プロンプ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR | The TIP of the Iceberg: Revealing a Hidden Class of Task-In-Prompt Adversarial Attacks on LLMs はコメントを受け付けていません

Boosting Asynchronous Decentralized Learning with Model Fragmentation

要約 分散学習(Decentralized Learning: DL)は、ウェブ … 続きを読む

カテゴリー: cs.AI, cs.DC | Boosting Asynchronous Decentralized Learning with Model Fragmentation はコメントを受け付けていません

λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics

要約 長周期移動操作(MoMa)タスクを効率的に学習・実行することは、家庭や職場 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics はコメントを受け付けていません

EffoVPR: Effective Foundation Model Utilization for Visual Place Recognition

要約 視覚的場所認識(Visual Place Recognition: VPR … 続きを読む

カテゴリー: cs.AI, cs.CV | EffoVPR: Effective Foundation Model Utilization for Visual Place Recognition はコメントを受け付けていません

On Computational Limits and Provably Efficient Criteria of Visual Autoregressive Models: A Fine-Grained Complexity Analysis

要約 最近、視覚的自己回帰($mathsf{VAR}$)モデルは、画像生成分野に … 続きを読む

カテゴリー: cs.AI, cs.CC, cs.CV, cs.LG | On Computational Limits and Provably Efficient Criteria of Visual Autoregressive Models: A Fine-Grained Complexity Analysis はコメントを受け付けていません

RichSpace: Enriching Text-to-Video Prompt Space via Text Embedding Interpolation

要約 テキストからビデオへの生成モデルは目覚ましい進歩を遂げているが、複雑な特徴 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | RichSpace: Enriching Text-to-Video Prompt Space via Text Embedding Interpolation はコメントを受け付けていません

Defeasible Visual Entailment: Benchmark, Evaluator, and Reward-Driven Optimization

要約 このタスクの目的は、追加的な更新に基づいて、画像の前提条件とテキストの仮説 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Defeasible Visual Entailment: Benchmark, Evaluator, and Reward-Driven Optimization はコメントを受け付けていません

UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent

要約 視覚-言語-行動(VLA)モデルの最近の進歩は、汎化能力を向上させるために … 続きを読む

カテゴリー: cs.AI, cs.CV | UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent はコメントを受け付けていません

HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers

要約 事前に学習された強力な視覚言語モデル(VLMs)バックエンドを活用した大規 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers はコメントを受け付けていません