月別アーカイブ: 2025年1月

Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking

要約 大規模言語モデル(LLM)は卓越した能力を発揮するが、依然として幻覚の問題 … 続きを読む

カテゴリー: cs.CL | Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking はコメントを受け付けていません

SVFR: A Unified Framework for Generalized Video Face Restoration

要約 顔復元(Face Restoration:FR)は、劣化した入力から高品質 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | SVFR: A Unified Framework for Generalized Video Face Restoration はコメントを受け付けていません

Free-Form Motion Control: A Synthetic Video Generation Dataset with Controllable Camera and Object Motions

要約 生成されたビデオ内の動的オブジェクトとカメラの動きを制御することは、有意義 … 続きを読む

カテゴリー: cs.CV | Free-Form Motion Control: A Synthetic Video Generation Dataset with Controllable Camera and Object Motions はコメントを受け付けていません

GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models

要約 近年、2次元視覚言語モデル(VLM)は、画像とテキストの理解タスクにおいて … 続きを読む

カテゴリー: cs.CV | GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models はコメントを受け付けていません

AdaptVC: High Quality Voice Conversion with Adaptive Learning

要約 音声変換の目標は、元のコンテンツを保持しながら、ソーススピーカーの音声をリ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | AdaptVC: High Quality Voice Conversion with Adaptive Learning はコメントを受け付けていません

Modelling and Control of Spatial Behaviours in Multi-Agent Systems with Applications to Biology and Robotics

要約 大規模マルチエージェントシステム(LS-MAS)は、いくつかの自律的な構成 … 続きを読む

カテゴリー: cs.MA, cs.RO, cs.SY, eess.SY | Modelling and Control of Spatial Behaviours in Multi-Agent Systems with Applications to Biology and Robotics はコメントを受け付けていません

Steppability-informed Quadrupedal Contact Planning through Deep Visual Search Heuristics

要約 本論文では、画像空間における環境ステッパビリティ(脚式ロボットのプラットフ … 続きを読む

カテゴリー: cs.RO | Steppability-informed Quadrupedal Contact Planning through Deep Visual Search Heuristics はコメントを受け付けていません

TrajLearn: Trajectory Prediction Learning using Deep Generative Models

要約 軌跡予測は、現在位置と過去の移動データを用いてエンティティの将来の経路を推 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | TrajLearn: Trajectory Prediction Learning using Deep Generative Models はコメントを受け付けていません

Automotive Speed Estimation: Sensor Types and Error Characteristics from OBD-II to ADAS

要約 現代のオンロード・ナビゲーション・システムは、慣性航法システム(INS)や … 続きを読む

カテゴリー: cs.RO, eess.SP | Automotive Speed Estimation: Sensor Types and Error Characteristics from OBD-II to ADAS はコメントを受け付けていません

Predicate Invention from Pixels via Pretrained Vision-Language Models

要約 我々の目的は、画像という形の生のセンサー入力が与えられた、変動が激しく、組 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Predicate Invention from Pixels via Pretrained Vision-Language Models はコメントを受け付けていません