投稿者「jarxiv」のアーカイブ

Speech Retrieval-Augmented Generation without Automatic Speech Recognition

要約 音声データに対する質問応答の一般的なアプローチの1つは、まず自動音声認識( … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS | Speech Retrieval-Augmented Generation without Automatic Speech Recognition はコメントを受け付けていません

BlockDialect: Block-wise Fine-grained Mixed Format for Energy-Efficient LLM Inference

要約 大規模言語モデル(LLM)は目覚ましい成功を収めているが、サイズが大きくな … 続きを読む

カテゴリー: cs.CL, cs.LG | BlockDialect: Block-wise Fine-grained Mixed Format for Energy-Efficient LLM Inference はコメントを受け付けていません

Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking

要約 大規模言語モデル(LLM)は卓越した能力を発揮するが、依然として幻覚の問題 … 続きを読む

カテゴリー: cs.CL | Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking はコメントを受け付けていません

SVFR: A Unified Framework for Generalized Video Face Restoration

要約 顔復元(Face Restoration:FR)は、劣化した入力から高品質 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | SVFR: A Unified Framework for Generalized Video Face Restoration はコメントを受け付けていません

Free-Form Motion Control: A Synthetic Video Generation Dataset with Controllable Camera and Object Motions

要約 生成されたビデオ内の動的オブジェクトとカメラの動きを制御することは、有意義 … 続きを読む

カテゴリー: cs.CV | Free-Form Motion Control: A Synthetic Video Generation Dataset with Controllable Camera and Object Motions はコメントを受け付けていません

GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models

要約 近年、2次元視覚言語モデル(VLM)は、画像とテキストの理解タスクにおいて … 続きを読む

カテゴリー: cs.CV | GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models はコメントを受け付けていません

AdaptVC: High Quality Voice Conversion with Adaptive Learning

要約 音声変換の目標は、元のコンテンツを保持しながら、ソーススピーカーの音声をリ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | AdaptVC: High Quality Voice Conversion with Adaptive Learning はコメントを受け付けていません

Modelling and Control of Spatial Behaviours in Multi-Agent Systems with Applications to Biology and Robotics

要約 大規模マルチエージェントシステム(LS-MAS)は、いくつかの自律的な構成 … 続きを読む

カテゴリー: cs.MA, cs.RO, cs.SY, eess.SY | Modelling and Control of Spatial Behaviours in Multi-Agent Systems with Applications to Biology and Robotics はコメントを受け付けていません

Steppability-informed Quadrupedal Contact Planning through Deep Visual Search Heuristics

要約 本論文では、画像空間における環境ステッパビリティ(脚式ロボットのプラットフ … 続きを読む

カテゴリー: cs.RO | Steppability-informed Quadrupedal Contact Planning through Deep Visual Search Heuristics はコメントを受け付けていません

TrajLearn: Trajectory Prediction Learning using Deep Generative Models

要約 軌跡予測は、現在位置と過去の移動データを用いてエンティティの将来の経路を推 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | TrajLearn: Trajectory Prediction Learning using Deep Generative Models はコメントを受け付けていません