投稿者「jarxiv」のアーカイブ

ObjectClear: Complete Object Removal via Object-Effect Attention

要約 オブジェクトの削除には、ターゲットオブジェクトだけでなく、影や反射などの効 … 続きを読む

カテゴリー: cs.CV | ObjectClear: Complete Object Removal via Object-Effect Attention はコメントを受け付けていません

SPIRAL: Semantic-Aware Progressive LiDAR Scene Generation

要約 最近の拡散モデルを活用して、LIDARベースの大規模な3Dシーン生成は大き … 続きを読む

カテゴリー: cs.CV | SPIRAL: Semantic-Aware Progressive LiDAR Scene Generation はコメントを受け付けていません

Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation

要約 トーキングヘッドやトーキングボディジェネレーションなどのオーディオ駆動型の … 続きを読む

カテゴリー: cs.CV | Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation はコメントを受け付けていません

Sherlock: Self-Correcting Reasoning in Vision-Language Models

要約 推論ビジョン言語モデル(VLM)は、複雑なマルチモーダルタスクで有望なパフ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Sherlock: Self-Correcting Reasoning in Vision-Language Models はコメントを受け付けていません

VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models

要約 最近の大規模な視覚言語モデル(LVLMS)は、より細かい粒度の視覚的知覚と … 続きを読む

カテゴリー: cs.CV | VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models はコメントを受け付けていません

3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model

要約 人間は、時間的および空間的経験を越えて長期的なメモリを活用することにより、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | 3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model はコメントを受け付けていません

Training Free Stylized Abstraction

要約 様式化された抽象化は、視覚的に誇張されているが意味的に忠実な被験者の表現を … 続きを読む

カテゴリー: cs.CV | Training Free Stylized Abstraction はコメントを受け付けていません

Zero-Shot Vision Encoder Grafting via LLM Surrogates

要約 ビジョン言語モデル(VLMS)は通常、控えめなサイズのビジョンエンコーダー … 続きを読む

カテゴリー: cs.CV | Zero-Shot Vision Encoder Grafting via LLM Surrogates はコメントを受け付けていません

GET: Goal-directed Exploration and Targeting for Large-Scale Unknown Environments

要約 大規模で構造化されていない環境でのオブジェクト検索は、特に屋外の自律探査な … 続きを読む

カテゴリー: cs.RO | GET: Goal-directed Exploration and Targeting for Large-Scale Unknown Environments はコメントを受け付けていません

Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks

要約 最近のテーブル表現学習およびデータ発見方法は、データレイク内のテーブルユニ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB, cs.IR, cs.LG | Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks はコメントを受け付けていません