月別アーカイブ: 2025年5月

3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model

要約 人間は、時間的および空間的経験を越えて長期的なメモリを活用することにより、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | 3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model はコメントを受け付けていません

Training Free Stylized Abstraction

要約 様式化された抽象化は、視覚的に誇張されているが意味的に忠実な被験者の表現を … 続きを読む

カテゴリー: cs.CV | Training Free Stylized Abstraction はコメントを受け付けていません

Zero-Shot Vision Encoder Grafting via LLM Surrogates

要約 ビジョン言語モデル(VLMS)は通常、控えめなサイズのビジョンエンコーダー … 続きを読む

カテゴリー: cs.CV | Zero-Shot Vision Encoder Grafting via LLM Surrogates はコメントを受け付けていません

GET: Goal-directed Exploration and Targeting for Large-Scale Unknown Environments

要約 大規模で構造化されていない環境でのオブジェクト検索は、特に屋外の自律探査な … 続きを読む

カテゴリー: cs.RO | GET: Goal-directed Exploration and Targeting for Large-Scale Unknown Environments はコメントを受け付けていません

Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks

要約 最近のテーブル表現学習およびデータ発見方法は、データレイク内のテーブルユニ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DB, cs.IR, cs.LG | Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks はコメントを受け付けていません

PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims

要約 特許請求は、発明の保護範囲を定義します。 請求に曖昧さがある場合、それは特 … 続きを読む

カテゴリー: cs.CL | PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims はコメントを受け付けていません

Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity

要約 大規模な言語モデルにおける専門家(MOE)の混合物の外科は、はるかに大きな … 続きを読む

カテゴリー: cs.CL | Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity はコメントを受け付けていません

MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on

要約 Video Virtual Try-On(VVT)は、連続したビデオフレー … 続きを読む

カテゴリー: cs.CV | MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on はコメントを受け付けていません

HoliTom: Holistic Token Merging for Fast Video Large Language Models

要約 ビデオ大規模な言語モデル(ビデオLLM)はビデオ理解に優れていますが、冗長 … 続きを読む

カテゴリー: cs.CV | HoliTom: Holistic Token Merging for Fast Video Large Language Models はコメントを受け付けていません

Visuospatial Cognitive Assistant

要約 ビデオベースの空間認知は、ロボット工学と具体化されたAIにとって不可欠です … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | Visuospatial Cognitive Assistant はコメントを受け付けていません