投稿者「jarxiv」のアーカイブ

ExAct: A Video-Language Benchmark for Expert Action Analysis

要約 熟練した身体的人間の活動を専門レベルの理解のための新しいビデオ言語ベンチマ … 続きを読む

カテゴリー: cs.CV | ExAct: A Video-Language Benchmark for Expert Action Analysis はコメントを受け付けていません

CoMemo: LVLMs Need Image Context with Image Memory

要約 大規模な言語モデルに基づいて構築された大規模な視覚言語モデルの最近の進歩に … 続きを読む

カテゴリー: cs.CV | CoMemo: LVLMs Need Image Context with Image Memory はコメントを受け付けていません

TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation

要約 現代の地球観測(EO)は、センサーと地域全体で衛星画像のスケールと多様性を … 続きを読む

カテゴリー: cs.CV | TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation はコメントを受け付けていません

Exploring Diffusion Transformer Designs via Grafting

要約 モデルアーキテクチャの設計には、オペレーター(注意、畳み込みなど)や構成( … 続きを読む

カテゴリー: cs.AI, cs.LG | Exploring Diffusion Transformer Designs via Grafting はコメントを受け付けていません

Kinetics: Rethinking Test-Time Scaling Laws

要約 実用的な効率の観点からテスト時間のスケーリング法則を再考し、小さなモデルの … 続きを読む

カテゴリー: cs.CL, cs.LG | Kinetics: Rethinking Test-Time Scaling Laws はコメントを受け付けていません

Teaming in the AI Era: AI-Augmented Frameworks for Forming, Simulating, and Optimizing Human Teams

要約 効果的なチームワークは、多様なドメインで不可欠です。 チームの形成段階では … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.MA | Teaming in the AI Era: AI-Augmented Frameworks for Forming, Simulating, and Optimizing Human Teams はコメントを受け付けていません

Defurnishing with X-Ray Vision: Joint Removal of Furniture from Panoramas and Mesh

要約 テクスチャメッシュと対応するマルチビューパノラマ画像として表される屋内スペ … 続きを読む

カテゴリー: cs.CV | Defurnishing with X-Ray Vision: Joint Removal of Furniture from Panoramas and Mesh はコメントを受け付けていません

Does It Make Sense to Speak of Introspection in Large Language Models?

要約 大規模な言語モデル(LLM)は、魅力的な言語行動を示し、時には自己報告を提 … 続きを読む

カテゴリー: cs.AI, cs.CL | Does It Make Sense to Speak of Introspection in Large Language Models? はコメントを受け付けていません

Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting

要約 NERFやGaussian Splatting(GS)を含むニューラルレン … 続きを読む

カテゴリー: cs.CV | Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting はコメントを受け付けていません

FreeTimeGS: Free Gaussian Primitives at Anytime and Anywhere for Dynamic Scene Reconstruction

要約 このペーパーでは、複雑な動きで動的な3Dシーンを再構築するという課題に取り … 続きを読む

カテゴリー: cs.CV | FreeTimeGS: Free Gaussian Primitives at Anytime and Anywhere for Dynamic Scene Reconstruction はコメントを受け付けていません