cs.CV」カテゴリーアーカイブ

TLA: Tactile-Language-Action Model for Contact-Rich Manipulation

要約 ビジョン言語モデルでは大きな進歩が遂げられています。 ただし、特に触覚セン … 続きを読む

カテゴリー: cs.CV, cs.RO | TLA: Tactile-Language-Action Model for Contact-Rich Manipulation はコメントを受け付けていません

Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning

要約 ビジョン言語モデル(VLM)は、マルチモーダル推論タスクの顕著な進歩を示し … 続きを読む

カテゴリー: cs.CL, cs.CV | Critic-V: VLM Critics Help Catch VLM Errors in Multimodal Reasoning はコメントを受け付けていません

ComicsPAP: understanding comic strips by picking the correct panel

要約 大規模なマルチモーダルモデル(LMM)は、画像キャプション、VQA、ビデオ … 続きを読む

カテゴリー: cs.CV | ComicsPAP: understanding comic strips by picking the correct panel はコメントを受け付けていません

CAD-Recode: Reverse Engineering CAD Code from Point Clouds

要約 コンピューター支援設計(CAD)モデルは、通常、パラメトリックスケッチを順 … 続きを読む

カテゴリー: cs.CV | CAD-Recode: Reverse Engineering CAD Code from Point Clouds はコメントを受け付けていません

Video-to-Audio Generation with Hidden Alignment

要約 ビデオ入力に従って意味的および一時的に整列したオーディオコンテンツを生成す … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Video-to-Audio Generation with Hidden Alignment はコメントを受け付けていません

Deformable Mamba for Wide Field of View Segmentation

要約 直線的な計算の複雑さを備えたマンバアーキテクチャの最近の進歩は、二次の複雑 … 続きを読む

カテゴリー: cs.CV | Deformable Mamba for Wide Field of View Segmentation はコメントを受け付けていません

Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting

要約 マルチモーダルのマルチエージェント軌跡予測では、2つの主要な課題が完全に取 … 続きを読む

カテゴリー: cs.CV, stat.ML | Collaborative Uncertainty Benefits Multi-Agent Multi-Modal Trajectory Forecasting はコメントを受け付けていません

Modular Customization of Diffusion Models via Blockwise-Parameterized Low-Rank Adaptation

要約 最近の拡散モデルのカスタマイズにより、テーマやスタイルの概念に少数の画像を … 続きを読む

カテゴリー: cs.CV | Modular Customization of Diffusion Models via Blockwise-Parameterized Low-Rank Adaptation はコメントを受け付けていません

RAG-Adapter: A Plug-and-Play RAG-enhanced Framework for Long Video Understanding

要約 ビデオ理解が可能なマルチモーダルの大手言語モデル(MLLMS)は急速に進ん … 続きを読む

カテゴリー: cs.CV | RAG-Adapter: A Plug-and-Play RAG-enhanced Framework for Long Video Understanding はコメントを受け付けていません

Comparing Satellite Data for Next-Day Wildfire Predictability

要約 複数の研究が衛星画像を使用して翌日の火災予測を実施しています。 2つの主要 … 続きを読む

カテゴリー: cs.CV | Comparing Satellite Data for Next-Day Wildfire Predictability はコメントを受け付けていません