月別アーカイブ: 2024年5月

Visualize and Paint GAN Activations

要約 私たちは、これらのモデルの内部動作をより深く理解し、無条件にトレーニングさ … 続きを読む

カテゴリー: cs.CV, cs.LG | Visualize and Paint GAN Activations はコメントを受け付けていません

Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition

要約 長いビデオのエンドツーエンドのアクション認識モデルを開発することは、長いビ … 続きを読む

カテゴリー: cs.CV | Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition はコメントを受け付けていません

M4U: Evaluating Multilingual Understanding and Reasoning for Large Multimodal Models

要約 多言語マルチモーダル推論は、人間レベルの知能を達成するための中心的なコンポ … 続きを読む

カテゴリー: cs.CL, cs.CV | M4U: Evaluating Multilingual Understanding and Reasoning for Large Multimodal Models はコメントを受け付けていません

Exploring Interactive Semantic Alignment for Efficient HOI Detection with Vision-language Model

要約 人間とオブジェクトの相互作用 (HOI) 検出は、人間とオブジェクトのペア … 続きを読む

カテゴリー: cs.CV | Exploring Interactive Semantic Alignment for Efficient HOI Detection with Vision-language Model はコメントを受け付けていません

GLiDR: Topologically Regularized Graph Generative Network for Sparse LiDAR Point Clouds

要約 LiDAR 点群がまばらであると、静的構造の詳細が大幅に失われ、ナビゲーシ … 続きを読む

カテゴリー: cs.CV, cs.RO | GLiDR: Topologically Regularized Graph Generative Network for Sparse LiDAR Point Clouds はコメントを受け付けていません

HDC: Hierarchical Semantic Decoding with Counting Assistance for Generalized Referring Expression Segmentation

要約 新しく提案された Generalized Referring Expres … 続きを読む

カテゴリー: cs.AI, cs.CV | HDC: Hierarchical Semantic Decoding with Counting Assistance for Generalized Referring Expression Segmentation はコメントを受け付けていません

Low-Light Video Enhancement via Spatial-Temporal Consistent Illumination and Reflection Decomposition

要約 Low-Light Video Enhancement (LLVE) は、 … 続きを読む

カテゴリー: cs.CV | Low-Light Video Enhancement via Spatial-Temporal Consistent Illumination and Reflection Decomposition はコメントを受け付けていません

MuLan: Multimodal-LLM Agent for Progressive and Interactive Multi-Object Diffusion

要約 既存のテキストから画像へのモデルは、複数のオブジェクトの画像を生成するのに … 続きを読む

カテゴリー: cs.CV | MuLan: Multimodal-LLM Agent for Progressive and Interactive Multi-Object Diffusion はコメントを受け付けていません

Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables

要約 画像分類におけるディープラーニングの台頭により、前例のない精度がもたらされ … 続きを読む

カテゴリー: cs.AI, cs.CV | Exposing Image Classifier Shortcuts with Counterfactual Frequency (CoF) Tables はコメントを受け付けていません

GroundGrid:LiDAR Point Cloud Ground Segmentation and Terrain Estimation

要約 正確な点群の地面セグメンテーションは、自動運転車の LiDAR センサーの … 続きを読む

カテゴリー: cs.CV, cs.RO | GroundGrid:LiDAR Point Cloud Ground Segmentation and Terrain Estimation はコメントを受け付けていません