月別アーカイブ: 2024年6月

Deciphering ‘What’ and ‘Where’ Visual Pathways from Spectral Clustering of Layer-Distributed Neural Representations

要約 我々は、ニューラルネットワークの活性化内に含まれるグループ化情報を分析し、 … 続きを読む

カテゴリー: cs.CV | Deciphering ‘What’ and ‘Where’ Visual Pathways from Spectral Clustering of Layer-Distributed Neural Representations はコメントを受け付けていません

Video Generation with Learned Action Prior

要約 確率的ビデオ生成は、カメラが移動プラットフォームに取り付けられている場合に … 続きを読む

カテゴリー: cs.CV, cs.RO | Video Generation with Learned Action Prior はコメントを受け付けていません

MM-GTUNets: Unified Multi-Modal Graph Deep Learning for Brain Disorders Prediction

要約 グラフ ディープ ラーニング (GDL) は、画像データと非画像データの両 … 続きを読む

カテゴリー: cs.CV | MM-GTUNets: Unified Multi-Modal Graph Deep Learning for Brain Disorders Prediction はコメントを受け付けていません

Capturing Temporal Components for Time Series Classification

要約 特にモノのインターネット パラダイムから収集されるデータが豊富であるため、 … 続きを読む

カテゴリー: cs.CV, cs.LG | Capturing Temporal Components for Time Series Classification はコメントを受け付けていません

RankCLIP: Ranking-Consistent Language-Image Pretraining

要約 CLIP などの自己教師あり対比学習モデルは、多くの下流タスクにおける視覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | RankCLIP: Ranking-Consistent Language-Image Pretraining はコメントを受け付けていません

Self-supervised Multi-actor Social Activity Understanding in Streaming Videos

要約 この研究では、監視や支援ロボット工学などの現実世界のタスクにおける重要なコ … 続きを読む

カテゴリー: cs.CV | Self-supervised Multi-actor Social Activity Understanding in Streaming Videos はコメントを受け付けていません

SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset

要約 ラージ ビジョン モデル (LVM) からの有害な出力のリスクを軽減するた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DB | SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset はコメントを受け付けていません

On Layer-wise Representation Similarity: Application for Multi-Exit Models with a Single Classifier

要約 異なるモデル内および異なるモデル間の内部表現の類似性を分析することは、ディ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | On Layer-wise Representation Similarity: Application for Multi-Exit Models with a Single Classifier はコメントを受け付けていません

Visible-Thermal Tiny Object Detection: A Benchmark Dataset and Baselines

要約 小型物体検出 (SOD) は、数十年にわたって長年にわたって課題となってき … 続きを読む

カテゴリー: cs.CV | Visible-Thermal Tiny Object Detection: A Benchmark Dataset and Baselines はコメントを受け付けていません

Does Object Grounding Really Reduce Hallucination of Large Vision-Language Models?

要約 ラージ ビジョン ランゲージ モデル (LVLM) は、最近、画像キャプシ … 続きを読む

カテゴリー: cs.CL, cs.CV | Does Object Grounding Really Reduce Hallucination of Large Vision-Language Models? はコメントを受け付けていません