月別アーカイブ: 2024年4月

RNb-NeuS: Reflectance and Normal-based Multi-View 3D Reconstruction

要約 この論文では、フォトメトリック ステレオを通じて取得されたマルチビュー反射 … 続きを読む

カテゴリー: cs.CV | RNb-NeuS: Reflectance and Normal-based Multi-View 3D Reconstruction はコメントを受け付けていません

Learn ‘No’ to Say ‘Yes’ Better: Improving Vision-Language Models via Negations

要約 既存のビジョン言語モデル (VLM) は、テキストの説明を 1 つの単位と … 続きを読む

カテゴリー: cs.CV | Learn ‘No’ to Say ‘Yes’ Better: Improving Vision-Language Models via Negations はコメントを受け付けていません

LipSim: A Provably Robust Perceptual Similarity Metric

要約 近年、知覚的類似性指標の開発と適用に対する関心が高まっています。 研究では … 続きを読む

カテゴリー: cs.CV, cs.LG | LipSim: A Provably Robust Perceptual Similarity Metric はコメントを受け付けていません

Learning to Count without Annotations

要約 参照ベースのオブジェクト計数のための最近の教師あり手法は、ベンチマーク デ … 続きを読む

カテゴリー: cs.CV | Learning to Count without Annotations はコメントを受け付けていません

Convolutional Prompting meets Language Models for Continual Learning

要約 継続学習 (CL) を使用すると、古いタスクからのデータがない場合でも、新 … 続きを読む

カテゴリー: cs.CV | Convolutional Prompting meets Language Models for Continual Learning はコメントを受け付けていません

SeaBird: Segmentation in Bird’s View with Dice Loss Improves Monocular 3D Detection of Large Objects

要約 単眼 3D 検出器は、自動車や小さな物体に対して優れたパフォーマンスを実現 … 続きを読む

カテゴリー: cs.AI, cs.CV | SeaBird: Segmentation in Bird’s View with Dice Loss Improves Monocular 3D Detection of Large Objects はコメントを受け付けていません

SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks

要約 セマンティック セグメンテーションにおける最先端の手法の効率を向上させるに … 続きを読む

カテゴリー: cs.AI, cs.CV | SERNet-Former: Semantic Segmentation by Efficient Residual Network with Attention-Boosting Gates and Attention-Fusion Networks はコメントを受け付けていません

MTLoRA: A Low-Rank Adaptation Approach for Efficient Multi-Task Learning

要約 大規模なデータセットで事前トレーニングされたモデルをさまざまな下流タスクに … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MTLoRA: A Low-Rank Adaptation Approach for Efficient Multi-Task Learning はコメントを受け付けていません

Language Model Beats Diffusion — Tokenizer is Key to Visual Generation

要約 大規模言語モデル (LLM) は、言語の生成タスクでは主要なモデルですが、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Language Model Beats Diffusion — Tokenizer is Key to Visual Generation はコメントを受け付けていません

Gromov-Wassertein-like Distances in the Gaussian Mixture Models Space

要約 グロモフ-ワッサーシュタイン (GW) 距離は、異なる計量空間にわたる分布 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Gromov-Wassertein-like Distances in the Gaussian Mixture Models Space はコメントを受け付けていません