月別アーカイブ: 2024年7月

SUMix: Mixup with Semantic and Uncertain Information

要約 ミックスアップ データ拡張アプローチは、ディープ ニューラル ネットワーク … 続きを読む

カテゴリー: cs.CV | SUMix: Mixup with Semantic and Uncertain Information はコメントを受け付けていません

A Survey on Deep Stereo Matching in the Twenties

要約 ステレオ マッチングの歴史は半世紀に近づきましたが、ディープラーニングのお … 続きを読む

カテゴリー: cs.CV | A Survey on Deep Stereo Matching in the Twenties はコメントを受け付けていません

RT-LA-VocE: Real-Time Low-SNR Audio-Visual Speech Enhancement

要約 このペーパーでは、今後の入力に依存せずに、ライブ ビデオ ストリームとノイ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | RT-LA-VocE: Real-Time Low-SNR Audio-Visual Speech Enhancement はコメントを受け付けていません

Disentangled Representation Learning through Geometry Preservation with the Gromov-Monge Gap

要約 教師なしで解きほぐされた表現を学習することは、機械学習における基本的な課題 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Disentangled Representation Learning through Geometry Preservation with the Gromov-Monge Gap はコメントを受け付けていません

RoBus: A Multimodal Dataset for Controllable Road Networks and Building Layouts Generation

要約 道路網や建物のレイアウトに重点を置いた自動 3D 都市生成は、都市デザイン … 続きを読む

カテゴリー: cs.AI, cs.CV | RoBus: A Multimodal Dataset for Controllable Road Networks and Building Layouts Generation はコメントを受け付けていません

Decompose and Compare Consistency: Measuring VLMs’ Answer Reliability via Task-Decomposition Consistency Comparison

要約 目覚ましい進歩にもかかわらず、現在の最先端の視覚言語モデル (VLM) は … 続きを読む

カテゴリー: cs.CL, cs.CV | Decompose and Compare Consistency: Measuring VLMs’ Answer Reliability via Task-Decomposition Consistency Comparison はコメントを受け付けていません

Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective

要約 人工知能 (AI) の最近の進歩、特に基礎モデル (FM) の自己教師あり … 続きを読む

カテゴリー: cs.CV | Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective はコメントを受け付けていません

Study on Aspect Ratio Variability toward Robustness of Vision Transformer-based Vehicle Re-identification

要約 ビジョン トランスフォーマー (ViT) は、車両再識別 (ReID) タ … 続きを読む

カテゴリー: cs.CV | Study on Aspect Ratio Variability toward Robustness of Vision Transformer-based Vehicle Re-identification はコメントを受け付けていません

Probabilistic Routing for Graph-Based Approximate Nearest Neighbor Search

要約 高次元空間における近似最近傍探索 (ANNS) は、機械学習の分野における … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DB, cs.DS, cs.LG | Probabilistic Routing for Graph-Based Approximate Nearest Neighbor Search はコメントを受け付けていません

OV-DINO: Unified Open-Vocabulary Detection with Language-Aware Selective Fusion

要約 オープン語彙の検出は、トレーニング中に遭遇しなかったものも含め、クラス名に … 続きを読む

カテゴリー: cs.CV | OV-DINO: Unified Open-Vocabulary Detection with Language-Aware Selective Fusion はコメントを受け付けていません