月別アーカイブ: 2024年6月

ELFS: Enhancing Label-Free Coreset Selection via Clustering-based Pseudo-Labeling

要約 最新の深層学習パイプラインには人間による注釈が付けられた高品質のデータが不 … 続きを読む

カテゴリー: cs.AI, cs.CV | ELFS: Enhancing Label-Free Coreset Selection via Clustering-based Pseudo-Labeling はコメントを受け付けていません

VideoTetris: Towards Compositional Text-to-Video Generation

要約 拡散モデルは、テキストからビデオ (T2V) の生成において大きな成功を収 … 続きを読む

カテゴリー: cs.CV | VideoTetris: Towards Compositional Text-to-Video Generation はコメントを受け付けていません

xMIL: Insightful Explanations for Multiple Instance Learning in Histopathology

要約 マルチ インスタンス学習 (MIL) は、弱教師機械学習に効果的で広く使用 … 続きを読む

カテゴリー: cs.CV, cs.LG | xMIL: Insightful Explanations for Multiple Instance Learning in Histopathology はコメントを受け付けていません

SpectralZoom: Efficient Segmentation with an Adaptive Hyperspectral Camera

要約 ハイパースペクトル画像セグメンテーションは、農業、リモート センシング、生 … 続きを読む

カテゴリー: cs.CV, cs.RO | SpectralZoom: Efficient Segmentation with an Adaptive Hyperspectral Camera はコメントを受け付けていません

VISTA: Visualized Text Embedding For Universal Multi-Modal Retrieval

要約 マルチモーダル検索は実際にますます一般的になってきています。 しかし、既存 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.IR | VISTA: Visualized Text Embedding For Universal Multi-Modal Retrieval はコメントを受け付けていません

Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment

要約 テスト時適応 (TTA) は、未知のシフトされたターゲット ドメインでテス … 続きを読む

カテゴリー: cs.CV | Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment はコメントを受け付けていません

Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation

要約 生成モデルを使用して新しいデータを合成することは、データ不足の問題に対処す … 続きを読む

カテゴリー: cs.CV | Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation はコメントを受け付けていません

Neural Surface Reconstruction from Sparse Views Using Epipolar Geometry

要約 この論文では、情報の欠落によるあいまいさとオクルージョンが大きな障害となる … 続きを読む

カテゴリー: cs.CV | Neural Surface Reconstruction from Sparse Views Using Epipolar Geometry はコメントを受け付けていません

Vision-LSTM: xLSTM as Generic Vision Backbone

要約 トランスフォーマーは、当初は自然言語処理のために導入されたにもかかわらず、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Vision-LSTM: xLSTM as Generic Vision Backbone はコメントを受け付けていません

Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability

要約 ワールドモデルはさまざまなアクションの結果を予測できますが、これは自動運転 … 続きを読む

カテゴリー: cs.AI, cs.CV | Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability はコメントを受け付けていません