月別アーカイブ: 2024年6月

ELFS: Enhancing Label-Free Coreset Selection via Clustering-based Pseudo-Labeling

投稿日: 2024年6月7日作成者: jarxiv

要約最新の深層学習パイプラインには人間による注釈が付けられた高品質のデータが不 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

VideoTetris: Towards Compositional Text-to-Video Generation

投稿日: 2024年6月7日作成者: jarxiv

要約拡散モデルは、テキストからビデオ (T2V) の生成において大きな成功を収 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

xMIL: Insightful Explanations for Multiple Instance Learning in Histopathology

投稿日: 2024年6月7日作成者: jarxiv

要約マルチインスタンス学習 (MIL) は、弱教師機械学習に効果的で広く使用 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

SpectralZoom: Efficient Segmentation with an Adaptive Hyperspectral Camera

投稿日: 2024年6月7日作成者: jarxiv

要約ハイパースペクトル画像セグメンテーションは、農業、リモートセンシング、生 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

VISTA: Visualized Text Embedding For Universal Multi-Modal Retrieval

投稿日: 2024年6月7日作成者: jarxiv

要約マルチモーダル検索は実際にますます一般的になってきています。しかし、既存 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.IR | コメントを受け付けていません

Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment

投稿日: 2024年6月7日作成者: jarxiv

要約テスト時適応 (TTA) は、未知のシフトされたターゲットドメインでテス … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation

投稿日: 2024年6月7日作成者: jarxiv

要約生成モデルを使用して新しいデータを合成することは、データ不足の問題に対処す … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Neural Surface Reconstruction from Sparse Views Using Epipolar Geometry

投稿日: 2024年6月7日作成者: jarxiv

要約この論文では、情報の欠落によるあいまいさとオクルージョンが大きな障害となる … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Vision-LSTM: xLSTM as Generic Vision Backbone

投稿日: 2024年6月7日作成者: jarxiv

要約トランスフォーマーは、当初は自然言語処理のために導入されたにもかかわらず、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability

投稿日: 2024年6月7日作成者: jarxiv

要約ワールドモデルはさまざまなアクションの結果を予測できますが、これは自動運転 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年6月

ELFS: Enhancing Label-Free Coreset Selection via Clustering-based Pseudo-Labeling

VideoTetris: Towards Compositional Text-to-Video Generation

xMIL: Insightful Explanations for Multiple Instance Learning in Histopathology

SpectralZoom: Efficient Segmentation with an Adaptive Hyperspectral Camera

VISTA: Visualized Text Embedding For Universal Multi-Modal Retrieval

Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment

Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation

Neural Surface Reconstruction from Sparse Views Using Epipolar Geometry

Vision-LSTM: xLSTM as Generic Vision Backbone

Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability

最近の投稿

最近のコメント

アーカイブ

カテゴリー