-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
ELFS: Enhancing Label-Free Coreset Selection via Clustering-based Pseudo-Labeling
要約 最新の深層学習パイプラインには人間による注釈が付けられた高品質のデータが不 … 続きを読む
VideoTetris: Towards Compositional Text-to-Video Generation
要約 拡散モデルは、テキストからビデオ (T2V) の生成において大きな成功を収 … 続きを読む
カテゴリー: cs.CV
VideoTetris: Towards Compositional Text-to-Video Generation はコメントを受け付けていません
xMIL: Insightful Explanations for Multiple Instance Learning in Histopathology
要約 マルチ インスタンス学習 (MIL) は、弱教師機械学習に効果的で広く使用 … 続きを読む
SpectralZoom: Efficient Segmentation with an Adaptive Hyperspectral Camera
要約 ハイパースペクトル画像セグメンテーションは、農業、リモート センシング、生 … 続きを読む
VISTA: Visualized Text Embedding For Universal Multi-Modal Retrieval
要約 マルチモーダル検索は実際にますます一般的になってきています。 しかし、既存 … 続きを読む
Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment
要約 テスト時適応 (TTA) は、未知のシフトされたターゲット ドメインでテス … 続きを読む
カテゴリー: cs.CV
Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment はコメントを受け付けていません
Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation
要約 生成モデルを使用して新しいデータを合成することは、データ不足の問題に対処す … 続きを読む
カテゴリー: cs.CV
Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation はコメントを受け付けていません
Neural Surface Reconstruction from Sparse Views Using Epipolar Geometry
要約 この論文では、情報の欠落によるあいまいさとオクルージョンが大きな障害となる … 続きを読む
カテゴリー: cs.CV
Neural Surface Reconstruction from Sparse Views Using Epipolar Geometry はコメントを受け付けていません
Vision-LSTM: xLSTM as Generic Vision Backbone
要約 トランスフォーマーは、当初は自然言語処理のために導入されたにもかかわらず、 … 続きを読む
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability
要約 ワールドモデルはさまざまなアクションの結果を予測できますが、これは自動運転 … 続きを読む