-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
SUMix: Mixup with Semantic and Uncertain Information
要約 ミックスアップ データ拡張アプローチは、ディープ ニューラル ネットワーク … 続きを読む
カテゴリー: cs.CV
SUMix: Mixup with Semantic and Uncertain Information はコメントを受け付けていません
A Survey on Deep Stereo Matching in the Twenties
要約 ステレオ マッチングの歴史は半世紀に近づきましたが、ディープラーニングのお … 続きを読む
カテゴリー: cs.CV
A Survey on Deep Stereo Matching in the Twenties はコメントを受け付けていません
RT-LA-VocE: Real-Time Low-SNR Audio-Visual Speech Enhancement
要約 このペーパーでは、今後の入力に依存せずに、ライブ ビデオ ストリームとノイ … 続きを読む
Disentangled Representation Learning through Geometry Preservation with the Gromov-Monge Gap
要約 教師なしで解きほぐされた表現を学習することは、機械学習における基本的な課題 … 続きを読む
RoBus: A Multimodal Dataset for Controllable Road Networks and Building Layouts Generation
要約 道路網や建物のレイアウトに重点を置いた自動 3D 都市生成は、都市デザイン … 続きを読む
Decompose and Compare Consistency: Measuring VLMs’ Answer Reliability via Task-Decomposition Consistency Comparison
要約 目覚ましい進歩にもかかわらず、現在の最先端の視覚言語モデル (VLM) は … 続きを読む
Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective
要約 人工知能 (AI) の最近の進歩、特に基礎モデル (FM) の自己教師あり … 続きを読む
カテゴリー: cs.CV
Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective はコメントを受け付けていません
Study on Aspect Ratio Variability toward Robustness of Vision Transformer-based Vehicle Re-identification
要約 ビジョン トランスフォーマー (ViT) は、車両再識別 (ReID) タ … 続きを読む
カテゴリー: cs.CV
Study on Aspect Ratio Variability toward Robustness of Vision Transformer-based Vehicle Re-identification はコメントを受け付けていません
Probabilistic Routing for Graph-Based Approximate Nearest Neighbor Search
要約 高次元空間における近似最近傍探索 (ANNS) は、機械学習の分野における … 続きを読む
OV-DINO: Unified Open-Vocabulary Detection with Language-Aware Selective Fusion
要約 オープン語彙の検出は、トレーニング中に遭遇しなかったものも含め、クラス名に … 続きを読む
カテゴリー: cs.CV
OV-DINO: Unified Open-Vocabulary Detection with Language-Aware Selective Fusion はコメントを受け付けていません