-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
Slovo: Russian Sign Language Dataset
要約 手話認識タスクの主な課題の 1 つは、難聴社会と聴者社会の間にあるギャップ … 続きを読む
カテゴリー: cs.CV
Slovo: Russian Sign Language Dataset はコメントを受け付けていません
Vivim: a Video Vision Mamba for Medical Video Object Segmentation
要約 従来の畳み込みニューラル ネットワークの受容野は限られていますが、トランス … 続きを読む
カテゴリー: cs.CV
Vivim: a Video Vision Mamba for Medical Video Object Segmentation はコメントを受け付けていません
CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive Self-Supervised Transformers
要約 このペーパーでは、複数の自己教師ありモデルからの特徴表現を活用する、教師な … 続きを読む
カテゴリー: cs.CV
CuVLER: Enhanced Unsupervised Object Discoveries through Exhaustive Self-Supervised Transformers はコメントを受け付けていません
Domain-Aware Continual Zero-Shot Learning
要約 現代の視覚システムには、種の発見の支援、野生動物の監視など、自然科学研究の … 続きを読む
Robust Synthetic-to-Real Transfer for Stereo Matching
要約 ドメイン汎用ステレオ マッチング ネットワークの進歩により、合成データで事 … 続きを読む
カテゴリー: cs.CV
Robust Synthetic-to-Real Transfer for Stereo Matching はコメントを受け付けていません
Fast and Simple Explainability for Point Cloud Networks
要約 点群データに対する高速かつシンプルな説明可能な AI (XAI) 手法を提 … 続きを読む
SSM Meets Video Diffusion Models: Efficient Video Generation with Structured State Spaces
要約 拡散モデルによる画像生成における目覚ましい成果を受けて、研究コミュニティは … 続きを読む
Intra-video Positive Pairs in Self-Supervised Learning for Ultrasound
要約 自己教師あり学習 (SSL) は、ラベルのない画像から表現を学習することで … 続きを読む
Dynamic Graph Representation with Knowledge-aware Attention for Histopathology Whole Slide Image Analysis
要約 組織病理学的全スライド画像 (WSI) の分類は、医療顕微鏡画像処理の基礎 … 続きを読む
カテゴリー: cs.CV
Dynamic Graph Representation with Knowledge-aware Attention for Histopathology Whole Slide Image Analysis はコメントを受け付けていません
Multi-modal Auto-regressive Modeling via Visual Words
要約 大規模言語モデル (LLM) は、注釈のない大量のテキスト コーパスに対し … 続きを読む