-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Exploiting Local Features and Range Images for Small Data Real-Time Point Cloud Semantic Segmentation
要約 点群のセマンティック セグメンテーションは、自動運転やロボット工学における … 続きを読む
ROSAR: An Adversarial Re-Training Framework for Robust Side-Scan Sonar Object Detection
要約 この論文では、ソナー センサーを使用して自律型水中ビークルによって生成され … 続きを読む
Uplifting Lower-Income Data: Strategies for Socioeconomic Perspective Shifts in Large Multi-modal Models
要約 最近の研究では、トレーニング データにおける文化と社会経済的グループの不平 … 続きを読む
TopoFR: A Closer Look at Topology Alignment on Face Recognition
要約 顔認識 (FR) の分野は、ディープラーニングの台頭により大幅な進歩を遂げ … 続きを読む
MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer
要約 ビデオ認識の大規模基礎モデルから視覚言語の知識を転送することが効果的である … 続きを読む
カテゴリー: cs.CV
MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer はコメントを受け付けていません
VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents
要約 検索拡張生成 (RAG) は、大規模言語モデル (LLM) が外部の知識ソ … 続きを読む
BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI
要約 脳異常の正確な診断は、相補的なマルチパラメトリック MRI 画像データを含 … 続きを読む
AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation
要約 テスト時の適応は、ソース モデルが監視なしでデータ分布の変化に適応できるよ … 続きを読む
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers
要約 最大 4096$\times$4096 の解像度の画像を効率的に生成できる … 続きを読む
カテゴリー: cs.CV
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers はコメントを受け付けていません
GAIA: Rethinking Action Quality Assessment for AI-Generated Videos
要約 アクションの品質の評価は、AI 生成ビデオの品質に重大な影響を与えるため、 … 続きを読む
カテゴリー: cs.CV
GAIA: Rethinking Action Quality Assessment for AI-Generated Videos はコメントを受け付けていません