-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
NeRAF: 3D Scene Infused Neural Radiance and Acoustic Fields
要約 サウンドは、人間の知覚において大きな役割を果たします。 ビジョンに加えて、 … 続きを読む
Text-to-Image Generation for Vocabulary Learning Using the Keyword Method
要約 「キーワード方法」は、外国語の語彙を学ぶための効果的な手法です。 それには … 続きを読む
Scenario Understanding of Traffic Scenes Through Large Visual Language Models
要約 自律運転、知覚、計画、および制御を包含する深い学習モデルは、高性能を達成す … 続きを読む
カテゴリー: cs.CV
Scenario Understanding of Traffic Scenes Through Large Visual Language Models はコメントを受け付けていません
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes
要約 Dino、Sam、ClipなどのVision Foundationモデルの … 続きを読む
カテゴリー: cs.CV
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes はコメントを受け付けていません
IC-Portrait: In-Context Matching for View-Consistent Personalized Portrait
要約 既存の拡散モデルは、アイデンティティを提供する生成の大きな可能性を示してい … 続きを読む
カテゴリー: cs.CV
IC-Portrait: In-Context Matching for View-Consistent Personalized Portrait はコメントを受け付けていません
A Hybrid Deep Learning CNN Model for Enhanced COVID-19 Detection from Computed Tomography (CT) Scan Images
要約 Covid-19の早期発見は、効果的な治療とその拡散を制御するために重要で … 続きを読む
SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training
要約 監視された微調整(SFT)および強化学習(RL)は、基礎モデルのトレーニン … 続きを読む
CubeDiff: Repurposing Diffusion-Based Image Models for Panorama Generation
要約 テキストプロンプトまたは画像から360 {\ deg}パノラマを生成するた … 続きを読む
Distilling foundation models for robust and efficient models in digital pathology
要約 近年、デジタル病理のための基礎モデル(FM)の出現は、トレーニング前のデー … 続きを読む
SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Model
要約 この論文では、空間的理解はロボット操作のキーポイントであると主張し、ロボッ … 続きを読む