-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
Scale Efficient Training for Large Datasets
要約 データセットスケールの急速な成長は、深い学習研究を進めるための重要な要因と … 続きを読む
MicroVQA: A Multimodal Reasoning Benchmark for Microscopy-Based Scientific Research
要約 科学研究には、マルチモーダルデータよりも洗練された推論が必要です。これは、 … 続きを読む
U2AD: Uncertainty-based Unsupervised Anomaly Detection Framework for Detecting T2 Hyperintensity in MRI Spinal Cord
要約 脊髄MR画像のT2高強度は、変性頸部骨髄障害などの条件のための重要なバイオ … 続きを読む
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction
要約 データ表現の選択は、幾何学的なタスクにおける深い学習の成功における重要な要 … 続きを読む
カテゴリー: cs.CV
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction はコメントを受け付けていません
Video-Guided Foley Sound Generation with Multimodal Controls
要約 ビデオのサウンドエフェクトを生成するには、多くの場合、実生活のソースとサウ … 続きを読む
CLIP’s Visual Embedding Projector is a Few-shot Cornucopia
要約 少数のショット分類のために、Clip(Radford et al。、202 … 続きを読む
カテゴリー: cs.CV
CLIP’s Visual Embedding Projector is a Few-shot Cornucopia はコメントを受け付けていません
Infinite Mobility: Scalable High-Fidelity Synthesis of Articulated Objects via Procedural Generation
要約 具体化されたAIに関連する複数のタスクには、高品質の大規模な明確なオブジェ … 続きを読む
カテゴリー: cs.CV
Infinite Mobility: Scalable High-Fidelity Synthesis of Articulated Objects via Procedural Generation はコメントを受け付けていません
Robust Latent Matters: Boosting Image Generation with Sampling Error Synthesis
要約 通常、最近の画像生成スキームは、凍結画像トークネイザーに依存して、事前に構 … 続きを読む
Escaping Plato’s Cave: Robust Conceptual Reasoning through Interpretable 3D Neural Object Volumes
要約 特にハイステークスアプリケーションでのニューラルネットワークの増加に伴い、 … 続きを読む
カテゴリー: cs.CV
Escaping Plato’s Cave: Robust Conceptual Reasoning through Interpretable 3D Neural Object Volumes はコメントを受け付けていません
AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction
要約 自律運転には、レーンや横断歩道などのインフラストラクチャ要素を理解する必要 … 続きを読む