-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
$C^{3}$-NeRF: Modeling Multiple Scenes via Conditional-cum-Continual Neural Radiance Fields
要約 Neural Radiance Field (NeRF) は、単一の 3D … 続きを読む
Quantifying the synthetic and real domain gap in aerial scene understanding
要約 合成画像と現実世界の画像の間のギャップを定量化することは、大量のデータに依 … 続きを読む
On Domain-Specific Post-Training for Multimodal Large Language Models
要約 近年、一般的なマルチモーダル大規模言語モデル (MLLM) の急速な発展が … 続きを読む
Perception Test 2024: Challenge Summary and a Novel Hour-Long VideoQA Benchmark
要約 2023 年版の成功に続き、最先端のビデオ モデルのベンチマークと測定を目 … 続きを読む
Free-form Generation Enhances Challenging Clothed Human Modeling
要約 リアルなアニメーション人間アバターを実現するには、ポーズに依存する衣服の変 … 続きを読む
DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation
要約 データセットの蒸留における最近の進歩により、2 つの主な方向での解決策が導 … 続きを読む
AlphaTablets: A Generic Plane Representation for 3D Planar Reconstruction from Monocular Videos
要約 AlphaTablets は、連続的な 3D 表面と正確な境界描写を特徴と … 続きを読む
T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs
要約 画像領域におけるマルチモーダル大規模言語モデル (MLLM) の成功は、研 … 続きを読む
MM-Path: Multi-modal, Multi-granularity Path Representation Learning — Extended Version
要約 効果的な経路表現の開発は、インテリジェント交通のさまざまな分野でますます重 … 続きを読む
Metric-DST: Mitigating Selection Bias Through Diversity-Guided Semi-Supervised Metric Learning
要約 選択バイアスは、母集団をあまり代表しないデータでトレーニングされたモデルが … 続きを読む