-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年8月
Efficient Slice Anomaly Detection Network for 3D Brain MRI Volume
要約 現在の異常検出方法は、ベンチマークとなる産業データでは優れていますが、「正 … 続きを読む
More Text, Less Point: Towards 3D Data-Efficient Point-Language Understanding
要約 大規模言語モデル (LLM) で 3D 物理世界を理解できるようにすること … 続きを読む
Distribution Backtracking Builds A Faster Convergence Trajectory for One-step Diffusion Distillation
要約 拡散モデルのサンプリング速度を高速化することは依然として大きな課題です。 … 続きを読む
カテゴリー: cs.CV
Distribution Backtracking Builds A Faster Convergence Trajectory for One-step Diffusion Distillation はコメントを受け付けていません
CoGen: Learning from Feedback with Coupled Comprehension and Generation
要約 言語理解機能と言語生成機能の両方を備えたシステムは、この 2 つの間の緊密 … 続きを読む
ClimDetect: A Benchmark Dataset for Climate Change Detection and Attribution
要約 気候変動による気温上昇を検出し、その原因を特定することは、地球温暖化を理解 … 続きを読む
カテゴリー: cs.CV, cs.LG, physics.ao-ph
ClimDetect: A Benchmark Dataset for Climate Change Detection and Attribution はコメントを受け付けていません
Perceive-IR: Learning to Perceive Degradation Better for All-in-One Image Restoration
要約 特定の劣化に対するタスク固有および一般的な画像復元方法には限界があるため、 … 続きを読む
カテゴリー: cs.CV
Perceive-IR: Learning to Perceive Degradation Better for All-in-One Image Restoration はコメントを受け付けていません
TEDRA: Text-based Editing of Dynamic and Photoreal Actors
要約 過去数年にわたり、実際の人間のビデオのみからフォトリアリスティックで運転可 … 続きを読む
カテゴリー: cs.CV
TEDRA: Text-based Editing of Dynamic and Photoreal Actors はコメントを受け付けていません
Spatio-Temporal Context Prompting for Zero-Shot Action Detection
要約 時空間アクションの検出には、ビデオ内の個々のアクションの位置を特定し、分類 … 続きを読む
Eagle: Exploring The Design Space for Multimodal LLMs with Mixture of Encoders
要約 複雑な視覚情報を正確に解釈する機能は、マルチモーダル大規模言語モデル (M … 続きを読む
Domain-decoupled Physics-informed Neural Networks with Closed-form Gradients for Fast Model Learning of Dynamical Systems
要約 物理情報に基づいたニューラル ネットワーク (PINN) は、物理方程式を … 続きを読む