-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.LG」カテゴリーアーカイブ
A Theoretical Analysis of Soft-Label vs Hard-Label Training in Neural Networks
要約 小規模の学生モデルが事前トレーニングされた大規模な教師モデルから学習する知 … 続きを読む
Disentangling Mean Embeddings for Better Diagnostics of Image Generators
要約 画像ジェネレーターの評価は、特定の画像領域に対する微妙な洞察を提供する際の … 続きを読む
SimAvatar: Simulation-Ready Avatars with Layered Hair and Clothing
要約 SimAvatar は、テキスト プロンプトからシミュレーション対応の服を … 続きを読む
Localizing Memorization in SSL Vision Encoders
要約 自己教師あり学習 (SSL) における記憶に関する研究に関する最近の研究で … 続きを読む
Neptune: The Long Orbit to Benchmarking Long Video Understanding
要約 このペーパーでは、長いビデオを理解するための難しい質問、回答、おとりのセッ … 続きを読む
LLAVIDAL: A Large LAnguage VIsion Model for Daily Activities of Living
要約 Web ビデオでトレーニングされた現在の大規模言語視覚モデル (LLVM) … 続きを読む
Owl-1: Omni World Model for Consistent Long Video Generation
要約 ビデオ生成モデル (VGM) は最近大きな注目を集めており、汎用大型ビジョ … 続きを読む
Hidden Biases of End-to-End Driving Datasets
要約 エンドツーエンドの駆動システムは急速に進歩していますが、これまでのところ、 … 続きを読む
Spectral Image Tokenizer
要約 画像トークナイザーは、画像を離散トークンのシーケンスにマッピングし、自己回 … 続きを読む
Doe-1: Closed-Loop Autonomous Driving with Large World Model
要約 エンドツーエンドの自動運転は、大量のデータから学習できる可能性があるため、 … 続きを読む