-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
SRE-Conv: Symmetric Rotation Equivariant Convolution for Biomedical Image Classification
要約 畳み込みニューラル ネットワーク (CNN) は、コンピューター ビジョン … 続きを読む
Lost in Translation, Found in Context: Sign Language Translation with Contextual Cues
要約 私たちの目的は、連続的な手話を音声言語テキストに翻訳することです。 人間の … 続きを読む
カテゴリー: cs.CV
Lost in Translation, Found in Context: Sign Language Translation with Contextual Cues はコメントを受け付けていません
Learnings from Scaling Visual Tokenizers for Reconstruction and Generation
要約 自動エンコーディングによる視覚的なトークン化により、ピクセルを潜在空間に圧 … 続きを読む
SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces
要約 ポートレートリライティング用拡散モデル「SynthLight」をご紹介しま … 続きを読む
Distilling Multi-modal Large Language Models for Autonomous Driving
要約 自動運転には、特に重要な「ロングテール」シナリオにおいて、安全な動作計画が … 続きを読む
Silent Abandonment in Text-Based Contact Centers: Identifying, Quantifying, and Mitigating its Operational Impacts
要約 サービスの向上を目指して、企業は顧客にテキストメッセージでエージェントとや … 続きを読む
A General Framework for Inference-time Scaling and Steering of Diffusion Models
要約 拡散モデルは、画像やビデオからタンパク質の設計やテキストに至るまで、さまざ … 続きを読む
Toward Zero-Shot User Intent Recognition in Shared Autonomy
要約 共有自律性の基本的な課題は、高自由度ロボットを使用して、最初にユーザーの意 … 続きを読む
SYNAPSE: SYmbolic Neural-Aided Preference Synthesis Engine
要約 この論文は、視覚的なデモンストレーションからユーザー固有の好み (例: 「 … 続きを読む