-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models?
要約 多言語の大規模言語モデルは、さまざまな言語の話者に対応できるように設計され … 続きを読む
UDC: A Unified Neural Divide-and-Conquer Framework for Large-Scale Combinatorial Optimization Problems
要約 シングルステージのニューラル組み合わせ最適化ソルバーは、専門知識を必要とせ … 続きを読む
HydraViT: Stacking Heads for a Scalable ViT
要約 ビジョン トランスフォーマー (ViT) のアーキテクチャ、特にマルチヘッ … 続きを読む
Transferring disentangled representations: bridging the gap between synthetic and real images
要約 データ生成メカニズムの基本構造を分離する、意味のある効率的な表現を開発する … 続きを読む
IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning
要約 画像キャプションの最近の進歩により、画像とテキストのペアのデータの制限を克 … 続きを読む
Revisit Anything: Visual Place Recognition via Image Segment Retrieval
要約 再訪問した場所を正確に認識することは、実体化したエージェントが位置を特定し … 続きを読む
Visual Data Diagnosis and Debiasing with Concept Graphs
要約 今日の深層学習モデルの広範な成功は、サイズと複雑さが大幅に異なる広範なデー … 続きを読む
FreeEdit: Mask-free Reference-based Image Editing with Multi-modal Instruction
要約 画像編集にユーザー指定の視覚的概念を導入することは、これらの概念がテキスト … 続きを読む
SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation
要約 衣服は多様で変形しやすい性質があるため、衣服操作の自動化は支援ロボットにと … 続きを読む
DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models
要約 知覚システムは自動運転において重要な役割を果たし、複数のセンサーと対応する … 続きを読む