-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年5月
Parameter-Efficient Fine-Tuning with Layer Pruning on Free-Text Sequence-to-Sequence Modeling
要約 言語モデルのサイズが増大することで、事前トレーニング済みモデルをフリーズし … 続きを読む
mdctGAN: Taming transformer-based GAN for speech super-resolution with Modified DCT spectra
要約 音声超解像度 (SSR) は、対応する低解像度 (LR) 音声から高解像度 … 続きを読む
A Compound Gaussian Network for Solving Linear Inverse Problems
要約 線形逆問題、特に断層撮影イメージングや圧縮センシングに現れるタイプの線形逆 … 続きを読む
PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering
要約 この論文では、重要な臨床関連情報を含む医用画像を効率的に解釈する上で重要な … 続きを読む
カテゴリー: cs.CV
PMC-VQA: Visual Instruction Tuning for Medical Visual Question Answering はコメントを受け付けていません
Annotation-free Audio-Visual Segmentation
要約 オーディオビジュアルセグメンテーション (AVS) の目的は、ピクセルごと … 続きを読む
LMEye: An Interactive Perception Network for Large Language Models
要約 GPT-4 のように、Large Visual Language Mode … 続きを読む
Towards A Foundation Model for Generalist Robots: Diverse Skill Learning at Scale via Automated Task and Scene Generation
要約 この文書は、ジェネラリストロボットへの潜在的な道筋についての著者のビジョン … 続きを読む
RAMP: Hierarchical Reactive Motion Planning for Manipulation Tasks Using Implicit Signed Distance Functions
要約 モーション プランニングに対する検索ベースのアプローチとリアクティブなアプ … 続きを読む
Sim-MEES: Modular End-Effector System Grasping Dataset for Mobile Manipulators in Cluttered Environments
要約 この論文では、Sim-MEES を紹介します。これは、さまざまな難易度や物 … 続きを読む
Improving Extrinsics between RADAR and LIDAR using Learning
要約 LIDAR と RADAR は、自動運転システムで一般的に使用される 2 … 続きを読む