-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances
要約 現在の画像透かし挿入方法は、大規模なテキストから画像へのモデルによって可能 … 続きを読む
Towards Visual Text Design Transfer Across Languages
要約 ビジュアル テキスト デザインは、映画のポスターやアルバム カバーなどのマ … 続きを読む
Ensemble architecture in polyp segmentation
要約 この研究では、セマンティック セグメンテーションのアーキテクチャを再考し、 … 続きを読む
ONCOPILOT: A Promptable CT Foundation Model For Solid Tumor Evaluation
要約 発がんはタンパク質現象であり、腫瘍がさまざまな場所に発生し、複雑で多様な形 … 続きを読む
RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation
要約 Segment Anything (SAM) の出現により、特に画像編集タ … 続きを読む
Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences
要約 ワンステップのテキストから画像への生成モデルには、迅速な推論効率、柔軟なア … 続きを読む
SkillMimicGen: Automated Demonstration Generation for Efficient Skill Learning and Deployment
要約 人間のデモンストレーションからの模倣学習はロボット操作の効果的なパラダイム … 続きを読む
SegLLM: Multi-round Reasoning Segmentation
要約 我々は、視覚的出力とテキスト出力の両方の会話記憶を利用することによってLL … 続きを読む
ANAVI: Audio Noise Awareness using Visuals of Indoor environments for NAVIgation
要約 私たちは、より静かなロボットの経路計画のためのナビゲーションに屋内のビジュ … 続きを読む
Unearthing Skill-Level Insights for Understanding Trade-Offs of Foundation Models
要約 モデルが強化されるにつれて、評価はより複雑になり、1 つのベンチマークで、 … 続きを読む