-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年6月
‘Let’s not Quote out of Context’: Unified Vision-Language Pretraining for Context Assisted Image Captioning
要約 マーケティング資料などの企業コンテンツ内の適切な形式のコンテキスト認識型画 … 続きを読む
Train Offline, Test Online: A Real Robot Learning Benchmark
要約 3 つの課題がロボット学習研究の進歩を制限しています。ロボットは高価である … 続きを読む
Make-Your-Video: Customized Video Generation Using Textual and Structural Guidance
要約 私たちの想像の中の出来事やシナリオから鮮やかなビデオを作成することは、本当 … 続きを読む
カテゴリー: cs.CV
Make-Your-Video: Customized Video Generation Using Textual and Structural Guidance はコメントを受け付けていません
Differential Diffusion: Giving Each Pixel Its Strength
要約 近年、テキストベースの画像編集が大幅に進歩しました。 普及モデルの台頭によ … 続きを読む
The ObjectFolder Benchmark: Multisensory Learning with Neural and Real Objects
要約 ObjectFolder Benchmark は、視覚、聴覚、触覚によるオ … 続きを読む
Cocktail: Mixing Multi-Modality Controls for Text-Conditional Image Generation
要約 テキスト条件付き拡散モデルは、多様なコンテンツを含む忠実度の高い画像を生成 … 続きを読む
カテゴリー: cs.CV
Cocktail: Mixing Multi-Modality Controls for Text-Conditional Image Generation はコメントを受け付けていません
BUOL: A Bottom-Up Framework with Occupancy-aware Lifting for Panoptic 3D Scene Reconstruction From A Single Image
要約 単一の画像から 3D シーンを理解してモデリングすることは実際的な問題です … 続きを読む
カテゴリー: cs.CV
BUOL: A Bottom-Up Framework with Occupancy-aware Lifting for Panoptic 3D Scene Reconstruction From A Single Image はコメントを受け付けていません
The Hidden Language of Diffusion Models
要約 テキストから画像への拡散モデルは、テキストの概念 (「医師」、「愛」など) … 続きを読む
カテゴリー: cs.CV
The Hidden Language of Diffusion Models はコメントを受け付けていません
GRES: Generalized Referring Expression Segmentation
要約 参照式セグメンテーション (RES) は、指定された言語式で記述されたオブ … 続きを読む
カテゴリー: cs.CV
GRES: Generalized Referring Expression Segmentation はコメントを受け付けていません
ViCo: Detail-Preserving Visual Condition for Personalized Text-to-Image Generation
要約 最近、拡散モデルを使用したパーソナライズされたテキストから画像への生成が提 … 続きを読む