月別アーカイブ: 2023年6月

‘Let’s not Quote out of Context’: Unified Vision-Language Pretraining for Context Assisted Image Captioning

要約 マーケティング資料などの企業コンテンツ内の適切な形式のコンテキスト認識型画 … 続きを読む

カテゴリー: cs.CL, cs.CV | ‘Let’s not Quote out of Context’: Unified Vision-Language Pretraining for Context Assisted Image Captioning はコメントを受け付けていません

Train Offline, Test Online: A Real Robot Learning Benchmark

要約 3 つの課題がロボット学習研究の進歩を制限しています。ロボットは高価である … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Train Offline, Test Online: A Real Robot Learning Benchmark はコメントを受け付けていません

Make-Your-Video: Customized Video Generation Using Textual and Structural Guidance

要約 私たちの想像の中の出来事やシナリオから鮮やかなビデオを作成することは、本当 … 続きを読む

カテゴリー: cs.CV | Make-Your-Video: Customized Video Generation Using Textual and Structural Guidance はコメントを受け付けていません

Differential Diffusion: Giving Each Pixel Its Strength

要約 近年、テキストベースの画像編集が大幅に進歩しました。 普及モデルの台頭によ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, I.3.3 | Differential Diffusion: Giving Each Pixel Its Strength はコメントを受け付けていません

The ObjectFolder Benchmark: Multisensory Learning with Neural and Real Objects

要約 ObjectFolder Benchmark は、視覚、聴覚、触覚によるオ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.HC, cs.RO | The ObjectFolder Benchmark: Multisensory Learning with Neural and Real Objects はコメントを受け付けていません

Cocktail: Mixing Multi-Modality Controls for Text-Conditional Image Generation

要約 テキスト条件付き拡散モデルは、多様なコンテンツを含む忠実度の高い画像を生成 … 続きを読む

カテゴリー: cs.CV | Cocktail: Mixing Multi-Modality Controls for Text-Conditional Image Generation はコメントを受け付けていません

BUOL: A Bottom-Up Framework with Occupancy-aware Lifting for Panoptic 3D Scene Reconstruction From A Single Image

要約 単一の画像から 3D シーンを理解してモデリングすることは実際的な問題です … 続きを読む

カテゴリー: cs.CV | BUOL: A Bottom-Up Framework with Occupancy-aware Lifting for Panoptic 3D Scene Reconstruction From A Single Image はコメントを受け付けていません

The Hidden Language of Diffusion Models

要約 テキストから画像への拡散モデルは、テキストの概念 (「医師」、「愛」など) … 続きを読む

カテゴリー: cs.CV | The Hidden Language of Diffusion Models はコメントを受け付けていません

GRES: Generalized Referring Expression Segmentation

要約 参照式セグメンテーション (RES) は、指定された言語式で記述されたオブ … 続きを読む

カテゴリー: cs.CV | GRES: Generalized Referring Expression Segmentation はコメントを受け付けていません

ViCo: Detail-Preserving Visual Condition for Personalized Text-to-Image Generation

要約 最近、拡散モデルを使用したパーソナライズされたテキストから画像への生成が提 … 続きを読む

カテゴリー: cs.AI, cs.CV | ViCo: Detail-Preserving Visual Condition for Personalized Text-to-Image Generation はコメントを受け付けていません