月別アーカイブ: 2024年6月

Autoregressive Pretraining with Mamba in Vision

要約 ビジョン コミュニティは、さまざまなタスクの新しいバックボーンとして、最近 … 続きを読む

カテゴリー: cs.CV | Autoregressive Pretraining with Mamba in Vision はコメントを受け付けていません

Ctrl-X: Controlling Structure and Appearance for Text-To-Image Generation Without Guidance

要約 FreeControl や Diffusion Self-guidance … 続きを読む

カテゴリー: cs.CV, cs.LG | Ctrl-X: Controlling Structure and Appearance for Text-To-Image Generation Without Guidance はコメントを受け付けていません

Vision Model Pre-training on Interleaved Image-Text Data via Latent Compression Learning

要約 最近、ビジョン モデルの事前トレーニングは、手動で注釈が付けられたデータセ … 続きを読む

カテゴリー: cs.CV | Vision Model Pre-training on Interleaved Image-Text Data via Latent Compression Learning はコメントを受け付けていません

Situational Awareness Matters in 3D Vision Language Reasoning

要約 3D 空間で複雑な視覚言語推論タスクを実行できることは、家庭用ロボットや人 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Situational Awareness Matters in 3D Vision Language Reasoning はコメントを受け付けていません

Commonsense-T2I Challenge: Can Text-to-Image Generation Models Understand Commonsense?

要約 我々は、Commonsense-T2Iと呼ぶ、実生活の常識に適合する画像を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Commonsense-T2I Challenge: Can Text-to-Image Generation Models Understand Commonsense? はコメントを受け付けていません

Zero-shot Image Editing with Reference Imitation

要約 画像編集は、ユーザーからの多様な要求を考慮した実用的でありながらやりがいの … 続きを読む

カテゴリー: cs.CV | Zero-shot Image Editing with Reference Imitation はコメントを受け付けていません

Image and Video Tokenization with Binary Spherical Quantization

要約 我々は、Binary Spherical Quantization (BS … 続きを読む

カテゴリー: cs.CV, cs.IT, cs.LG, eess.IV, math.IT | Image and Video Tokenization with Binary Spherical Quantization はコメントを受け付けていません

Blur-aware Spatio-temporal Sparse Transformer for Video Deblurring

要約 ビデオのぼけ除去は、ビデオ シーケンス内の他のフレームからの情報を利用して … 続きを読む

カテゴリー: cs.CV | Blur-aware Spatio-temporal Sparse Transformer for Video Deblurring はコメントを受け付けていません

An Image is Worth 32 Tokens for Reconstruction and Generation

要約 生成モデルの最近の進歩により、高解像度画像の効率的な合成における画像トーク … 続きを読む

カテゴリー: cs.CV | An Image is Worth 32 Tokens for Reconstruction and Generation はコメントを受け付けていません

Fast and Certifiable Trajectory Optimization

要約 我々は、多項式の目的と制約によって定義される非凸軌道最適化問題に対して、高 … 続きを読む

カテゴリー: cs.RO, math.OC | Fast and Certifiable Trajectory Optimization はコメントを受け付けていません