月別アーカイブ: 2024年6月

Score Distillation via Reparametrized DDIM

要約 2D 拡散モデルはリアルで詳細な画像を生成しますが、これらの 2D 拡散モ … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | Score Distillation via Reparametrized DDIM はコメントを受け付けていません

Multiagent Multitraversal Multimodal Self-Driving: Open MARS Dataset

要約 大規模なデータセットは、AI ベースの自動運転車研究の最近の進歩を促進して … 続きを読む

カテゴリー: cs.CV | Multiagent Multitraversal Multimodal Self-Driving: Open MARS Dataset はコメントを受け付けていません

Reflecting on the State of Rehearsal-free Continual Learning with Pretrained Models

要約 基礎モデルの出現と最近の普及により、継続学習 (CL) は最近、ゼロからの … 続きを読む

カテゴリー: cs.CV, cs.LG | Reflecting on the State of Rehearsal-free Continual Learning with Pretrained Models はコメントを受け付けていません

Towards Vision-Language Geo-Foundation Model: A Survey

要約 視覚言語基盤モデル (VLFM) は、画像キャプション、画像とテキストの検 … 続きを読む

カテゴリー: cs.CV | Towards Vision-Language Geo-Foundation Model: A Survey はコメントを受け付けていません

SimGen: Simulator-conditioned Driving Scene Generation

要約 制御可能な合成データ生成により、自動運転の研究開発におけるトレーニング デ … 続きを読む

カテゴリー: cs.CV | SimGen: Simulator-conditioned Driving Scene Generation はコメントを受け付けていません

Exploring the Spectrum of Visio-Linguistic Compositionality and Recognition

要約 CLIP などの視覚および言語モデル (VLM) は、驚くべきゼロショット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Exploring the Spectrum of Visio-Linguistic Compositionality and Recognition はコメントを受け付けていません

Sagiri: Low Dynamic Range Image Enhancement with Generative Diffusion Prior

要約 8 ビット カメラを使用してハイ ダイナミック レンジ (HDR) 風景を … 続きを読む

カテゴリー: cs.CV, eess.IV | Sagiri: Low Dynamic Range Image Enhancement with Generative Diffusion Prior はコメントを受け付けていません

LLAVIDAL: Benchmarking Large Language Vision Models for Daily Activities of Living

要約 大規模言語視覚モデル (LLVM) は、インターネット ビデオの処理におい … 続きを読む

カテゴリー: cs.CV, cs.LG | LLAVIDAL: Benchmarking Large Language Vision Models for Daily Activities of Living はコメントを受け付けていません

WonderWorld: Interactive 3D Scene Generation from a Single Image

要約 私たちは、\emph{interactive} 3D シーン外挿のための新 … 続きを読む

カテゴリー: cs.CV, cs.GR | WonderWorld: Interactive 3D Scene Generation from a Single Image はコメントを受け付けていません

Modeling Ambient Scene Dynamics for Free-view Synthesis

要約 単眼でキャプチャした環境シーンを動的に自由にビュー合成して、視聴体験に没入 … 続きを読む

カテゴリー: cs.CV | Modeling Ambient Scene Dynamics for Free-view Synthesis はコメントを受け付けていません