月別アーカイブ: 2024年4月

Graphic Design with Large Multimodal Model

要約 グラフィック デザインの分野では、デザイン要素を統合した一体性のある多層ア … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Graphic Design with Large Multimodal Model はコメントを受け付けていません

CoGS: Controllable Gaussian Splatting

要約 多関節オブジェクトの 3D 構造をキャプチャして再アニメーション化するには … 続きを読む

カテゴリー: cs.CV | CoGS: Controllable Gaussian Splatting はコメントを受け付けていません

Does Gaussian Splatting need SFM Initialization?

要約 3D ガウス スプラッティングは、その高品質な結果とハードウェア ラスター … 続きを読む

カテゴリー: cs.CV | Does Gaussian Splatting need SFM Initialization? はコメントを受け付けていません

TAVGBench: Benchmarking Text to Audible-Video Generation

要約 Text to Audible-Video Generation (TAV … 続きを読む

カテゴリー: cs.CV, cs.MM | TAVGBench: Benchmarking Text to Audible-Video Generation はコメントを受け付けていません

STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies

要約 時空間ネットワークの観察機能は、複数のセクターにわたる正確なデータ収集と情 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MA | STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies はコメントを受け付けていません

GeoAI Reproducibility and Replicability: a computational and spatial perspective

要約 GeoAI は、空間理論とデータを最先端の AI モデルと組み合わせて、斬 … 続きを読む

カテゴリー: cs.CV, cs.LG | GeoAI Reproducibility and Replicability: a computational and spatial perspective はコメントを受け付けていません

Trends, Applications, and Challenges in Human Attention Modelling

要約 近年、人間の注意モデリングは、視覚探索の基礎となる認知プロセスを理解するだ … 続きを読む

カテゴリー: cs.AI, cs.CV | Trends, Applications, and Challenges in Human Attention Modelling はコメントを受け付けていません

A Multimodal Automated Interpretability Agent

要約 この文書では、マルチモーダル自動解釈エージェントである MAIA について … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | A Multimodal Automated Interpretability Agent はコメントを受け付けていません

SEED-X: Multimodal Models with Unified Multi-granularity Comprehension and Generation

要約 マルチモーダル基礎モデルの急速な進化は、ビジョン言語の理解と生成における大 … 続きを読む

カテゴリー: cs.CV | SEED-X: Multimodal Models with Unified Multi-granularity Comprehension and Generation はコメントを受け付けていません

GeoDiffuser: Geometry-Based Image Editing with Diffusion Models

要約 画像生成モデルの成功により、テキストやその他のユーザー入力に基づいて画像を … 続きを読む

カテゴリー: cs.CV | GeoDiffuser: Geometry-Based Image Editing with Diffusion Models はコメントを受け付けていません