月別アーカイブ: 2024年4月

Graphic Design with Large Multimodal Model

投稿日: 2024年4月23日作成者: jarxiv

要約グラフィックデザインの分野では、デザイン要素を統合した一体性のある多層ア … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

CoGS: Controllable Gaussian Splatting

投稿日: 2024年4月23日作成者: jarxiv

要約多関節オブジェクトの 3D 構造をキャプチャして再アニメーション化するには … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Does Gaussian Splatting need SFM Initialization?

投稿日: 2024年4月23日作成者: jarxiv

要約 3D ガウススプラッティングは、その高品質な結果とハードウェアラスター … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TAVGBench: Benchmarking Text to Audible-Video Generation

投稿日: 2024年4月23日作成者: jarxiv

要約 Text to Audible-Video Generation (TAV … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies

投稿日: 2024年4月23日作成者: jarxiv

要約時空間ネットワークの観察機能は、複数のセクターにわたる正確なデータ収集と情 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MA | コメントを受け付けていません

GeoAI Reproducibility and Replicability: a computational and spatial perspective

投稿日: 2024年4月23日作成者: jarxiv

要約 GeoAI は、空間理論とデータを最先端の AI モデルと組み合わせて、斬 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Trends, Applications, and Challenges in Human Attention Modelling

投稿日: 2024年4月23日作成者: jarxiv

要約近年、人間の注意モデリングは、視覚探索の基礎となる認知プロセスを理解するだ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Multimodal Automated Interpretability Agent

投稿日: 2024年4月23日作成者: jarxiv

要約この文書では、マルチモーダル自動解釈エージェントである MAIA について … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

SEED-X: Multimodal Models with Unified Multi-granularity Comprehension and Generation

投稿日: 2024年4月23日作成者: jarxiv

要約マルチモーダル基礎モデルの急速な進化は、ビジョン言語の理解と生成における大 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GeoDiffuser: Geometry-Based Image Editing with Diffusion Models

投稿日: 2024年4月23日作成者: jarxiv

要約画像生成モデルの成功により、テキストやその他のユーザー入力に基づいて画像を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

月別アーカイブ: 2024年4月

Graphic Design with Large Multimodal Model

CoGS: Controllable Gaussian Splatting

Does Gaussian Splatting need SFM Initialization?

TAVGBench: Benchmarking Text to Audible-Video Generation

STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies

GeoAI Reproducibility and Replicability: a computational and spatial perspective

Trends, Applications, and Challenges in Human Attention Modelling

A Multimodal Automated Interpretability Agent

SEED-X: Multimodal Models with Unified Multi-granularity Comprehension and Generation

GeoDiffuser: Geometry-Based Image Editing with Diffusion Models

最近の投稿

最近のコメント

アーカイブ

カテゴリー