月別アーカイブ: 2024年1月

MM-Interleaved: Interleaved Image-Text Generative Modeling via Multi-modal Feature Synchronizer

要約 インターリーブされた画像とテキストのデータの生成モデルの開発には、研究と実 … 続きを読む

カテゴリー: cs.CL, cs.CV | MM-Interleaved: Interleaved Image-Text Generative Modeling via Multi-modal Feature Synchronizer はコメントを受け付けていません

GPAvatar: Generalizable and Precise Head Avatar from Image(s)

要約 頭部アバターの再構成は、仮想現実、オンライン会議、ゲーム、映画業界のアプリ … 続きを読む

カテゴリー: cs.CV | GPAvatar: Generalizable and Precise Head Avatar from Image(s) はコメントを受け付けていません

Explaining the Implicit Neural Canvas: Connecting Pixels to Neurons by Tracing their Contributions

要約 ニューラル ネットワークが信号の連続表現としてトレーニングされる暗黙的ニュ … 続きを読む

カテゴリー: cs.CV | Explaining the Implicit Neural Canvas: Connecting Pixels to Neurons by Tracing their Contributions はコメントを受け付けていません

Edit One for All: Interactive Batch Image Editing

要約 近年、画像編集の進歩はめざましいものがあります。 人間による制御が強化され … 続きを読む

カテゴリー: cs.CV | Edit One for All: Interactive Batch Image Editing はコメントを受け付けていません

AutoFT: Robust Fine-Tuning by Optimizing Hyperparameters on OOD Data

要約 基盤モデルは、タスク固有のデータを微調整することで、目的のタスクに適応でき … 続きを読む

カテゴリー: cs.CV, cs.LG | AutoFT: Robust Fine-Tuning by Optimizing Hyperparameters on OOD Data はコメントを受け付けていません

Supervised Fine-tuning in turn Improves Visual Foundation Models

要約 近年、CLIP のような画像テキスト トレーニングが視覚基礎モデルの事前ト … 続きを読む

カテゴリー: cs.AI, cs.CV | Supervised Fine-tuning in turn Improves Visual Foundation Models はコメントを受け付けていません

The Manga Whisperer: Automatically Generating Transcriptions for Comics

要約 過去数十年の間に、一般にマンガと呼ばれる日本のコミックは、文化と言語の境界 … 続きを読む

カテゴリー: cs.CV | The Manga Whisperer: Automatically Generating Transcriptions for Comics はコメントを受け付けていません

Towards Language-Driven Video Inpainting via Multimodal Large Language Models

要約 新しいタスクである言語駆動型ビデオ修復を導入します。これは自然言語命令を使 … 続きを読む

カテゴリー: cs.CV | Towards Language-Driven Video Inpainting via Multimodal Large Language Models はコメントを受け付けていません

AGILE3D: Attention Guided Interactive Multi-object 3D Segmentation

要約 インタラクティブなセグメンテーションでは、モデルとユーザーが協力して、3D … 続きを読む

カテゴリー: cs.CV, cs.HC | AGILE3D: Attention Guided Interactive Multi-object 3D Segmentation はコメントを受け付けていません

A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting

要約 パノプティック ネットワークとインスタンス セグメンテーション ネットワー … 続きを読む

カテゴリー: cs.CV, cs.LG | A Simple Latent Diffusion Approach for Panoptic Segmentation and Mask Inpainting はコメントを受け付けていません