cs.CV」カテゴリーアーカイブ

Liquid: Language Models are Scalable Multi-modal Generators

要約 私たちは、画像を個別のコードにトークン化し、視覚と言語の両方の共有特徴空間 … 続きを読む

カテゴリー: cs.CV | Liquid: Language Models are Scalable Multi-modal Generators はコメントを受け付けていません

Can Modern LLMs Act as Agent Cores in Radiology~Environments?

要約 大規模言語モデル (LLM) の進歩により、さまざまなドメインにわたって精 … 続きを読む

カテゴリー: cs.CV | Can Modern LLMs Act as Agent Cores in Radiology~Environments? はコメントを受け付けていません

Dynamic-VLM: Simple Dynamic Visual Token Compression for VideoLLM

要約 画像やビデオを分析するためのラージ ビジョン言語モデル (LVLM) のア … 続きを読む

カテゴリー: cs.CV | Dynamic-VLM: Simple Dynamic Visual Token Compression for VideoLLM はコメントを受け付けていません

Disentangling Mean Embeddings for Better Diagnostics of Image Generators

要約 画像ジェネレーターの評価は、特定の画像領域に対する微妙な洞察を提供する際の … 続きを読む

カテゴリー: cs.CV, cs.LG | Disentangling Mean Embeddings for Better Diagnostics of Image Generators はコメントを受け付けていません

Altogether: Image Captioning via Re-aligning Alt-text

要約 このペーパーでは、画像キャプションの品質を向上させるための合成データの作成 … 続きを読む

カテゴリー: cs.CL, cs.CV | Altogether: Image Captioning via Re-aligning Alt-text はコメントを受け付けていません

SimAvatar: Simulation-Ready Avatars with Layered Hair and Clothing

要約 SimAvatar は、テキスト プロンプトからシミュレーション対応の服を … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | SimAvatar: Simulation-Ready Avatars with Layered Hair and Clothing はコメントを受け付けていません

Meshtron: High-Fidelity, Artist-Like 3D Mesh Generation at Scale

要約 メッシュは 3D サーフェスの基本的な表現です。 ただし、高品質のメッシュ … 続きを読む

カテゴリー: cs.CV, cs.GR | Meshtron: High-Fidelity, Artist-Like 3D Mesh Generation at Scale はコメントを受け付けていません

Exemplar Masking for Multimodal Incremental Learning

要約 マルチモーダル増分学習では、以前に学習した情報を忘れることなく、新しい知識 … 続きを読む

カテゴリー: cs.CV | Exemplar Masking for Multimodal Incremental Learning はコメントを受け付けていません

Video Creation by Demonstration

要約 私たちは、新しいビデオ作成体験、つまりデモンストレーションによるビデオ作成 … 続きを読む

カテゴリー: cs.CV | Video Creation by Demonstration はコメントを受け付けていません

Leveraging Medical Foundation Model Features in Graph Neural Network-Based Retrieval of Breast Histopathology Images

要約 乳がんは、世界中の女性に最も多いがんの種類です。 早期発見と適切な治療によ … 続きを読む

カテゴリー: cs.CV | Leveraging Medical Foundation Model Features in Graph Neural Network-Based Retrieval of Breast Histopathology Images はコメントを受け付けていません