月別アーカイブ: 2024年7月

PIXELMOD: Improving Soft Moderation of Visual Misleading Information on Twitter

要約 画像は、誤解を招くメッセージやまったくの虚偽のメッセージを伝えるための強力 … 続きを読む

カテゴリー: cs.CV, cs.CY | PIXELMOD: Improving Soft Moderation of Visual Misleading Information on Twitter はコメントを受け付けていません

From Feature Importance to Natural Language Explanations Using LLMs with RAG

要約 機械学習が人間との対話を伴う自律的な意思決定プロセスにますます不可欠になる … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.HC, cs.LG | From Feature Importance to Natural Language Explanations Using LLMs with RAG はコメントを受け付けていません

GABInsight: Exploring Gender-Activity Binding Bias in Vision-Language Models

要約 視覚言語モデル (VLM) は、画像に映る個人の評価を必要とするタスクなど … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | GABInsight: Exploring Gender-Activity Binding Bias in Vision-Language Models はコメントを受け付けていません

XHand: Real-time Expressive Hand Avatar

要約 ハンド アバターは、さまざまなデジタル インターフェイスで極めて重要な役割 … 続きを読む

カテゴリー: cs.AI, cs.CV | XHand: Real-time Expressive Hand Avatar はコメントを受け付けていません

Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection

要約 最近の進歩により、2 つのストリームのアプローチが憎悪ミームの検出において … 続きを読む

カテゴリー: cs.CL, cs.CV | Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection はコメントを受け付けていません

CLEFT: Language-Image Contrastive Learning with Efficient Large Language Model and Prompt Fine-Tuning

要約 Contrastive Language-Image Pre-traini … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | CLEFT: Language-Image Contrastive Learning with Efficient Large Language Model and Prompt Fine-Tuning はコメントを受け付けていません

Add-SD: Rational Generation without Manual Reference

要約 拡散モデルは、視覚的な一般化において顕著な優れた能力を発揮してきました。 … 続きを読む

カテゴリー: cs.CV | Add-SD: Rational Generation without Manual Reference はコメントを受け付けていません

Matting by Generation

要約 この論文では、従来の回帰ベースのタスクを生成モデリングの課題として再定義す … 続きを読む

カテゴリー: cs.CV | Matting by Generation はコメントを受け付けていません

Mixture of Nested Experts: Adaptive Processing of Visual Tokens

要約 視覚媒体 (画像やビデオ) には当然ながら大量の情報の冗長性が含まれている … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Mixture of Nested Experts: Adaptive Processing of Visual Tokens はコメントを受け付けていません

SpaER: Learning Spatio-temporal Equivariant Representations for Fetal Brain Motion Tracking

要約 この論文では、等変フィルターと自己注意メカニズムを活用して時空間表現を効果 … 続きを読む

カテゴリー: cs.CV, eess.IV | SpaER: Learning Spatio-temporal Equivariant Representations for Fetal Brain Motion Tracking はコメントを受け付けていません