-
最近の投稿
- Does It Make Sense to Speak of Introspection in Large Language Models?
- Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting
- FreeTimeGS: Free Gaussian Primitives at Anytime and Anywhere for Dynamic Scene Reconstruction
- ArtVIP: Articulated Digital Assets of Visual Realism, Modular Interaction, and Physical Fidelity for Robot Learning
- ECoRAG: Evidentiality-guided Compression for Long Context RAG
-
最近のコメント
表示できるコメントはありません。 cs.AI (39262) cs.CL (29718) cs.CV (44649) cs.HC (2989) cs.LG (44173) cs.RO (23445) cs.SY (3577) eess.IV (5131) eess.SY (3569) stat.ML (5744)
月別アーカイブ: 2024年7月
PIXELMOD: Improving Soft Moderation of Visual Misleading Information on Twitter
要約 画像は、誤解を招くメッセージやまったくの虚偽のメッセージを伝えるための強力 … 続きを読む
From Feature Importance to Natural Language Explanations Using LLMs with RAG
要約 機械学習が人間との対話を伴う自律的な意思決定プロセスにますます不可欠になる … 続きを読む
GABInsight: Exploring Gender-Activity Binding Bias in Vision-Language Models
要約 視覚言語モデル (VLM) は、画像に映る個人の評価を必要とするタスクなど … 続きを読む
XHand: Real-time Expressive Hand Avatar
要約 ハンド アバターは、さまざまなデジタル インターフェイスで極めて重要な役割 … 続きを読む
Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Models for Hateful Meme Detection
要約 最近の進歩により、2 つのストリームのアプローチが憎悪ミームの検出において … 続きを読む
CLEFT: Language-Image Contrastive Learning with Efficient Large Language Model and Prompt Fine-Tuning
要約 Contrastive Language-Image Pre-traini … 続きを読む
Add-SD: Rational Generation without Manual Reference
要約 拡散モデルは、視覚的な一般化において顕著な優れた能力を発揮してきました。 … 続きを読む
カテゴリー: cs.CV
Add-SD: Rational Generation without Manual Reference はコメントを受け付けていません
Matting by Generation
要約 この論文では、従来の回帰ベースのタスクを生成モデリングの課題として再定義す … 続きを読む
カテゴリー: cs.CV
Matting by Generation はコメントを受け付けていません
Mixture of Nested Experts: Adaptive Processing of Visual Tokens
要約 視覚媒体 (画像やビデオ) には当然ながら大量の情報の冗長性が含まれている … 続きを読む
SpaER: Learning Spatio-temporal Equivariant Representations for Fetal Brain Motion Tracking
要約 この論文では、等変フィルターと自己注意メカニズムを活用して時空間表現を効果 … 続きを読む