月別アーカイブ: 2024年6月

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

要約 現在、深層学習におけるエキサイティングなアプリケーションのほとんどを強化し … 続きを読む

カテゴリー: cs.AI, cs.LG | Mamba: Linear-Time Sequence Modeling with Selective State Spaces はコメントを受け付けていません

Code Pretraining Improves Entity Tracking Abilities of Language Models

要約 最近の研究では、コード上で言語モデルを事前トレーニングすると、自然言語で表 … 続きを読む

カテゴリー: cs.AI, cs.CL | Code Pretraining Improves Entity Tracking Abilities of Language Models はコメントを受け付けていません

Context-aware Difference Distilling for Multi-change Captioning

要約 マルチチェンジキャプションは、画像ペア内の複雑で結合した変化を自然言語で説 … 続きを読む

カテゴリー: cs.CV | Context-aware Difference Distilling for Multi-change Captioning はコメントを受け付けていません

Rethinking Open-World Semi-Supervised Learning: Distribution Mismatch and Inductive Inference

要約 オープンワールド半教師あり学習 (OWSSL) は、ラベルのないデータセッ … 続きを読む

カテゴリー: cs.CV, cs.LG | Rethinking Open-World Semi-Supervised Learning: Distribution Mismatch and Inductive Inference はコメントを受け付けていません

Attention-aware Semantic Communications for Collaborative Inference

要約 ビジョントランスフォーマー(ViT)モデルの効率的な使用に焦点を当て、エッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.SP | Attention-aware Semantic Communications for Collaborative Inference はコメントを受け付けていません

Retrieval Meets Reasoning: Even High-school Textbook Knowledge Benefits Multimodal Reasoning

要約 検索拡張生成 (RAG) を備えた大規模言語モデルは、外部知識ベースを活用 … 続きを読む

カテゴリー: cs.CV | Retrieval Meets Reasoning: Even High-school Textbook Knowledge Benefits Multimodal Reasoning はコメントを受け付けていません

einspace: Searching for Neural Architectures from Fundamental Operations

要約 ニューラル アーキテクチャ検索 (NAS) は、特定のタスクに対して高性能 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML | einspace: Searching for Neural Architectures from Fundamental Operations はコメントを受け付けていません

Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks

要約 暗い環境で鮮明なコンテンツを含む高品質の写真を取得することは非常に望まれて … 続きを読む

カテゴリー: cs.CV, eess.IV | Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks はコメントを受け付けていません

MegActor: Harness the Power of Raw Video for Vivid Portrait Animation

要約 生の運転ビデオには、ポートレート アニメーションの分野におけるランドマーク … 続きを読む

カテゴリー: cs.CV | MegActor: Harness the Power of Raw Video for Vivid Portrait Animation はコメントを受け付けていません

MeshXL: Neural Coordinate Field for Generative 3D Foundation Models

要約 3D データのポリゴン メッシュ表現は、優れた柔軟性、高速なレンダリング速 … 続きを読む

カテゴリー: cs.CV | MeshXL: Neural Coordinate Field for Generative 3D Foundation Models はコメントを受け付けていません