月別アーカイブ: 2025年3月

ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts

要約 既存のスコアディスティレーションサンプリング(SDS)ベースの手法は、テキ … 続きを読む

カテゴリー: cs.CV | ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts はコメントを受け付けていません

Atomas: Hierarchical Alignment on Molecule-Text for Unified Molecule Understanding and Generation

要約 分子・テキスト横断的表現学習は、分子表現の質を向上させ、それによって様々な … 続きを読む

カテゴリー: cs.AI, cs.CL, q-bio.QM | Atomas: Hierarchical Alignment on Molecule-Text for Unified Molecule Understanding and Generation はコメントを受け付けていません

The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition

要約 捕獲された行動は個体群の健康状態の変化を示す最も早い指標となるため、カメラ … 続きを読む

カテゴリー: cs.AI, cs.CV | The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition はコメントを受け付けていません

Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models

要約 物体中心(OC)表現は、視覚シーンを離散的な物体の構成としてモデル化するも … 続きを読む

カテゴリー: cs.CV, cs.LG | Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models はコメントを受け付けていません

Foundation Models — A Panacea for Artificial Intelligence in Pathology?

要約 病理診断における人工知能(AI)の役割は、診断の補助から、全スライド画像( … 続きを読む

カテゴリー: cs.AI, cs.CV | Foundation Models — A Panacea for Artificial Intelligence in Pathology? はコメントを受け付けていません

MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing

要約 拡散に基づく画像生成は大きく進歩したが、被写体駆動型生成と指示に基づく編集 … 続きを読む

カテゴリー: cs.CV | MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing はコメントを受け付けていません

ECLeKTic: a Novel Challenge Set for Evaluation of Cross-Lingual Knowledge Transfer

要約 言語間で公平なパフォーマンスを達成するためには、多言語大規模言語モデル(L … 続きを読む

カテゴリー: cs.AI, cs.CL | ECLeKTic: a Novel Challenge Set for Evaluation of Cross-Lingual Knowledge Transfer はコメントを受け付けていません

FlexDrive: Toward Trajectory Flexibility in Driving Scene Reconstruction and Rendering

要約 ドライビングシーンの再構成とレンダリングは、3Dガウススプラッティングを用 … 続きを読む

カテゴリー: cs.CV | FlexDrive: Toward Trajectory Flexibility in Driving Scene Reconstruction and Rendering はコメントを受け付けていません

Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning

要約 多インスタンス学習(Multi-Instance Learning: MI … 続きを読む

カテゴリー: cs.CV | Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning はコメントを受け付けていません

AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models

要約 大規模言語モデル(Large Language Models: LLM)が … 続きを読む

カテゴリー: cs.AI, cs.CL | AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models はコメントを受け付けていません