cs.AI」カテゴリーアーカイブ

A Hitchhiker’s Guide to Scaling Law Estimation

要約 スケーリング則は、より少ないパラメーターまたはより小さなトレーニング セッ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Hitchhiker’s Guide to Scaling Law Estimation はコメントを受け付けていません

GaVaMoE: Gaussian-Variational Gated Mixture of Experts for Explainable Recommendation

要約 大規模言語モデルベースの説明可能なレコメンデーション (LLM ベースの … 続きを読む

カテゴリー: cs.AI, cs.IR | GaVaMoE: Gaussian-Variational Gated Mixture of Experts for Explainable Recommendation はコメントを受け付けていません

VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models

要約 複雑な視覚情報を正確に理解することは、視覚言語モデル (VLM) にとって … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models はコメントを受け付けていません

Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering

要約 Text-to-Image(TTI)生成モデルは目覚ましい成功を収めている … 続きを読む

カテゴリー: cs.AI, cs.CV | Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering はコメントを受け付けていません

SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars

要約 ガウス プリミティブを使用した頭部アバター レンダリングの最近の進歩により … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars はコメントを受け付けていません

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions

要約 マルチモーダル大規模言語モデル (MLLM) における幻覚は、実際の応用を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions はコメントを受け付けていません

RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation

要約 Segment Anything (SAM) の出現により、特に画像編集タ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.HC, I.4.6 | RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation はコメントを受け付けていません

Learning Truncated Causal History Model for Video Restoration

要約 ビデオ復元に対する重要な課題の 1 つは、動きによって支配されるビデオ フ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Learning Truncated Causal History Model for Video Restoration はコメントを受け付けていません

Patch-Based Diffusion Models Beat Whole-Image Models for Mismatched Distribution Inverse Problems

要約 拡散モデルは、強力な画像事前分布を学習できるため、逆問題の解決において優れ … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Patch-Based Diffusion Models Beat Whole-Image Models for Mismatched Distribution Inverse Problems はコメントを受け付けていません

SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding

要約 計算病理学におけるマルチモーダル大規模言語モデル (MLLM) の進歩にも … 続きを読む

カテゴリー: cs.AI, cs.CV | SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding はコメントを受け付けていません