「cs.AI」カテゴリーアーカイブ

A Hitchhiker’s Guide to Scaling Law Estimation

投稿日: 2024年10月16日作成者: jarxiv

要約スケーリング則は、より少ないパラメーターまたはより小さなトレーニングセッ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

GaVaMoE: Gaussian-Variational Gated Mixture of Experts for Explainable Recommendation

投稿日: 2024年10月16日作成者: jarxiv

要約大規模言語モデルベースの説明可能なレコメンデーション (LLM ベースの … 続きを読む →

カテゴリー: cs.AI, cs.IR | コメントを受け付けていません

VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models

投稿日: 2024年10月16日作成者: jarxiv

要約複雑な視覚情報を正確に理解することは、視覚言語モデル (VLM) にとって … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering

投稿日: 2024年10月16日作成者: jarxiv

要約 Text-to-Image（TTI）生成モデルは目覚ましい成功を収めている … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars

投稿日: 2024年10月16日作成者: jarxiv

要約ガウスプリミティブを使用した頭部アバターレンダリングの最近の進歩により … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR | コメントを受け付けていません

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions

投稿日: 2024年10月16日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) における幻覚は、実際の応用を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation

投稿日: 2024年10月16日作成者: jarxiv

要約 Segment Anything (SAM) の出現により、特に画像編集タ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, I.4.6 | コメントを受け付けていません

Learning Truncated Causal History Model for Video Restoration

投稿日: 2024年10月16日作成者: jarxiv

要約ビデオ復元に対する重要な課題の 1 つは、動きによって支配されるビデオフ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Patch-Based Diffusion Models Beat Whole-Image Models for Mismatched Distribution Inverse Problems

投稿日: 2024年10月16日作成者: jarxiv

要約拡散モデルは、強力な画像事前分布を学習できるため、逆問題の解決において優れ … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding

投稿日: 2024年10月16日作成者: jarxiv

要約計算病理学におけるマルチモーダル大規模言語モデル (MLLM) の進歩にも … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

A Hitchhiker’s Guide to Scaling Law Estimation

GaVaMoE: Gaussian-Variational Gated Mixture of Experts for Explainable Recommendation

VisualRWKV-HD and UHD: Advancing High-Resolution Processing for Visual Language Models

Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering

SurFhead: Affine Rig Blending for Geometrically Accurate 2D Gaussian Surfel Head Avatars

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructions

RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation

Learning Truncated Causal History Model for Video Restoration

Patch-Based Diffusion Models Beat Whole-Image Models for Mismatched Distribution Inverse Problems

SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding

最近の投稿

最近のコメント

アーカイブ

カテゴリー