投稿者「jarxiv」のアーカイブ

NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search

要約 生成AI検索は、複雑なクエリに対するエンドツーエンドの回答を提供し、複数の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.IR | NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search はコメントを受け付けていません

Mind the Gap: Bridging Thought Leap for Improved Chain-of-Thought Tuning

要約 大規模な言語モデル(LLMS)は、チェーンオブシャート(COT)の推論を通 … 続きを読む

カテゴリー: cs.AI, cs.CL | Mind the Gap: Bridging Thought Leap for Improved Chain-of-Thought Tuning はコメントを受け付けていません

Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study

要約 Vision-Language Models(VLMS)は、広範囲にわたる … 続きを読む

カテゴリー: cs.CL, cs.CV | Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study はコメントを受け付けていません

IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting

要約 私たちが成長するにつれて私たちを魅了する物語とキャラクターは、ユニークなフ … 続きを読む

カテゴリー: cs.CV | IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting はコメントを受け付けていません

Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model

要約 一般化された少数のショット3Dポイントクラウドセグメンテーション(GFS- … 続きを読む

カテゴリー: cs.CV | Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model はコメントを受け付けていません

Online Iterative Self-Alignment for Radiology Report Generation

要約 Radiology Report Generation(RRG)は、放射線 … 続きを読む

カテゴリー: cs.AI, cs.CV | Online Iterative Self-Alignment for Radiology Report Generation はコメントを受け付けていません

MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents

要約 Multimodal Document検索は、広範なドキュメントからの図、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents はコメントを受け付けていません

Video Compression Commander: Plug-and-Play Inference Acceleration for Video Large Language Models

要約 ビデオ大規模な言語モデル(Videollm)はビデオ理解に優れていますが、 … 続きを読む

カテゴリー: cs.CV | Video Compression Commander: Plug-and-Play Inference Acceleration for Video Large Language Models はコメントを受け付けていません

VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank

要約 DeepSeek-R1は、強化学習を通じて、大きな言語モデル(LLMS)の … 続きを読む

カテゴリー: cs.CV | VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank はコメントを受け付けていません

RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding

要約 ビジョン言語モデル(VLM)が日常生活にますます統合されるようになるにつれ … 続きを読む

カテゴリー: cs.CL, cs.CV | RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding はコメントを受け付けていません