投稿者「jarxiv」のアーカイブ

NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search

投稿日: 2025年5月21日作成者: jarxiv

要約生成AI検索は、複雑なクエリに対するエンドツーエンドの回答を提供し、複数の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.HC, cs.IR | コメントを受け付けていません

Mind the Gap: Bridging Thought Leap for Improved Chain-of-Thought Tuning

投稿日: 2025年5月21日作成者: jarxiv

要約大規模な言語モデル（LLMS）は、チェーンオブシャート（COT）の推論を通 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study

投稿日: 2025年5月21日作成者: jarxiv

要約 Vision-Language Models（VLMS）は、広範囲にわたる … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting

投稿日: 2025年5月21日作成者: jarxiv

要約私たちが成長するにつれて私たちを魅了する物語とキャラクターは、ユニークなフ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model

投稿日: 2025年5月21日作成者: jarxiv

要約一般化された少数のショット3Dポイントクラウドセグメンテーション（GFS- … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Online Iterative Self-Alignment for Radiology Report Generation

投稿日: 2025年5月21日作成者: jarxiv

要約 Radiology Report Generation（RRG）は、放射線 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents

投稿日: 2025年5月21日作成者: jarxiv

要約 Multimodal Document検索は、広範なドキュメントからの図、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | コメントを受け付けていません

Video Compression Commander: Plug-and-Play Inference Acceleration for Video Large Language Models

投稿日: 2025年5月21日作成者: jarxiv

要約ビデオ大規模な言語モデル（Videollm）はビデオ理解に優れていますが、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank

投稿日: 2025年5月21日作成者: jarxiv

要約 DeepSeek-R1は、強化学習を通じて、大きな言語モデル（LLMS）の … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding

投稿日: 2025年5月21日作成者: jarxiv

要約ビジョン言語モデル（VLM）が日常生活にますます統合されるようになるにつれ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

NExT-Search: Rebuilding User Feedback Ecosystem for Generative AI Search

Mind the Gap: Bridging Thought Leap for Improved Chain-of-Thought Tuning

Does Acceleration Cause Hidden Instability in Vision Language Models? Uncovering Instance-Level Divergence Through a Large-Scale Empirical Study

IP-Prompter: Training-Free Theme-Specific Image Generation via Dynamic Visual Prompting

Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model

Online Iterative Self-Alignment for Radiology Report Generation

MMDocIR: Benchmarking Multi-Modal Retrieval for Long Documents

Video Compression Commander: Plug-and-Play Inference Acceleration for Video Large Language Models

VisualQuality-R1: Reasoning-Induced Image Quality Assessment via Reinforcement Learning to Rank

RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding

最近の投稿

最近のコメント

アーカイブ

カテゴリー