「cs.CL」カテゴリーアーカイブ

From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Pedagogical Visualization

投稿日: 2025年5月23日作成者: jarxiv

要約拡散モデルや大規模な視覚言語モデル（LVLMS）などの基礎モデル（FMS） … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

More Text, Less Point: Towards 3D Data-Efficient Point-Language Understanding

投稿日: 2025年5月23日作成者: jarxiv

要約大規模な言語モデル（LLM）が3Dの物理的世界を理解できるようにすることは … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

ATR-Bench: A Federated Learning Benchmark for Adaptation, Trust, and Reasoning

投稿日: 2025年5月23日作成者: jarxiv

要約 Federated Learning（FL）は、分散型の参加者全体でデータ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning?

投稿日: 2025年5月23日作成者: jarxiv

要約大規模なファンデーションモデルは、特に剛性テンプレートまたは群衆発表の命令 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning

投稿日: 2025年5月23日作成者: jarxiv

要約この作業では、現在のマルチモーダルアプローチで支配的な自己網性パラダイムか … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

NovelSeek: When Agent Becomes the Scientist — Building Closed-Loop System from Hypothesis to Verification

投稿日: 2025年5月23日作成者: jarxiv

要約人工知能（AI）は、科学研究のパラダイムの変換を加速し、研究効率を高めるだ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

MedFrameQA: A Multi-Image Medical VQA Benchmark for Clinical Reasoning

投稿日: 2025年5月23日作成者: jarxiv

要約既存の医療用VQAベンチマークは、主に単一イメージ分析に焦点を当てています … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Multi-SpatialMLLM: Multi-Frame Spatial Understanding with Multi-Modal Large Language Models

投稿日: 2025年5月23日作成者: jarxiv

要約マルチモーダルの大手言語モデル（MLLM）は視覚的なタスクで急速に進歩して … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Delving into RL for Image Generation with CoT: A Study on DPO vs. GRPO

投稿日: 2025年5月23日作成者: jarxiv

要約最近の進歩は、大規模な言語モデル（LLM）の考え方（COT）の推論能力を高 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

GoT-R1: Unleashing Reasoning Capability of MLLM for Visual Generation with Reinforcement Learning

投稿日: 2025年5月23日作成者: jarxiv

要約視覚生成モデルは、テキストプロンプトから現実的な画像を作成する際に顕著な進 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Pedagogical Visualization

More Text, Less Point: Towards 3D Data-Efficient Point-Language Understanding

ATR-Bench: A Federated Learning Benchmark for Adaptation, Trust, and Reasoning

MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning?

LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning

NovelSeek: When Agent Becomes the Scientist — Building Closed-Loop System from Hypothesis to Verification

MedFrameQA: A Multi-Image Medical VQA Benchmark for Clinical Reasoning

Multi-SpatialMLLM: Multi-Frame Spatial Understanding with Multi-Modal Large Language Models

Delving into RL for Image Generation with CoT: A Study on DPO vs. GRPO

GoT-R1: Unleashing Reasoning Capability of MLLM for Visual Generation with Reinforcement Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー