「cs.AI」カテゴリーアーカイブ

PhyX: Does Your Model Have the ‘Wits’ for Physical Reasoning?

投稿日: 2025年5月30日作成者: jarxiv

要約既存のベンチマークは、インテリジェンスの重要な側面をキャプチャできません。 … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

DeepTheorem: Advancing LLM Reasoning for Theorem Proving Through Natural Language and Reinforcement Learning

投稿日: 2025年5月30日作成者: jarxiv

要約定理証明は、大規模な言語モデル（LLM）の複雑な推論能力を評価するための主 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Differential Information: An Information-Theoretic Perspective on Preference Optimization

投稿日: 2025年5月30日作成者: jarxiv

要約直接選好最適化（DPO）は、監督された方法で人間の好みを整合するための標準 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

From Chat Logs to Collective Insights: Aggregative Question Answering

投稿日: 2025年5月30日作成者: jarxiv

要約大規模な言語モデル（LLM）を搭載した会話エージェントは、私たちの毎日の相 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory

投稿日: 2025年5月30日作成者: jarxiv

要約効果的なビデオトークン化は、長いビデオのトランスモデルをスケーリングするた … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging

投稿日: 2025年5月30日作成者: jarxiv

要約医療画像分析では、機能エンジニアリングは、機械学習モデルの設計とパフォーマ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

VF-Eval: Evaluating Multimodal LLMs for Generating Feedback on AIGC Videos

投稿日: 2025年5月30日作成者: jarxiv

要約 MLLMSは、最近のビデオ質問のために広く研究されています。ただし、既存 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

CLDTracker: A Comprehensive Language Description for Visual Tracking

投稿日: 2025年5月30日作成者: jarxiv

要約投票は、動的な外観の変化、閉塞、および背景乱れにより、コンピュータービジョ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Skin Lesion Phenotyping via Nested Multi-modal Contrastive Learning

投稿日: 2025年5月30日作成者: jarxiv

要約画像とメタデータの間の複雑な関係を捉える新しいネストされたコントラスト学習 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

MAGREF: Masked Guidance for Any-Reference Video Generation

投稿日: 2025年5月30日作成者: jarxiv

要約ビデオ生成は、深い生成モデル、特に拡散ベースのアプローチの出現に大きな進歩 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

PhyX: Does Your Model Have the ‘Wits’ for Physical Reasoning?

DeepTheorem: Advancing LLM Reasoning for Theorem Proving Through Natural Language and Reinforcement Learning

Differential Information: An Information-Theoretic Perspective on Preference Optimization

From Chat Logs to Collective Insights: Aggregative Question Answering

One Trajectory, One Token: Grounded Video Tokenization via Panoptic Sub-object Trajectory

Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging

VF-Eval: Evaluating Multimodal LLMs for Generating Feedback on AIGC Videos

CLDTracker: A Comprehensive Language Description for Visual Tracking

Skin Lesion Phenotyping via Nested Multi-modal Contrastive Learning

MAGREF: Masked Guidance for Any-Reference Video Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー