投稿者「jarxiv」のアーカイブ

PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims

投稿日: 2025年5月29日作成者: jarxiv

要約特許請求は、発明の保護範囲を定義します。請求に曖昧さがある場合、それは特 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity

投稿日: 2025年5月29日作成者: jarxiv

要約大規模な言語モデルにおける専門家（MOE）の混合物の外科は、はるかに大きな … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on

投稿日: 2025年5月29日作成者: jarxiv

要約 Video Virtual Try-On（VVT）は、連続したビデオフレー … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HoliTom: Holistic Token Merging for Fast Video Large Language Models

投稿日: 2025年5月29日作成者: jarxiv

要約ビデオ大規模な言語モデル（ビデオLLM）はビデオ理解に優れていますが、冗長 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Visuospatial Cognitive Assistant

投稿日: 2025年5月29日作成者: jarxiv

要約ビデオベースの空間認知は、ロボット工学と具体化されたAIにとって不可欠です … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts

投稿日: 2025年5月29日作成者: jarxiv

要約マルチモーダルの大手言語モデル（MLLM）は一般的なビジョン言語タスクに優 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping

投稿日: 2025年5月29日作成者: jarxiv

要約正確な作物マッピングは、個々のフィールドテクスチャから景観レベルのコンテキ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Diagnosing and Resolving Cloud Platform Instability with Multi-modal RAG LLMs

投稿日: 2025年5月29日作成者: jarxiv

要約今日のクラウドホストのアプリケーションとサービスは複雑なシステムであり、パ … 続きを読む →

カテゴリー: cs.AI, cs.OS | コメントを受け付けていません

Automating eHMI Action Design with LLMs for Automated Vehicle Communication

投稿日: 2025年5月28日作成者: jarxiv

要約自動化された車両（AVS）と他の道路利用者間に明示的な通信チャネルがないた … 続きを読む →

カテゴリー: cs.HC, cs.RO | コメントを受け付けていません

ManiTaskGen: A Comprehensive Task Generator for Benchmarking and Improving Vision-Language Agents on Embodied Decision-Making

投稿日: 2025年5月28日作成者: jarxiv

要約任意のタスクを達成できる具体化されたエージェントを構築することは、具体化さ … 続きを読む →

カテゴリー: cs.RO | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims

Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity

MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on

HoliTom: Holistic Token Merging for Fast Video Large Language Models

Visuospatial Cognitive Assistant

Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts

AgriFM: A Multi-source Temporal Remote Sensing Foundation Model for Crop Mapping

Diagnosing and Resolving Cloud Platform Instability with Multi-modal RAG LLMs

Automating eHMI Action Design with LLMs for Automated Vehicle Communication

ManiTaskGen: A Comprehensive Task Generator for Benchmarking and Improving Vision-Language Agents on Embodied Decision-Making

最近の投稿

最近のコメント

アーカイブ

カテゴリー