投稿者「jarxiv」のアーカイブ

Person Recognition at Altitude and Range: Fusion of Face, Body Shape and Gait

要約 制約のない環境における全身の人認識の問題に対処します。 この問題は、高度お … 続きを読む

カテゴリー: cs.CV | Person Recognition at Altitude and Range: Fusion of Face, Body Shape and Gait はコメントを受け付けていません

Merging and Disentangling Views in Visual Reinforcement Learning for Robotic Manipulation

要約 ビジョンは、特に視覚サーボを使用して、操作での使用でよく知られています。 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Merging and Disentangling Views in Visual Reinforcement Learning for Robotic Manipulation はコメントを受け付けていません

On Path to Multimodal Generalist: General-Level and General-Bench

要約 Multimodal Large Languageモデル(MLLM)は、L … 続きを読む

カテゴリー: cs.CV | On Path to Multimodal Generalist: General-Level and General-Bench はコメントを受け付けていません

PrimitiveAnything: Human-Crafted 3D Primitive Assembly Generation with Auto-Regressive Transformer

要約 複雑な3D形状を単純な幾何学的要素に分解し、人間の視覚認知において重要な役 … 続きを読む

カテゴリー: cs.CV, cs.GR | PrimitiveAnything: Human-Crafted 3D Primitive Assembly Generation with Auto-Regressive Transformer はコメントを受け付けていません

EchoInk-R1: Exploring Audio-Visual Reasoning in Multimodal LLMs via Reinforcement Learning

要約 マルチモーダル大手言語モデル(MLLM)は、テキスト、ビジョン、オーディオ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | EchoInk-R1: Exploring Audio-Visual Reasoning in Multimodal LLMs via Reinforcement Learning はコメントを受け付けていません

Vision-Language Models Create Cross-Modal Task Representations

要約 自己回帰ビジョン言語モデル(VLM)は、単一のモデル内で多くのタスクを処理 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Vision-Language Models Create Cross-Modal Task Representations はコメントを受け付けていません

Anant-Net: Breaking the Curse of Dimensionality with Scalable and Interpretable Neural Surrogate for High-Dimensional PDEs

要約 高次元の部分微分方程式(PDE)は、多様な科学的および工学的アプリケーショ … 続きを読む

カテゴリー: cs.LG | Anant-Net: Breaking the Curse of Dimensionality with Scalable and Interpretable Neural Surrogate for High-Dimensional PDEs はコメントを受け付けていません

Learning Survival Distributions with the Asymmetric Laplace Distribution

要約 確率論的生存分析モデルは、一連の共変量を与えられたイベントの将来の発生(時 … 続きを読む

カテゴリー: cs.LG, math.ST, stat.TH | Learning Survival Distributions with the Asymmetric Laplace Distribution はコメントを受け付けていません

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

要約 検証可能な報酬(RLVR)による強化学習は、結果ベースの報酬から直接学習す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Absolute Zero: Reinforced Self-play Reasoning with Zero Data はコメントを受け付けていません

Enhancing Target-unspecific Tasks through a Features Matrix

要約 大規模なビジョン言語モデルの迅速な学習の最近の開発により、ターゲット固有の … 続きを読む

カテゴリー: cs.CL, cs.CV | Enhancing Target-unspecific Tasks through a Features Matrix はコメントを受け付けていません