投稿者「jarxiv」のアーカイブ

ICE: Intrinsic Concept Extraction from a Single Image via Diffusion Models

投稿日: 2025年4月22日作成者: jarxiv

要約視覚概念を定義する際の固有のあいまいさは、単一の画像から概念を正確に学習す … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DRAWER: Digital Reconstruction and Articulation With Environment Realism

投稿日: 2025年4月22日作成者: jarxiv

要約現実世界のデータから仮想デジタルレプリカを作成すると、ゲームやロボット工学 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Seeing from Another Perspective: Evaluating Multi-View Understanding in MLLMs

投稿日: 2025年4月22日作成者: jarxiv

要約マルチビューの理解、効果的なナビゲーション、操作、3Dシーンの理解のために … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models

投稿日: 2025年4月22日作成者: jarxiv

要約視覚的推論は、人間の知能のコアコンポーネントであり、高度なマルチモーダルモ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians

投稿日: 2025年4月22日作成者: jarxiv

要約 3Dガウスのスプラッティング（3DG）は、フォトリアリスティックシーンの再 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Analysing the Robustness of Vision-Language-Models to Common Corruptions

投稿日: 2025年4月22日作成者: jarxiv

要約 Vision-Language Models（VLMS）は、視覚的およびテ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Generative AI Act II: Test Time Scaling Drives Cognition Engineering

投稿日: 2025年4月22日作成者: jarxiv

要約生成AI（2020-2023）の「Act I」と呼ばれる可能性のある大規模 … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Improving Generalization in Intent Detection: GRPO with Reward-Based Curriculum Sampling

投稿日: 2025年4月22日作成者: jarxiv

要約タスク指向のダイアログ（TOD）システムの重要なコンポーネントである意図検 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

BadApex: Backdoor Attack Based on Adaptive Optimization Mechanism of Black-box Large Language Models

投稿日: 2025年4月22日作成者: jarxiv

要約以前の挿入ベースおよび言い換えベースの背景は、攻撃の有効性に大きな成功を収 … 続きを読む →

カテゴリー: cs.CL, cs.CR | コメントを受け付けていません

SLAM&Render: A Benchmark for the Intersection Between Neural Rendering, Gaussian Splatting and SLAM

投稿日: 2025年4月22日作成者: jarxiv

要約元々、ニューラル放射輝度フィールド（NERF）やガウスのスプラッティングな … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

ICE: Intrinsic Concept Extraction from a Single Image via Diffusion Models

DRAWER: Digital Reconstruction and Articulation With Environment Realism

Seeing from Another Perspective: Evaluating Multi-View Understanding in MLLMs

VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models

StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians

Analysing the Robustness of Vision-Language-Models to Common Corruptions

Generative AI Act II: Test Time Scaling Drives Cognition Engineering

Improving Generalization in Intent Detection: GRPO with Reward-Based Curriculum Sampling

BadApex: Backdoor Attack Based on Adaptive Optimization Mechanism of Black-box Large Language Models

SLAM&Render: A Benchmark for the Intersection Between Neural Rendering, Gaussian Splatting and SLAM

最近の投稿

最近のコメント

アーカイブ

カテゴリー