月別アーカイブ: 2024年3月

Robust Shape Fitting for 3D Scene Abstraction

要約 人間は世界を単純なパラメトリック モデルの配置として認識し、構築します。 … 続きを読む

カテゴリー: cs.CV | Robust Shape Fitting for 3D Scene Abstraction はコメントを受け付けていません

SimPLR: A Simple and Plain Transformer for Scaling-Efficient Object Detection and Segmentation

要約 さまざまなスケールの画像内の物体を検出する機能は、最新の物体検出器の設計に … 続きを読む

カテゴリー: cs.CV | SimPLR: A Simple and Plain Transformer for Scaling-Efficient Object Detection and Segmentation はコメントを受け付けていません

Understanding the Double Descent Phenomenon in Deep Learning

要約 モデルクラスの容量が大きくなるにつれて、汎化ギャップを制御して過剰適合を回 … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | Understanding the Double Descent Phenomenon in Deep Learning はコメントを受け付けていません

DeepRepViz: Identifying Confounders in Deep Learning Model Predictions

要約 深層学習 (DL) モデルは、心理的行動、認知特性、脳の病理を予測するため … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | DeepRepViz: Identifying Confounders in Deep Learning Model Predictions はコメントを受け付けていません

Approximate Nullspace Augmented Finetuning for Robust Vision Transformers

要約 ディープラーニング モデルの堅牢性を強化することは、特にビジョン トランス … 続きを読む

カテゴリー: cs.CV, cs.LG | Approximate Nullspace Augmented Finetuning for Robust Vision Transformers はコメントを受け付けていません

MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation

要約 我々は、単一の RGB 画像から利用可能な 3D コンピュータ支援設計 ( … 続きを読む

カテゴリー: cs.CV | MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation はコメントを受け付けていません

Geometry of the Visual Cortex with Applications to Image Inpainting and Enhancement

要約 ロトトランスレーション群 $SE(2)$ に視覚野 V1 から着想を得たサ … 続きを読む

カテゴリー: cs.CV | Geometry of the Visual Cortex with Applications to Image Inpainting and Enhancement はコメントを受け付けていません

Joint Multimodal Transformer for Dimensional Emotional Recognition in the Wild

要約 ビデオにおける視聴覚感情認識 (ER) には、単峰性のパフォーマンスに比べ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Joint Multimodal Transformer for Dimensional Emotional Recognition in the Wild はコメントを受け付けていません

HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using Diffusion Models

要約 私たちは、テキストのプロンプトによって駆動されるリアルな 3D 人間とオブ … 続きを読む

カテゴリー: cs.CV | HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using Diffusion Models はコメントを受け付けていません

Mitigating Dialogue Hallucination for Large Multi-modal Models via Adversarial Instruction Tuning

要約 大規模マルチモーダル モデル (LMM) の幻覚を軽減することは、汎用アシ … 続きを読む

カテゴリー: cs.CV | Mitigating Dialogue Hallucination for Large Multi-modal Models via Adversarial Instruction Tuning はコメントを受け付けていません