-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
Robust Shape Fitting for 3D Scene Abstraction
要約 人間は世界を単純なパラメトリック モデルの配置として認識し、構築します。 … 続きを読む
カテゴリー: cs.CV
Robust Shape Fitting for 3D Scene Abstraction はコメントを受け付けていません
SimPLR: A Simple and Plain Transformer for Scaling-Efficient Object Detection and Segmentation
要約 さまざまなスケールの画像内の物体を検出する機能は、最新の物体検出器の設計に … 続きを読む
カテゴリー: cs.CV
SimPLR: A Simple and Plain Transformer for Scaling-Efficient Object Detection and Segmentation はコメントを受け付けていません
Understanding the Double Descent Phenomenon in Deep Learning
要約 モデルクラスの容量が大きくなるにつれて、汎化ギャップを制御して過剰適合を回 … 続きを読む
DeepRepViz: Identifying Confounders in Deep Learning Model Predictions
要約 深層学習 (DL) モデルは、心理的行動、認知特性、脳の病理を予測するため … 続きを読む
Approximate Nullspace Augmented Finetuning for Robust Vision Transformers
要約 ディープラーニング モデルの堅牢性を強化することは、特にビジョン トランス … 続きを読む
MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation
要約 我々は、単一の RGB 画像から利用可能な 3D コンピュータ支援設計 ( … 続きを読む
カテゴリー: cs.CV
MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation はコメントを受け付けていません
Geometry of the Visual Cortex with Applications to Image Inpainting and Enhancement
要約 ロトトランスレーション群 $SE(2)$ に視覚野 V1 から着想を得たサ … 続きを読む
カテゴリー: cs.CV
Geometry of the Visual Cortex with Applications to Image Inpainting and Enhancement はコメントを受け付けていません
Joint Multimodal Transformer for Dimensional Emotional Recognition in the Wild
要約 ビデオにおける視聴覚感情認識 (ER) には、単峰性のパフォーマンスに比べ … 続きを読む
HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using Diffusion Models
要約 私たちは、テキストのプロンプトによって駆動されるリアルな 3D 人間とオブ … 続きを読む
カテゴリー: cs.CV
HOI-Diff: Text-Driven Synthesis of 3D Human-Object Interactions using Diffusion Models はコメントを受け付けていません
Mitigating Dialogue Hallucination for Large Multi-modal Models via Adversarial Instruction Tuning
要約 大規模マルチモーダル モデル (LMM) の幻覚を軽減することは、汎用アシ … 続きを読む
カテゴリー: cs.CV
Mitigating Dialogue Hallucination for Large Multi-modal Models via Adversarial Instruction Tuning はコメントを受け付けていません