cs.CV」カテゴリーアーカイブ

Mono-InternVL: Pushing the Boundaries of Monolithic Multimodal Large Language Models with Endogenous Visual Pre-training

要約 このペーパーでは、ビジュアル エンコーディングと言語デコーディングを単一の … 続きを読む

カテゴリー: cs.CL, cs.CV | コメントする

DGTR: Distributed Gaussian Turbo-Reconstruction for Sparse-View Vast Scenes

要約 ノベルビュー合成 (NVS) アプローチは、広大なシーンの再構築において重 … 続きを読む

カテゴリー: cs.CV | コメントする

Paying more attention to local contrast: improving infrared small target detection performance via prior knowledge

要約 赤外線小型目標検出 (IRSTD) のデータ駆動型手法は、有望な結果を達成 … 続きを読む

カテゴリー: cs.CV | コメントする

PDE-CNNs: Axiomatic Derivations and Applications

要約 PDE ベースのグループ畳み込みニューラル ネットワーク (PDE-G-C … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

HHAvatar: Gaussian Head Avatar with Dynamic Hairs

要約 高忠実度の 3D ヘッド アバターの作成は常に研究のホットスポットですが、 … 続きを読む

カテゴリー: cs.CV, cs.GR | コメントする

Analysis and Synthesis Denoisers for Forward-Backward Plug-and-Play Algorithms

要約 この研究では、プラグ アンド プレイ (PnP) 方式で、近接演算子を部分 … 続きを読む

カテゴリー: 65K10, 68T07, 68U10, 90C59, 94A08, cs.CV, eess.IV, eess.SP, math.OC | コメントする

VideoAutoArena: An Automated Arena for Evaluating Large Multimodal Models in Video Analysis through User Simulation

要約 高度なビデオ分析機能を備えた大規模マルチモーダル モデル (LMM) が、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントする

3D-Aware Instance Segmentation and Tracking in Egocentric Videos

要約 自己中心的なビデオでは、急速なカメラの動き、頻繁なオブジェクトの遮蔽、およ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | コメントする

DATTA: Domain-Adversarial Test-Time Adaptation for Cross-Domain WiFi-Based Human Activity Recognition

要約 クロスドメイン一般化は、環境、デバイス、対象の変化に起因する WiFi ベ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.ET, cs.LG | コメントする

DAOcc: 3D Object Detection Assisted Multi-Sensor Fusion for 3D Occupancy Prediction

要約 マルチセンサー フュージョンにより、自動運転やロボット工学にとって重要な … 続きを読む

カテゴリー: cs.CV | コメントする