月別アーカイブ: 2024年6月

D-NPC: Dynamic Neural Point Clouds for Non-Rigid View Synthesis from Monocular Video

要約 非剛体変形シーンの動的再構成と時空間的な斬新な視点の合成は、最近ますます注 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | D-NPC: Dynamic Neural Point Clouds for Non-Rigid View Synthesis from Monocular Video はコメントを受け付けていません

Localizing Events in Videos with Multimodal Queries

要約 ビデオの理解はデジタル時代において極めて重要なタスクですが、ビデオの動的か … 続きを読む

カテゴリー: cs.AI, cs.CV | Localizing Events in Videos with Multimodal Queries はコメントを受け付けていません

Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation

要約 Audio-Visual Speech Recognition (AVSR … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation はコメントを受け付けていません

Retraining-free Model Quantization via One-Shot Weight-Coupling Learning

要約 量子化は、過剰にパラメータ化されたディープ ニューラル モデルを圧縮し、リ … 続きを読む

カテゴリー: cs.CV | Retraining-free Model Quantization via One-Shot Weight-Coupling Learning はコメントを受け付けていません

SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding

要約 リモート センシング大型マルチモーダル モデル (RSLMM) は急速に開 … 続きを読む

カテゴリー: cs.AI, cs.CV | SkySenseGPT: A Fine-Grained Instruction Tuning Dataset and Model for Remote Sensing Vision-Language Understanding はコメントを受け付けていません

Annotation Cost-Efficient Active Learning for Deep Metric Learning Driven Remote Sensing Image Retrieval

要約 ディープメトリックラーニング (DML) は、リモートセンシング (RS) … 続きを読む

カテゴリー: cs.CV | Annotation Cost-Efficient Active Learning for Deep Metric Learning Driven Remote Sensing Image Retrieval はコメントを受け付けていません

GaussianSR: 3D Gaussian Super-Resolution with 2D Diffusion Priors

要約 低解像度の入力ビューから高解像度の新規ビュー合成 (HRNVS) を実現す … 続きを読む

カテゴリー: cs.CV | GaussianSR: 3D Gaussian Super-Resolution with 2D Diffusion Priors はコメントを受け付けていません

Task-aligned Part-aware Panoptic Segmentation through Joint Object-Part Representations

要約 部分認識パノプティック セグメンテーション (PPS) では、(a) 画像 … 続きを読む

カテゴリー: cs.CV | Task-aligned Part-aware Panoptic Segmentation through Joint Object-Part Representations はコメントを受け付けていません

Shelf-Supervised Multi-Modal Pre-Training for 3D Object Detection

要約 最先端の 3D オブジェクト検出器は、多くの場合、大量のラベル付きデータセ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Shelf-Supervised Multi-Modal Pre-Training for 3D Object Detection はコメントを受け付けていません

Modified Risk Formulation for Improving the Prediction of Knee Osteoarthritis Progression

要約 変形性関節症 (OA) の転帰を予測する現在の方法には、転帰予測モデルを改 … 続きを読む

カテゴリー: cs.CV, eess.IV, q-bio.QM | Modified Risk Formulation for Improving the Prediction of Knee Osteoarthritis Progression はコメントを受け付けていません