月別アーカイブ: 2024年2月

IBD: Alleviating Hallucinations in Large Vision-Language Models via Image-Biased Decoding

要約 大規模視覚言語モデル (LVLM) は急速な開発を達成し、広く応用されてい … 続きを読む

カテゴリー: cs.CV | IBD: Alleviating Hallucinations in Large Vision-Language Models via Image-Biased Decoding はコメントを受け付けていません

TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models

要約 画像生成の一般的なフレームワークである拡散モデルは、推論時間の延長と大量の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models はコメントを受け付けていません

TAMM: TriAdapter Multi-Modal Learning for 3D Shape Understanding

要約 現在の 3D 形状データセットの規模が限られているため、3D 形状理解の進 … 続きを読む

カテゴリー: cs.CV | TAMM: TriAdapter Multi-Modal Learning for 3D Shape Understanding はコメントを受け付けていません

Sunshine to Rainstorm: Cross-Weather Knowledge Distillation for Robust 3D Object Detection

要約 LiDAR ベースの 3D 物体検出モデルは、従来、雨天時にはスキャン信号 … 続きを読む

カテゴリー: cs.CV | Sunshine to Rainstorm: Cross-Weather Knowledge Distillation for Robust 3D Object Detection はコメントを受け付けていません

Detection of Micromobility Vehicles in Urban Traffic Videos

要約 都市の交通環境では、特に電動スクーターや自転車などの超小型モビリティ車両の … 続きを読む

カテゴリー: cs.CV | Detection of Micromobility Vehicles in Urban Traffic Videos はコメントを受け付けていません

Multimodal Learning To Improve Cardiac Late Mechanical Activation Detection From Cine MR Images

要約 この論文では、日常的に取得される標準画像に大きく依存する臨床分析のパフォー … 続きを読む

カテゴリー: cs.CV | Multimodal Learning To Improve Cardiac Late Mechanical Activation Detection From Cine MR Images はコメントを受け付けていません

Defect Detection in Tire X-Ray Images: Conventional Methods Meet Deep Structures

要約 この論文では、ローカル バイナリ パターン (LBP) やグレー レベル共 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, I.4.0 | Defect Detection in Tire X-Ray Images: Conventional Methods Meet Deep Structures はコメントを受け付けていません

Gradient Reweighting: Towards Imbalanced Class-Incremental Learning

要約 クラス増分学習 (CIL) は、学習した知識を保持しながら、非定常データか … 続きを読む

カテゴリー: cs.CV | Gradient Reweighting: Towards Imbalanced Class-Incremental Learning はコメントを受け付けていません

Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models

要約 Sora は、2024 年 2 月に OpenAI によってリリースされた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models はコメントを受け付けていません

ToDo: Token Downsampling for Efficient Generation of High-Resolution Images

要約 注意メカニズムは画像拡散モデルにとって重要ですが、二次計算の複雑さにより、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | ToDo: Token Downsampling for Efficient Generation of High-Resolution Images はコメントを受け付けていません