月別アーカイブ: 2025年2月

Enhancing Vehicle Make and Model Recognition with 3D Attention Modules

要約 車両の製造およびモデル認識(VMMR)は、インテリジェント輸送システムの重 … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhancing Vehicle Make and Model Recognition with 3D Attention Modules はコメントを受け付けていません

Generative Video Diffusion for Unseen Novel Semantic Video Moment Retrieval

要約 ビデオモーメント検索(VMR)は、非トリムビデオのテキストクエリに対応する … 続きを読む

カテゴリー: cs.CV | Generative Video Diffusion for Unseen Novel Semantic Video Moment Retrieval はコメントを受け付けていません

Evaluating Multimodal Generative AI with Korean Educational Standards

要約 このペーパーでは、韓国の国家教育テストを使用してマルチモーダル生成AIシス … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Evaluating Multimodal Generative AI with Korean Educational Standards はコメントを受け付けていません

Anatomy-Informed Deep Learning and Radiomics for Automated Neurofibroma Segmentation in Whole-Body MRI

要約 神経線維腫症1型は、神経線維腫(NFS)の発症を特徴とする遺伝的障害であり … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Anatomy-Informed Deep Learning and Radiomics for Automated Neurofibroma Segmentation in Whole-Body MRI はコメントを受け付けていません

LaRE$^2$: Latent Reconstruction Error Based Method for Diffusion-Generated Image Detection

要約 拡散モデルの進化により、画像生成の品質が劇的に向上し、実際の画像と生成され … 続きを読む

カテゴリー: cs.AI, cs.CV | LaRE$^2$: Latent Reconstruction Error Based Method for Diffusion-Generated Image Detection はコメントを受け付けていません

HeRCULES: Heterogeneous Radar Dataset in Complex Urban Environment for Multi-session Radar SLAM

要約 最近、レーダーは、挑戦的な気象条件での堅牢性のためにロボット工学で広く掲載 … 続きを読む

カテゴリー: cs.CV, cs.RO | HeRCULES: Heterogeneous Radar Dataset in Complex Urban Environment for Multi-session Radar SLAM はコメントを受け付けていません

LEAP: Enhancing Vision-Based Occupancy Networks with Lightweight Spatio-Temporal Correlation

要約 ビジョンベースの占有ネットワークは、マルチビュー画像に由来するセマンティッ … 続きを読む

カテゴリー: cs.CV | LEAP: Enhancing Vision-Based Occupancy Networks with Lightweight Spatio-Temporal Correlation はコメントを受け付けていません

MVIP — A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition

要約 マルチモーダルおよびマルチビューアプリケーション指向の産業部品認識の新しい … 続きを読む

カテゴリー: cs.AI, cs.CV | MVIP — A Dataset and Methods for Application Oriented Multi-View and Multi-Modal Industrial Part Recognition はコメントを受け付けていません

Memory Helps, but Confabulation Misleads: Understanding Streaming Events in Videos with MLLMs

要約 マルチモーダル大手言語モデル(MLLMS)は、ビデオを総合的に理解する上で … 続きを読む

カテゴリー: cs.CV | Memory Helps, but Confabulation Misleads: Understanding Streaming Events in Videos with MLLMs はコメントを受け付けていません

Game State and Spatio-temporal Action Detection in Soccer using Graph Neural Networks and 3D Convolutional Networks

要約 サッカー分析は、2つのデータソースに依存しています。プレーヤーがピッチ上の … 続きを読む

カテゴリー: cs.CV | Game State and Spatio-temporal Action Detection in Soccer using Graph Neural Networks and 3D Convolutional Networks はコメントを受け付けていません