月別アーカイブ: 2024年7月

Conceptual Codebook Learning for Vision-Language Models

要約 この論文では、ビジョン言語モデル (VLM) の新しい微調整手法である概念 … 続きを読む

カテゴリー: cs.CV | Conceptual Codebook Learning for Vision-Language Models はコメントを受け付けていません

Enable the Right to be Forgotten with Federated Client Unlearning in Medical Imaging

要約 ほとんどのデータ規制に記載されているように、忘れられる権利はフェデレーテッ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Enable the Right to be Forgotten with Federated Client Unlearning in Medical Imaging はコメントを受け付けていません

SMERF: Streamable Memory Efficient Radiance Fields for Real-Time Large-Scene Exploration

要約 リアルタイム ビュー合成の最近の技術は、忠実度と速度が急速に進歩しており、 … 続きを読む

カテゴリー: cs.CV, cs.GR | SMERF: Streamable Memory Efficient Radiance Fields for Real-Time Large-Scene Exploration はコメントを受け付けていません

GCF: Graph Convolutional Networks for Facial Expression Recognition

要約 表情認識 (FER) は、対人コミュニケーションを理解するために不可欠です … 続きを読む

カテゴリー: cs.CV | GCF: Graph Convolutional Networks for Facial Expression Recognition はコメントを受け付けていません

ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos

要約 ビデオ イベント内で時間的推論を実行する AI モデルの能力を厳密にテスト … 続きを読む

カテゴリー: cs.CV | ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos はコメントを受け付けていません

Investigating Event-Based Cameras for Video Frame Interpolation in Sports

要約 スローモーション リプレイは、スポーツ ゲームの重要な瞬間をスリリングな視 … 続きを読む

カテゴリー: cs.CV | Investigating Event-Based Cameras for Video Frame Interpolation in Sports はコメントを受け付けていません

Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion

要約 この論文では、独立したトークンごとのノイズ レベルで一連のトークンのノイズ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion はコメントを受け付けていません

OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation

要約 Text-to-Video(T2V)生成は、大規模なマルチモダリティ モデ … 続きを読む

カテゴリー: cs.CV | OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation はコメントを受け付けていません

Steerable Pyramid Transform Enables Robust Left Ventricle Quantification

要約 心臓指数の予測は、医療画像分野で長い間焦点となってきました。 さまざまな深 … 続きを読む

カテゴリー: cs.CV, eess.IV | Steerable Pyramid Transform Enables Robust Left Ventricle Quantification はコメントを受け付けていません

xLSTM-UNet can be an Effective 2D & 3D Medical Image Segmentation Backbone with Vision-LSTM (ViL) better than its Mamba Counterpart

要約 畳み込みニューラル ネットワーク (CNN) とビジョン トランスフォーマ … 続きを読む

カテゴリー: cs.CV, eess.IV | xLSTM-UNet can be an Effective 2D & 3D Medical Image Segmentation Backbone with Vision-LSTM (ViL) better than its Mamba Counterpart はコメントを受け付けていません