-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
Conceptual Codebook Learning for Vision-Language Models
要約 この論文では、ビジョン言語モデル (VLM) の新しい微調整手法である概念 … 続きを読む
カテゴリー: cs.CV
Conceptual Codebook Learning for Vision-Language Models はコメントを受け付けていません
Enable the Right to be Forgotten with Federated Client Unlearning in Medical Imaging
要約 ほとんどのデータ規制に記載されているように、忘れられる権利はフェデレーテッ … 続きを読む
SMERF: Streamable Memory Efficient Radiance Fields for Real-Time Large-Scene Exploration
要約 リアルタイム ビュー合成の最近の技術は、忠実度と速度が急速に進歩しており、 … 続きを読む
GCF: Graph Convolutional Networks for Facial Expression Recognition
要約 表情認識 (FER) は、対人コミュニケーションを理解するために不可欠です … 続きを読む
カテゴリー: cs.CV
GCF: Graph Convolutional Networks for Facial Expression Recognition はコメントを受け付けていません
ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos
要約 ビデオ イベント内で時間的推論を実行する AI モデルの能力を厳密にテスト … 続きを読む
カテゴリー: cs.CV
ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos はコメントを受け付けていません
Investigating Event-Based Cameras for Video Frame Interpolation in Sports
要約 スローモーション リプレイは、スポーツ ゲームの重要な瞬間をスリリングな視 … 続きを読む
カテゴリー: cs.CV
Investigating Event-Based Cameras for Video Frame Interpolation in Sports はコメントを受け付けていません
Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion
要約 この論文では、独立したトークンごとのノイズ レベルで一連のトークンのノイズ … 続きを読む
OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation
要約 Text-to-Video(T2V)生成は、大規模なマルチモダリティ モデ … 続きを読む
カテゴリー: cs.CV
OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation はコメントを受け付けていません
Steerable Pyramid Transform Enables Robust Left Ventricle Quantification
要約 心臓指数の予測は、医療画像分野で長い間焦点となってきました。 さまざまな深 … 続きを読む
xLSTM-UNet can be an Effective 2D & 3D Medical Image Segmentation Backbone with Vision-LSTM (ViL) better than its Mamba Counterpart
要約 畳み込みニューラル ネットワーク (CNN) とビジョン トランスフォーマ … 続きを読む