-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding
要約 現在のマルチモーダル大規模言語モデル (MLLM) はビデオ理解において有 … 続きを読む
カテゴリー: cs.CV
Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding はコメントを受け付けていません
Less is More: Selective Reduction of CT Data for Self-Supervised Pre-Training of Deep Learning Models with Contrastive Learning Improves Downstream Classification Performance
要約 対照学習を使用した深層学習モデルの自己教師あり事前トレーニングは、画像分析 … 続きを読む
A Hybrid Feature Fusion Deep Learning Framework for Leukemia Cancer Detection in Microscopic Blood Sample Using Gated Recurrent Unit and Uncertainty Quantification
要約 急性リンパ芽球性白血病 (ALL) は、白血病の中で最も悪性度が高く、成人 … 続きを読む
Multi-modal Pose Diffuser: A Multimodal Generative Conditional Pose Prior
要約 スキン付きマルチパーソン線形 (SMPL) モデルは、3D 人間の姿勢推定 … 続きを読む
カテゴリー: cs.CV
Multi-modal Pose Diffuser: A Multimodal Generative Conditional Pose Prior はコメントを受け付けていません
Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model
要約 フルオレセイン眼底血管造影法 (FFA) は、網膜血管の問題の診断とモニタ … 続きを読む
カテゴリー: cs.CV
Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model はコメントを受け付けていません
MomentumSMoE: Integrating Momentum into Sparse Mixture of Experts
要約 Sparse Mixture of Experts (SMoE) は、ディ … 続きを読む
Scalable Drift Monitoring in Medical Imaging AI
要約 医療画像への人工知能 (AI) の統合により、臨床診断は高度化しましたが、 … 続きを読む
IncEventGS: Pose-Free Gaussian Splatting from a Single Event Camera
要約 新しいビュー合成のための暗黙的ニューラル表現と明示的 3D ガウス スプラ … 続きを読む
カテゴリー: cs.CV
IncEventGS: Pose-Free Gaussian Splatting from a Single Event Camera はコメントを受け付けていません
Harnessing Shared Relations via Multimodal Mixup Contrastive Learning for Multimodal Classification
要約 深層マルチモーダル学習は、対照学習を活用してモダリティ間の明示的な 1 対 … 続きを読む
Movie101v2: Improved Movie Narration Benchmark
要約 自動映画ナレーションは、視覚障害のある視聴者を支援するために、ビデオに合わ … 続きを読む