-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
SeD: Semantic-Aware Discriminator for Image Super-Resolution
要約 Generative Adversarial Networks (GAN) … 続きを読む
Assessing Visually-Continuous Corruption Robustness of Neural Networks Relative to Human Performance
要約 ニューラル ネットワーク (NN) は、ImageNet 上の画像分類にお … 続きを読む
カテゴリー: cs.CV
Assessing Visually-Continuous Corruption Robustness of Neural Networks Relative to Human Performance はコメントを受け付けていません
Entity-Aware Multimodal Alignment Framework for News Image Captioning
要約 ニュース画像のキャプション タスクは、画像キャプション タスクの変形であり … 続きを読む
Navigating Hallucinations for Reasoning of Unintentional Activities
要約 この研究では、ビデオ内の意図しない人間の活動を理解するという新しい課題を提 … 続きを読む
カテゴリー: cs.CV
Navigating Hallucinations for Reasoning of Unintentional Activities はコメントを受け付けていません
PEM: Prototype-based Efficient MaskFormer for Image Segmentation
要約 最近のトランスフォーマーベースのアーキテクチャは、画像セグメンテーションの … 続きを読む
Leveraging AI Predicted and Expert Revised Annotations in Interactive Segmentation: Continual Tuning or Full Training?
要約 AI アルゴリズムと人間の専門知識を統合したインタラクティブなセグメンテー … 続きを読む
Listening to the Noise: Blind Denoising with Gibbs Diffusion
要約 近年、ノイズ除去の問題が深い生成モデルの開発と絡み合うようになりました。 … 続きを読む
カテゴリー: astro-ph.CO, cs.CV, cs.LG, eess.SP, stat.ML
Listening to the Noise: Blind Denoising with Gibbs Diffusion はコメントを受け付けていません
SeMoLi: What Moves Together Belongs Together
要約 私たちは、モーションキューに基づいた半教師あり物体検出に取り組みます。 最 … 続きを読む
カテゴリー: cs.CV
SeMoLi: What Moves Together Belongs Together はコメントを受け付けていません
TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning
要約 テレビ クリップなどの複雑でマルチモーダルなコンテンツに対して質問応答を実 … 続きを読む
Surgical Tattoos in Infrared: A Dataset for Quantifying Tissue Tracking and Mapping
要約 内視鏡環境で組織を追跡およびマッピングする方法のパフォーマンスを定量化する … 続きを読む
カテゴリー: cs.CV
Surgical Tattoos in Infrared: A Dataset for Quantifying Tissue Tracking and Mapping はコメントを受け付けていません