-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年3月
MeaCap: Memory-Augmented Zero-shot Image Captioning
要約 適切にペアリングされた画像テキスト データを使用しないゼロショット画像キャ … 続きを読む
カテゴリー: cs.CV
MeaCap: Memory-Augmented Zero-shot Image Captioning はコメントを受け付けていません
Transformer-based nowcasting of radar composites from satellite images for severe weather
要約 気象レーダー データはナウキャスティングにとって重要であり、数値気象予測モ … 続きを読む
カテゴリー: cs.CV, cs.LG, eess.IV, physics.ao-ph
Transformer-based nowcasting of radar composites from satellite images for severe weather はコメントを受け付けていません
Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study
要約 コンピューター断層撮影 (CT) による肺気腫の確実な定量化は、さまざまな … 続きを読む
カテゴリー: cs.CV
Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study はコメントを受け付けていません
Multimodal Transformer for Comics Text-Cloze
要約 この作品は、視覚的要素とテキスト要素が複雑に絡み合っている媒体であるコミッ … 続きを読む
カテゴリー: cs.CV
Multimodal Transformer for Comics Text-Cloze はコメントを受け付けていません
CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D Object Detection
要約 最近の LiDAR ベースの 3D 物体検出 (3DOD) 手法は有望な結 … 続きを読む
Bridging Diversity and Uncertainty in Active learning with Self-Supervised Pre-Training
要約 この研究は、特に自己教師付き事前トレーニング済みモデルのコンテキスト内での … 続きを読む
Learning 3D object-centric representation through prediction
要約 人間の核となる知識の一部として、オブジェクトの表現は、高レベルの概念と象徴 … 続きを読む
Towards Concept-based Interpretability of Skin Lesion Diagnosis using Vision-Language Models
要約 医療専門家が病変の一連の視覚パターンに基づいて決定を下すため、コンセプトベ … 続きを読む
カテゴリー: cs.CV
Towards Concept-based Interpretability of Skin Lesion Diagnosis using Vision-Language Models はコメントを受け付けていません
Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer
要約 生成圧縮技術の最近の進歩により、圧縮データの知覚品質が大幅に向上しました。 … 続きを読む
Self-supervised Photographic Image Layout Representation Learning
要約 画像レイアウト表現学習の領域では、画像レイアウトを簡潔なベクトル形式に変換 … 続きを読む