-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
Efficient Contrastive Decoding with Probabilistic Hallucination Detection – Mitigating Hallucinations in Large Vision Language Models –
要約 大規模なビジョン言語モデル(LVLMS)の最近の進歩にもかかわらず、これら … 続きを読む
OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning
要約 ビジョン言語モデル(VLM)の進歩により、強力な推論能力を活用するための自 … 続きを読む
カテゴリー: cs.CV
OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning はコメントを受け付けていません
Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction
要約 ドキュメント解析は、契約、学術論文、請求書などの非構造化および半構造化され … 続きを読む
FocusedAD: Character-centric Movie Audio Description
要約 映画オーディオの説明(AD)は、対話のないセグメント中に視覚的なコンテンツ … 続きを読む
StructRe: Rewriting for Structured Shape Modeling
要約 人工の3D形状は、部品と階層で自然に編成されています。 このような構造は、 … 続きを読む
カテゴリー: cs.CV
StructRe: Rewriting for Structured Shape Modeling はコメントを受け付けていません
Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification
要約 少ないショット画像分類は、コンピュータービジョンの分野、特にデータスカース … 続きを読む
カテゴリー: cs.CV
Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification はコメントを受け付けていません
Exploring Self-supervised Skeleton-based Action Recognition in Occluded Environments
要約 アクション認識を自律的なロボットシステムに統合するには、人の閉塞などの課題 … 続きを読む
OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning
要約 ビジョン言語モデル(VLM)の進歩により、強力な推論能力を活用するための自 … 続きを読む
カテゴリー: cs.CV
OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning はコメントを受け付けていません
Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks
要約 高高度プラットフォームステーション(HAPS)によってサポートされている非 … 続きを読む
Deep Anatomical Federated Network (Dafne): An open client-server framework for the continuous, collaborative improvement of deep learning-based medical image segmentation
要約 目的:Dafne(深い解剖学的フェデレーションネットワーク)を提示して評価 … 続きを読む