-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年5月
Anatomical Similarity as a New Metric to Evaluate Brain Generative Models
要約 生成モデルは、データ増強、品質改善、およびまれな状態研究により、ニューロイ … 続きを読む
カテゴリー: cs.CV
Anatomical Similarity as a New Metric to Evaluate Brain Generative Models はコメントを受け付けていません
LoC-LIC: Low Complexity Learned Image Coding Using Hierarchical Feature Transforms
要約 現在、学習した画像圧縮モデルは通常、高い複雑さを示し、重要な計算リソースを … 続きを読む
Anomaly-Driven Approach for Enhanced Prostate Cancer Segmentation
要約 磁気共鳴イメージング(MRI)は、臨床的に重要な前立腺癌(CSPCA)を特 … 続きを読む
Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals
要約 大規模な言語モデル(LLM)がますます印象的な機能を備えているため、視覚入 … 続きを読む
カテゴリー: cs.CV
Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals はコメントを受け付けていません
A simple and effective approach for body part recognition on CT scans based on projection estimation
要約 機械学習モデルには、最適なパフォーマンスを得るために大量の注釈付きデータが … 続きを読む
Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles
要約 ポイントクラウドの表現は最近、コンピュータービジョンの分野での研究ホットス … 続きを読む
カテゴリー: cs.CV
Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles はコメントを受け付けていません
Explorations of the Softmax Space: Knowing When the Neural Network Doesn’t Know
要約 人工知能システムが重要な状況でより広く展開されるため、ニューラルネットワー … 続きを読む
Why Compress What You Can Generate? When GPT-4o Generation Ushers in Image Compression Fields
要約 AIGC Foundationモデルの急速な発展は、画像圧縮のパラダイムに … 続きを読む
カテゴリー: cs.CV
Why Compress What You Can Generate? When GPT-4o Generation Ushers in Image Compression Fields はコメントを受け付けていません
Early Exit and Multi Stage Knowledge Distillation in VLMs for Video Summarization
要約 Deevisum(要約のための蒸留早期出口ビジョン言語モデル)を紹介します … 続きを読む
ObjectFinder: An Open-Vocabulary Assistive System for Interactive Object Search by Blind People
要約 なじみのないシナリオでオブジェクトを検索することは、盲人にとって挑戦的な作 … 続きを読む