-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
A Methodology to Evaluate Strategies Predicting Rankings on Unseen Domains
要約 多くの場合、複数のエンティティ(メソッド、アルゴリズム、手順、ソリューショ … 続きを読む
Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology
要約 計算病理学で全体のスライド画像(WSI)を効率的に統合するための重要なステ … 続きを読む
LENS: Multi-level Evaluation of Multimodal Reasoning with Large Language Models
要約 マルチモーダル大手言語モデル(MLLM)は、視覚的および言語情報の統合に大 … 続きを読む
カテゴリー: cs.CV
LENS: Multi-level Evaluation of Multimodal Reasoning with Large Language Models はコメントを受け付けていません
SNAP: A Benchmark for Testing the Effects of Capture Conditions on Fundamental Vision Tasks
要約 Deep-Rearningベースの(DL)コンピュータービジョンアルゴリズ … 続きを読む
カテゴリー: cs.CV
SNAP: A Benchmark for Testing the Effects of Capture Conditions on Fundamental Vision Tasks はコメントを受け付けていません
Oral Imaging for Malocclusion Issues Assessments: OMNI Dataset, Deep Learning Baselines and Benchmarking
要約 不正咬合は歯科矯正の主要な課題であり、その複雑な症状と多様な臨床症状により … 続きを読む
カテゴリー: cs.CV
Oral Imaging for Malocclusion Issues Assessments: OMNI Dataset, Deep Learning Baselines and Benchmarking はコメントを受け付けていません
FragFake: A Dataset for Fine-Grained Detection of Edited Images with Vision Language Models
要約 特に、最新の拡散モデルと画像編集方法が非常に現実的な操作を生成する可能性が … 続きを読む
How far can we go with ImageNet for Text-to-Image generation?
要約 最近のテキストからイメージの生成モデルは、「より大きなISが優れている」パ … 続きを読む
カテゴリー: cs.CV
How far can we go with ImageNet for Text-to-Image generation? はコメントを受け付けていません
The Devil is in Fine-tuning and Long-tailed Problems:A New Benchmark for Scene Text Detection
要約 シーンのテキスト検出では、アカデミックベンチマークで優れた高性能な方法の出 … 続きを読む
カテゴリー: cs.CV
The Devil is in Fine-tuning and Long-tailed Problems:A New Benchmark for Scene Text Detection はコメントを受け付けていません
Exploring the Limits of Vision-Language-Action Manipulations in Cross-task Generalization
要約 目に見えないタスクに対するビジョン言語アクション(VLA)モデルの一般化能 … 続きを読む
Gompertz Linear Units: Leveraging Asymmetry for Enhanced Learning Dynamics
要約 活性化関数は、トレーニングのダイナミクスに大きな影響を与えるため、深い学習 … 続きを読む