-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras
要約 HyperComplex画像処理は、代数および幾何学的原理を含む統一された … 続きを読む
CROC: Evaluating and Training T2I Metrics with Pseudo- and Human-Labeled Contrastive Robustness Checks
要約 評価指標(メタ評価)の評価は、テキストからイメージ(T2I)の生成タスクに … 続きを読む
Resolving the Ambiguity of Complete-to-Partial Point Cloud Registration for Image-Guided Liver Surgery with Patches-to-Partial Matching
要約 画像誘導肝臓手術では、術前雲として表されることが多い術前と術中のデータの間 … 続きを読む
カテゴリー: cs.CV
Resolving the Ambiguity of Complete-to-Partial Point Cloud Registration for Image-Guided Liver Surgery with Patches-to-Partial Matching はコメントを受け付けていません
Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models
要約 ビジョン言語モデル(VLM)は、画像キャプションやビデオ質問の回答などのオ … 続きを読む
Inspiring the Next Generation of Segment Anything Models: Comprehensively Evaluate SAM and SAM 2 with Diverse Prompts Towards Context-Dependent Concepts under Different Scenes
要約 基礎モデルとして、SAMはコンピュータービジョン内の複数のフィールドに大き … 続きを読む
カテゴリー: cs.CV
Inspiring the Next Generation of Segment Anything Models: Comprehensively Evaluate SAM and SAM 2 with Diverse Prompts Towards Context-Dependent Concepts under Different Scenes はコメントを受け付けていません
MARRS: Masked Autoregressive Unit-based Reaction Synthesis
要約 この作業は、挑戦的なタスクを目的としています。つまり、人間のアクション反応 … 続きを読む
カテゴリー: cs.CV
MARRS: Masked Autoregressive Unit-based Reaction Synthesis はコメントを受け付けていません
Dynamic Base model Shift for Delta Compression
要約 プレイン式財政パラダイムを備えた変圧器ベースのモデルは、複数のタスク上の微 … 続きを読む
Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?
要約 検証可能な報酬(RLVR)による強化学習は最近、特に数学とプログラミングタ … 続きを読む
Dynam3D: Dynamic Layered 3D Tokens Empower VLM for Vision-and-Language Navigation
要約 Vision-and-Language Navigation(VLN)は、 … 続きを読む
reBEN: Refined BigEarthNet Dataset for Remote Sensing Image Analysis
要約 このペーパーでは、リモートセンシング画像分析のためのディープラーニング(D … 続きを読む