-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年1月
MVP: Multimodal Emotion Recognition based on Video and Physiological Signals
要約 人間の感情には、行動、生理学的、認知の複雑な変化が伴います。 現在の最先端 … 続きを読む
Task-Agnostic Federated Learning
要約 医療画像の分野では、さまざまな機関からの大規模なデータセットを活用すること … 続きを読む
ETO:Efficient Transformer-based Local Feature Matching by Organizing Multiple Homography Hypotheses
要約 局所特徴マッチングの学習効率の問題に取り組みます。 最近の進歩により、純粋 … 続きを読む
カテゴリー: cs.CV
ETO:Efficient Transformer-based Local Feature Matching by Organizing Multiple Homography Hypotheses はコメントを受け付けていません
CAT: Content-Adaptive Image Tokenization
要約 既存の画像トークナイザーのほとんどは、画像を固定数のトークンまたはパッチに … 続きを読む
カテゴリー: cs.CV
CAT: Content-Adaptive Image Tokenization はコメントを受け付けていません
Normalizing Batch Normalization for Long-Tailed Recognition
要約 実際のシナリオでは、クラス全体のトレーニング サンプルの数は通常、ロングテ … 続きを読む
カテゴリー: cs.CV
Normalizing Batch Normalization for Long-Tailed Recognition はコメントを受け付けていません
SCRREAM : SCan, Register, REnder And Map:A Framework for Annotating Accurate and Dense 3D Indoor Scenes with a Benchmark
要約 従来、3D 屋内データセットは一般的に、一般化を向上させるために、グラウン … 続きを読む
カテゴリー: cs.CV
SCRREAM : SCan, Register, REnder And Map:A Framework for Annotating Accurate and Dense 3D Indoor Scenes with a Benchmark はコメントを受け付けていません
Geometry Restoration and Dewarping of Camera-Captured Document Images
要約 この研究は、検出、セグメンテーション、ジオメトリ復元、歪み補正のアルゴリズ … 続きを読む
Large language models for artificial general intelligence (AGI): A survey of foundational principles and approaches
要約 視覚言語モデル、大規模言語モデル (LLM)、拡散モデル、視覚言語行動 ( … 続きを読む
Segment Anything Model for Zero-shot Single Particle Tracking in Liquid Phase Transmission Electron Microscopy
要約 液相透過電子顕微鏡 (LPTEM) は、比類のない空間分解能と時間分解能の … 続きを読む
カテゴリー: cs.CV, physics.data-an
Segment Anything Model for Zero-shot Single Particle Tracking in Liquid Phase Transmission Electron Microscopy はコメントを受け付けていません
MObI: Multimodal Object Inpainting Using Diffusion Models
要約 自動運転などの安全性が重要なアプリケーションでは、厳密なテストのために広範 … 続きを読む
カテゴリー: cs.CV
MObI: Multimodal Object Inpainting Using Diffusion Models はコメントを受け付けていません