-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace Projection
要約 最近の研究では、大きな視覚言語モデル(LVLM)がしばしばオブジェクトの幻 … 続きを読む
カテゴリー: cs.CV
Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace Projection はコメントを受け付けていません
LEAVS: An LLM-based Labeler for Abdominal CT Supervision
要約 放射線レポートから構造化されたラベルの抽出が採用されており、視力モデルを作 … 続きを読む
STEP: Simultaneous Tracking and Estimation of Pose for Animals and Humans
要約 私たちは、多様な動物種や人間にわたるポーズの同時追跡と推定のために、変圧器 … 続きを読む
カテゴリー: cs.CV
STEP: Simultaneous Tracking and Estimation of Pose for Animals and Humans はコメントを受け付けていません
Spatio-Temporal Distortion Aware Omnidirectional Video Super-Resolution
要約 全方向性ビデオ(ODV)は没入型の視覚体験を提供し、仮想現実と拡張現実で広 … 続きを読む
カテゴリー: cs.CV
Spatio-Temporal Distortion Aware Omnidirectional Video Super-Resolution はコメントを受け付けていません
TriDF: Triplane-Accelerated Density Fields for Few-Shot Remote Sensing Novel View Synthesis
要約 リモートセンシング新規ビュー合成(NVS)は、都市計画と環境監視における重 … 続きを読む
カテゴリー: cs.CV
TriDF: Triplane-Accelerated Density Fields for Few-Shot Remote Sensing Novel View Synthesis はコメントを受け付けていません
GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting
要約 3D Gaussian Splatting(3DGS)は、最近、さまざまな … 続きを読む
Parameter-free structure-texture image decomposition by unrolling
要約 この作業では、構造テクスチャー画像分解問題に取り組むためのパラメーターフリ … 続きを読む
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation
要約 スーパー解像度(SR)の拡散モデルは、高品質の視覚的結果を生成しますが、高 … 続きを読む
カテゴリー: cs.CV
One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation はコメントを受け付けていません
Mitigating Visual Forgetting via Take-along Visual Conditioning for Multi-modal Long CoT Reasoning
要約 大規模な言語モデル(LLMS)の最近の進歩は、推論能力の強化を実証しており … 続きを読む
Structure-Activation Synergy: A Dual Efficiency Framework for Parameter-Memory Optimized Transfer Learning
要約 パラメーター効率の高い転送学習(PETL)は、大規模な事前訓練モデルを適応 … 続きを読む
カテゴリー: cs.CV
Structure-Activation Synergy: A Dual Efficiency Framework for Parameter-Memory Optimized Transfer Learning はコメントを受け付けていません