-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
Explaining Low Perception Model Competency with High-Competency Counterfactuals
要約 画像分類モデルがその決定を生成する方法を説明する多くの方法が存在しますが、 … 続きを読む
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction
要約 データ表現の選択は、幾何学的なタスクにおける深い学習の成功における重要な要 … 続きを読む
カテゴリー: cs.CV
DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction はコメントを受け付けていません
TflosYOLO+TFSC: An Accurate and Robust Model for Estimating Flower Count and Flowering Period
要約 茶の花は、茶植物の分類学的研究とハイブリッド繁殖において重要な役割を果たし … 続きを読む
From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models
要約 拡張現実(XR)では、ユーザーの全身動きを生成することは、自分の行動を理解 … 続きを読む
カテゴリー: cs.CV
From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models はコメントを受け付けていません
FetalCLIP: A Visual-Language Foundation Model for Fetal Ultrasound Image Analysis
要約 基礎モデルは、医療ドメインでますます効果的になりつつあり、下流のタスクに容 … 続きを読む
AnomalousNet: A Hybrid Approach with Attention U-Nets and Change Point Detection for Accurate Characterization of Anomalous Diffusion in Video Data
要約 異常な拡散は、細胞内のタンパク質輸送、複雑な生息地の動物の動き、地下水の汚 … 続きを読む
LiveVQA: Live Visual Knowledge Seeking
要約 合成されたVQA問題を備えたインターネットからの最新の視覚知識の自動的に収 … 続きを読む
Let it Snow! Animating Static Gaussian Scenes With Dynamic Weather Effects
要約 3D Gaussian Splattingは最近、静的3Dシーンの高速かつ … 続きを読む
One-Minute Video Generation with Test-Time Training
要約 今日のトランスフォーマーは、自己触媒層が長いコンテキストでは非効率的である … 続きを読む
カテゴリー: cs.CV
One-Minute Video Generation with Test-Time Training はコメントを受け付けていません
SmolVLM: Redefining small and efficient multimodal models
要約 大規模なビジョン言語モデル(VLM)は、例外的なパフォーマンスを提供します … 続きを読む