-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年4月
InteractAvatar: Modeling Hand-Face Interaction in Photorealistic Avatars with Deformable Gaussians
要約 デジタルアバターのコミュニティからの関心が高まっているため、コミュニケーシ … 続きを読む
カテゴリー: cs.CV
InteractAvatar: Modeling Hand-Face Interaction in Photorealistic Avatars with Deformable Gaussians はコメントを受け付けていません
Scaling Laws for Native Multimodal Models Scaling Laws for Native Multimodal Models
要約 マルチモーダル信号を通じて世界を効果的に知覚できる汎用モデルの構築は、長年 … 続きを読む
カテゴリー: cs.CV
Scaling Laws for Native Multimodal Models Scaling Laws for Native Multimodal Models はコメントを受け付けていません
Perception-R1: Pioneering Perception Policy with Reinforcement Learning
要約 DeepSeek-R1の成功に触発されて、知覚政策学習のためのトレーニング … 続きを読む
BoxDreamer: Dreaming Box Corners for Generalizable Object Pose Estimation
要約 このペーパーでは、オブジェクトポーズ推定のための一般化可能なRGBベースの … 続きを読む
カテゴリー: cs.CV
BoxDreamer: Dreaming Box Corners for Generalizable Object Pose Estimation はコメントを受け付けていません
VCR-Bench: A Comprehensive Evaluation Framework for Video Chain-of-Thought Reasoning
要約 考え方(COT)の推論の進歩により、大規模な言語モデル(LLMS)と大規模 … 続きを読む
MM-IFEngine: Towards Multimodal Instruction Following
要約 次の(IF)能力は、マルチモーダルの大手言語モデル(MLLM)がどの程度よ … 続きを読む
カテゴリー: cs.CV
MM-IFEngine: Towards Multimodal Instruction Following はコメントを受け付けていません
Detect Anything 3D in the Wild
要約 密集した3Dオブジェクトの検出における深い学習の成功にもかかわらず、既存の … 続きを読む
カテゴリー: cs.CV
Detect Anything 3D in the Wild はコメントを受け付けていません
CCMNet: Leveraging Calibrated Color Correction Matrices for Cross-Camera Color Constancy
要約 計算色の恒常性、または白いバランスは、シーン照明から鋳造された色を修正する … 続きを読む
カテゴリー: cs.CV
CCMNet: Leveraging Calibrated Color Correction Matrices for Cross-Camera Color Constancy はコメントを受け付けていません
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning
要約 拡散モデルの最近の進歩は、さまざまな画像生成タスクを大幅に進めています。 … 続きを読む
カテゴリー: cs.CV
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning はコメントを受け付けていません
Interactive4D: Interactive 4D LiDAR Segmentation
要約 インタラクティブなセグメンテーションは、将来のLIDARデータセットの注釈 … 続きを読む
カテゴリー: cs.CV
Interactive4D: Interactive 4D LiDAR Segmentation はコメントを受け付けていません