-
最近の投稿
- SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation
- GeoManip: Geometric Constraints as General Interfaces for Robot Manipulation
- Torque Responsive Metamaterials Enable High Payload Soft Robot Arms
- Visual collective behaviors on spherical robots
- The Dark Side of Rich Rewards: Understanding and Mitigating Noise in VLM Rewards
-
最近のコメント
表示できるコメントはありません。 cs.AI (32458) cs.CL (24535) cs.CR (2513) cs.CV (38657) cs.LG (37326) cs.RO (18908) cs.SY (2892) eess.IV (4630) eess.SY (2886) stat.ML (4924)
投稿者「jarxiv」のアーカイブ
When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents
要約 最新の非参照画質評価 (NR-IQA) モデルは、知覚される画質を効果的に … 続きを読む
Admitting Ignorance Helps the Video Question Answering Models to Answer
要約 ディープラーニングと大規模な事前トレーニングのおかげで、ビデオ質問応答 ( … 続きを読む
3VL: Using Trees to Improve Vision-Language Models’ Interpretability
要約 ビジョン言語モデル (VLM) は、画像とテキスト表現を調整するのに効果的 … 続きを読む
Solving Energy-Independent Density for CT Metal Artifact Reduction via Neural Representation
要約 X 線 CT では、金属材料の存在下で影や縞模様のアーチファクトが発生し、 … 続きを読む
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling
要約 さまざまな画像生成および編集タスクに取り組む命令ベースの拡散フレームワーク … 続きを読む
SemTalk: Holistic Co-speech Motion Generation with Frame-level Semantic Emphasis
要約 良好な共同音声動作生成は、一般的なリズミカルな動作と、まれではあるが不可欠 … 続きを読む
Exploring ChatGPT for Face Presentation Attack Detection in Zero and Few-Shot in-Context Learning
要約 この研究は、顔提示攻撃検出 (PAD) の競合代替手段としての ChatG … 続きを読む
Structural damage detection via hierarchical damage information with volumetric assessment
要約 構造健全性モニタリング (SHM) は、インフラストラクチャの安全性と寿命 … 続きを読む
Multi-visual modality micro drone-based structural damage detection
要約 構造物損傷検出における物体検出器の正確な検出と回復力は、民間インフラの継続 … 続きを読む
Human Pose-Constrained UV Map Estimation
要約 UV マップ推定は、コンピューター ビジョンで人間の姿勢や活動を詳細に分析 … 続きを読む