-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Hard Negative Contrastive Learning for Fine-Grained Geometric Understanding in Large Multimodal Models
要約 大規模な自然なシーン画像で対比訓練された視覚エンコーダーの恩恵を受けて、大 … 続きを読む
HunyuanVideo-Avatar: High-Fidelity Audio-Driven Human Animation for Multiple Characters
要約 近年、オーディオ駆動型の人間のアニメーションの大きな進歩が目撃されています … 続きを読む
カテゴリー: cs.CV
HunyuanVideo-Avatar: High-Fidelity Audio-Driven Human Animation for Multiple Characters はコメントを受け付けていません
STAR-R1: Spatial TrAnsformation Reasoning by Reinforcing Multimodal LLMs
要約 マルチモーダル大手言語モデル(MLLM)は、多様なタスク全体で顕著な能力を … 続きを読む
カテゴリー: cs.CV
STAR-R1: Spatial TrAnsformation Reasoning by Reinforcing Multimodal LLMs はコメントを受け付けていません
Long-Context State-Space Video World Models
要約 ビデオ拡散モデルは最近、アクションを条件とする自己回帰フレーム予測を通じて … 続きを読む
カテゴリー: cs.CV
Long-Context State-Space Video World Models はコメントを受け付けていません
AW-GATCN: Adaptive Weighted Graph Attention Convolutional Network for Event Camera Data Joint Denoising and Object Recognition
要約 輝度が高い時間分解能で変化するイベントカメラは、本質的に重要なオブジェクト … 続きを読む
カテゴリー: cs.CV
AW-GATCN: Adaptive Weighted Graph Attention Convolutional Network for Event Camera Data Joint Denoising and Object Recognition はコメントを受け付けていません
EVM-Fusion: An Explainable Vision Mamba Architecture with Neural Algorithmic Fusion
要約 医療画像の分類は臨床的意思決定には重要ですが、正確性、解釈可能性、一般化に … 続きを読む
PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology
要約 Pathology Foundationモデルの出現は、計算組織病理学に革 … 続きを読む
カテゴリー: cs.CV
PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology はコメントを受け付けていません
Probabilistic Interactive 3D Segmentation with Hierarchical Neural Processes
要約 インタラクティブな3Dセグメンテーションは、ユーザーが提供するクリックを組 … 続きを読む
カテゴリー: cs.CV
Probabilistic Interactive 3D Segmentation with Hierarchical Neural Processes はコメントを受け付けていません
Open the Eyes of MPNN: Vision Enhances MPNN in Link Prediction
要約 メッセージパスグラフニューラルネットワーク(MPNNS)と構造的特徴(SF … 続きを読む
Multimodal Federated Learning With Missing Modalities through Feature Imputation Network
要約 マルチモーダルフェデレーションラーニングは、生データを共有せずに複数のソー … 続きを読む