-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
投稿者「jarxiv」のアーカイブ
Rasterizing Wireless Radiance Field via Deformable 2D Gaussian Splatting
要約 ワイヤレスラディアンスフィールド(WRF)のモデリングは、最新の通信システ … 続きを読む
Hunyuan3D 2.1: From Images to High-Fidelity 3D Assets with Production-Ready PBR Material
要約 3D AI-Generated Content(AIGC)は、ゲーム、映画 … 続きを読む
RefChartQA: Grounding Visual Answer on Chart Images through Instruction Tuning
要約 最近、Vision Language Models(VLM)は、より良い人 … 続きを読む
Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation
要約 カテゴリレベルのオブジェクトのポーズ推定は、事前に定義されたカテゴリから以 … 続きを読む
Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation
要約 セマンティックセグメンテーション(DGSS)におけるオープンボキャブラリー … 続きを読む
Multimodal Large Language Models for Medical Report Generation via Customized Prompt Tuning
要約 イメージングデータからの医療報告書の生成は、臨床診療における困難なタスクの … 続きを読む
GenHOI: Generalizing Text-driven 4D Human-Object Interaction Synthesis for Unseen Objects
要約 拡散モデルと大規模なモーションデータセットは、テキスト駆動型のヒトモーショ … 続きを読む
Unsourced Adversarial CAPTCHA: A Bi-Phase Adversarial CAPTCHA Framework
要約 深い学習の急速な進歩により、従来のキャプチャスキームは、深いニューラルネッ … 続きを読む
Advanced cervical cancer classification: enhancing pap smear images with hybrid PMD Filter-CLAHE
要約 子宮頸がんは、特に発展途上国では重大な健康問題のままです。 効果的な治療に … 続きを読む