-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年6月
Rasterizing Wireless Radiance Field via Deformable 2D Gaussian Splatting
要約 ワイヤレスラディアンスフィールド(WRF)のモデリングは、最新の通信システ … 続きを読む
カテゴリー: cs.CV
Rasterizing Wireless Radiance Field via Deformable 2D Gaussian Splatting はコメントを受け付けていません
Hunyuan3D 2.1: From Images to High-Fidelity 3D Assets with Production-Ready PBR Material
要約 3D AI-Generated Content(AIGC)は、ゲーム、映画 … 続きを読む
RefChartQA: Grounding Visual Answer on Chart Images through Instruction Tuning
要約 最近、Vision Language Models(VLM)は、より良い人 … 続きを読む
カテゴリー: cs.CV
RefChartQA: Grounding Visual Answer on Chart Images through Instruction Tuning はコメントを受け付けていません
Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation
要約 カテゴリレベルのオブジェクトのポーズ推定は、事前に定義されたカテゴリから以 … 続きを読む
カテゴリー: cs.CV
Instance-Adaptive Keypoint Learning with Local-to-Global Geometric Aggregation for Category-Level Object Pose Estimation はコメントを受け付けていません
Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation
要約 セマンティックセグメンテーション(DGSS)におけるオープンボキャブラリー … 続きを読む
カテゴリー: cs.CV
Leveraging Depth and Language for Open-Vocabulary Domain-Generalized Semantic Segmentation はコメントを受け付けていません
Multimodal Large Language Models for Medical Report Generation via Customized Prompt Tuning
要約 イメージングデータからの医療報告書の生成は、臨床診療における困難なタスクの … 続きを読む
カテゴリー: cs.CV
Multimodal Large Language Models for Medical Report Generation via Customized Prompt Tuning はコメントを受け付けていません
GenHOI: Generalizing Text-driven 4D Human-Object Interaction Synthesis for Unseen Objects
要約 拡散モデルと大規模なモーションデータセットは、テキスト駆動型のヒトモーショ … 続きを読む
Unsourced Adversarial CAPTCHA: A Bi-Phase Adversarial CAPTCHA Framework
要約 深い学習の急速な進歩により、従来のキャプチャスキームは、深いニューラルネッ … 続きを読む
Advanced cervical cancer classification: enhancing pap smear images with hybrid PMD Filter-CLAHE
要約 子宮頸がんは、特に発展途上国では重大な健康問題のままです。 効果的な治療に … 続きを読む
Pixel-level Certified Explanations via Randomized Smoothing
要約 事後帰属方法は、影響力のある入力ピクセルを強調することにより、深い学習予測 … 続きを読む