投稿者「jarxiv」のアーカイブ

Are Vision-Language Models Ready for Dietary Assessment? Exploring the Next Frontier in AI-Powered Food Image Recognition

要約 食品の画像に基づいた自動食事評価は依然として課題であり、正確な食品検出、セ … 続きを読む

カテゴリー: cs.AI, cs.CV | Are Vision-Language Models Ready for Dietary Assessment? Exploring the Next Frontier in AI-Powered Food Image Recognition はコメントを受け付けていません

Towards Communication-Efficient Adversarial Federated Learning for Robust Edge Intelligence

要約 Federated Learning(FL)は、生データを公開せずにエッジ … 続きを読む

カテゴリー: cs.CV | Towards Communication-Efficient Adversarial Federated Learning for Robust Edge Intelligence はコメントを受け付けていません

PathSegDiff: Pathology Segmentation using Diffusion model representations

要約 画像セグメンテーションは、正確な疾患診断、サブタイピング、結果、生存可能性 … 続きを読む

カテゴリー: cs.CV | PathSegDiff: Pathology Segmentation using Diffusion model representations はコメントを受け付けていません

A Comparison of Deep Learning Methods for Cell Detection in Digital Cytology

要約 多くの生物医学的画像分析タスクでは、正確で効率的な細胞検出が重要です。 予 … 続きを読む

カテゴリー: cs.CV | A Comparison of Deep Learning Methods for Cell Detection in Digital Cytology はコメントを受け付けていません

VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning

要約 補強学習における最近の進歩により、マルチモーダルの大手言語モデル(MLLM … 続きを読む

カテゴリー: cs.CV | VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning はコメントを受け付けていません

Two by Two: Learning Multi-Task Pairwise Objects Assembly for Generalizable Robot Manipulation

要約 家具アセンブリやコンポーネントフィッティングなどの3Dアセンブリタスクは、 … 続きを読む

カテゴリー: cs.CV, cs.RO | Two by Two: Learning Multi-Task Pairwise Objects Assembly for Generalizable Robot Manipulation はコメントを受け付けていません

Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation

要約 自己学習学習(SSL)により、地球観察のためのVision Foundat … 続きを読む

カテゴリー: cs.AI, cs.CV | Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation はコメントを受け付けていません

A Deep Single Image Rectification Approach for Pan-Tilt-Zoom Cameras

要約 広角レンズを備えたパンチルトズーム(PTZ)カメラは、監視に広く使用されて … 続きを読む

カテゴリー: cs.CV | A Deep Single Image Rectification Approach for Pan-Tilt-Zoom Cameras はコメントを受け付けていません

Wheat3DGS: In-field 3D Reconstruction, Instance Segmentation and Phenotyping of Wheat Heads with Gaussian Splatting

要約 植物の形態学的特性の自動抽出は、ハイスループットフィールド表現型(HTFP … 続きを読む

カテゴリー: cs.CV | Wheat3DGS: In-field 3D Reconstruction, Instance Segmentation and Phenotyping of Wheat Heads with Gaussian Splatting はコメントを受け付けていません

SIGMAN:Scaling 3D Human Gaussian Generation with Millions of Assets

要約 3D人間のデジタル化は、長い間、非常に追求されているが挑戦的な作業でした。 … 続きを読む

カテゴリー: cs.CV | SIGMAN:Scaling 3D Human Gaussian Generation with Millions of Assets はコメントを受け付けていません