月別アーカイブ: 2025年4月

OG-HFYOLO :Orientation gradient guidance and heterogeneous feature fusion for deformation table cell instance segmentation

要約 テーブル構造の認識は、ドキュメント分析の重要なタスクです。 ただし、変形テ … 続きを読む

カテゴリー: cs.CV | OG-HFYOLO :Orientation gradient guidance and heterogeneous feature fusion for deformation table cell instance segmentation はコメントを受け付けていません

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

要約 RGB入力のみを使用して、高速かつ正確な単眼シーンの再構成を実現する幾何学 … 続きを読む

カテゴリー: cs.CV, cs.RO | HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction はコメントを受け付けていません

Efficient Listener: Dyadic Facial Motion Synthesis via Action Diffusion

要約 ダイアディックな会話における現実的なリスナーの顔の動きを生成することは、高 … 続きを読む

カテゴリー: cs.CV, cs.HC | Efficient Listener: Dyadic Facial Motion Synthesis via Action Diffusion はコメントを受け付けていません

In-Context Edit: Enabling Instructional Image Editing with In-Context Generation in Large Scale Diffusion Transformer

要約 命令ベースの画像編集により、自然言語プロンプトを介した堅牢な画像変更が可能 … 続きを読む

カテゴリー: cs.CV | In-Context Edit: Enabling Instructional Image Editing with In-Context Generation in Large Scale Diffusion Transformer はコメントを受け付けていません

Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images

要約 医療画像の識別は、研究および臨床環境でのデータ共有中にプライバシーを確​​ … 続きを読む

カテゴリー: cs.CV | Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images はコメントを受け付けていません

Instruct-ReID: A Multi-purpose Person Re-identification Task with Instructions

要約 人間の知性は、視覚と言語の両方の説明に従って、すべての人を取得できます。 … 続きを読む

カテゴリー: cs.CV | Instruct-ReID: A Multi-purpose Person Re-identification Task with Instructions はコメントを受け付けていません

SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation

要約 慣用的な表現は、NLPにユニークな課題を提示します。その意味は、構成要素の … 続きを読む

カテゴリー: cs.CL, cs.CV, I.2.7 | SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation はコメントを受け付けていません

Practical solutions to the relative pose of three calibrated cameras

要約 4つのポイント通信から3つの較正カメラの相対的なポーズを推定するという挑戦 … 続きを読む

カテゴリー: cs.CV | Practical solutions to the relative pose of three calibrated cameras はコメントを受け付けていません

Learning a General Model: Folding Clothing with Topological Dynamics

要約 高度の自由度と衣服の複雑な構造は、衣服の操作に大きな課題をもたらします。 … 続きを読む

カテゴリー: cs.CV, cs.RO | Learning a General Model: Folding Clothing with Topological Dynamics はコメントを受け付けていません

4D mmWave Radar for Sensing Enhancement in Adverse Environments: Advances and Challenges

要約 インテリジェントな輸送システムには、正確で信頼できるセンシングが必要です。 … 続きを読む

カテゴリー: cs.CV | 4D mmWave Radar for Sensing Enhancement in Adverse Environments: Advances and Challenges はコメントを受け付けていません