投稿者「jarxiv」のアーカイブ

Efficient Listener: Dyadic Facial Motion Synthesis via Action Diffusion

要約 ダイアディックな会話における現実的なリスナーの顔の動きを生成することは、高 … 続きを読む

カテゴリー: cs.CV, cs.HC | Efficient Listener: Dyadic Facial Motion Synthesis via Action Diffusion はコメントを受け付けていません

In-Context Edit: Enabling Instructional Image Editing with In-Context Generation in Large Scale Diffusion Transformer

要約 命令ベースの画像編集により、自然言語プロンプトを介した堅牢な画像変更が可能 … 続きを読む

カテゴリー: cs.CV | In-Context Edit: Enabling Instructional Image Editing with In-Context Generation in Large Scale Diffusion Transformer はコメントを受け付けていません

Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images

要約 医療画像の識別は、研究および臨床環境でのデータ共有中にプライバシーを確​​ … 続きを読む

カテゴリー: cs.CV | Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images はコメントを受け付けていません

Instruct-ReID: A Multi-purpose Person Re-identification Task with Instructions

要約 人間の知性は、視覚と言語の両方の説明に従って、すべての人を取得できます。 … 続きを読む

カテゴリー: cs.CV | Instruct-ReID: A Multi-purpose Person Re-identification Task with Instructions はコメントを受け付けていません

SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation

要約 慣用的な表現は、NLPにユニークな課題を提示します。その意味は、構成要素の … 続きを読む

カテゴリー: cs.CL, cs.CV, I.2.7 | SemEval-2025 Task 1: AdMIRe — Advancing Multimodal Idiomaticity Representation はコメントを受け付けていません

Practical solutions to the relative pose of three calibrated cameras

要約 4つのポイント通信から3つの較正カメラの相対的なポーズを推定するという挑戦 … 続きを読む

カテゴリー: cs.CV | Practical solutions to the relative pose of three calibrated cameras はコメントを受け付けていません

Learning a General Model: Folding Clothing with Topological Dynamics

要約 高度の自由度と衣服の複雑な構造は、衣服の操作に大きな課題をもたらします。 … 続きを読む

カテゴリー: cs.CV, cs.RO | Learning a General Model: Folding Clothing with Topological Dynamics はコメントを受け付けていません

4D mmWave Radar for Sensing Enhancement in Adverse Environments: Advances and Challenges

要約 インテリジェントな輸送システムには、正確で信頼できるセンシングが必要です。 … 続きを読む

カテゴリー: cs.CV | 4D mmWave Radar for Sensing Enhancement in Adverse Environments: Advances and Challenges はコメントを受け付けていません

UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granularities

要約 検索された生成(RAG)は、クエリに関連する外部知識をモデルの応答に接地す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granularities はコメントを受け付けていません

A Survey on Event-based Optical Marker Systems

要約 レイテンシが低く、ダイナミックレンジが高く、消費電力が削減されたイベントベ … 続きを読む

カテゴリー: cs.CV, cs.RO | A Survey on Event-based Optical Marker Systems はコメントを受け付けていません