cs.CV」カテゴリーアーカイブ

Synthesizing Environment-Specific People in Photographs

要約 我々は、入力写真に描かれたシーンに意味的に適切な服を着た人物のフォトリアリ … 続きを読む

カテゴリー: cs.CV | Synthesizing Environment-Specific People in Photographs はコメントを受け付けていません

Transferring disentangled representations: bridging the gap between synthetic and real images

要約 データ生成メカニズムの基本構造を分離する、意味のある効率的な表現を開発する … 続きを読む

カテゴリー: cs.AI, cs.CV | Transferring disentangled representations: bridging the gap between synthetic and real images はコメントを受け付けていません

ReliOcc: Towards Reliable Semantic Occupancy Prediction via Uncertainty Learning

要約 視覚中心のセマンティック占有予測は自動運転において重要な役割を果たしており … 続きを読む

カテゴリー: cs.CV, cs.RO | ReliOcc: Towards Reliable Semantic Occupancy Prediction via Uncertainty Learning はコメントを受け付けていません

Exploring Event-based Human Pose Estimation with 3D Event Representations

要約 人間の姿勢推定は、コンピューター ビジョンにおける基本的かつ魅力的なタスク … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.RO, eess.IV | Exploring Event-based Human Pose Estimation with 3D Event Representations はコメントを受け付けていません

EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions

要約 GPT-4o は、多様な感情やトーンの音声会話を可能にするオムニモーダル … 続きを読む

カテゴリー: cs.CL, cs.CV | EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions はコメントを受け付けていません

IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning

要約 画像キャプションの最近の進歩により、画像とテキストのペアのデータの制限を克 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | IFCap: Image-like Retrieval and Frequency-based Entity Filtering for Zero-shot Captioning はコメントを受け付けていません

Revisit Anything: Visual Place Recognition via Image Segment Retrieval

要約 再訪問した場所を正確に認識することは、実体化したエージェントが位置を特定し … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.IR, cs.LG, cs.RO | Revisit Anything: Visual Place Recognition via Image Segment Retrieval はコメントを受け付けていません

Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers

要約 3D Large Language Model (LLM) の最近の進歩に … 続きを読む

カテゴリー: cs.CV | Chat-Scene: Bridging 3D Scene and Large Language Models with Object Identifiers はコメントを受け付けていません

Visual Data Diagnosis and Debiasing with Concept Graphs

要約 今日の深層学習モデルの広範な成功は、サイズと複雑さが大幅に異なる広範なデー … 続きを読む

カテゴリー: cs.AI, cs.CV | Visual Data Diagnosis and Debiasing with Concept Graphs はコメントを受け付けていません

LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field

要約 最近の研究では、パラメトリック モデル上の神経放射フィールド (NeRF) … 続きを読む

カテゴリー: cs.CV | LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field はコメントを受け付けていません