月別アーカイブ: 2024年7月

General Geometry-aware Weakly Supervised 3D Object Detection

要約 3D オブジェクト検出は、シーンを理解するために不可欠なコンポーネントです … 続きを読む

カテゴリー: cs.CV | General Geometry-aware Weakly Supervised 3D Object Detection はコメントを受け付けていません

Pose-guided multi-task video transformer for driver action recognition

要約 私たちは、車内ビデオの分析を通じて脇見運転の状況を特定するタスクを調査しま … 続きを読む

カテゴリー: cs.CV | Pose-guided multi-task video transformer for driver action recognition はコメントを受け付けていません

LogoSticker: Inserting Logos into Diffusion Models for Customized Generation

要約 テキストから画像へのモデルのカスタマイズにおける最近の進歩により、新しい概 … 続きを読む

カテゴリー: cs.CV | LogoSticker: Inserting Logos into Diffusion Models for Customized Generation はコメントを受け付けていません

Exploring Facial Biomarkers for Depression through Temporal Analysis of Action Units

要約 うつ病は、持続的な悲しみと興味の喪失を特徴とし、日常生活の機能を著しく損な … 続きを読む

カテゴリー: cs.CV | Exploring Facial Biomarkers for Depression through Temporal Analysis of Action Units はコメントを受け付けていません

Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion

要約 我々は、オンザフライで合成された都市スケールのシーンを通じて、街並みに相当 … 続きを読む

カテゴリー: cs.CV, cs.GR | Streetscapes: Large-scale Consistent Street View Generation Using Autoregressive Video Diffusion はコメントを受け付けていません

SegPoint: Segment Any Point Cloud via Large Language Model

要約 3D 点群セグメンテーションが大幅に進歩しているにもかかわらず、既存の方法 … 続きを読む

カテゴリー: cs.CV | SegPoint: Segment Any Point Cloud via Large Language Model はコメントを受け付けていません

Shape of Motion: 4D Reconstruction from a Single Video

要約 単眼の動的再構成は、非常に不適切な作業であるため、長年にわたる困難な視覚問 … 続きを読む

カテゴリー: cs.CV | Shape of Motion: 4D Reconstruction from a Single Video はコメントを受け付けていません

Visual Haystacks: Answering Harder Questions About Sets of Images

要約 大規模マルチモーダル モデル (LMM) の最近の進歩により、単一画像によ … 続きを読む

カテゴリー: cs.CV | Visual Haystacks: Answering Harder Questions About Sets of Images はコメントを受け付けていません

Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models

要約 変圧器モデルは大成功を収めているにもかかわらず、依然として詳細に拡張するこ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, I.2.10 | Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models はコメントを受け付けていません

Addressing Imbalance for Class Incremental Learning in Medical Image Classification

要約 ディープ畳み込みニューラル ネットワークは、すべてのクラスのトレーニング … 続きを読む

カテゴリー: cs.CV | Addressing Imbalance for Class Incremental Learning in Medical Image Classification はコメントを受け付けていません