月別アーカイブ: 2024年1月

Uncovering the human motion pattern: Pattern Memory-based Diffusion Model for Trajectory Prediction

要約 人間の軌跡予測は、ロボット工学や自動運転などの分野において重要な課題です。 … 続きを読む

カテゴリー: cs.CV | Uncovering the human motion pattern: Pattern Memory-based Diffusion Model for Trajectory Prediction はコメントを受け付けていません

Language-free Compositional Action Generation via Decoupling Refinement

要約 単純な要素を複雑なコンセプトに組み込むことは、特に 3D アクション生成の … 続きを読む

カテゴリー: cs.CV | Language-free Compositional Action Generation via Decoupling Refinement はコメントを受け付けていません

SPFormer: Enhancing Vision Transformer with Superpixel Representation

要約 この作品では、スーパーピクセル表現によって強化された新しいビジョン トラン … 続きを読む

カテゴリー: cs.CV | SPFormer: Enhancing Vision Transformer with Superpixel Representation はコメントを受け付けていません

Enhancing Network Initialization for Medical AI Models Using Large-Scale, Unlabeled Natural Images

要約 ImageNet のような事前トレーニング データセットは、医療画像分析の … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Enhancing Network Initialization for Medical AI Models Using Large-Scale, Unlabeled Natural Images はコメントを受け付けていません

Locally Adaptive Neural 3D Morphable Models

要約 3D メッシュの生成と操作を学習するための柔軟性の高い自動エンコーダー ( … 続きを読む

カテゴリー: cs.CV | Locally Adaptive Neural 3D Morphable Models はコメントを受け付けていません

TreeLearn: A Comprehensive Deep Learning Method for Segmenting Individual Trees from Ground-Based LiDAR Forest Point Clouds

要約 レーザースキャンされた森林の点群により、森林管理のための貴重な情報を抽出す … 続きを読む

カテゴリー: cs.CV | TreeLearn: A Comprehensive Deep Learning Method for Segmenting Individual Trees from Ground-Based LiDAR Forest Point Clouds はコメントを受け付けていません

Open-Vocabulary SAM: Segment and Recognize Twenty-thousand Classes Interactively

要約 CLIP および Segment Anything Model (SAM) … 続きを読む

カテゴリー: cs.CV | Open-Vocabulary SAM: Segment and Recognize Twenty-thousand Classes Interactively はコメントを受け付けていません

MC-ViViT: Multi-branch Classifier-ViViT to detect Mild Cognitive Impairment in older adults using facial videos

要約 畳み込みニューラル ネットワーク (CNN) を含む深層機械学習モデルは、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MC-ViViT: Multi-branch Classifier-ViViT to detect Mild Cognitive Impairment in older adults using facial videos はコメントを受け付けていません

Denoising Vision Transformers

要約 私たちは、ビジョン トランスフォーマー (ViT) に固有の微妙だが重要な … 続きを読む

カテゴリー: cs.CV | Denoising Vision Transformers はコメントを受け付けていません

Retrieval-Augmented Generation for Large Language Models: A Survey

要約 大規模言語モデル (LLM) は重要な機能を実証していますが、幻覚、古い知 … 続きを読む

カテゴリー: cs.AI, cs.CL | Retrieval-Augmented Generation for Large Language Models: A Survey はコメントを受け付けていません