「cs.CV」カテゴリーアーカイブ

OmniEvalKit: A Modular, Lightweight Toolbox for Evaluating Large Language Model and its Omni-Extensions

投稿日: 2024年12月10日作成者: jarxiv

要約大規模言語モデル (LLM) の急速な進歩により、多言語サポートからドメイ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Gen-3Diffusion: Realistic Image-to-3D Generation via 2D & 3D Diffusion Synergy

投稿日: 2024年12月10日作成者: jarxiv

要約単一の RGB 画像からリアルな 3D オブジェクトや服を着たアバターを作 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

You See it, You Got it: Learning 3D Creation on Pose-Free Videos at Scale

投稿日: 2024年12月10日作成者: jarxiv

要約最近の 3D 生成モデルは通常、3D コンテンツの作成に限定されたスケール … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FabuLight-ASD: Unveiling Speech Activity via Body Language

投稿日: 2024年12月10日作成者: jarxiv

要約マルチモーダル環境におけるアクティブ話者検出 (ASD) は、ビデオ会議か … 続きを読む →

カテゴリー: 68T20, cs.CV, cs.LG, cs.NE, cs.SD, eess.AS, I.2.0 | コメントを受け付けていません

FlexEvent: Event Camera Object Detection at Arbitrary Frequencies

投稿日: 2024年12月10日作成者: jarxiv

要約イベントカメラは、マイクロ秒レベルの時間分解能と非同期操作により、動的な … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Parkinson’s Disease Diagnosis Through Deep Learning: A Novel LSTM-Based Approach for Freezing of Gait Detection

投稿日: 2024年12月10日作成者: jarxiv

要約ディープラーニングは、広範な臨床データセット内の隠れたパターンを明らかにし … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

How to Merge Your Multimodal Models Over Time?

投稿日: 2024年12月10日作成者: jarxiv

要約モデルの結合では、さまざまなタスクやドメインに関する基本基盤モデルから微調 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

ALEN: An Adaptive Dual-Approach for Enhancing Uniform and Non-Uniform Low-Light Images

投稿日: 2024年12月10日作成者: jarxiv

要約低照度画像の強調は、最適ではない照明条件下で撮影された画像の視認性と品質を … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Toward Non-Invasive Diagnosis of Bankart Lesions with Deep Learning

投稿日: 2024年12月10日作成者: jarxiv

要約バンカート病変、つまり関節窩前下唇裂傷は、画像上の特徴が微妙なため、標準的 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

MVAD: A Multiple Visual Artifact Detector for Video Streaming

投稿日: 2024年12月10日作成者: jarxiv

要約コンテンツの制作および配信中の一般的な状況により、ストリーミングビデオ … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

OmniEvalKit: A Modular, Lightweight Toolbox for Evaluating Large Language Model and its Omni-Extensions

Gen-3Diffusion: Realistic Image-to-3D Generation via 2D & 3D Diffusion Synergy

You See it, You Got it: Learning 3D Creation on Pose-Free Videos at Scale

FabuLight-ASD: Unveiling Speech Activity via Body Language

FlexEvent: Event Camera Object Detection at Arbitrary Frequencies

Parkinson’s Disease Diagnosis Through Deep Learning: A Novel LSTM-Based Approach for Freezing of Gait Detection

How to Merge Your Multimodal Models Over Time?

ALEN: An Adaptive Dual-Approach for Enhancing Uniform and Non-Uniform Low-Light Images

Toward Non-Invasive Diagnosis of Bankart Lesions with Deep Learning

MVAD: A Multiple Visual Artifact Detector for Video Streaming

最近の投稿

最近のコメント

アーカイブ

カテゴリー