cs.CV」カテゴリーアーカイブ

OmniEvalKit: A Modular, Lightweight Toolbox for Evaluating Large Language Model and its Omni-Extensions

要約 大規模言語モデル (LLM) の急速な進歩により、多言語サポートからドメイ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | OmniEvalKit: A Modular, Lightweight Toolbox for Evaluating Large Language Model and its Omni-Extensions はコメントを受け付けていません

Gen-3Diffusion: Realistic Image-to-3D Generation via 2D & 3D Diffusion Synergy

要約 単一の RGB 画像からリアルな 3D オブジェクトや服を着たアバターを作 … 続きを読む

カテゴリー: cs.CV | Gen-3Diffusion: Realistic Image-to-3D Generation via 2D & 3D Diffusion Synergy はコメントを受け付けていません

You See it, You Got it: Learning 3D Creation on Pose-Free Videos at Scale

要約 最近の 3D 生成モデルは通常、3D コンテンツの作成に限定されたスケール … 続きを読む

カテゴリー: cs.CV | You See it, You Got it: Learning 3D Creation on Pose-Free Videos at Scale はコメントを受け付けていません

FabuLight-ASD: Unveiling Speech Activity via Body Language

要約 マルチモーダル環境におけるアクティブ話者検出 (ASD) は、ビデオ会議か … 続きを読む

カテゴリー: 68T20, cs.CV, cs.LG, cs.NE, cs.SD, eess.AS, I.2.0 | FabuLight-ASD: Unveiling Speech Activity via Body Language はコメントを受け付けていません

FlexEvent: Event Camera Object Detection at Arbitrary Frequencies

要約 イベント カメラは、マイクロ秒レベルの時間分解能と非同期操作により、動的な … 続きを読む

カテゴリー: cs.CV, cs.RO | FlexEvent: Event Camera Object Detection at Arbitrary Frequencies はコメントを受け付けていません

Parkinson’s Disease Diagnosis Through Deep Learning: A Novel LSTM-Based Approach for Freezing of Gait Detection

要約 ディープラーニングは、広範な臨床データセット内の隠れたパターンを明らかにし … 続きを読む

カテゴリー: cs.AI, cs.CV | Parkinson’s Disease Diagnosis Through Deep Learning: A Novel LSTM-Based Approach for Freezing of Gait Detection はコメントを受け付けていません

How to Merge Your Multimodal Models Over Time?

要約 モデルの結合では、さまざまなタスクやドメインに関する基本基盤モデルから微調 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | How to Merge Your Multimodal Models Over Time? はコメントを受け付けていません

ALEN: An Adaptive Dual-Approach for Enhancing Uniform and Non-Uniform Low-Light Images

要約 低照度画像の強調は、最適ではない照明条件下で撮影された画像の視認性と品質を … 続きを読む

カテゴリー: cs.CV | ALEN: An Adaptive Dual-Approach for Enhancing Uniform and Non-Uniform Low-Light Images はコメントを受け付けていません

Toward Non-Invasive Diagnosis of Bankart Lesions with Deep Learning

要約 バンカート病変、つまり関節窩前下唇裂傷は、画像上の特徴が微妙なため、標準的 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Toward Non-Invasive Diagnosis of Bankart Lesions with Deep Learning はコメントを受け付けていません

MVAD: A Multiple Visual Artifact Detector for Video Streaming

要約 コンテンツの制作および配信中の一般的な状況により、ストリーミング ビデオ … 続きを読む

カテゴリー: cs.CV, eess.IV | MVAD: A Multiple Visual Artifact Detector for Video Streaming はコメントを受け付けていません