cs.CV」カテゴリーアーカイブ

CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting

要約 安全な自律運転(AD)には、正確なモーション予測が重要です。 この研究では … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting はコメントを受け付けていません

MonoSOWA: Scalable monocular 3D Object detector Without human Annotations

要約 単一のRGBカメラからのオブジェクト3Dの位置と方向を推測することは、多く … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | MonoSOWA: Scalable monocular 3D Object detector Without human Annotations はコメントを受け付けていません

AI-Driven Automated Tool for Abdominal CT Body Composition Analysis in Gastrointestinal Cancer Management

要約 胃腸がんの発生率は、特に中国では、正確な予後評価と効果的な治療戦略の重要性 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | AI-Driven Automated Tool for Abdominal CT Body Composition Analysis in Gastrointestinal Cancer Management はコメントを受け付けていません

COMODO: Cross-Modal Video-to-IMU Distillation for Efficient Egocentric Human Activity Recognition

要約 エゴセントリックビデオベースのモデルは、豊富なセマンティック情報をキャプチ … 続きを読む

カテゴリー: cs.AI, cs.CV | COMODO: Cross-Modal Video-to-IMU Distillation for Efficient Egocentric Human Activity Recognition はコメントを受け付けていません

WISE: A World Knowledge-Informed Semantic Evaluation for Text-to-Image Generation

要約 テキストツーイメージ(T2I)モデルは、高品質の芸術作品と視覚的なコンテン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | WISE: A World Knowledge-Informed Semantic Evaluation for Text-to-Image Generation はコメントを受け付けていません

Distilling Knowledge into Quantum Vision Transformers for Biomedical Image Classification

要約 量子視力変圧器(QVITS)は、自己触媒メカニズム内の線形層をパラメーター … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Distilling Knowledge into Quantum Vision Transformers for Biomedical Image Classification はコメントを受け付けていません

ALLVB: All-in-One Long Video Understanding Benchmark

要約 画像からビデオの理解まで、マルチモーダルLLMS(MLLM)の機能はますま … 続きを読む

カテゴリー: cs.CV | ALLVB: All-in-One Long Video Understanding Benchmark はコメントを受け付けていません

Goal Conditioned Reinforcement Learning for Photo Finishing Tuning

要約 写真仕上げのチューニングは、Adobe LightroomやDarktab … 続きを読む

カテゴリー: cs.CV, cs.GR | Goal Conditioned Reinforcement Learning for Photo Finishing Tuning はコメントを受け付けていません

AttenST: A Training-Free Attention-Driven Style Transfer Framework with Pre-Trained Diffusion Models

要約 拡散モデルはスタイル転送タスクで顕著な進歩を遂げましたが、既存の方法は通常 … 続きを読む

カテゴリー: cs.CV | AttenST: A Training-Free Attention-Driven Style Transfer Framework with Pre-Trained Diffusion Models はコメントを受け付けていません

BillBoard Splatting (BBSplat): Learnable Textured Primitives for Novel View Synthesis

要約 ビルボードスプラッティング(BBSPLAT) – テクスチャの … 続きを読む

カテゴリー: cs.CV | BillBoard Splatting (BBSplat): Learnable Textured Primitives for Novel View Synthesis はコメントを受け付けていません