月別アーカイブ: 2025年2月

A hierarchical semantic segmentation framework for computer vision-based bridge damage detection

要約 遠隔カメラや無人航空機(UAV)を使用したコンピュータ・ビジョン・ベースの … 続きを読む

カテゴリー: cs.CV | A hierarchical semantic segmentation framework for computer vision-based bridge damage detection はコメントを受け付けていません

On Computational Limits and Provably Efficient Criteria of Visual Autoregressive Models: A Fine-Grained Complexity Analysis

要約 最近、視覚的自己回帰($mathsf{VAR}$)モデルは、画像生成分野に … 続きを読む

カテゴリー: cs.AI, cs.CC, cs.CV, cs.LG | On Computational Limits and Provably Efficient Criteria of Visual Autoregressive Models: A Fine-Grained Complexity Analysis はコメントを受け付けていません

RichSpace: Enriching Text-to-Video Prompt Space via Text Embedding Interpolation

要約 テキストからビデオへの生成モデルは目覚ましい進歩を遂げているが、複雑な特徴 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | RichSpace: Enriching Text-to-Video Prompt Space via Text Embedding Interpolation はコメントを受け付けていません

Remote Blood Oxygen Estimation From Videos Using Neural Networks

要約 血中酸素飽和度(SpO$_2$)は呼吸機能の重要な指標であり、COVID- … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Remote Blood Oxygen Estimation From Videos Using Neural Networks はコメントを受け付けていません

Defeasible Visual Entailment: Benchmark, Evaluator, and Reward-Driven Optimization

要約 このタスクの目的は、追加的な更新に基づいて、画像の前提条件とテキストの仮説 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Defeasible Visual Entailment: Benchmark, Evaluator, and Reward-Driven Optimization はコメントを受け付けていません

HFGCN:Hypergraph Fusion Graph Convolutional Networks for Skeleton-Based Action Recognition

要約 近年、映像理解における重要な役割のため、行動認識が注目され、広く応用されて … 続きを読む

カテゴリー: cs.CV, cs.LG | HFGCN:Hypergraph Fusion Graph Convolutional Networks for Skeleton-Based Action Recognition はコメントを受け付けていません

Prompt-Aware Controllable Shadow Removal

要約 シャドウ除去は、シャドウ領域の画像コンテンツを復元することを目的としている … 続きを読む

カテゴリー: cs.CV | Prompt-Aware Controllable Shadow Removal はコメントを受け付けていません

UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent

要約 視覚-言語-行動(VLA)モデルの最近の進歩は、汎化能力を向上させるために … 続きを読む

カテゴリー: cs.AI, cs.CV | UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent はコメントを受け付けていません

HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers

要約 事前に学習された強力な視覚言語モデル(VLMs)バックエンドを活用した大規 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers はコメントを受け付けていません

OpenAI ChatGPT interprets Radiological Images: GPT-4 as a Medical Doctor for a Fast Check-Up

要約 OpenAIは2022年11月に発表したChatGPTの成功を受けて、20 … 続きを読む

カテゴリー: cs.CV | OpenAI ChatGPT interprets Radiological Images: GPT-4 as a Medical Doctor for a Fast Check-Up はコメントを受け付けていません