cs.CV」カテゴリーアーカイブ

VizFlyt: Perception-centric Pedagogical Framework For Autonomous Aerial Robots

要約 私たちの生活の中で自律的な航空ロボットが一般的になっています。 実践的な航 … 続きを読む

カテゴリー: cs.CV, cs.RO | VizFlyt: Perception-centric Pedagogical Framework For Autonomous Aerial Robots はコメントを受け付けていません

Emotion estimation from video footage with LSTM

要約 一般的な感情の推定は、長い間研究されてきた分野であり、機械学習を使用してい … 続きを読む

カテゴリー: (Primary), 68T40, cs.CV, cs.LG, cs.RO, I.2.9 | Emotion estimation from video footage with LSTM はコメントを受け付けていません

FUSION: Frequency-guided Underwater Spatial Image recOnstructioN

要約 水中画像は、色の歪み、視界の低下、波長依存性の減衰と散乱による構造の詳細の … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | FUSION: Frequency-guided Underwater Spatial Image recOnstructioN はコメントを受け付けていません

ForestVO: Enhancing Visual Odometry in Forest Environments through ForestGlue

要約 視覚臭トメトリシステムの最近の進歩により、自律的なナビゲーションが改善され … 続きを読む

カテゴリー: cs.CV, cs.RO | ForestVO: Enhancing Visual Odometry in Forest Environments through ForestGlue はコメントを受け付けていません

Can DeepSeek Reason Like a Surgeon? An Empirical Evaluation for Vision-Language Understanding in Robotic-Assisted Surgery

要約 Deepseekシリーズは、その効率的なトレーニングパラダイムと強力な推論 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | Can DeepSeek Reason Like a Surgeon? An Empirical Evaluation for Vision-Language Understanding in Robotic-Assisted Surgery はコメントを受け付けていません

Efficient Alignment of Unconditioned Action Prior for Language-conditioned Pick and Place in Clutter

要約 私たちは、ロボットがターゲットオブジェクトを開いたクラッターで把握し、指定 … 続きを読む

カテゴリー: cs.CV, cs.RO | Efficient Alignment of Unconditioned Action Prior for Language-conditioned Pick and Place in Clutter はコメントを受け付けていません

FortisAVQA and MAVEN: a Benchmark Dataset and Debiasing Framework for Robust Multimodal Reasoning

要約 オーディオビジュアル質問応答(AVQA)は、ペアのオーディオビデオ入力に基 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM, H.5.1 | FortisAVQA and MAVEN: a Benchmark Dataset and Debiasing Framework for Robust Multimodal Reasoning はコメントを受け付けていません

Robust Unsupervised Domain Adaptation for 3D Point Cloud Segmentation Under Source Adversarial Attacks

要約 監視されていないドメイン適応(UDA)フレームワークは、クリーンデータの3 … 続きを読む

カテゴリー: cs.CV | Robust Unsupervised Domain Adaptation for 3D Point Cloud Segmentation Under Source Adversarial Attacks はコメントを受け付けていません

BioAtt: Anatomical Prior Driven Low-Dose CT Denoising

要約 ディープラーニングベースの除去方法により、低用量CT(LDCT)の画質が大 … 続きを読む

カテゴリー: cs.CV | BioAtt: Anatomical Prior Driven Low-Dose CT Denoising はコメントを受け付けていません

CLIP-SLA: Parameter-Efficient CLIP Adaptation for Continuous Sign Language Recognition

要約 継続的な手話認識(CSLR)は、ビデオの手話ジェスチャーの解釈と転写シーケ … 続きを読む

カテゴリー: cs.CV | CLIP-SLA: Parameter-Efficient CLIP Adaptation for Continuous Sign Language Recognition はコメントを受け付けていません