cs.CV」カテゴリーアーカイブ

T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs

要約 画像領域におけるマルチモーダル大規模言語モデル (MLLM) の成功は、研 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | T2Vid: Translating Long Text into Multi-Image is the Catalyst for Video-LLMs はコメントを受け付けていません

SuperMat: Physically Consistent PBR Material Estimation at Interactive Rates

要約 画像から物理ベースのマテリアルをその構成プロパティに分解することは、特に計 … 続きを読む

カテゴリー: cs.CV | SuperMat: Physically Consistent PBR Material Estimation at Interactive Rates はコメントを受け付けていません

Enhancing weed detection performance by means of GenAI-based image augmentation

要約 作物の生産性と生態系のバランスを維持するには、正確な雑草管理が不可欠です。 … 続きを読む

カテゴリー: cs.CV | Enhancing weed detection performance by means of GenAI-based image augmentation はコメントを受け付けていません

DECODE: Domain-aware Continual Domain Expansion for Motion Prediction

要約 自動運転車が複雑な環境を効果的に移動し、他の交通参加者の行動を正確に予測す … 続きを読む

カテゴリー: cs.CV, cs.RO, I.2.9 | DECODE: Domain-aware Continual Domain Expansion for Motion Prediction はコメントを受け付けていません

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

要約 HI-SLAM2 は、RGB 入力のみを使用して高速かつ正確な単眼シーンの … 続きを読む

カテゴリー: cs.CV, cs.RO | HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction はコメントを受け付けていません

Breathless: An 8-hour Performance Contrasting Human and Robot Expressiveness

要約 この論文では、人間のダンサー (Cuan) と産業用ロボット アームを組み … 続きを読む

カテゴリー: cs.CV, cs.RO | Breathless: An 8-hour Performance Contrasting Human and Robot Expressiveness はコメントを受け付けていません

Monocular Obstacle Avoidance Based on Inverse PPO for Fixed-wing UAVs

要約 固定翼無人航空機 (UAV) は、その長時間の耐久性と高速機能により、急成 … 続きを読む

カテゴリー: cs.CV, cs.RO | Monocular Obstacle Avoidance Based on Inverse PPO for Fixed-wing UAVs はコメントを受け付けていません

FASIONAD : FAst and Slow FusION Thinking Systems for Human-Like Autonomous Driving with Adaptive Feedback

要約 安全、快適、効率的なナビゲーションを確保することは、自動運転システムにとっ … 続きを読む

カテゴリー: cs.CV, cs.RO | FASIONAD : FAst and Slow FusION Thinking Systems for Human-Like Autonomous Driving with Adaptive Feedback はコメントを受け付けていません

Image Compression Using Novel View Synthesis Priors

要約 リアルタイムの視覚フィードバックは、特に検査や操作作業中に、遠隔操作車両の … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Image Compression Using Novel View Synthesis Priors はコメントを受け付けていません

Applications of Spiking Neural Networks in Visual Place Recognition

要約 ロボット工学では、スパイキング ニューラル ネットワーク (SNN) は、 … 続きを読む

カテゴリー: cs.CV, cs.RO | Applications of Spiking Neural Networks in Visual Place Recognition はコメントを受け付けていません