cs.CV」カテゴリーアーカイブ

Material Anything: Generating Materials for Any 3D Object via Diffusion

要約 私たちは、3D オブジェクト用の物理ベースのマテリアルを生成するように設計 … 続きを読む

カテゴリー: cs.CV, cs.GR | Material Anything: Generating Materials for Any 3D Object via Diffusion はコメントを受け付けていません

DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving

要約 最近、拡散モデルはロボットによる政策学習のための強力な生成技術として登場し … 続きを読む

カテゴリー: cs.CV, cs.RO | DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving はコメントを受け付けていません

Adversarial Poisoning Attack on Quantum Machine Learning Models

要約 量子機械学習 (QML) への関心が高まり、クラウド プロバイダーを通じて … 続きを読む

カテゴリー: cs.CR, cs.CV, quant-ph | Adversarial Poisoning Attack on Quantum Machine Learning Models はコメントを受け付けていません

Image Compression Using Novel View Synthesis Priors

要約 リアルタイムの視覚フィードバックは、特に検査や操作作業中に、遠隔操作車両の … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Image Compression Using Novel View Synthesis Priors はコメントを受け付けていません

OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments

要約 複雑で乱雑な環境における自律探索は、さまざまなアプリケーションにとって不可 … 続きを読む

カテゴリー: cs.CV, cs.RO | OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments はコメントを受け付けていません

t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving

要約 自動運転車 (AV) によるマルチモーダル センサー (カメラ、ライダー、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.DC, cs.LG, cs.RO | t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving はコメントを受け付けていません

Exosense: A Vision-Based Scene Understanding System For Exoskeletons

要約 自己平衡外骨格は、運動障害のある人にとって重要な技術です。 現在の課題は人 … 続きを読む

カテゴリー: cs.CV, cs.RO | Exosense: A Vision-Based Scene Understanding System For Exoskeletons はコメントを受け付けていません

MMGenBench: Evaluating the Limits of LMMs from the Text-to-Image Generation Perspective

要約 大規模マルチモーダル モデル (LMM) は、顕著な機能を実証しています。 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | MMGenBench: Evaluating the Limits of LMMs from the Text-to-Image Generation Perspective はコメントを受け付けていません

Is Less More? Exploring Token Condensation as Training-free Adaptation for CLIP

要約 対照言語画像事前トレーニング (CLIP) は、画像分類において顕著な汎化 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Is Less More? Exploring Token Condensation as Training-free Adaptation for CLIP はコメントを受け付けていません

Visual Contexts Clarify Ambiguous Expressions: A Benchmark Dataset

要約 現実世界のシナリオでモデルが人間と効果的に対話するには、マルチモーダルな入 … 続きを読む

カテゴリー: cs.CL, cs.CV | Visual Contexts Clarify Ambiguous Expressions: A Benchmark Dataset はコメントを受け付けていません