月別アーカイブ: 2024年3月

Low-power, Continuous Remote Behavioral Localization with Event Cameras

要約 自然科学の研究者は、動物の行動を定量化するための信頼できる方法を必要として … 続きを読む

カテゴリー: cs.AI, cs.CV | Low-power, Continuous Remote Behavioral Localization with Event Cameras はコメントを受け付けていません

MambaMIR: An Arbitrary-Masked Mamba for Joint Medical Image Reconstruction and Uncertainty Estimation

要約 最近の Mamba モデルは、医療画像タスクなどの視覚表現学習に顕著な適応 … 続きを読む

カテゴリー: cs.CV, eess.IV | MambaMIR: An Arbitrary-Masked Mamba for Joint Medical Image Reconstruction and Uncertainty Estimation はコメントを受け付けていません

PoNQ: a Neural QEM-based Mesh Representation

要約 ポリゴン メッシュはジオメトリ処理における標準的な表現ですが、その不規則で … 続きを読む

カテゴリー: cs.CV | PoNQ: a Neural QEM-based Mesh Representation はコメントを受け付けていません

Confusing Pair Correction Based on Category Prototype for Domain Adaptation under Noisy Environments

要約 この論文では、従来のドメイン適応よりも困難かつ現実的である、ノイズの多い環 … 続きを読む

カテゴリー: cs.CV | Confusing Pair Correction Based on Category Prototype for Domain Adaptation under Noisy Environments はコメントを受け付けていません

HYDRA: A Hyper Agent for Dynamic Compositional Visual Reasoning

要約 特に大規模視覚言語モデル (VLM) を活用した視覚的推論 (VR) の最 … 続きを読む

カテゴリー: cs.CV | HYDRA: A Hyper Agent for Dynamic Compositional Visual Reasoning はコメントを受け付けていません

EmoVOCA: Speech-Driven Emotional 3D Talking Heads

要約 3D トーキング ヘッド生成の分野は、近年大幅な進歩を遂げています。 この … 続きを読む

カテゴリー: cs.CV | EmoVOCA: Speech-Driven Emotional 3D Talking Heads はコメントを受け付けていません

Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector

要約 この論文では、最小限のラベル付きサンプルで新しいドメイン向けの正確な物体検 … 続きを読む

カテゴリー: cs.CV, cs.LG | Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector はコメントを受け付けていません

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

要約 この作業では、パフォーマンスの高いマルチモーダル大規模言語モデル (MLL … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training はコメントを受け付けていません

BugNIST – a Large Volumetric Dataset for Object Detection under Domain Shift

要約 ドメイン シフトは、特にボリューム 3D 画像内のオブジェクト検出において … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | BugNIST – a Large Volumetric Dataset for Object Detection under Domain Shift はコメントを受け付けていません

Adaptive Visual Imitation Learning for Robotic Assisted Feeding Across Varied Bowl Configurations and Food Types

要約 この研究では、ロボット支援給餌 (RAF) のための空間注意モジュールを備 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Adaptive Visual Imitation Learning for Robotic Assisted Feeding Across Varied Bowl Configurations and Food Types はコメントを受け付けていません