月別アーカイブ: 2023年8月

Latency-aware Unified Dynamic Networks for Efficient Image Recognition

要約 動的計算は、ディープネットワークの推論効率を向上させる有望な手段として浮上 … 続きを読む

カテゴリー: cs.CV | Latency-aware Unified Dynamic Networks for Efficient Image Recognition はコメントを受け付けていません

NBV-SC: Next Best View Planning based on Shape Completion for Fruit Mapping and Reconstruction

要約 オクルージョンが頻繁に発生し、時間の経過とともに果物の位置やサイズが変化す … 続きを読む

カテゴリー: cs.CV, cs.RO | NBV-SC: Next Best View Planning based on Shape Completion for Fruit Mapping and Reconstruction はコメントを受け付けていません

Fusing Pseudo Labels with Weak Supervision for Dynamic Traffic Scenarios

要約 先進運転支援システム (ADAS) は、コンピューター ビジョンを活用して … 続きを読む

カテゴリー: cs.CV | Fusing Pseudo Labels with Weak Supervision for Dynamic Traffic Scenarios はコメントを受け付けていません

Finding-Aware Anatomical Tokens for Chest X-Ray Automated Reporting

要約 放射線医学レポートのタスクには、位置や外観の説明を含む、放射線画像内の医学 … 続きを読む

カテゴリー: cs.CL, cs.CV | Finding-Aware Anatomical Tokens for Chest X-Ray Automated Reporting はコメントを受け付けていません

SHARP Challenge 2023: Solving CAD History and pArameters Recovery from Point clouds and 3D scans. Overview, Datasets, Metrics, and Baselines

要約 幾何学的な深層学習 (DL) における最近の進歩と大規模なコンピューター支 … 続きを読む

カテゴリー: cs.CV | SHARP Challenge 2023: Solving CAD History and pArameters Recovery from Point clouds and 3D scans. Overview, Datasets, Metrics, and Baselines はコメントを受け付けていません

Food Classification using Joint Representation of Visual and Textual Data

要約 食品の分類はヘルスケアにおける重要なタスクです。 この研究では、画像分類に … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | Food Classification using Joint Representation of Visual and Textual Data はコメントを受け付けていません

RoboTAP: Tracking Arbitrary Points for Few-Shot Visual Imitation

要約 ロボットが研究室や専門工場の外で役立つためには、新しい有用な動作をロボット … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | RoboTAP: Tracking Arbitrary Points for Few-Shot Visual Imitation はコメントを受け付けていません

Learning Structure-from-Motion with Graph Attention Networks

要約 この論文では、グラフ アテンション ネットワークを使用して Structu … 続きを読む

カテゴリー: cs.CV, cs.LG | Learning Structure-from-Motion with Graph Attention Networks はコメントを受け付けていません

DiffuVolume: Diffusion Model for Volume based Stereo Matching

要約 ステレオ マッチングは、多くのコンピューター ビジョン タスクや運転ベース … 続きを読む

カテゴリー: cs.CV | DiffuVolume: Diffusion Model for Volume based Stereo Matching はコメントを受け付けていません

DTrOCR: Decoder-only Transformer for Optical Character Recognition

要約 一般的なテキスト認識方法は、エンコーダが画像から特徴を抽出し、デコーダがこ … 続きを読む

カテゴリー: cs.CV | DTrOCR: Decoder-only Transformer for Optical Character Recognition はコメントを受け付けていません