月別アーカイブ: 2024年8月

Attend-Fusion: Efficient Audio-Visual Fusion for Video Classification

要約 既存の方法では大規模なモデル アーキテクチャが必要となり、高い計算量とリソ … 続きを読む

カテゴリー: cs.AI, cs.CV | Attend-Fusion: Efficient Audio-Visual Fusion for Video Classification はコメントを受け付けていません

Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition

要約 ディープ畳み込みニューラル ネットワーク (CNN) は、幅広い画像処理ア … 続きを読む

カテゴリー: 65N55, 68T07, 68W10, 68W15, cs.CV, cs.LG, cs.NA, math.NA | Model Parallel Training and Transfer Learning for Convolutional Neural Networks by Domain Decomposition はコメントを受け付けていません

Center Direction Network for Grasping Point Localization on Cloths

要約 物体の把握はロボット工学とコンピュータビジョンにおける基本的な課題であり、 … 続きを読む

カテゴリー: cs.CV | Center Direction Network for Grasping Point Localization on Cloths はコメントを受け付けていません

Dense Center-Direction Regression for Object Counting and Localization with Point Supervision

要約 オブジェクトの計数と位置特定の問題は、一般的にポイント教師あり学習で対処さ … 続きを読む

カテゴリー: cs.CV | Dense Center-Direction Regression for Object Counting and Localization with Point Supervision はコメントを受け付けていません

Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos

要約 この論文では、長い形式の自己中心的なビデオにおけるマルチホップ ビデオ質問 … 続きを読む

カテゴリー: cs.CV | Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos はコメントを受け付けていません

A Practitioner’s Guide to Continual Multimodal Pretraining

要約 マルチモーダル基盤モデルは、視覚と言語の交差点で数多くのアプリケーションに … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A Practitioner’s Guide to Continual Multimodal Pretraining はコメントを受け付けていません

Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure

要約 偏微分方程式 (PDE) は、特に生物学の領域において、複雑な自然プロセス … 続きを読む

カテゴリー: cs.CV | Global Attractor for a Reaction-Diffusion Model Arising in Biological Dynamic in 3D Soil Structure はコメントを受け付けていません

Ten Problems in Geobotics

要約 ロボットは物理世界で感知し、動き、行動します。 したがって、ロボット工学や … 続きを読む

カテゴリー: cs.CG, cs.RO | Ten Problems in Geobotics はコメントを受け付けていません

Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification

要約 Spatial-Spectral Mamba (SSM) は、計算効率を向 … 続きを読む

カテゴリー: cs.CV | Multi-head Spatial-Spectral Mamba for Hyperspectral Image Classification はコメントを受け付けていません

Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation

要約 テキスト プロンプトから高密度のマルチビュー イメージを生成することは、忠 … 続きを読む

カテゴリー: cs.CV | Focus on Neighbors and Know the Whole: Towards Consistent Dense Multiview Text-to-Image Generator for 3D Creation はコメントを受け付けていません