月別アーカイブ: 2024年1月

FM-AE: Frequency-masked Multimodal Autoencoder for Zinc Electrolysis Plate Contact Abnormality Detection

要約 亜鉛電解は亜鉛製錬の基幹工程の一つであり、亜鉛電解の安定操業を維持すること … 続きを読む

カテゴリー: cs.CV, I.5.1 | FM-AE: Frequency-masked Multimodal Autoencoder for Zinc Electrolysis Plate Contact Abnormality Detection はコメントを受け付けていません

Gnuastro: visualizing the full dynamic range in color images

要約 色は、多波長の天体画像の視覚化、解釈、分析において重要な役割を果たします。 … 続きを読む

カテゴリー: astro-ph.GA, astro-ph.IM, cs.CV | Gnuastro: visualizing the full dynamic range in color images はコメントを受け付けていません

A multimodal gesture recognition dataset for desktop human-computer interaction

要約 ジェスチャ認識は、特にデスクトップ レベルのアプリケーションにおいて、自然 … 続きを読む

カテゴリー: cs.CV | A multimodal gesture recognition dataset for desktop human-computer interaction はコメントを受け付けていません

A foundation for exact binarized morphological neural networks

要約 ディープ ニューラル ネットワーク (NN) のトレーニングと実行には、多 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | A foundation for exact binarized morphological neural networks はコメントを受け付けていません

Limitations of Data-Driven Spectral Reconstruction — An Optics-Aware Analysis

要約 ハイパースペクトル イメージングは​​、コンピューター ビジョン システム … 続きを読む

カテゴリー: cs.CV, eess.IV | Limitations of Data-Driven Spectral Reconstruction — An Optics-Aware Analysis はコメントを受け付けていません

WidthFormer: Toward Efficient Transformer-based BEV View Transformation

要約 この研究では、リアルタイム自動運転アプリケーション向けに調整された新しい変 … 続きを読む

カテゴリー: cs.CV | WidthFormer: Toward Efficient Transformer-based BEV View Transformation はコメントを受け付けていません

Fully Attentional Networks with Self-emerging Token Labeling

要約 最近の研究では、ビジョン トランスフォーマー (ViT) が配布外のシナリ … 続きを読む

カテゴリー: cs.CV | Fully Attentional Networks with Self-emerging Token Labeling はコメントを受け付けていません

UFO: Unidentified Foreground Object Detection in 3D Point Cloud

要約 この論文では、3D 点群における未確認前景物体 (UFO) の検出に関する … 続きを読む

カテゴリー: cs.CV, cs.LG | UFO: Unidentified Foreground Object Detection in 3D Point Cloud はコメントを受け付けていません

Multimodal Parameter-Efficient Few-Shot Class Incremental Learning

要約 Few-Shot Class Incremental Learning ( … 続きを読む

カテゴリー: cs.AI, cs.CV | Multimodal Parameter-Efficient Few-Shot Class Incremental Learning はコメントを受け付けていません

Aligned with LLM: a new multi-modal training paradigm for encoding fMRI activity in visual cortex

要約 最近、事前トレーニングされた大規模言語モデル (LLM) (GPT-4 な … 続きを読む

カテゴリー: cs.CV, q-bio.NC | Aligned with LLM: a new multi-modal training paradigm for encoding fMRI activity in visual cortex はコメントを受け付けていません