月別アーカイブ: 2025年2月

ContextFormer: Redefining Efficiency in Semantic Segmentation

要約 セマンティックセグメンテーションは、コンピュータービジョンにおける重要であ … 続きを読む

カテゴリー: cs.CV | ContextFormer: Redefining Efficiency in Semantic Segmentation はコメントを受け付けていません

Are They the Same? Exploring Visual Correspondence Shortcomings of Multimodal LLMs

要約 マルチモーダルモデルの最近の進歩により、視覚的認識、推論能力、視覚言語の理 … 続きを読む

カテゴリー: cs.CV | Are They the Same? Exploring Visual Correspondence Shortcomings of Multimodal LLMs はコメントを受け付けていません

Classifying Deepfakes Using Swin Transformers

要約 ディープフェイクテクノロジーの急増は、デジタルメディアの信頼性と信頼性に大 … 続きを読む

カテゴリー: cs.CV | Classifying Deepfakes Using Swin Transformers はコメントを受け付けていません

Neuro-LIFT: A Neuromorphic, LLM-based Interactive Framework for Autonomous Drone FlighT at the Edge

要約 自律システムへの人間の直感的な相互作用の統合は限られています。 従来の自然 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.NE, cs.RO, cs.SY, eess.SY | Neuro-LIFT: A Neuromorphic, LLM-based Interactive Framework for Autonomous Drone FlighT at the Edge はコメントを受け付けていません

$α$-OCC: Uncertainty-Aware Camera-based 3D Semantic Occupancy Prediction

要約 自律的な車両の認識の領域では、計画やマッピングなどのタスクの3Dシーンを理 … 続きを読む

カテゴリー: cs.CV | $α$-OCC: Uncertainty-Aware Camera-based 3D Semantic Occupancy Prediction はコメントを受け付けていません

Medical Semantic Segmentation with Diffusion Pretrain

要約 深い学習の最近の進歩により、学習堅牢な機能表現は、医療画像セグメンテーショ … 続きを読む

カテゴリー: cs.CV, cs.LG | Medical Semantic Segmentation with Diffusion Pretrain はコメントを受け付けていません

Imagine with the Teacher: Complete Shape in a Multi-View Distillation Way

要約 ポイントクラウドの完了は、オクルージョン、センサーの制限、ノイズなどによっ … 続きを読む

カテゴリー: cs.CV | Imagine with the Teacher: Complete Shape in a Multi-View Distillation Way はコメントを受け付けていません

Referential communication in heterogeneous communities of pre-trained visual deep networks

要約 大規模な事前に訓練された画像処理ニューラルネットワークが自動運転車やロボッ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Referential communication in heterogeneous communities of pre-trained visual deep networks はコメントを受け付けていません

Application of Generative Adversarial Network (GAN) for Synthetic Training Data Creation to improve performance of ANN Classifier for extracting Built-Up pixels from Landsat Satellite Imagery

要約 低解像度のランドサット画像を使用したピクセルベースの分類タスクのニューラル … 続きを読む

カテゴリー: cs.CV, cs.LG, I.4.6 | Application of Generative Adversarial Network (GAN) for Synthetic Training Data Creation to improve performance of ANN Classifier for extracting Built-Up pixels from Landsat Satellite Imagery はコメントを受け付けていません

Anatomy Might Be All You Need: Forecasting What to Do During Surgery

要約 外科的指導はさまざまな方法で提供できます。 脳神経外科では、術前のMRIス … 続きを読む

カテゴリー: cs.AI, cs.CV | Anatomy Might Be All You Need: Forecasting What to Do During Surgery はコメントを受け付けていません