cs.AI」カテゴリーアーカイブ

Label-Efficient Deep Learning in Medical Image Analysis: Challenges and Future Directions

要約 ディープラーニングは、多様な臨床タスク全体で最先端のパフォーマンスを達成し … 続きを読む

カテゴリー: cs.AI, cs.CV | Label-Efficient Deep Learning in Medical Image Analysis: Challenges and Future Directions はコメントを受け付けていません

PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes

要約 実際の3Dシーンで言語誘導オブジェクト配置の新しいタスクを紹介します。 私 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes はコメントを受け付けていません

Benchmarking Ophthalmology Foundation Models for Clinically Significant Age Macular Degeneration Detection

要約 自己学習学習(SSL)により、ビジョントランス(VITS)が大規模な自然画 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV, q-bio.TO | Benchmarking Ophthalmology Foundation Models for Clinically Significant Age Macular Degeneration Detection はコメントを受け付けていません

Mapping User Trust in Vision Language Models: Research Landscape, Challenges, and Prospects

要約 大きな画像テキストおよびビデオテキストデータセットで事前に訓練されたビジョ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.HC, cs.RO | Mapping User Trust in Vision Language Models: Research Landscape, Challenges, and Prospects はコメントを受け付けていません

Feature-Augmented Deep Networks for Multiscale Building Segmentation in High-Resolution UAV and Satellite Imagery

要約 高解像度のRGB画像からの正確な構築セグメンテーションは、非建設機能、影、 … 続きを読む

カテゴリー: cs.AI, cs.CV, I.2.10 | Feature-Augmented Deep Networks for Multiscale Building Segmentation in High-Resolution UAV and Satellite Imagery はコメントを受け付けていません

Time of the Flight of the Gaussians: Optimizing Depth Indirectly in Dynamic Radiance Fields

要約 単眼の連続波の飛行時間(C-TOF)カメラから動的シーンを再構築する方法を … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | Time of the Flight of the Gaussians: Optimizing Depth Indirectly in Dynamic Radiance Fields はコメントを受け付けていません

Threshold Modulation for Online Test-Time Adaptation of Spiking Neural Networks

要約 最近、神経変動チップに展開されたスパイクニューラルネットワーク(SNN)は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE | Threshold Modulation for Online Test-Time Adaptation of Spiking Neural Networks はコメントを受け付けていません

TokLIP: Marry Visual Tokens to CLIP for Multimodal Comprehension and Generation

要約 ChameleonやEMU3などの先駆的なトークンベースの作品は、マルチモ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | TokLIP: Marry Visual Tokens to CLIP for Multimodal Comprehension and Generation はコメントを受け付けていません

Automated detection of underdiagnosed medical conditions via opportunistic imaging

要約 腹部コンピューター断層撮影(CT)スキャンは、臨床環境で頻繁に行われます。 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Automated detection of underdiagnosed medical conditions via opportunistic imaging はコメントを受け付けていません

StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant

要約 StreamBridgeを紹介します。これは、オフラインのビデオllmsを … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant はコメントを受け付けていません