-
最近の投稿
- Multimodal Machine Learning Can Predict Videoconference Fluidity and Enjoyment
- Scaling Efficient LLMs
- Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders
- Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use
- Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (31841) cs.CL (24084) cs.CR (2470) cs.CV (38127) cs.LG (36713) cs.RO (18601) cs.SY (2850) eess.IV (4579) eess.SY (2844) stat.ML (4859)
月別アーカイブ: 2024年4月
OpenStreetView-5M: The Many Roads to Global Visual Geolocation
要約 地球上の任意の場所にある画像の位置を決定することは、視覚的に複雑なタスクで … 続きを読む
A Multilevel Strategy to Improve People Tracking in a Real-World Scenario
要約 ブラジル大統領官邸であるプラナルト宮殿は、2023 年 1 月 8 日にデ … 続きを読む
カテゴリー: cs.CV
A Multilevel Strategy to Improve People Tracking in a Real-World Scenario はコメントを受け付けていません
Adaptive Input-image Normalization for Solving the Mode Collapse Problem in GAN-based X-ray Images
要約 対象となる疾患の希少性により、生物医学画像データセットの不均衡が生じる可能 … 続きを読む
Hide and Seek: How Does Watermarking Impact Face Recognition?
要約 生成モデルの最近の進歩により、顔画像などの非常に現実的な画像の合成に革命が … 続きを読む
カテゴリー: cs.CV
Hide and Seek: How Does Watermarking Impact Face Recognition? はコメントを受け付けていません
IPixMatch: Boost Semi-supervised Semantic Segmentation with Inter-Pixel Relation
要約 現実世界のシナリオにおけるラベル付きデータの不足は、深層学習の有効性の重大 … 続きを読む
RSCaMa: Remote Sensing Image Change Captioning with State Space Model
要約 リモート センシング画像変化キャプション (RSICC) は、多時間リモー … 続きを読む
カテゴリー: cs.CV
RSCaMa: Remote Sensing Image Change Captioning with State Space Model はコメントを受け付けていません
Amodal Ground Truth and Completion in the Wild
要約 この論文では、モーダル画像セグメンテーション、つまり可視部分と不可視 (遮 … 続きを読む
カテゴリー: cs.CV
Amodal Ground Truth and Completion in the Wild はコメントを受け付けていません
Benchmarking the CoW with the TopCoW Challenge: Topology-Aware Anatomical Segmentation of the Circle of Willis for CTA and MRA
要約 ウィリス環 (CoW) は、脳の主要な循環を接続する重要な動脈ネットワーク … 続きを読む
Make-it-Real: Unleashing Large Multimodal Model’s Ability for Painting 3D Objects with Realistic Materials
要約 物理的にリアルなマテリアルは、さまざまなアプリケーションや照明条件にわたっ … 続きを読む
Ego-Exo4D: Understanding Skilled Human Activity from First- and Third-Person Perspectives
要約 多様で大規模なマルチモーダル マルチビュー ビデオ データセットとベンチマ … 続きを読む