-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2025年3月
RAG-Adapter: A Plug-and-Play RAG-enhanced Framework for Long Video Understanding
要約 ビデオ理解が可能なマルチモーダルの大手言語モデル(MLLMS)は急速に進ん … 続きを読む
カテゴリー: cs.CV
RAG-Adapter: A Plug-and-Play RAG-enhanced Framework for Long Video Understanding はコメントを受け付けていません
Comparing Satellite Data for Next-Day Wildfire Predictability
要約 複数の研究が衛星画像を使用して翌日の火災予測を実施しています。 2つの主要 … 続きを読む
カテゴリー: cs.CV
Comparing Satellite Data for Next-Day Wildfire Predictability はコメントを受け付けていません
MsaMIL-Net: An End-to-End Multi-Scale Aware Multiple Instance Learning Network for Efficient Whole Slide Image Classification
要約 バッグベースの複数インスタンス学習(MIL)アプローチは、スライド画像全体 … 続きを読む
HierarQ: Task-Aware Hierarchical Q-Former for Enhanced Video Understanding
要約 マルチモーダルの大手言語モデル(MLLM)の進歩にもかかわらず、現在のアプ … 続きを読む
カテゴリー: cs.CV
HierarQ: Task-Aware Hierarchical Q-Former for Enhanced Video Understanding はコメントを受け付けていません
Integration of nested cross-validation, automated hyperparameter optimization, high-performance computing to reduce and quantify the variance of test performance estimation of deep learning models
要約 医療イメージングのためのディープラーニングモデルの実際のパフォーマンスベン … 続きを読む
カテゴリー: cs.CV
Integration of nested cross-validation, automated hyperparameter optimization, high-performance computing to reduce and quantify the variance of test performance estimation of deep learning models はコメントを受け付けていません
3D Point Cloud Generation via Autoregressive Up-sampling
要約 3Dポイントクラウド生成向けの先駆的なオートレーフレフな生成モデルを紹介し … 続きを読む
X-Field: A Physically Grounded Representation for 3D X-ray Reconstruction
要約 X線イメージングは、医療診断において不可欠ですが、その使用は潜在的な健 … 続きを読む
カテゴリー: cs.CV
X-Field: A Physically Grounded Representation for 3D X-ray Reconstruction はコメントを受け付けていません
LiSu: A Dataset and Method for LiDAR Surface Normal Estimation
要約 表面正数は3Dシーンのジオメトリを分析するために広く使用されていますが、L … 続きを読む
カテゴリー: cs.CV
LiSu: A Dataset and Method for LiDAR Surface Normal Estimation はコメントを受け付けていません
ReTaKe: Reducing Temporal and Knowledge Redundancy for Long Video Understanding
要約 ビデオ大規模な言語モデル(Videollms)は、ビデオ理解において顕著な … 続きを読む
CellStyle: Improved Zero-Shot Cell Segmentation via Style Transfer
要約 細胞顕微鏡データは豊富です。 ただし、対応するセグメンテーション注釈は希少 … 続きを読む