投稿者「jarxiv」のアーカイブ

RayFronts: Open-Set Semantic Ray Frontiers for Online Scene Understanding and Exploration

要約 オープンワールドロボットにとって、オープンセットセマンティックマッピングが … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | RayFronts: Open-Set Semantic Ray Frontiers for Online Scene Understanding and Exploration はコメントを受け付けていません

Latent Diffusion U-Net Representations Contain Positional Embeddings and Anomalies

要約 拡散モデルは、現実的な画像を合成する際に顕著な能力を実証し、さまざまな下流 … 続きを読む

カテゴリー: cs.CV | Latent Diffusion U-Net Representations Contain Positional Embeddings and Anomalies はコメントを受け付けていません

Dolphin: Moving Towards Closed-loop Auto-research through Thinking, Practice, and Feedback

要約 科学研究のパラダイムは、人工知能(AI)の発達により、深い変換を受けていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Dolphin: Moving Towards Closed-loop Auto-research through Thinking, Practice, and Feedback はコメントを受け付けていません

Glossy Object Reconstruction with Cost-effective Polarized Acquisition

要約 光沢のあるオブジェクトの画像ベースの3D再構成の課題は、RGBデータのみを … 続きを読む

カテゴリー: cs.CV | Glossy Object Reconstruction with Cost-effective Polarized Acquisition はコメントを受け付けていません

Distilling Textual Priors from LLM to Efficient Image Fusion

要約 マルチモダリティ画像Fusionは、複数のソース入力からの単一の包括的な画 … 続きを読む

カテゴリー: cs.CV | Distilling Textual Priors from LLM to Efficient Image Fusion はコメントを受け付けていません

Holstein-Friesian Re-Identification using Multiple Cameras and Self-Supervision on a Working Farm

要約 Multicamcows2024は、ユニークな白黒のコートパターンを利用す … 続きを読む

カテゴリー: cs.CV | Holstein-Friesian Re-Identification using Multiple Cameras and Self-Supervision on a Working Farm はコメントを受け付けていません

A Unified Agentic Framework for Evaluating Conditional Image Generation

要約 条件付き画像生成は、コンテンツをパーソナライズする能力について大きな注目を … 続きを読む

カテゴリー: cs.CL, cs.CV | A Unified Agentic Framework for Evaluating Conditional Image Generation はコメントを受け付けていません

Unsolvable Problem Detection: Robust Understanding Evaluation for Large Multimodal Models

要約 このペーパーでは、大規模なマルチモーダルモデル(LMMS)の堅牢な理解能力 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Unsolvable Problem Detection: Robust Understanding Evaluation for Large Multimodal Models はコメントを受け付けていません

Generalized Semantic Contrastive Learning via Embedding Side Information for Few-Shot Object Detection

要約 少数のショットオブジェクト検出(FSOD)の目的は、トレーニングサンプルが … 続きを読む

カテゴリー: cs.CV | Generalized Semantic Contrastive Learning via Embedding Side Information for Few-Shot Object Detection はコメントを受け付けていません

Teaching pathology foundation models to accurately predict gene expression with parameter efficient knowledge transfer

要約 遺伝子発現プロファイリングは、細胞の不均一性、生物学的プロセス、疾患メカニ … 続きを読む

カテゴリー: cs.CV | Teaching pathology foundation models to accurately predict gene expression with parameter efficient knowledge transfer はコメントを受け付けていません