月別アーカイブ: 2025年4月

Image Difference Grounding with Natural Language

要約 視覚的接地(VG)は通常、自然言語を使用して画像内の関心領域を見つけること … 続きを読む

カテゴリー: cs.CV | Image Difference Grounding with Natural Language はコメントを受け付けていません

Deep Representation Learning for Unsupervised Clustering of Myocardial Fiber Trajectories in Cardiac Diffusion Tensor Imaging

要約 複雑な心筋アーキテクチャを理解することは、心臓病の診断と治療に不可欠です。 … 続きを読む

カテゴリー: cs.CV, cs.LG | Deep Representation Learning for Unsupervised Clustering of Myocardial Fiber Trajectories in Cardiac Diffusion Tensor Imaging はコメントを受け付けていません

Towards Unified Referring Expression Segmentation Across Omni-Level Visual Target Granularities

要約 参照式セグメンテーション(RES)は、記述言語式に一致するエンティティのマ … 続きを読む

カテゴリー: cs.CV | Towards Unified Referring Expression Segmentation Across Omni-Level Visual Target Granularities はコメントを受け付けていません

Scene-Centric Unsupervised Panoptic Segmentation

要約 監視されていないパノプティックセグメンテーションは、手動で注釈付きのデータ … 続きを読む

カテゴリー: cs.CV | Scene-Centric Unsupervised Panoptic Segmentation はコメントを受け付けていません

VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step

要約 スパースビューから3Dシーンを回復することは、その固有の不適切な問題のため … 続きを読む

カテゴリー: cs.CV | VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step はコメントを受け付けていません

GaussianLSS — Toward Real-world BEV Perception: Depth Uncertainty Estimation via Gaussian Splatting

要約 バードアイビュー(BEV)の認識は、複数のビュー画像を融合するための統一さ … 続きを読む

カテゴリー: cs.CV | GaussianLSS — Toward Real-world BEV Perception: Depth Uncertainty Estimation via Gaussian Splatting はコメントを受け付けていません

Diffusion-Guided Gaussian Splatting for Large-Scale Unconstrained 3D Reconstruction and Novel View Synthesis

要約 3Dガウスの飛び散(3DG)および神経放射輝度(NERF)の最近の進歩は、 … 続きを読む

カテゴリー: cs.CV, cs.LG | Diffusion-Guided Gaussian Splatting for Large-Scale Unconstrained 3D Reconstruction and Novel View Synthesis はコメントを受け付けていません

Learning from Streaming Video with Orthogonal Gradients

要約 私たちは、自己教師の方法で、入力としての動画の連続的なストリームから学習す … 続きを読む

カテゴリー: cs.CV | Learning from Streaming Video with Orthogonal Gradients はコメントを受け付けていません

Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation

要約 大規模な現実世界のロボットデータセットは、ジェネラリストのロボットモデルを … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation はコメントを受け付けていません

Non-Determinism of ‘Deterministic’ LLM Settings

要約 LLM(大規模な言語モデル)開業医は、一般に、出力が決定論的と予想される設 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.SE | Non-Determinism of ‘Deterministic’ LLM Settings はコメントを受け付けていません