cs.CV」カテゴリーアーカイブ

EgoMimic: Scaling Imitation Learning via Egocentric Video

要約 模倣学習に必要な実証データの規模と多様性は、大きな課題です。 私たちは、人 … 続きを読む

カテゴリー: cs.CV, cs.RO | EgoMimic: Scaling Imitation Learning via Egocentric Video はコメントを受け付けていません

URAvatar: Universal Relightable Gaussian Codec Avatars

要約 私たちは、未知の照明を使用した電話スキャンからフォトリアリスティックで再照 … 続きを読む

カテゴリー: cs.CV, cs.GR | URAvatar: Universal Relightable Gaussian Codec Avatars はコメントを受け付けていません

Aligning Audio-Visual Joint Representations with an Agentic Workflow

要約 ビジュアル コンテンツと付随するオーディオ信号は、オーディオビジュアル ( … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Aligning Audio-Visual Joint Representations with an Agentic Workflow はコメントを受け付けていません

Robotic State Recognition with Image-to-Text Retrieval Task of Pre-Trained Vision-Language Model and Black-Box Optimization

要約 日常生活支援や警備業務を行うロボットにとって、ドアの開閉や照明の点灯・消灯 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Robotic State Recognition with Image-to-Text Retrieval Task of Pre-Trained Vision-Language Model and Black-Box Optimization はコメントを受け付けていません

ES-Gaussian: Gaussian Splatting Mapping via Error Space-Based Gaussian Completion

要約 ロボットの効果的なナビゲーションとインタラクションには、正確かつ手頃な価格 … 続きを読む

カテゴリー: cs.CV, cs.RO | ES-Gaussian: Gaussian Splatting Mapping via Error Space-Based Gaussian Completion はコメントを受け付けていません

DexGraspNet 2.0: Learning Generative Dexterous Grasping in Large-scale Synthetic Cluttered Scenes

要約 データが不足しているため、乱雑なシーンを把握することは、器用な手にとって依 … 続きを読む

カテゴリー: cs.CV, cs.RO | DexGraspNet 2.0: Learning Generative Dexterous Grasping in Large-scale Synthetic Cluttered Scenes はコメントを受け付けていません

Neural Attention Field: Emerging Point Relevance in 3D Scenes for One-Shot Dexterous Grasping

要約 器用な把握を、オブジェクトとコンテキストのバリエーションのある新しいシーン … 続きを読む

カテゴリー: cs.CV, cs.RO | Neural Attention Field: Emerging Point Relevance in 3D Scenes for One-Shot Dexterous Grasping はコメントを受け付けていません

S3PT: Scene Semantics and Structure Guided Clustering to Boost Self-Supervised Pre-Training for Autonomous Driving

要約 DINO や Cribo などの最近の自己教師ありクラスタリング ベースの … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | S3PT: Scene Semantics and Structure Guided Clustering to Boost Self-Supervised Pre-Training for Autonomous Driving はコメントを受け付けていません

Improving Hateful Meme Detection through Retrieval-Guided Contrastive Learning

要約 憎しみに満ちたミームがインターネット上で重大な懸念事項として浮上しています … 続きを読む

カテゴリー: cs.CL, cs.CV | Improving Hateful Meme Detection through Retrieval-Guided Contrastive Learning はコメントを受け付けていません

VisAidMath: Benchmarking Visual-Aided Mathematical Reasoning

要約 大規模言語モデル (LLM) および大規模マルチモーダル モデル (LMM … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | VisAidMath: Benchmarking Visual-Aided Mathematical Reasoning はコメントを受け付けていません