月別アーカイブ: 2024年7月

TARGO: Benchmarking Target-driven Object Grasping under Occlusions

要約 単一の深度画像から 6D 把握ポーズを予測する最近の進歩により、ロボットに … 続きを読む

カテゴリー: cs.CV, cs.RO | TARGO: Benchmarking Target-driven Object Grasping under Occlusions はコメントを受け付けていません

Potential Based Diffusion Motion Planning

要約 高次元空間における効果的な動作計画は、ロボット工学における長年の未解決の問 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Potential Based Diffusion Motion Planning はコメントを受け付けていません

The Tug-of-War Between Deepfake Generation and Detection

要約 マルチモーダル生成モデルは急速に進化しており、リアルなビデオやオーディオの … 続きを読む

カテゴリー: cs.CV | The Tug-of-War Between Deepfake Generation and Detection はコメントを受け付けていません

Vision-Language Models under Cultural and Inclusive Considerations

要約 大規模視覚言語モデル (VLM) は、視覚障害のある人々の日常生活の画像を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.CY | Vision-Language Models under Cultural and Inclusive Considerations はコメントを受け付けていません

Transfer Learning with Self-Supervised Vision Transformers for Snake Identification

要約 画像からヘビの種類を予測する SnakeCLEF 2024 コンテストのア … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.LG | Transfer Learning with Self-Supervised Vision Transformers for Snake Identification はコメントを受け付けていません

JeDi: Joint-Image Diffusion Models for Finetuning-Free Personalized Text-to-Image Generation

要約 パーソナライズされたテキストから画像への生成モデルにより、ユーザーはさまざ … 続きを読む

カテゴリー: cs.CV, cs.GR | JeDi: Joint-Image Diffusion Models for Finetuning-Free Personalized Text-to-Image Generation はコメントを受け付けていません

CrowdMoGen: Zero-Shot Text-Driven Collective Motion Generation

要約 群集モーション生成は、アニメやゲームなどのエンターテインメント業界だけでな … 続きを読む

カテゴリー: cs.CV | CrowdMoGen: Zero-Shot Text-Driven Collective Motion Generation はコメントを受け付けていません

Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision

要約 Large Vision Language Model (LVLM) のパ … 続きを読む

カテゴリー: cs.AI, cs.CV | Video-STaR: Self-Training Enables Video Instruction Tuning with Any Supervision はコメントを受け付けていません

4D Contrastive Superflows are Dense 3D Representation Learners

要約 自動運転の分野では、正確な 3D 認識が基礎となります。 ただし、このよう … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | 4D Contrastive Superflows are Dense 3D Representation Learners はコメントを受け付けていません

Tailor3D: Customized 3D Assets Editing and Generation with Dual-Side Images

要約 3D AIGC の最近の進歩により、テキストや画像から 3D オブジェクト … 続きを読む

カテゴリー: cs.CV | Tailor3D: Customized 3D Assets Editing and Generation with Dual-Side Images はコメントを受け付けていません