「cs.CV」カテゴリーアーカイブ

Efficient Data Representation for Motion Forecasting: A Scene-Specific Trajectory Set Approach

投稿日: 2024年12月10日作成者: jarxiv

要約自動運転における動作予測には、多様でありそうな将来の軌道を表現することが重 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

On-Device Self-Supervised Learning of Low-Latency Monocular Depth from Only Events

投稿日: 2024年12月10日作成者: jarxiv

要約イベントカメラは、わずかミリワットの電力で低遅延の認識を提供します。そ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Adaptive Graph Learning from Spatial Information for Surgical Workflow Anticipation

投稿日: 2024年12月10日作成者: jarxiv

要約手術ワークフローの予測は、ライブビデオデータから関連する手術イベントのタイ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Perception Helps Planning: Facilitating Multi-Stage Lane-Level Integration via Double-Edge Structures

投稿日: 2024年12月10日作成者: jarxiv

要約自動運転を計画する場合、車線、交差点、交通規制、ダイナミックエージェント … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

An Efficient Scene Coordinate Encoding and Relocalization Method

投稿日: 2024年12月10日作成者: jarxiv

要約シーン座標回帰 (SCR) は、ディープニューラルネットワーク (DN … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

PPT: Pre-Training with Pseudo-Labeled Trajectories for Motion Forecasting

投稿日: 2024年12月10日作成者: jarxiv

要約自動運転のための動き予測 (MF) は、複雑な都市シナリオにおける周囲のエ … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Improved GUI Grounding via Iterative Narrowing

投稿日: 2024年12月10日作成者: jarxiv

要約グラフィカルユーザーインターフェイス (GUI) の基礎は、視覚言語モ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

A Topic-level Self-Correctional Approach to Mitigate Hallucinations in MLLMs

投稿日: 2024年12月10日作成者: jarxiv

要約マルチモーダル大規模言語モデル (MLLM) の動作を人間の好みに合わせる … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Jailbreak Attacks and Defenses against Multimodal Generative Models: A Survey

投稿日: 2024年12月10日作成者: jarxiv

要約マルチモーダル基礎モデルの急速な進化により、テキスト、画像、オーディオ、ビ … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

From Pixels to Words: Leveraging Explainability in Face Recognition through Interactive Natural Language Processing

投稿日: 2024年12月10日作成者: jarxiv

要約顔認識 (FR) はディープラーニングの発展により大幅に進歩し、いくつかの … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.CY, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Efficient Data Representation for Motion Forecasting: A Scene-Specific Trajectory Set Approach

On-Device Self-Supervised Learning of Low-Latency Monocular Depth from Only Events

Adaptive Graph Learning from Spatial Information for Surgical Workflow Anticipation

Perception Helps Planning: Facilitating Multi-Stage Lane-Level Integration via Double-Edge Structures

An Efficient Scene Coordinate Encoding and Relocalization Method

PPT: Pre-Training with Pseudo-Labeled Trajectories for Motion Forecasting

Improved GUI Grounding via Iterative Narrowing

A Topic-level Self-Correctional Approach to Mitigate Hallucinations in MLLMs

Jailbreak Attacks and Defenses against Multimodal Generative Models: A Survey

From Pixels to Words: Leveraging Explainability in Face Recognition through Interactive Natural Language Processing

最近の投稿

最近のコメント

アーカイブ

カテゴリー