月別アーカイブ: 2024年8月

iMatching: Imperative Correspondence Learning

要約 特徴の対応関係の学習はコンピュータ ビジョンの基礎的なタスクであり、ビジュ … 続きを読む

カテゴリー: cs.CV | iMatching: Imperative Correspondence Learning はコメントを受け付けていません

Paying More Attention to Image: A Training-Free Method for Alleviating Hallucination in LVLMs

要約 既存の大規模ビジョン言語モデル (LVLM) は、主にビジョン エンコーダ … 続きを読む

カテゴリー: cs.CV | Paying More Attention to Image: A Training-Free Method for Alleviating Hallucination in LVLMs はコメントを受け付けていません

RainMamba: Enhanced Locality Learning with State Space Models for Video Deraining

要約 屋外ビジョン システムは、雨筋や雨滴によって頻繁に汚染され、視覚タスクやマ … 続きを読む

カテゴリー: cs.CV | RainMamba: Enhanced Locality Learning with State Space Models for Video Deraining はコメントを受け付けていません

An Earth Rover dataset recorded at the ICRA@40 party

要約 ICRA 会議は 2024 年 9 月にロッテルダムで $40^{th}$ … 続きを読む

カテゴリー: 68, cs.CV, cs.RO, I.4.8 | An Earth Rover dataset recorded at the ICRA@40 party はコメントを受け付けていません

The Llama 3 Herd of Models

要約 最新の人工知能 (AI) システムは基礎モデルを利用しています。 このペー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | The Llama 3 Herd of Models はコメントを受け付けていません

Vision-Language Model Based Handwriting Verification

要約 手書き検証は文書フォレンジックにおいて非常に重要です。 深層学習ベースのア … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Vision-Language Model Based Handwriting Verification はコメントを受け付けていません

PerAct2: Benchmarking and Learning for Robotic Bimanual Manipulation Tasks

要約 両手操作は、2 つのアーム間の正確な空間的および時間的調整が必要なため、困 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | PerAct2: Benchmarking and Learning for Robotic Bimanual Manipulation Tasks はコメントを受け付けていません

Generalized Out-of-Distribution Detection and Beyond in Vision Language Model Era: A Survey

要約 配布外 (OOD) サンプルの検出は、機械学習システムの安全性を確保するた … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Generalized Out-of-Distribution Detection and Beyond in Vision Language Model Era: A Survey はコメントを受け付けていません

MoFO: Momentum-Filtered Optimizer for Mitigating Forgetting in LLM Fine-Tuning

要約 最近、大規模言語モデル (LLM) は、幅広いタスクにおいて顕著な機能を実 … 続きを読む

カテゴリー: cs.AI, cs.LG | MoFO: Momentum-Filtered Optimizer for Mitigating Forgetting in LLM Fine-Tuning はコメントを受け付けていません

SpaER: Learning Spatio-temporal Equivariant Representations for Fetal Brain Motion Tracking

要約 この論文では、等変フィルターと自己注意メカニズムを活用して時空間表現を効果 … 続きを読む

カテゴリー: cs.CV, eess.IV | SpaER: Learning Spatio-temporal Equivariant Representations for Fetal Brain Motion Tracking はコメントを受け付けていません