cs.AI」カテゴリーアーカイブ

Modeling cognitive processes of natural reading with transformer-based Language Models

要約 自然言語処理(NLP)の最近の進歩により、テキスト生成のために非常に洗練さ … 続きを読む

カテゴリー: cs.AI, cs.CL | Modeling cognitive processes of natural reading with transformer-based Language Models はコメントを受け付けていません

Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization

要約 犬の樹皮を聞いて、駐車した車を見るためだけに音に向かって曲がると想像してく … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization はコメントを受け付けていません

Equal is Not Always Fair: A New Perspective on Hyperspectral Representation Non-Uniformity

要約 ハイパースペクトル画像(HSI)表現は、スペクトル依存性、空間連続性、およ … 続きを読む

カテゴリー: cs.AI, cs.CV | Equal is Not Always Fair: A New Perspective on Hyperspectral Representation Non-Uniformity はコメントを受け付けていません

Communication-Efficient Federated Learning Based on Explanation-Guided Pruning for Remote Sensing Image Classification

要約 Federated Learning(FL)は、クライアントのローカルデー … 続きを読む

カテゴリー: cs.AI, cs.CV | Communication-Efficient Federated Learning Based on Explanation-Guided Pruning for Remote Sensing Image Classification はコメントを受け付けていません

Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models

要約 ビジョン言語モデル(VLM)は、画像キャプションやビデオ質問の回答などのオ … 続きを読む

カテゴリー: cs.AI, cs.CV | Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models はコメントを受け付けていません

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

要約 検証可能な報酬(RLVR)による強化学習は最近、特に数学とプログラミングタ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model? はコメントを受け付けていません

Patho-R1: A Multimodal Reinforcement Learning-Based Pathology Expert Reasoner

要約 ビジョン言語モデル(VLM)の最近の進歩により、一般的な医療分野での広範な … 続きを読む

カテゴリー: cs.AI, cs.CV | Patho-R1: A Multimodal Reinforcement Learning-Based Pathology Expert Reasoner はコメントを受け付けていません

Visual Planning: Let’s Think Only with Images

要約 大規模な言語モデル(LLMS)とそのマルチモーダル拡張(MLLM)の最近の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | Visual Planning: Let’s Think Only with Images はコメントを受け付けていません

Improving Object Detection Performance through YOLOv8: A Comprehensive Training and Evaluation Study

要約 本研究では、YOLOv8ベースのセグメンテーションモデルによる顔画像のしわ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Improving Object Detection Performance through YOLOv8: A Comprehensive Training and Evaluation Study はコメントを受け付けていません

SurgPose: Generalisable Surgical Instrument Pose Estimation using Zero-Shot Learning and Stereo Vision

要約 ロボット支援低侵襲手術(RMIS)における外科的ツールの正確なポーズ推定は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | SurgPose: Generalisable Surgical Instrument Pose Estimation using Zero-Shot Learning and Stereo Vision はコメントを受け付けていません