月別アーカイブ: 2025年1月

URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics

要約 思考連鎖 (CoT) 推論は、大規模言語モデル (LLM) の数学的推論に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics はコメントを受け付けていません

Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding

要約 世界とのインタラクションは、多感覚体験です。効果的な汎用インタラクションを … 続きを読む

カテゴリー: cs.AI, cs.RO | Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding はコメントを受け付けていません

EpiCoder: Encompassing Diversity and Complexity in Code Generation

要約 コード LLM を最適化し、モデルの動作をユーザーの期待に合わせて調整し、 … 続きを読む

カテゴリー: cs.AI, cs.CL | EpiCoder: Encompassing Diversity and Complexity in Code Generation はコメントを受け付けていません

The Role of Machine Learning in Congenital Heart Disease Diagnosis: Datasets, Algorithms, and Insights

要約 先天性心疾患は、最も一般的な胎児の異常および先天異常の 1 つです。 その … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | The Role of Machine Learning in Congenital Heart Disease Diagnosis: Datasets, Algorithms, and Insights はコメントを受け付けていません

Balanced 3DGS: Gaussian-wise Parallelism Rendering with Fine-Grained Tiling

要約 3D ガウス スプラッティング (3DGS) は、その優れたビジュアル品質 … 続きを読む

カテゴリー: cs.CV | Balanced 3DGS: Gaussian-wise Parallelism Rendering with Fine-Grained Tiling はコメントを受け付けていません

Efficient Video-Based ALPR System Using YOLO and Visual Rhythm

要約 自動ナンバー プレート認識 (ALPR) には、画像またはビデオ キャプチ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Efficient Video-Based ALPR System Using YOLO and Visual Rhythm はコメントを受け付けていません

From Pixels to Titles: Video Game Identification by Screenshots using Convolutional Neural Networks

要約 このペーパーでは、10 個の畳み込みニューラル ネットワーク (CNN) … 続きを読む

カテゴリー: cs.CV, cs.NE | From Pixels to Titles: Video Game Identification by Screenshots using Convolutional Neural Networks はコメントを受け付けていません

Energy-based Hopfield Boosting for Out-of-Distribution Detection

要約 機械学習モデルを現実世界に展開する場合、配布外 (OOD) の検出が重要で … 続きを読む

カテゴリー: cs.CV, cs.LG | Energy-based Hopfield Boosting for Out-of-Distribution Detection はコメントを受け付けていません

ReCLIP++: Learn to Rectify the Bias of CLIP for Unsupervised Semantic Segmentation

要約 最近の研究では、CLIP を利用して、注釈のない画像のみを利用できる、困難 … 続きを読む

カテゴリー: cs.CV | ReCLIP++: Learn to Rectify the Bias of CLIP for Unsupervised Semantic Segmentation はコメントを受け付けていません

Improving Image Captioning by Mimicking Human Reformulation Feedback at Inference-time

要約 自動的に予測された人間のフィードバックを生成モデルのトレーニング プロセス … 続きを読む

カテゴリー: cs.CL, cs.CV | Improving Image Captioning by Mimicking Human Reformulation Feedback at Inference-time はコメントを受け付けていません