sklearn.metrics模块重要API总结(持续更新)
创始人
2024-02-14 10:36:25
0

目录

  • 前言
  • 各类指标
    • 分类指标(Classification metrics)
      • sklearn.metrics.accuracy_score
      • sklearn.metrics.auc
      • average_precision_score (AP)
    • 回归指标(Regression metrics)
    • 多标签排序指标(Multilabel ranking metrics)
    • 聚类指标(Clustering metrics)
    • 双聚类指标(Biclustering metrics)
    • 距离指标(Distance metrics)
    • Pairwise metrics
  • 绘图

前言

平时训练模型,会写一些评估函数,简单的评估函数如准确率等很容易实现,当使用AUC、NDCG等指标时,调用sklearn.metrics不仅准确可靠,而且速度飞快。

sklearn有三种不同的度量:

  • Estimator score method:估计器有一个评分方法,为他们要解决的问题提供默认的评估标准。
  • Scoring parameter:模型评估工具使用交叉验证(如model_selection.cross_val_scoremodel_selection.GridSearchCV)依赖于内部评分策略。
  • Metric functionssklearn.metrics 模块实现了为特定目的评估预测误差的功能。这些指标在分类指标(Classification metrics)、多标签排名指标(Multilabel ranking metrics)、回归指标(Regression metrics)和聚类指标(Clustering metrics)部分中有详细说明。

本节主要就是介绍Metric functions

参考资料:
sklearn.metrics官方文档

各类指标

sklearn.metrics一个package,包含评分函数(score functions)、性能指标(性能指标)、pairwise metrics和距离计算(distance computations)。

分类指标(Classification metrics)

sklearn.metrics.accuracy_score

准确度分类得分。为样本预测的标签集必须与y_true中的相应标签集完全匹配。也可以给样本加权,详见sklearn.metrics.accuracy_score文档

accuracy_score(y_true, y_pred)

y_pred = [0, 2, 1, 3]
y_true = [0, 1, 2, 3]
accuracy_score(y_true, y_pred)
"""
输出:
0.5
"""

sklearn.metrics.auc

使用梯形法则(trapezoidal rule)求曲线下的面积“Area Under the Curve (AUC) ”。这是一个通用的求曲线下面积的函数,只需要给定曲线上的点。要计算ROC曲线下的面积,使用roc_auc_score

简单来说,这就是一个根据梯形法则逼近曲线在区间内的积分,比如我们计算 y=x2y=x^2y=x2 在区间 [0,2][0,2][0,2] 内的面积,通过牛顿-莱布尼茨公式可以计算出其面积为 83{\frac 8 3}38​,我们只需要给定 y=x2y=x^2y=x2 曲线在 [0,1][0,1][0,1] 上的点,就可以用梯形法则逼近其区间内的面积,见如下图片及代码部分(图片来源于南安普顿大学)。
在这里插入图片描述

sklearn.metrics.auc(x, y)
x:x坐标,要么是单调递增,要么是单调递减。
y:y坐标。

import numpy as np
from sklearn import metrics
# n越大,结果越精确
n = 10000000
x = np.linspace(0,2,n)
y = x**2
metrics.auc(x, y)
"""
输出:
2.6666666666666803
"""

average_precision_score (AP)

计算平均查准率(average precision, AP)。

AP=∑n(Rn−Rn−1)Pn\text{AP} = \sum_n (R_n - R_{n-1}) P_n AP=n∑​(Rn​−Rn−1​)Pn​

回归指标(Regression metrics)

多标签排序指标(Multilabel ranking metrics)

聚类指标(Clustering metrics)

双聚类指标(Biclustering metrics)

距离指标(Distance metrics)

Pairwise metrics

绘图

相关内容

热门资讯

喜欢穿一身黑的男生性格(喜欢穿... 今天百科达人给各位分享喜欢穿一身黑的男生性格的知识,其中也会对喜欢穿一身黑衣服的男人人好相处吗进行解...
发春是什么意思(思春和发春是什... 本篇文章极速百科给大家谈谈发春是什么意思,以及思春和发春是什么意思对应的知识点,希望对各位有所帮助,...
网络用语zl是什么意思(zl是... 今天给各位分享网络用语zl是什么意思的知识,其中也会对zl是啥意思是什么网络用语进行解释,如果能碰巧...
为什么酷狗音乐自己唱的歌不能下... 本篇文章极速百科小编给大家谈谈为什么酷狗音乐自己唱的歌不能下载到本地?,以及为什么酷狗下载的歌曲不是...
家里可以做假山养金鱼吗(假山能... 今天百科达人给各位分享家里可以做假山养金鱼吗的知识,其中也会对假山能放鱼缸里吗进行解释,如果能碰巧解...
华为下载未安装的文件去哪找(华... 今天百科达人给各位分享华为下载未安装的文件去哪找的知识,其中也会对华为下载未安装的文件去哪找到进行解...
四分五裂是什么生肖什么动物(四... 本篇文章极速百科小编给大家谈谈四分五裂是什么生肖什么动物,以及四分五裂打一生肖是什么对应的知识点,希...
怎么往应用助手里添加应用(应用... 今天百科达人给各位分享怎么往应用助手里添加应用的知识,其中也会对应用助手怎么添加微信进行解释,如果能...
客厅放八骏马摆件可以吗(家里摆... 今天给各位分享客厅放八骏马摆件可以吗的知识,其中也会对家里摆八骏马摆件好吗进行解释,如果能碰巧解决你...
苏州离哪个飞机场近(苏州离哪个... 本篇文章极速百科小编给大家谈谈苏州离哪个飞机场近,以及苏州离哪个飞机场近点对应的知识点,希望对各位有...