curve fitting怎么導入數據，sklearn.metrics.roc_curve使用說明-基礎知識庫-匯編語言學習筆記

curve fitting怎么導入數據，sklearn.metrics.roc_curve使用說明

2023-12-25 阅读 26 评论 0

摘要：roc曲線是機器學習中十分重要的一種學習器評估準則，在sklearn中有完整的實現，api函數為sklearn.metrics.roc_curve(params)函數。 curve fitting怎么導入數據、官方接口說明：http://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curv

roc曲線是機器學習中十分重要的一種學習器評估準則，在sklearn中有完整的實現，api函數為sklearn.metrics.roc_curve(params)函數。

curve fitting怎么導入數據、官方接口說明：http://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curve.html

不過這個接口只限于進行二分類任務。！

下面主要是對官方接口做一下翻譯。

接口函數 ??sklearn.metrics.roc_curve(y_true,?y_score,?pos_label=None,?sample_weight=None,?drop_intermediate=True)

參數說明

　　　　y_true：數組，存儲數據的標簽，維度就是樣本數，形如[0,1,1,0,1...]這樣的，也可以是-1和1，只要有兩個值

　　　　y_score：數組，存儲數據的預測概率值，維度也是樣本數，形如[0.38,0.5,0.8]這樣的

　　　　pos_label：整型或字符串，當y_true中只有一個值時，比如都是1或者都是0，無法判斷哪個是正樣本，需要用一個數字或字符串指出

　　　　sample_weight：采樣權重，這個官方沒有仔細說，是一個可選參數，有待考察

　　　　drop_intermediate：丟掉一些閾值，以便畫roc曲線圖

返回值：一共三個，分別是fpr,tpr,thresholds

　　　　fpr：數組，隨閾值上漲的假陽性率

　　　　tpr：數組，隨閾值上漲的真正例率

　　　　thresholds：數組，對預測值排序后的score列表，作為閾值，排序從大到小

舉例

>>> import numpy as np
>>> from sklearn import metrics
>>> y = np.array([1, 1, 2, 2])
>>> scores = np.array([0.1, 0.4, 0.35, 0.8])
>>> fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2)
>>> fpr
array([ 0. ,  0.5,  0.5,  1. ])
>>> tpr
array([ 0.5,  0.5,  1. ,  1. ])
>>> thresholds
array([ 0.8 ,  0.4 ,  0.35,  0.1 ])