python正則化,Spark MLlib(一)正則化特征

 2023-11-18 阅读 20 评论 0

摘要:Spark 在其 MLlib 機器學習庫中內置了一些函數用于特征的縮放和標準化。 (1)StandardScaler:標準正太變換(2)Normalizer:特征向量正則化(范數為1,xi∥x∥\frac {x_i}{\|\mathbf x\|}) pyspark >>> f

Spark 在其 MLlib 機器學習庫中內置了一些函數用于特征的縮放和標準化。

  • (1)StandardScaler:標準正太變換
  • (2)Normalizer:特征向量正則化(范數為1,xix

pyspark

>>> from pyspark.mllib.feature import Normalizer

python正則化,驗證兩種方式(直接使用 numpy 相關函數進行處理,使用 mllib 提供的類)的歸一化結果:

>>> import numpy as np
>>> np.__version__
'1.9.2'                         # 注意 numpy 的版本要高于 1.4 才行
>>> np.random.seed(42)
>>> x = np.random.randn(10)
  • (1)numpy 相關函數

    >>> normalized_x_2 = x / np.linalg.norm(x)
  • (2)使用 MLlib 類

    >>> from pyspark.mllib.feature import Normalizer
    >>> normalizer = Normalizer()
    >>> x = sc.parallelize([x])
    >>> normalized_x_mllib = normalizer.transform(x).first().toArray()# toArray:返回 numpy 數組
    

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/3/176568.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息