python正則化，Spark MLlib（一）正則化特征

2023-11-18 阅读 20 评论 0

摘要：Spark 在其 MLlib 機器學習庫中內置了一些函數用于特征的縮放和標準化。（1）StandardScaler：標準正太變換（2）Normalizer：特征向量正則化（范數為1，xi∥x∥\frac {x_i}{\|\mathbf x\|}） pyspark >>> f

Spark 在其 MLlib 機器學習庫中內置了一些函數用于特征的縮放和標準化。

（1）StandardScaler：標準正太變換
（2）Normalizer：特征向量正則化（范數為1， $\frac {x_i}{\|\mathbf x\|}$ ）

pyspark

>>> from pyspark.mllib.feature import Normalizer

python正則化，驗證兩種方式（直接使用 numpy 相關函數進行處理，使用 mllib 提供的類）的歸一化結果：

>>> import numpy as np
>>> np.__version__
'1.9.2'                         # 注意 numpy 的版本要高于 1.4 才行
>>> np.random.seed(42)
>>> x = np.random.randn(10)

（1）numpy 相關函數

>>> normalized_x_2 = x / np.linalg.norm(x)

（2）使用 MLlib 類

>>> from pyspark.mllib.feature import Normalizer
>>> normalizer = Normalizer()
>>> x = sc.parallelize([x])
>>> normalized_x_mllib = normalizer.transform(x).first().toArray()# toArray：返回 numpy 數組

原文链接：https://hbdhgg.com/3/176568.html

上一篇：java 模板類，標準模板庫（STL）之 priority_queue 列傳

下一篇：python數據結構，Python 數據結構與算法 —— list與deque（雙端隊列）

标签：python正則化數據正則化 l1正則化和l2正則化 l1正則化能得到稀疏解 pytorch l2正則化如果lasso的正則參數很大正則化參數 lasso正則化

python正則化

发表评论: