归一化函数python 归一化函数是什么意思

python数据归一化的函数吗

目测是autonorm.py中lin 17 normdataset=zeros(shape(dataset)) 这一句 shape(dataset)返回的是元组，但是zeros( args )需要的是整形参数，做个类型转换就ok了

站在用户的角度思考问题，与客户深入沟通，找到定兴网站设计与定兴网站推广的解决方案，凭借多年的经验，让设计与互联网技术结合，创造个性化、用户体验好的作品，建站类型包括：成都网站设计、成都网站制作、企业官网、英文网站、手机端网站、网站推广、域名与空间、网络空间、企业邮箱。业务覆盖定兴地区。

PYTHON实现对CSV文件多维不同单位数据的归一化处理

1）线性归一化

这种归一化比较适用在数值比较集中的情况，缺陷就是如果max和min不稳定，很容易使得归一化结果不稳定，使得后续的效果不稳定，实际使用中可以用经验常量来代替max和min。

2）标准差标准化

经过处理的数据符合标准正态分布，即均值为0，标准差为1。

3）非线性归一化

经常用在数据分化较大的场景，有些数值大，有些很小。通过一些数学函数，将原始值进行映射。该方法包括log、指数、反正切等。需要根据数据分布的情况，决定非线性函数的曲线。

log函数：x = lg(x)/lg(max)

反正切函数：x = atan(x)*2/pi

Python实现

线性归一化

定义数组：x = numpy.array(x)

获取二维数组列方向的最大值：x.max(axis = 0)

获取二维数组列方向的最小值：x.min(axis = 0)

对二维数组进行线性归一化：

def max_min_normalization(data_value, data_col_max_values, data_col_min_values):

""" Data normalization using max value and min value

Args:

data_value: The data to be normalized

data_col_max_values: The maximum value of data's columns

data_col_min_values: The minimum value of data's columns

"""

data_shape = data_value.shape

data_rows = data_shape[0]

data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):

for j in xrange(0, data_cols, 1):

data_value[i][j] = \

(data_value[i][j] - data_col_min_values[j]) / \

(data_col_max_values[j] - data_col_min_values[j])

标准差归一化

定义数组：x = numpy.array(x)

获取二维数组列方向的均值：x.mean(axis = 0)

获取二维数组列方向的标准差：x.std(axis = 0)

对二维数组进行标准差归一化：

def standard_deviation_normalization(data_value, data_col_means,

data_col_standard_deviation):

""" Data normalization using standard deviation

Args:

data_value: The data to be normalized

data_col_means: The means of data's columns

data_col_standard_deviation: The variance of data's columns

"""

data_shape = data_value.shape

data_rows = data_shape[0]

data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):

for j in xrange(0, data_cols, 1):

data_value[i][j] = \

(data_value[i][j] - data_col_means[j]) / \

data_col_standard_deviation[j]

非线性归一化（以lg为例）

定义数组：x = numpy.array(x)

获取二维数组列方向的最大值：x.max(axis=0)

获取二维数组每个元素的lg值：numpy.log10(x)

获取二维数组列方向的最大值的lg值：numpy.log10(x.max(axis=0))

对二维数组使用lg进行非线性归一化：

def nonlinearity_normalization_lg(data_value_after_lg,

data_col_max_values_after_lg):

""" Data normalization using lg

Args:

data_value_after_lg: The data to be normalized

data_col_max_values_after_lg: The maximum value of data's columns

"""

data_shape = data_value_after_lg.shape

data_rows = data_shape[0]

data_cols = data_shape[1]

for i in xrange(0, data_rows, 1):

for j in xrange(0, data_cols, 1):

data_value_after_lg[i][j] = \

data_value_after_lg[i][j] / data_col_max_values_after_lg[j]

Python怎么对数据框中的两列进行归一化？

可以使用sklearn库中的MinMaxScaler函数：

```

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()

data[['col1', 'col2']] = scaler.fit_transform(data[['col1', 'col2']])

```

Python 数据归一化/标准化

数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。最典型的就是数据的归一化处理，即将数据统一映射到(0,1]区间上

（1）0-1标准化

将数据的最大最小值记录下来，并通过max-min作为基数（即min=0,max=1)进行数据的归一化处理

x=(x - min) / (max - min)

（2）Z-score标准化

Z分数（z-score），是一个分数与平均数的差再除以标准差的过程 → z=(x-μ)/σ，其中x为某一具体分数，μ为平均数，σ为标准差

Z值的量代表着原始分数和母体平均值之间的距离，是以标准差为单位计算。在原始分数低于平均值时Z则为负数，反之则为正数

数学意义：一个给定分数距离平均数多少个标准差?

在python上数据归一化后怎样还原

看到各位大佬们都会把原始数据进行归一化，再处理。可是都没有人讲怎样把归一化的数据还原回来。

目前可找到的方法就只有matlab上的这个函数：

xtt = mapminmax('reverse',y1,ps)

在python上，就看到许多人推荐用sklearn进行归一化，但没有还原的方法呀。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

你要问我为什么要还原？

把日期和气温的数据放到模型里跑半天，想看看下一天的气温，结果出来一个0.837之类东西。

sklearn中transform用来归一化后，可以用inverse_transform还原。

[Python] 数组归一化

将数组归一化

归一化：将一组数据变化到某个固定区间中，通常，这个区间是[0,1]，广义的讲，可以是各种区间，比如映射到[0,1]一样可以继续映射到其他范围，图像中可能会映射到[0,255]，其他情况可能映射到[-1,1]。

名称栏目：归一化函数python 归一化函数是什么意思
文章转载：http://kswsj.cn/article/hpsdjp.html

关于创新互联

归一化函数python 归一化函数是什么意思

python数据归一化的函数吗

PYTHON实现对CSV文件多维不同单位数据的归一化处理

Python怎么对数据框中的两列进行归一化？

Python 数据归一化/标准化

在python上数据归一化后怎样还原

[Python] 数组归一化

其他资讯