输入
CSV
|
|
预处理
iloc
: 数据截取
|
|
fillna
: 把空值 NA
用指定值填充
|
|
get_dummies
: 进行
one-hot 编码
|
|
如果 Alley
有其他值比如 Bave
,则会多一列 Alley_Bave
只在值为 Bave
的行为 1
Why one-hot?
模型通常用 类型值 の差作为两个类别的差距 一般类别之间差距是两两等距的,而 label 编码不符合该特征,one-hot 编码符合
get_numpy
: 转为张量
|
|