Python 2.7 带数值数据的Python浮点错误_Python 2.7_Scikit Learn_Pca

Python 2.7 带数值数据的Python浮点错误

python-2.7 scikit-learn

Python 2.7 带数值数据的Python浮点错误,python-2.7,scikit-learn,pca,Python 2.7,Scikit Learn,Pca,我试图在一个包含162列和69000行的数据集上使用sklearn运行PCA。我一直收到下面的浮动错误消息，我已经检查过，以确保我只有数字数据。我可能做错了什么？任何帮助都将不胜感激 >>> data = np.loadtxt("PCAdata.txt") >>> trans = data.transpose() >>> trans array([[0., 0., 1., ..., 0., 0., 1.],

我试图在一个包含162列和69000行的数据集上使用sklearn运行PCA。我一直收到下面的浮动错误消息，我已经检查过，以确保我只有数字数据。我可能做错了什么？任何帮助都将不胜感激

    >>> data = np.loadtxt("PCAdata.txt")
    >>> trans = data.transpose()
    >>> trans
    array([[0., 0., 1., ..., 0., 0., 1.],
           [0., 0., 1., ..., 1., 0., 2.],
           [0., 0., 1., ..., 0., 0., 1.],
           ...,
           [1., 0., 1., ..., 0., 0., 1.],
           [0., 0., 1., ..., 0., 0., 2.],
           [0., 0., 1., ..., 0., 0., 2.]])
    >>> sscaler = preprocessing.StandardScaler().fit(trans)
    >>> sscaler
    StandardScaler(copy=True, with_mean=True, with_std=True)
    >>> pca = PCA(n_components=2)
    >>> pca.fit(sscaler)
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
      File "C:\Python27\lib\site-packages\sklearn\decomposition\pca.py", line 329, i
    n fit
        self._fit(X)
      File "C:\Python27\lib\site-packages\sklearn\decomposition\pca.py", line 370, i
    n _fit
        copy=self.copy)
      File "C:\Python27\lib\site-packages\sklearn\utils\validation.py", line 433, in
     check_array
        array = np.array(array, dtype=dtype, order=order, copy=copy)
    TypeError: float() argument must be a string or a number

>data=np.loadtxt（“PCAdata.txt”）
>>>trans=data.transpose（）
>>>反式
数组（[[0,0,1.，…，0,0,1.]），
[0., 0., 1., ..., 1., 0., 2.],
[0., 0., 1., ..., 0., 0., 1.],
...,
[1., 0., 1., ..., 0., 0., 1.],
[0., 0., 1., ..., 0., 0., 2.],
[0., 0., 1., ..., 0., 0., 2.]])
>>>sscaler=preprocessing.StandardScaler（）.fit（trans）
>>>sscaler
StandardScaler（复制=真，平均值=真，标准值=真）
>>>pca=pca（n_分量=2）
>>>pca.fit（sscaler）
回溯（最近一次呼叫最后一次）：
文件“”，第1行，在
文件“C:\Python27\lib\site packages\sklearn\decomposition\pca.py”，第329行，i
n适合
自适配（X）
文件“C:\Python27\lib\site packages\sklearn\decomposition\pca.py”，第370行，i
不合适
复制=自我复制）
文件“C:\Python27\lib\site packages\sklearn\utils\validation.py”，第433行，在
校验数组
array=np.array（array，dtype=dtype，order=order，copy=copy）
TypeError:float（）参数必须是字符串或数字

fit

方法不返回矩阵。Sklearn给出错误，因为您输入的参数，

sscaler

，不是数字矩阵。如果要获得缩放数据矩阵，可以使用

fit\u transform

方法，或分别使用

fit

和

transform

方法

例如：

data = np.random.randint(0, 3, (100, 10))
scaler = StandardScaler()
data = scaler.fit_transform(data)
pca = PCA()
data = pca.fit_transform(data)