Python 2.7 带数值数据的Python浮点错误

Python 2.7 带数值数据的Python浮点错误,python-2.7,scikit-learn,pca,Python 2.7,Scikit Learn,Pca,我试图在一个包含162列和69000行的数据集上使用sklearn运行PCA。我一直收到下面的浮动错误消息,我已经检查过,以确保我只有数字数据。我可能做错了什么?任何帮助都将不胜感激 >>> data = np.loadtxt("PCAdata.txt") >>> trans = data.transpose() >>> trans array([[0., 0., 1., ..., 0., 0., 1.],

我试图在一个包含162列和69000行的数据集上使用sklearn运行PCA。我一直收到下面的浮动错误消息,我已经检查过,以确保我只有数字数据。我可能做错了什么?任何帮助都将不胜感激

    >>> data = np.loadtxt("PCAdata.txt")
    >>> trans = data.transpose()
    >>> trans
    array([[0., 0., 1., ..., 0., 0., 1.],
           [0., 0., 1., ..., 1., 0., 2.],
           [0., 0., 1., ..., 0., 0., 1.],
           ...,
           [1., 0., 1., ..., 0., 0., 1.],
           [0., 0., 1., ..., 0., 0., 2.],
           [0., 0., 1., ..., 0., 0., 2.]])
    >>> sscaler = preprocessing.StandardScaler().fit(trans)
    >>> sscaler
    StandardScaler(copy=True, with_mean=True, with_std=True)
    >>> pca = PCA(n_components=2)
    >>> pca.fit(sscaler)
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
      File "C:\Python27\lib\site-packages\sklearn\decomposition\pca.py", line 329, i
    n fit
        self._fit(X)
      File "C:\Python27\lib\site-packages\sklearn\decomposition\pca.py", line 370, i
    n _fit
        copy=self.copy)
      File "C:\Python27\lib\site-packages\sklearn\utils\validation.py", line 433, in
     check_array
        array = np.array(array, dtype=dtype, order=order, copy=copy)
    TypeError: float() argument must be a string or a number
>data=np.loadtxt(“PCAdata.txt”)
>>>trans=data.transpose()
>>>反式
数组([[0,0,1.,…,0,0,1.]),
[0., 0., 1., ..., 1., 0., 2.],
[0., 0., 1., ..., 0., 0., 1.],
...,
[1., 0., 1., ..., 0., 0., 1.],
[0., 0., 1., ..., 0., 0., 2.],
[0., 0., 1., ..., 0., 0., 2.]])
>>>sscaler=preprocessing.StandardScaler().fit(trans)
>>>sscaler
StandardScaler(复制=真,平均值=真,标准值=真)
>>>pca=pca(n_分量=2)
>>>pca.fit(sscaler)
回溯(最近一次呼叫最后一次):
文件“”,第1行,在
文件“C:\Python27\lib\site packages\sklearn\decomposition\pca.py”,第329行,i
n适合
自适配(X)
文件“C:\Python27\lib\site packages\sklearn\decomposition\pca.py”,第370行,i
不合适
复制=自我复制)
文件“C:\Python27\lib\site packages\sklearn\utils\validation.py”,第433行,在
校验数组
array=np.array(array,dtype=dtype,order=order,copy=copy)
TypeError:float()参数必须是字符串或数字

fit
方法不返回矩阵。Sklearn给出错误,因为您输入的参数,
sscaler
,不是数字矩阵。如果要获得缩放数据矩阵,可以使用
fit\u transform
方法,或分别使用
fit
transform
方法

例如:

data = np.random.randint(0, 3, (100, 10))
scaler = StandardScaler()
data = scaler.fit_transform(data)
pca = PCA()
data = pca.fit_transform(data)