Keras 如何使用on_hot组合文本和数字
我正在使用keras,我想训练一个模型来识别文本。然而,在我的文本中,我也有数字。当然,由于_hot上的文本中有一个数字,我不知道如何处理它,我得到了这个错误: AttributeError:“float”对象没有属性“translate” 知道我该怎么办吗? 我有如下文字:Keras 如何使用on_hot组合文本和数字,keras,one-hot-encoding,Keras,One Hot Encoding,我正在使用keras,我想训练一个模型来识别文本。然而,在我的文本中,我也有数字。当然,由于_hot上的文本中有一个数字,我不知道如何处理它,我得到了这个错误: AttributeError:“float”对象没有属性“translate” 知道我该怎么办吗? 我有如下文字: “9145>23[SYN]Seq=0 Win=12713 Len=0[以太网帧检查序列不正确]”我无法重现您的错误。当调用one_hot时,数字是字符串。为了向你们展示,我调用了text-To-word-sequence
“9145>23[SYN]Seq=0 Win=12713 Len=0[以太网帧检查序列不正确]”我无法重现您的错误。当调用one_hot时,数字是字符串。为了向你们展示,我调用了text-To-word-sequence
In [8]: from keras.preprocessing import text as kt
In [9]: text = '9145 > 23 [SYN] Seq=0 Win=12713 Len=0 [ETHERNET FRAME CHECK SEQUENCE INCORRECT]'
In [10]: kt.text_to_word_sequence(text)
Out[10]:
['9145',
'23',
'syn',
'seq',
'0',
'win',
'12713',
'len',
'0',
'ethernet',
'frame',
'check',
'sequence',
'incorrect']
In [11]: kt.one_hot(text, 20)
Out[11]: [12, 3, 9, 4, 5, 18, 12, 2, 5, 1, 13, 12, 16, 17]
啊,你是对的,是nan值导致了它爆炸。非常感谢你的帮助。