Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/89.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用python将文本设置为html文本区域_Python_Html - Fatal编程技术网

使用python将文本设置为html文本区域

使用python将文本设置为html文本区域,python,html,Python,Html,我想得到用户输入的文本,处理它,然后显示在html文本区。文本是英文的。目前我得到的是一些乱七八糟的html标签。 如果我用的是英语弦而不是僧伽罗语弦,这就行了。 这就是我到目前为止所尝试的 cgitb.enable() #for debugging form = cgi.FieldStorage() doc1 = form.getvalue('doc1') doc2 = form.getvalue('doc2') sinstopwords = set(stopwords.words("

我想得到用户输入的文本,处理它,然后显示在html文本区。文本是英文的。目前我得到的是一些乱七八糟的html标签。 如果我用的是英语弦而不是僧伽罗语弦,这就行了。 这就是我到目前为止所尝试的

cgitb.enable() #for debugging  
form = cgi.FieldStorage()  
doc1 = form.getvalue('doc1')
doc2 = form.getvalue('doc2')
sinstopwords = set(stopwords.words("sinhala"))
p = re.compile('[0-9]{1,9}')
p1 = re.compile('[0-9]{1,9}.[0-9]{1,9}')

data1 = doc1.replace('-','')
data2 = doc2.replace('-','')

newdata1 = p1.sub('0', p.sub('0',data1))
words1 = word_tokenize(newdata1)
newdata2 = p1.sub('0', p.sub('0',data2))
words2 = word_tokenize(newdata2)

filtered_sentence1 = [w1 for w1 in words1 if not w1 in sinstopwords]
filtered_sentence2 = [w2 for w2 in words2 if not w2 in sinstopwords]

outtext1 = ''
outtext2 = ''
for i in filtered_sentence1:
    outtext1 = outtext1 + i + ' '

for j in filtered_sentence2:
    outtext2 = outtext2 + j + ' '
下面是我如何使用print()在python中设置输出

打印(“”)
打印(输出文本1)
打印(“”)
文件2
""")
打印(输出文本2)
打印(“”)
删除停止字之前doc1的标记长度
""")

这似乎是一些转换问题,但我没有任何想法来纠正这一点。

您可以展示一个“胡言乱语”输出和“真实输出”的示例吗?您如何部署它?如果您在终端本地试用它,是否也会发生这种情况?乱七八糟的输出-
-->
我想看到的是'කෙසේ හෝ උදෑසන 10ට පමණ අප පන්සල් භූමියෙන් පිටත්ව උමා ඔය මාර්ගය අසලට පැමිණියේ වතුර බෝතල් 2.ක් හා කැමරාව පමණක් අතැතිවය. මෙම ගමනේ අතිශය දුෂ්කර ජීවිත අවදානම පිරුණු කඳු නැගීම් තිබෙන අතර ඒ සඳහා කිසිදු කඹයක්වත් නොමැතිව' 在僧伽罗就有类似的情况。我正在本地部署这个lamp@syntonym@abought我在这个问题上看到了你的答案(),你已经提到过,“如果你这样做是为了显示任意的用户输入,那么一定要以某种方式预处理你的字符串,以避免在你的表单中间插入任意的HTML代码。”我想这就是我的问题所在。你能给我一些例子来说明如何预处理输入文本吗?因为我的输出中似乎有一些任意的html代码。提前谢谢
print("""<textarea class="form-control" rows="20" name="doc1">""")
print(outtext1)
print("""</textarea>
            </div>
        </div>
        <div class="col-lg-6">
            <div class="form-group">
                <label>Document 2</label>
                <textarea class="form-control" rows="20" name="doc2">
""")
print(outtext2)
print("""</textarea>
            </div>
        </div>
        <div class="col-lg-12">
            <div class="col-lg-6">
                <div class="form-group">
                    <label>Token length of doc1 before removing stopwords</label>
""")