Python 如何查找文本功能并打印它们?

Python 如何查找文本功能并打印它们?,python,nltk,Python,Nltk,我刚刚开始使用自然语言工具包NLTK作为我工程学院项目的一部分。谁能告诉我如何阅读输入段落和文本 1将其分解为文本成分,即句子数量、单词数量、字符数量和给定段落中的复音或复合词数量 及 2同时打印上述确定值输入段落来自何处?文件安慰这比NLTK更像是python的问题 对于其余部分,请查看nltk.tokenize模块&nltk.probability.FreqDist。输入段落来自哪里?文件安慰这比NLTK更像是python的问题 对于其余部分,请查看以下讨论中的nltk.tokenize模块

我刚刚开始使用自然语言工具包NLTK作为我工程学院项目的一部分。谁能告诉我如何阅读输入段落和文本

1将其分解为文本成分,即句子数量、单词数量、字符数量和给定段落中的复音或复合词数量


2同时打印上述确定值

输入段落来自何处?文件安慰这比NLTK更像是python的问题


对于其余部分,请查看nltk.tokenize模块&nltk.probability.FreqDist。

输入段落来自哪里?文件安慰这比NLTK更像是python的问题

对于其余部分,请查看以下讨论中的nltk.tokenize模块&nltk.probability.FreqDist.

这应该可以给你每个单词的音节计数。希望这能有所帮助。

来自以下网站的讨论:


这应该可以给你每个单词的音节计数。希望这有帮助。

输入段落来自控制台和文件。我需要使用句子、单词、字符和复杂单词的数量来查找输入文本的可读性分数。一旦有了文本,nltk.tokenize.sent\u tokenize将给出句子数量,nltk.tokenize.word\u tokenize给出单词数量,当然还有lentext给出字符数量。但我不知道如何判断一个单词是否复杂——可能要计算元音的数量?如果输入可以来自控制台或文件,则需要单独的方法来读取文件。输入段落同时来自控制台和文件。我需要使用句子、单词、字符和复杂单词的数量来查找输入文本的可读性分数。一旦有了文本,nltk.tokenize.sent\u tokenize将给出句子数量,nltk.tokenize.word\u tokenize给出单词数量,当然还有lentext给出字符数量。但是我不知道有什么方法可以确定一个单词是否复杂——也许可以计算元音的数量?如果输入可以来自控制台或文件,则需要单独的方法来读取文件。
import curses 
from curses.ascii import isdigit 
import nltk 
from nltk.corpus import cmudict

d = cmudict.dict() 

def nsyl(word): 
  return [len(list(y for y in x if isdigit(y[-1]))) for x in d[word.lower()]]