Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/performance/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何读取只有一列的某些行的html?_Python_Pandas - Fatal编程技术网

Python 如何读取只有一列的某些行的html?

Python 如何读取只有一列的某些行的html?,python,pandas,Python,Pandas,我试图阅读下表: 为了做到这一点,我正在使用以下代码: pd.read_html('http://unicode.org/emoji/charts/full-emoji-list.html', skiprows=2, encoding="utf-8")[0] 问题是,如果使用skiprows,将跳过前两列,但选择3列作为标题,另一个问题是标题在表中多次出现 那么,如何才能读取这些内容,避免多个标题和只有一行的列呢 谢谢你试试这个 df = pd.read_html('ht

我试图阅读下表:

为了做到这一点,我正在使用以下代码:

pd.read_html('http://unicode.org/emoji/charts/full-emoji-list.html', skiprows=2, encoding="utf-8")[0]
问题是,如果使用skiprows,将跳过前两列,但选择3列作为标题,另一个问题是标题在表中多次出现

那么,如何才能读取这些内容,避免多个标题和只有一行的列呢

谢谢你试试这个

df = pd.read_html('http://unicode.org/emoji/charts/full-emoji-list.html',encoding="utf-8")[0]
df.columns = [i[2] for i in df.columns]
现在,如果您打印
df
,它看起来是这样的

                     №                                               Code           Browser  ...               DCM              KDDI                  CLDR Short Name
0                    1                                            U+1F600                 �  ...                 —                 —                    grinning face
1                    2                                            U+1F603                 �  ...               NaN               NaN      grinning face with big eyes
2                    3                                            U+1F604                 �  ...                 —                 —  grinning face with smiling eyes
3                    4                                            U+1F601                 �  ...               NaN               NaN   beaming face with smiling eyes
4                    5                                            U+1F606                 �  ...               NaN                 —          grinning squinting face
...                ...                                                ...               ...  ...               ...               ...                              ...
2063  subdivision-flag                                   subdivision-flag  subdivision-flag  ...  subdivision-flag  subdivision-flag                 subdivision-flag
2064                 №                                               Code           Browser  ...               DCM              KDDI                  CLDR Short Name
2065              1814  U+1F3F4 U+E0067 U+E0062 U+E0065 U+E006E U+E006...           �������        ...                 —                 —                    flag: England
2066              1815  U+1F3F4 U+E0067 U+E0062 U+E0073 U+E0063 U+E007...           �������        ...                 —                 —                   flag: Scotland
2067              1816  U+1F3F4 U+E0067 U+E0062 U+E0077 U+E006C U+E007...           �������        ...                 —                 —                      flag: Wales

[2068 rows x 15 columns]

试着用熊猫的read\u html阅读它。更多信息在我正在使用read_html,但我复制了另一个trie。我更新了问题。您希望的输出是什么样子的?我只希望得到一个带有代码和浏览器图标表示的表。这不起作用,您只选择了一列的行。我选择了所有的行和列。您可以在末尾看到-
2068行x 15列