Pandas 我需要从一句话的开头过滤这个专栏

Pandas 我需要从一句话的开头过滤这个专栏,pandas,dataframe,python-3.7,Pandas,Dataframe,Python 3.7,在我的代码中,我可以从精确的文本中过滤出一列,并且它可以毫无问题地工作。但是,有必要过滤另一个以句子开头的列。 本栏中的短语包括: A_2020.092222 A_2020.090787 B_2020.983898 B_2020.209308 所以,我需要接收所有从A_20和B_20开始的内容 提前谢谢 我的代码: from bs4 import BeautifulSoup import pandas as pd import zipfile, urllib.request, shutil, t

在我的代码中,我可以从精确的文本中过滤出一列,并且它可以毫无问题地工作。但是,有必要过滤另一个以句子开头的列。 本栏中的短语包括: A_2020.092222 A_2020.090787 B_2020.983898 B_2020.209308 所以,我需要接收所有从A_20和B_20开始的内容

提前谢谢

我的代码:

from bs4 import BeautifulSoup
import pandas as pd
import zipfile, urllib.request, shutil, time, csv, datetime, os, sys, os.path


#location
dt = datetime.datetime.now()
file_csv = "/home/Downloads/source.CSV"
file_csv_new = "/var/www/html/Data/Test.csv"

#open CSV
with open(file_csv, 'r', encoding='CP1251') as file:
 reader = csv.reader(file, delimiter=';')
 data = list(reader)

#list to dataframe
df = pd.DataFrame(data)

#filter UF
df = df.loc[df[9].isin(['PR','SC','RS'])]

#filter key
# A_ & B_
df = df.loc[df[35].isin(['A_20','B_20'])]

#print (df)
#Empty DataFrame
#Columns: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ...]
#Index: []

#[0 rows x 119 columns]```

尝试以下方法:

lst1 = ['A_2020.092222', 'A_2020.090787 ', 'B_2020.983898', 'B_2020.209308', 'C_2020.209308', 'D_2020.209308'] 

df = pd.DataFrame(lst1,   columns =['Name']) 

df.loc[df.Name.str.startswith(('A_20','B_20'))]

尝试以下方法:

lst1 = ['A_2020.092222', 'A_2020.090787 ', 'B_2020.983898', 'B_2020.209308', 'C_2020.209308', 'D_2020.209308'] 

df = pd.DataFrame(lst1,   columns =['Name']) 

df.loc[df.Name.str.startswith(('A_20','B_20'))]

解释一下这段代码是做什么的,以及OP为什么应该尝试它,在这里会有好处!嗯,它从一开始就过滤记录,这就是麦克德温在寻找的。它起作用了!感谢@Priyanka
df=df.loc[df[40].str.startswith(('Org.Chave','A_20','B_20'))
解释一下这段代码的作用以及OP为什么应该尝试这段代码在这里会有好处!嗯,它从一开始就过滤记录,这就是麦克德温在寻找的。它起作用了!谢谢@Priyanka
df=df.loc[df[40].str.startswith(('Org.Chave','A_20','B_20'))]