Python 无法在beautiful soup中正确获取时间戳

Python 无法在beautiful soup中正确获取时间戳,python,web-scraping,beautifulsoup,timestamp,web-scraping-language,Python,Web Scraping,Beautifulsoup,Timestamp,Web Scraping Language,请参考所附图片。我正在尝试获取时间戳和下面的10#内容,如图所示,以及下面代码中的预期输出,但是我无法获取“40分钟前”类型的文本。相反,我得到的是这种格式的“08-04-2021 16:48:34” from bs4 import BeautifulSoup import requests URL="https://trends24.in/india/" html_text=requests.get(URL) soup= Beau

请参考所附图片。我正在尝试获取时间戳和下面的10#内容,如图所示,以及下面代码中的预期输出,但是我无法获取“40分钟前”类型的文本。相反,我得到的是这种格式的“08-04-2021 16:48:34”

 from bs4 import BeautifulSoup
    import requests
    
    URL="https://trends24.in/india/"
    html_text=requests.get(URL)
    soup= BeautifulSoup(html_text.content,'lxml')
    results = []
    
    job_elem=soup.findAll(attrs={'class': 'trend-card'})
    for j in job_elem:
        print(j.find('h5').get_text())
    
    for i in soup.select('#trend-list li'):
         d = dict()
         d[i.a.text] = ''
         try:
             val = i.select_one('.tweet-count').text
         except:
             val = "NA"
         finally:
             d[i.a.text] = val
             results.append(d)
             print(d)
**Output:**

08-04-2021 16:48:34
08-04-2021 15:54:30
08-04-2021 15:01:07
...
{'#AskNivetha': 'NA'}
{'#TikaUtsav': 'NA'}
{'#VakeelSaabFestivalBegins': '62K'}
...

**expected output :**

40 minutes ago  

{'#AskNivetha': 'NA'}
{'#TikaUtsav': 'NA'}
{'#VakeelSaabFestivalBegins': '62K'}
{'ANMOL SUSHANT': '33K'}
{'#TheBigBull': 'NA'}
{'#IPL2021': '73K'}
{'nidra ley uv creations': '64K'}
{'Chief Ministers': 'NA'}
{'B. True 48MP Camera': 'NA'}
{'conan': '51K'}

1 hour ago

{'#AskNivetha': 'NA'}
{'#VakeelSaabFestivalBegins': '50K'}
{'NIDRA LEY UV CREATIONS': '59K'}
{'#SecretOfHappyLiving': 'NA'}
{'#MeditateToRaiseWillpower': 'NA'}
{'#HappinessMantra': 'NA'}
{'ANMOL SUSHANT': 'NA'}
{'Tika Utsav': 'NA'}
{'Chief Ministers': 'NA'}
{'conan': '46K'}

 

我还试图获取时间戳和10个内容标题。如所附屏幕截图所示。

这是存储日期时间信息的格式。禁用JavaScript,您将看到:

您在网页中看到的是
数据时间戳
属性值,当JavaScript在网页中运行时,该属性值会被美化。更具体地说,当调用以下命令时:

T24.prettyDate=函数(t){
var e=新日期(1e3*t),
n=((新日期).getTime()-e.getTime())/1e3,
a=数学楼层(n/86400);
return isNaN(a)| a<0?“:0==a&&((n<900?):n<1800&“几分钟前”)| n<3600&&Math.floor(n/60)+“分钟前”| n<7200&“1小时前”| n<86400&&Math.floor(n/3600)+“小时前”)| 1==a&“昨天”| a<7&&a+“几天前”1247周前”| | 31}
谢谢!然而,我得到了预期的输出。例如:40分钟前、1小时前等等,我应该如何与IST(印度标准时间)或任何其他时间交叉验证此时间线?如果在目标元素上使用带有get_属性(“数据-时间戳”)的selenium,则可以提取数据时间戳属性。然后使用库来管理对话,例如utz,我想转换为IST,例如,假设我有字符串格式的输出,例如:40分钟前、1小时前、2小时前,我应该如何将其转换为正确的时间戳?有什么例子吗?请看我上面的评论