Python 无法在beautiful soup中正确获取时间戳_Python_Web Scraping_Beautifulsoup_Timestamp_Web Scraping Language

Python 无法在beautiful soup中正确获取时间戳

python web-scraping

Python 无法在beautiful soup中正确获取时间戳,python,web-scraping,beautifulsoup,timestamp,web-scraping-language,Python,Web Scraping,Beautifulsoup,Timestamp,Web Scraping Language,请参考所附图片。我正在尝试获取时间戳和下面的10#内容，如图所示，以及下面代码中的预期输出，但是我无法获取“40分钟前”类型的文本。相反，我得到的是这种格式的“08-04-2021 16:48:34” from bs4 import BeautifulSoup import requests URL="https://trends24.in/india/" html_text=requests.get(URL) soup= Beau

请参考所附图片。我正在尝试获取时间戳和下面的10#内容，如图所示，以及下面代码中的预期输出，但是我无法获取“40分钟前”类型的文本。相反，我得到的是这种格式的“08-04-2021 16:48:34”

 from bs4 import BeautifulSoup
    import requests
    
    URL="https://trends24.in/india/"
    html_text=requests.get(URL)
    soup= BeautifulSoup(html_text.content,'lxml')
    results = []
    
    job_elem=soup.findAll(attrs={'class': 'trend-card'})
    for j in job_elem:
        print(j.find('h5').get_text())
    
    for i in soup.select('#trend-list li'):
         d = dict()
         d[i.a.text] = ''
         try:
             val = i.select_one('.tweet-count').text
         except:
             val = "NA"
         finally:
             d[i.a.text] = val
             results.append(d)
             print(d)
**Output:**

08-04-2021 16:48:34
08-04-2021 15:54:30
08-04-2021 15:01:07
...
{'#AskNivetha': 'NA'}
{'#TikaUtsav': 'NA'}
{'#VakeelSaabFestivalBegins': '62K'}
...

**expected output :**

40 minutes ago  

{'#AskNivetha': 'NA'}
{'#TikaUtsav': 'NA'}
{'#VakeelSaabFestivalBegins': '62K'}
{'ANMOL SUSHANT': '33K'}
{'#TheBigBull': 'NA'}
{'#IPL2021': '73K'}
{'nidra ley uv creations': '64K'}
{'Chief Ministers': 'NA'}
{'B. True 48MP Camera': 'NA'}
{'conan': '51K'}

1 hour ago

{'#AskNivetha': 'NA'}
{'#VakeelSaabFestivalBegins': '50K'}
{'NIDRA LEY UV CREATIONS': '59K'}
{'#SecretOfHappyLiving': 'NA'}
{'#MeditateToRaiseWillpower': 'NA'}
{'#HappinessMantra': 'NA'}
{'ANMOL SUSHANT': 'NA'}
{'Tika Utsav': 'NA'}
{'Chief Ministers': 'NA'}
{'conan': '46K'}

我还试图获取时间戳和10个内容标题。如所附屏幕截图所示。

这是存储日期时间信息的格式。禁用JavaScript，您将看到：

您在网页中看到的是

数据时间戳

属性值，当JavaScript在网页中运行时，该属性值会被美化。更具体地说，当调用以下命令时：

T24.prettyDate=函数（t）{
var e=新日期（1e3*t），
n=（（新日期）.getTime（）-e.getTime（））/1e3，
a=数学楼层（n/86400）；
return isNaN（a）| a<0？“：0==a&&（（n<900？）：n<1800&“几分钟前”）| n<3600&&Math.floor（n/60）+“分钟前”| n<7200&“1小时前”| n<86400&&Math.floor（n/3600）+“小时前”）| 1==a&“昨天”| a<7&&a+“几天前”1247周前”| | 31}

谢谢！然而，我得到了预期的输出。例如：40分钟前、1小时前等等，我应该如何与IST（印度标准时间）或任何其他时间交叉验证此时间线？如果在目标元素上使用带有get_属性（“数据-时间戳”）的selenium，则可以提取数据时间戳属性。然后使用库来管理对话，例如utz，我想转换为IST，例如，假设我有字符串格式的输出，例如：40分钟前、1小时前、2小时前，我应该如何将其转换为正确的时间戳？有什么例子吗？请看我上面的评论