Can';t使用python请求和beautifulsoup从页面提取信息
我试图从使用python请求和BeautifulSoup中提取一些信息(最新消息),但遇到了一些问题。我没有太多的刮削经验,但我想学习与请求刮削 这是我目前正在编写的一段代码,我被困在这里:Can';t使用python请求和beautifulsoup从页面提取信息,python,web-scraping,beautifulsoup,python-requests,Python,Web Scraping,Beautifulsoup,Python Requests,我试图从使用python请求和BeautifulSoup中提取一些信息(最新消息),但遇到了一些问题。我没有太多的刮削经验,但我想学习与请求刮削 这是我目前正在编写的一段代码,我被困在这里: import requests from requests import session from bs4 import BeautifulSoup link_root = r'https://www.rtrs.tv/vijesti/index.php' with session() as c:
import requests
from requests import session
from bs4 import BeautifulSoup
link_root = r'https://www.rtrs.tv/vijesti/index.php'
with session() as c:
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'}
r = c.get(link_root, headers=headers)
print r
soup = BeautifulSoup(r.text, 'html.parser')
print soup
我在打印时得到了这个结果(我只获取了我感兴趣的部分数据):
Вишковић: Нисам добио ниједан захтјев од Милићевића
预期会出现类似的情况:ПаПааПаПаПаПаПаПаПаПаПаааааа(Фааа107
所以我想知道,网站是否使用西里尔语很重要,还是存在其他问题
有人知道可能的解决办法吗
import requests
from bs4 import BeautifulSoup
r = requests.get('https://www.rtrs.tv/vijesti/index.php')
soup = BeautifulSoup(r.text, 'html.parser')
for item in soup.findAll('ul', attrs={'class': 'ul-najnovije'}):
for new in item.findAll('li'):
print(new.text)
输出:
Вишковић: Нисам добио ниједан захтјев од Милићевића
БиХ не иде у НАТО; Српска враћена као фактор одлучивања (ФОТО)
Драган Богданић реизабран за предсједника теслићког СНСД-а
Милиновић: РТРС уређују људи посвећени Српској
СИПА заплијенила 100 килограма дроге на подручју Требиња (ФОТО)
Тришић Бабић: Прича о члансту у НАТО стављена са стране
Додик за Раша тудеј: БиХ је неуспјешан експеримент Запада
Како је Шаровић удомио Пандуревићеву
Девастирано Партизанско спомен-гробље у Мостару
Додик: СДС и ПДП хтјели да сједе у Сарајеву и наређују Српској (ВИДЕО)
Вулин: Угрожавањем безбједности Срба аутоматски угрожена и Србија
Вулин: Угрожавањем безбједности Срба аутоматски угрожена и Србија
Вулин: Угрожавањем безбједности Срба аутоматски угрожена и Србија
Путин честитао Кустурици рођендан (ФОТО)
Високи Дечани прославили ктиторску славу (ФОТО)
Србија остаје војно неутрална
Бреза: Мислили да је из Београда па му издували гуму и оставили поруку "Србине" (ФОТО)
Тихи одлазак Милана Дашића
Приједор: Завршена Друга балканска изложба ситних животиња (ФОТО)
Пас убацио аутомобил у рикверц и возио сат времена (ВИДЕО)
У малом Међувођу партизански авион пркоси времену
Бијељинац једини спасилац на води и под водом у зимским условима
У великом пожару у Сплиту петоро повријеђених (ФОТО/ВИДЕО)
Тужбу за Јасеновац упутити Суду у Стразбуру
Афера "Муниција": Павловић на слободи
Полиција разоружала тзв. Штајерску стражу (ФОТО)
Албанија отвара конзулат у Улцињу
У поплавама у Француској двоје несталих, поплављене стотине кућа (ФОТО)
Џонсон: Брегзит ће омогућити талас инвестиција
Најмоћнија икад забиљежена експлозија у свемиру (ВИДЕО)
"Пола свијета крвари због америчке похлепе"
Папа позвао на потпуну забрану нуклеарног оружја (ФОТО/ВИДЕО)
"Тесла" има скоро 150.000 наруџби за нови електрични камионет
Хаџићи једни од највећих произвођача мркве у Српској
Здрава храна адут средњег Подриња (ВИДЕО)
Више од 50 излагача на Аранђеловданском вашару (ФОТО)
Њемачки ауто-гигант повлачи 230.000 аутомобила
Билећа: Oдузето 6.700 паклица цигарета
Упао у кућу, претукао власника и украо 2.200 евра
Младић из Србије напао возача и претукао полицајце у Бечу
Пронађено тијело мушкарца у Сарајеву
МУП: Благић приведен јер је организовао јавни скуп без пријаве надлежном органу
"Српско благо из Беча и Вукова продаја српских реликвија" у Требињу
Позориште младих "Корфеј" из Нове Биле гостовало у Требињу
Бањалука: Отворена изложба о страдању југа Србије у Великом рату (ФОТО)
Промовисани 21. "Градишки зборник" и 22. зборник "Истина о Србима"
Филм "Четири руже" ускоро у кинима (ВИДЕО)
Соколац јутрос у минусу
У недјељу облачно уз краће сунчане интервале
Облачно уз дуже сунчане интервале
У суботу облачно са сунчаним интервалима
Сунчано уз умјерену облачност, температура до 18 степени
可能只是因为您没有西里尔字体来显示它,或者它采用了不同的编码,然后
UTF-8
,您得到了错误的编码。idk如果这是您想要的还是没有。检查我的答案。如果您在显示输出时仍有问题,请检查。请告知您正在使用的IDLE
!并确认您是否正在使用windows
!另外,如果您以python script.py
的方式运行脚本,请告知。也请为我运行此脚本import sys
,然后print(sys.stdin.encoding)