Python 2.7 Pandas只写入CSV文件中的最后一行_Python 2.7_Dataframe_Web Scraping_Python Requests_Export To Csv - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 2.7 Pandas只写入CSV文件中的最后一行_Python 2.7_Dataframe_Web Scraping_Python Requests_Export To Csv - Fatal编程技术网

Python 2.7 Pandas只写入CSV文件中的最后一行

python-2.7 dataframe web-scraping

Python 2.7 Pandas只写入CSV文件中的最后一行,python-2.7,dataframe,web-scraping,python-requests,export-to-csv,Python 2.7,Dataframe,Web Scraping,Python Requests,Export To Csv,我正在从txt文件中抓取URL并将其导出到csv文件。但是在所有的过程之后，我的代码只写最后一个url中的信息。我猜我忘记了一个循环。但是在哪里呢？这是我的密码： import requests from bs4 import BeautifulSoup import pandas as pd from urllib import urlopen file = open('urls.txt', 'r') filelines = (line.strip() for line in file)

我正在从txt文件中抓取URL并将其导出到csv文件。但是在所有的过程之后，我的代码只写最后一个url中的信息。我猜我忘记了一个循环。但是在哪里呢？这是我的密码：

import requests
from bs4 import BeautifulSoup
import pandas as pd
from urllib import urlopen

file = open('urls.txt', 'r')
filelines = (line.strip() for line in file)
for code in filelines:
    site = urlopen(code)
    soup = BeautifulSoup(site, "html.parser")
    final = soup.find_all("span", {"class": "bd js-title-main-info"})
    print final

records = []
for pagetxt in final:
    print pagetxt.text
    records.append((pagetxt.text))
df = pd.DataFrame(records, columns=['product name'])  
df.to_csv('test.csv', index=False, encoding='utf-8')

谢谢

当您从文件中获取数据时，您只保留变量

final

中的最后一个值。尝试更早地附加数据（我已经用

标记了更改）：
import requests
from bs4 import BeautifulSoup
import pandas as pd
from urllib import urlopen

file = open('urls.txt', 'r')
filelines = (line.strip() for line in file)
records = []                         ######
for code in filelines:
    site = urlopen(code)
    soup = BeautifulSoup(site, "html.parser")
    final = soup.find_all("span", {"class": "bd js-title-main-info"})
    print final

    for pagetxt in final:               ######
       print pagetxt.text               ######
       records.append((pagetxt.text))   ######   

df = pd.DataFrame(records, columns=['product name'])  
df.to_csv('test.csv', index=False, encoding='utf-8')




[dataframe]相关文章推荐



                                                        
Dataframe 为什么在将csv加载到pyspark数据帧时类型都是字符串？
dataframepyspark 
Dataframe 无法广播isna。对于DataArray.DataArray{String}
dataframejulia 
将csv文件从pypark dataframe保存到s3存储桶中
dataframeamazon-s3pyspark 
如何在Julia中将GroupedDataFrame转换为DataFrame？
dataframejulia 
Dataframe 从红移读取Spark数据帧返回空数据帧
dataframeapache-sparkpysparkamazon-redshift 
Pyspark—将dataframe列的值提供给函数，并将函数的输出附加到原始dataframe
dataframepyspark 
Dataframe 带空条件的Pypark连接
dataframeapache-sparkjoinpyspark 
如何根据不同dataframe列的值从pyspark dataframe中筛选出行
dataframejoinpyspark 
将多个函数应用于Julia DataFrames.jl中的单个列
dataframejulia 
                                       





随机文章推荐



                                                        
如何在作业后脚本中获得Jenkins中使用JUnit XML格式运行的测试数量？
jenkinscontinuous-integration 
安装Jenkins角色策略插件后-所有登录失败
jenkins 
Jenkins 詹金斯有没有像TeamCity'；服务信息？
jenkinscontinuous-integration 
Jenkins CI-无法向通讯组列表发送后期生成电子邮件
jenkins 
Docker在新EC2 Jenkins从机上的首次执行不起作用
jenkinsamazon-ec2docker 
Jenkins Cron表达式未安排在正确的时间
jenkinscron 
下游和子项目之间的Jenkins差异
jenkins 
使用公共IP地址访问Jenkins
jenkinsamazon-ec2 
无法连接到Mac上在Vagrant内部运行的Jenkins docker容器
jenkinsdockervagrant 
如何从Jenkins为maven指定-X或-e标志
jenkins 
Jenkins 作业DSL将作业限制到选定节点
jenkinsgroovy 
Jenkins 詹金斯错误：“；错误：除非提供有效的用户名/密码，否则无法安装JDK；
jenkins 
如何在Jenkins中使用测试选择器插件？
jenkins 
Jenkinsfile将变量复制到文件
jenkins 
如何阅读Jenkins网页钩子帖子请求正文？
jenkinscontinuous-integration 
压缩jenkins工作区文件夹中的所有文件
jenkins 
ZAP扫描：Jenkins作业失败（url不是上下文中的）
jenkins 
在Jenkins的哪里可以找到application/lib日志文件
jenkins 
传递参数化Jenkins项目的整数参数
jenkins 
github的Jenkins Blue Ocean插件webhook集成？
jenkins


                                        

                                        
                                        


                                                
                                                        [python 2.7]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Cypress
Html
Vuejs2
Asp.net Core
Push Notification
Notifications
Install4j
Mapping
Inno Setup
Cucumber
Arrays
Windows 7
Rx Java
Camera
Eclipse
Ruby On Rails 3.1
Udp
Function
Opengl Es
Processing
Aframe
Docker
Certificate
Hazelcast
Azure Data Factory
Dojo
Batch File
Ipad
Heroku
Xamarin.forms
Google Chrome Devtools
Iis
Data Binding
Puppet
Xamarin.android
Wpf
F#
Ms Word
Reporting Services
Material Ui
Sip
Ag Grid
Geometry
Validation
Phpmyadmin
Angular Material
Internationalization
Neo4j
Titanium
Bootstrap 4
Vim
Cmake
Webview
Logic
Google Cloud Platform
Blazor
Jira
Llvm
Sharepoint 2013
Windows Mobile
Orchardcms
Unix
Dataframe
Elm
Algorithm
Memory
Haskell
Delphi
Swift2
Email
Grep
Ethereum
Swift3
Documentation
Compiler Errors
Magento2
Aws Lambda
Emacs
Discord.js
Terminal
Laravel 5
Clearcase
Mapbox
Playframework 2.0
Akka
Charts
Module
Command Line
Tinymce
Outlook
Cocoa
Nuget
Openerp
Html5 Canvas
Orm
Gwt
Ajax
Directory
Actionscript 3
Compression
Image
Memory Management
Karate
Winforms
Security
Nest
Yii
Powerbi
Web Services
Firefox
Arduino
Python 2.7
.net 4.0
Keycloak
Pentaho
Notepad++
Spring Security
Listview
Directx
Atom Editor
Checkbox
Oauth 2.0
Continuous Integration
Android Studio
Socket.io
Apache2
Lisp
Pip
Libgdx
Hybris
Class
Apache Flink
Scripting
Xcode
Inheritance
Jersey
Rspec
Twilio
Text
Z3
Phpunit
Odata
Qt
Next.js
Selenium Webdriver
Entity Framework
Random
Exchange Server
C# 4.0
Rxjs
Servlets
Oracle10g
Usb
Enums
Database
Apache Zookeeper
Memory Leaks
Odoo
Testing
Opencl
Xna
Wcf
Omnet++
Concurrency
Devexpress
Map
D3.js
Highcharts
Colors
Rdf
Yaml
Windows Runtime
Iis 7
Netlogo
Linux
R
Vue.js
Cron
Asp.net Mvc 3
Dialogflow Es
Qml
Visual Studio
Umbraco
Erlang
Apache Camel
Sql
X86
Jvm
Yocto
Symfony
Maven
Download
Amazon S3
Dom
C++11
Spring
Object
Loops
Cloud Foundry
Menu
Vector


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网