Python 3.x 使用f.read（）对字符串进行切片的直接方法，最终将csv作为数据帧读取_Python 3.x_Pandas_Stringio - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/283.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 使用f.read（）对字符串进行切片的直接方法，最终将csv作为数据帧读取_Python 3.x_Pandas_Stringio - Fatal编程技术网

Python 3.x 使用f.read（）对字符串进行切片的直接方法，最终将csv作为数据帧读取

python-3.x pandas

Python 3.x 使用f.read（）对字符串进行切片的直接方法，最终将csv作为数据帧读取,python-3.x,pandas,stringio,Python 3.x,Pandas,Stringio,我有一个.csv文件，我想打开它并最终将其保存为一个数据帧。此文件在数据帧上方有一些垃圾文本，其标题从字符串Sample\u ID开始。我编写了一个代码，它分多个步骤完成这项工作，现在我想知道是否有更优雅的方法来完成这项工作。这是我的密码 import pandas as pd import re from io import StringIO with open('SampleSheet.csv') as f: ## read in the .csv file as a string

我有一个.csv文件，我想打开它并最终将其保存为一个数据帧。此文件在数据帧上方有一些垃圾文本，其标题从字符串

Sample\u ID

开始。我编写了一个代码，它分多个步骤完成这项工作，现在我想知道是否有更优雅的方法来完成这项工作。这是我的密码

import pandas as pd
import re
from io import StringIO

with open('SampleSheet.csv') as f:
    ## read in the .csv file as a string
    step1 = f.read()

    ## subset the step1 file
    # define where my df should start
    start = 'Sample_ID'
    step2 = step1[step1.index(start):]

    ## read in step2 as a pandas dataframe with stringio
    step3 = pd.read_csv(StringIO(step2))

我想知道是否有一种方法可以直接使用

f.read（）

，这样我就可以少走一步了

我还尝试将

pd.read\u csv（）

与

skiprows

一起使用，但我在分配以

Sample\u ID开始的行号时遇到了困难
您可以仅使用read\u csv（）
导入和读取文件，如下所示：
df  =   pd.read_csv('SampleSheet.csv', header=3)

where header是数据集开始之前要在文件顶部跳过的行数。
问题是，垃圾行的数量因我拥有的不同文件而异，这就是为什么我必须查找模式Sample\u ID
它们中没有一个可以做这项工作，因为垃圾行的数量不同（这会影响我要读取的所有SampleSheet.csv
中的标题和skiprows
）




[pandas]相关文章推荐



                                                        
Pandas 如何使用列创建新的Dataframe form Dataframe（PYTHON）
pandas 
使用pandas将带有字符串值的数据帧块附加到大型HDF5文件时出现异常
pandas 
Pandas 水蟒4.3头熊猫
pandasnumpyanaconda 
Pandas:获取分组数据帧中的日期时间标准
pandas 
Pandas Pyinstaller可执行文件非常大
pandasnumpyanaconda 
Pandas 使用matplotlib三维打印简单数据集
pandasmatplotlib 
Pandas 熊猫-以一根柱子和另一根柱子的圆木为基础
pandasnumpy 
Pandas 熊猫文件读取器错误FileNotFoundError:[WinError 3]
pandas 
Pandas 如何使用单行数据帧广播熊猫数据帧？
pandas 
Pandas 减去熊猫中的日期时间对象
pandasdataframedatetime 
如何在pandas数据帧上应用api
pandas 
Pandas 将特定值从一列复制到第二列
pandas 
Pandas 时间序列分析-将值放入存储箱
pandas 
Pandas 如何在groupby compute（）之后保留Dask数据帧
pandasdask 
Pandas 通过df.iloc中的可调用函数，每隔n列获取一段excel数据
pandas 
Pandas groupby连续值的加权平均值（将连续公共值保留在一列中）
pandas 
Pandas 左对齐标记中的整个表格（Jupyter）
pandasmarkdown 
Pandas 按索引编号排序的多索引数据帧索引
pandas 
Pandas 如何优化这些功能？
pandaslambda 
Pandas Jupyter笔记本仍在截断熊猫列
pandasdataframejupyter-notebook 
                                       





随机文章推荐


                                        

                                        
                                        


                                                
                                                        [python 3.x]相关推荐
                                                        
Python 3.x 在数据框中连接几行
									Python 3.x
							 									Dataframe
							 
Python 3.x python：多线程unix套接字传输非常慢
									Python 3.x
							 									Sockets
							 
Python 3.x 无法将pandas系列解析为datetime
									Python 3.x
							 									Pandas
							 									Datetime
							 
Python 3.x Can'；我想不出有多少关于mongoengine的更新
									Python 3.x
							 									Mongodb
							 
Python 3.x 使用日期值重塑/透视数据
									Python 3.x
							 									Pandas
							 
Python 3.x 如何基于具有多个ID的另一列从列中拾取特定值'；给
									Python 3.x
							 									Pandas
							 
Python 3.x 如何在ubuntu-14.04的pycharm-2018.2.4中的anaconda3和python 3.7中配置lpsolve？
									Python 3.x
							 									Pycharm
							 									Anaconda
							 
Python 3.x 为什么我应该使用（y，x）而不是（x，y）来访问opencv中的像素？
									Python 3.x
							 									Numpy
							 									Opencv
							 
Python 3.x 快速将大型Salesforce查询读入pandas
									Python 3.x
							 									Pandas
							 
Python 3.x Yaml与Python 3
									Python 3.x
							 									Tensorflow
							 									Keras
							 
Python 3.x 在Python 3中的CSV文件的两个连续行之间插入新行
									Python 3.x
							 									Csv
							 
Python 3.x 如何在windows 10上的GitBash环境中配置代理
									Python 3.x
							 									Windows
							 									Proxy
							 
Python 3.x 使用Python复制和粘贴Photoshop图层
									Python 3.x
							 
Python 3.x （一周）作为您的开始DAG时间。也就是说，获取当前运行的开始时间，减去7天的时间增量。如果它们是分开的，您可以将计划的时间间隔更改为每周运行，并使用相同的代码。要获取的区块/时间间隔如：2018-01-01至2018-01-072018-01-08至201
									Python 3.x
							 									Airflow
							 
Python 3.x 在python中舍入到下一个5的倍数
									Python 3.x
							 
Python 3.x 如何构建用于创建模型的分类器？
									Python 3.x
							 									Machine Learning
							 
Python 3.x 使用pip3不工作的SymPy安装
									Python 3.x
							 									Visual Studio Code
							 
Python 3.x 对数据帧中的每个项执行计算
									Python 3.x
							 									Pandas
							 									Dataframe
							 
Python 3.x 将我的文件保存在共享驱动器google colab上
									Python 3.x
							 									Google Colaboratory
							 
Python 3.x 如何在API中使用参数访问URL
									Python 3.x
							 									Python 2.7
							 									Api
							 									Flask
							 
Python 3.x “Django对象权限”；“django guardian”；技术管理对象权限用户界面
									Python 3.x
							 									Django Models
							 
Python 3.x 如何测试使用db并根据参数返回布尔值的函数
									Python 3.x
							 									Unit Testing
							 
Python 3.x 创建新对象时，即使使用默认值也会保留数据
									Python 3.x
							 
Python 3.x 如何打印文本文件中的每一行，而中间没有emtpy行？python
									Python 3.x
							 
Python 3.x 如何在matplotlib直方图中设置y轴？
									Python 3.x
							 									Pandas
							 									Matplotlib
							 
Python 3.x 如何正确地将字符串转换为列表
									Python 3.x
							 									String
							 									List
							 
Python 3.x 如何只匹配一行的双空格出现一次？
									Python 3.x
							 									Regex
							 
Python 3.x 根据python中的y轴值查找x轴值
									Python 3.x
							 									Matplotlib
							 
Python 3.x 将id/索引与xgboost/预测单个数据点的预测相匹配
									Python 3.x
							 									Pandas
							 									Dataframe
							 									Scikit Learn
							 
Python 3.x 我想制作一个discord.py机器人，它将逐行读取文本文件，并每小时输出一行文本
									Python 3.x
							 									Discord.py
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Loopbackjs
Ios7
String
Jsp
Entity Framework
Nservicebus
Programming Languages
Tags
Lucene
Time
Amazon S3
Wpf
Virtual Machine
Batch File
Svg
Botframework
Active Directory
Docusignapi
Ravendb
Doxygen
Ssas
Serialization
Usb
Jdbc
Haskell
Emacs
Optimization
Sms
Laravel
Css
Youtube Api
Hibernate
Yocto
Twig
Jvm
Synchronization
Ssl
Hyperlink
Xslt
Charts
Kernel
Pentaho
Utf 8
Rx Java
Multithreading
Dependency Injection
Activemq
Couchbase
Itext
Database
Sql Server
Angular
Openssl
Listview
Ms Access
Menu
Coldfusion
Typo3
Login
Geolocation
Session
Ruby On Rails 3
Encryption
Eclipse Plugin
Mysql
Msbuild
Xcode4
Java 8
Gridview
Jquery Plugins
Authentication
Pascal
Spring Batch
Windows Phone 8
Primefaces
Swift
Talend
Ruby On Rails 3.2
Openlayers 3
Extjs
Date
Magento2
Drupal 7
Asp.net Mvc 2
Ruby On Rails
Join
Npm
Browser
Maven
Eclipse Rcp
Tabs
Linq
Yaml
Typescript
Windows Phone 7
Numpy
Bash
Cocos2d X
Dynamic
Data Structures
Speech Recognition
Ssh
View
Grafana
Perforce
Ubuntu
Grep
Ip
Button
Gdb
Windows Phone 8.1
Dll
Azure Functions
Antlr
Compression
Air
Download
Windows 7
Azure
Ibm Mq
Google Colaboratory
Wso2
Cuda
Ruby On Rails 3.1
Asp.net Core
Isabelle
Checkbox
Requirejs
Model View Controller
Xsd
Neo4j
Aframe
Laravel 5
Microsoft Graph Api
Mod Rewrite
Telegram
Url Rewriting
Migration
Cmd
Amazon Web Services
Forms
Jquery Ui
Arrays
Sublimetext2
Pandas
Autodesk Forge
Asp.net Core Mvc
Plugins
Orchardcms
Jquery
Cypress
Kibana
Outlook
Binary
Composer Php
Dotnetnuke
Scikit Learn
Sencha Touch 2
Mongoose
Ffmpeg
Nativescript
Parse Platform
Curl
Sonarqube
Core Data
Titanium
Sql Server 2008 R2
Visual Studio 2012
Scheme
Here Api
Mapreduce
Reflection
Silverstripe
Prometheus
Image
Blockchain
Debugging
Gatsby
Vb6
Google Drive Api
Web
Vagrant
C# 4.0
Dialogflow Es
Apache Kafka
Csv
Jqgrid
Lotus Notes
Sublimetext3
Asp Classic
Cakephp
Frameworks
Graphics
Apache Storm
Doctrine Orm
Stanford Nlp
Orm
Dependencies
Encoding
Inno Setup
Class


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网