Python 如何使用urllib编辑csv文件?

Python 如何使用urllib编辑csv文件?,python,csv,urllib,Python,Csv,Urllib,我想下载和操纵一个csv文件,当我打开一个历史股票报价从雅虎金融 简要了解csv文件的外观: Date,Open,High,Low,Close,Volume,Adj Close 2012-11-30,691.31,699.22,685.69,698.37,3163600,698.37 2012-11-29,687.78,693.90,682.00,691.89,2776500,691.89 2012-11-28,668.01,684.91,663.89,683.67,3042000,683.67

我想下载和操纵一个csv文件,当我打开一个历史股票报价从雅虎金融

简要了解csv文件的外观:

Date,Open,High,Low,Close,Volume,Adj Close
2012-11-30,691.31,699.22,685.69,698.37,3163600,698.37
2012-11-29,687.78,693.90,682.00,691.89,2776500,691.89
2012-11-28,668.01,684.91,663.89,683.67,3042000,683.67
我想创建一个代码,删除单词“open、High、Low、Close、Volume、Adj”及其下面的数据,并添加两个新列,这样我就可以:

Date        Close    [Insert new column here] [Another column]
2012-11-30  698.37      ---some data----       ---some data----
2012-11-29  691.89      ---some data----       ---some data----
2012-11-28  683.67      ---some data----       ---some data----
我是Python的初学者,所以写这段代码有点困难。如果有人能帮我,我将非常感激

到目前为止,这就是我所拥有的,尽管它显然没有按照我想要的方式工作

def _download_url(url):
    response = None
    try:
        response = urllib.request.urlopen(url)
        content_bytes=response.read()
        content_string=content_bytes.decode(encoding='utf-8')
        data = io.StringIO(content_string)
        mycsv=csv.reader(data)
        for row in mycsv:
            if row:
                print(row[0],row[6])
此代码打印出来(简要概述):

这是我想要的,但我想删除“Adj”,并添加两个新列。
谢谢大家!

在创建
数据之前,请调整
内容\u字符串以删除“Adj”:

content_string=content_bytes.decode(encoding='utf-8')
content_string = content_string.replace('Adj ', '')
data = io.StringIO(content_string)

至于添加列,您可以在
print
语句中这样做。

我碰巧是
csv
中的
DictReader
类的超级粉丝,因为它消除了解析
csv
的所有猜测(没有更多索引!):

mycsv=csv.DictReader(数据)

打印('{:如果你还没有完全投入到你的设计中,我建议你看看。这样做比其他方式容易得多。获取数据:

>>> from pandas.io.data import DataReader
>>> apple = DataReader("AAPL",  "yahoo")
>>> apple
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 786 entries, 2010-01-04 00:00:00 to 2013-02-15 00:00:00
Data columns:
Open         786  non-null values
High         786  non-null values
Low          786  non-null values
Close        786  non-null values
Volume       786  non-null values
Adj Close    786  non-null values
dtypes: float64(5), int64(1)
>>> apple[:5]
              Open    High     Low   Close    Volume  Adj Close
Date                                                           
2010-01-04  213.43  214.50  212.38  214.01  17633200     210.90
2010-01-05  214.60  215.59  213.25  214.38  21496600     211.26
2010-01-06  214.38  215.23  210.75  210.97  19720000     207.90
2010-01-07  211.75  212.00  209.05  210.58  17040400     207.52
2010-01-08  210.30  212.00  209.06  211.98  15986100     208.90
仅选择所需的列:

>>> new = apple[["Close", "new_column"]]
>>> new[:5]
             Close  new_column
Date                          
2010-01-04  214.01    6.430066
2010-01-05  214.38    6.354936
2010-01-06  210.97    6.389032
2010-01-07  210.58    6.433440
2010-01-08  211.98    6.451164

等等。

我试过这样做,但是我如何在我刚刚添加的新列下面添加不同的数据?'123'和'456'似乎在这些列下面重复,但我希望它是不同的值。当然,你必须用你想要的数据替换
打印
中的
123
456
。不,我是说ab当我替换print语句中的“123”和“456”时,当我想要像“123”“345”“567”这样的值时,它在每个列“123”下重复相同的值。它只是在重复…用您想要的计算替换它。
>>> from pandas.io.data import DataReader
>>> apple = DataReader("AAPL",  "yahoo")
>>> apple
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 786 entries, 2010-01-04 00:00:00 to 2013-02-15 00:00:00
Data columns:
Open         786  non-null values
High         786  non-null values
Low          786  non-null values
Close        786  non-null values
Volume       786  non-null values
Adj Close    786  non-null values
dtypes: float64(5), int64(1)
>>> apple[:5]
              Open    High     Low   Close    Volume  Adj Close
Date                                                           
2010-01-04  213.43  214.50  212.38  214.01  17633200     210.90
2010-01-05  214.60  215.59  213.25  214.38  21496600     211.26
2010-01-06  214.38  215.23  210.75  210.97  19720000     207.90
2010-01-07  211.75  212.00  209.05  210.58  17040400     207.52
2010-01-08  210.30  212.00  209.06  211.98  15986100     208.90
>>> apple["new_column"] = apple["Open"]/apple["Volume"]**0.3 + 5
>>> apple[:5]
              Open    High     Low   Close    Volume  Adj Close  new_column
Date                                                                       
2010-01-04  213.43  214.50  212.38  214.01  17633200     210.90    6.430066
2010-01-05  214.60  215.59  213.25  214.38  21496600     211.26    6.354936
2010-01-06  214.38  215.23  210.75  210.97  19720000     207.90    6.389032
2010-01-07  211.75  212.00  209.05  210.58  17040400     207.52    6.433440
2010-01-08  210.30  212.00  209.06  211.98  15986100     208.90    6.451164
>>> new = apple[["Close", "new_column"]]
>>> new[:5]
             Close  new_column
Date                          
2010-01-04  214.01    6.430066
2010-01-05  214.38    6.354936
2010-01-06  210.97    6.389032
2010-01-07  210.58    6.433440
2010-01-08  211.98    6.451164