用python进行CSV数据分析

用python进行CSV数据分析,python,csv,python-3.x,pandas,matplotlib,Python,Csv,Python 3.x,Pandas,Matplotlib,我应该分析csv文件中的数据。我需要可视化和打印: 访问最多的站点交通图 访问每个网站的用户数 在网站上花费的在线时间 我如何利用这些数据分别绘制2014年和2015年的第一张站点流量图: address used_at am.ru 2014 413071 2015 183402 auto.ru 2014 9122342

我应该分析csv文件中的数据。我需要可视化和打印:

访问最多的站点交通图 访问每个网站的用户数 在网站上花费的在线时间 我如何利用这些数据分别绘制2014年和2015年的第一张站点流量图:

address            used_at
am.ru              2014         413071
                   2015         183402
auto.ru            2014        9122342
                   2015        6923367
avito.ru           2014       84503151
                   2015       87688571
avtomarket.ru      2014         106849
                   2015          95927
cars.mail.ru/sale  2014         211456
                   2015         167278
drom.ru            2014       11014955
                   2015        9704124
e1.ru              2014       28678357
                   2015       27961857
irr.ru/cars        2014         222193
                   2015         133678

您需要包括您使用的csv文件的外观,如果我不知道引用的是什么,则无法提供帮助

作为提示,您可以使用pandas read_csv方法,而不必使用csv


例如:infle=pd.read_csvavito_trend.csv

如果您只想在csv中可视化和打印行,那么以下代码应该可以工作

table = []
with open('avito_trend.csv') as fin:
    reader = csv.reader(fin)
    for row in reader:
        table.append(row)
print(table)

我已经生成了3个网站的样本输入数据,时间跨度:2年,100.000条,因为您没有提供

代码:

输出:

Time spent online per web site
                duration
site
aliexpress.com  16603827
avito.ru        16560223
rozetka.ua      16731197

Time spent online per web site, per year
                     duration
ts   site
2014 aliexpress.com   8242863
     avito.ru         8288967
     rozetka.ua       8392353
2015 aliexpress.com   8360964
     avito.ru         8271256
     rozetka.ua       8338844

PS请始终提供5-10行样本输入和基于样本数据的预期输出

您可以添加吗?假设您提供的数据位于df数据框中:df.plotkind='barh'我使用csv文件和498430个字符串。它们看起来都像DC2829DA4D79AD3F554988471F0D534,avito.ru,2014-11-26 22:35:08132,7。1-用户id;2-网站;3-访问数据;4-在网站上上网,5-这不重要-你在哪里卡住了?如果你问了一些重要的问题,你应该开始编写一些代码,或者将项目分解成更易于管理的任务。我需要按访问年份分组。但我有2014-11-26 22:35:08格式的日期,我不知道我能做什么如果我需要分别打印2014年和2015年,我该怎么办?例如,在am.ru 2014 413071 2015 183402 auto.ru 2014 9122342 2015 6923367 avito.ru 2014 84503151 2015 87688571 avtomarket.ru 2014 106849使用的地址201595927@ldevyataykina,您应该使用预期输出的示例更新您的问题
Time spent online per web site
                duration
site
aliexpress.com  16603827
avito.ru        16560223
rozetka.ua      16731197

Time spent online per web site, per year
                     duration
ts   site
2014 aliexpress.com   8242863
     avito.ru         8288967
     rozetka.ua       8392353
2015 aliexpress.com   8360964
     avito.ru         8271256
     rozetka.ua       8338844