博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
四种方法下载网络文本数据到本地内存
阅读量:7233 次
发布时间:2019-06-29

本文共 1137 字,大约阅读时间需要 3 分钟。

import urllib.requestimport requestsfrom io import StringIOimport numpy as npimport pandas as pd'''下载网络文件,并导入CSV文件作为numpy的矩阵'''# 网络数据文件地址url = "http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data"# 方法一# ========================================================# 下载文件#r = urllib.request.urlopen(url)# 导入CSV文件作为numpy的矩阵#dataset = np.loadtxt(r, delimiter=",")# 方法二# ========================================================# 下载文件#r = requests.get(url)# 导入CSV文件作为numpy的矩阵#dataset = np.loadtxt(StringIO(r.text), delimiter=",") # 此处用到 StringIO !!!!!!# 方法三# ========================================================#用genfromtxt直接下载网络文件,并将CSV文件导作numpy矩阵。爽!!!!!!!!#dataset = np.genfromtxt(url, delimiter=",")# 方法四# ========================================================# 用pandas.read_csv直接下载网络文件,并将CSV文件导作pandas.DataFrame。# dataset = pd.read_csv('http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv', index_col=0)dataset = pd.read_csv(url)# ========================================================# separate the data from the target attributesX = dataset[:,0:7]y = dataset[:,8]print(X)#print(y)

 

转载地址:http://fupfm.baihongyu.com/

你可能感兴趣的文章
static和final修饰方法
查看>>
读《认知三部曲》
查看>>
关于SVN 目录结构
查看>>
tp5页面输出时,搜索后跳转下一页的处理
查看>>
crontab命令
查看>>
面试问题
查看>>
DeltaBlue基准测试显示 Dart2js生成的JavaScript代码优于手写代码
查看>>
cvReleaseImage()函数说明
查看>>
linux下查看某个文件属于哪个包
查看>>
Weui 文件上传完整版示例
查看>>
ubuntu上安装 MySQL 启动/停止 连接MySQL
查看>>
liunx 修改ssh 端口22
查看>>
iOS企业证书申请介绍
查看>>
hdu 1950 Bridging signals(最长上升子序列)
查看>>
jquery学习收获
查看>>
es6js promise在ie中报错“未定义”
查看>>
思科HSRP和Port-channel配置
查看>>
常用的sql脚本(陆续更新)
查看>>
mongodb的gridfs
查看>>
api图片传输,转成64位字符串进行传输
查看>>