本篇文章小编给大家分享一下python读取以空格分开的文件操作代码,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看。
在查找数据集的时候发现,并不是所有的数据集都是以csv的格式存储,也就是每一列特征数据的分割并不是都以逗号分割,有的数据格式是以空格为分割
例如.data格式,
接下来就实现对.data格式数据的读取:
(数据来源于Boston房价预测数据集,文件名称为“housing.data”)
import pandas as pd data = pd.read_csv('./housing.data', delim_whiteshape=True)
以上代码就是实现了对空格的分割,但是不知道针对也是以一列存储,并且数据分割也是空格的csv文件此方法还行得通不。
另外pd.read_csv()中的参数sep和delimiter表示的意义一样,具体如何使用不清楚,目前用到不多。
遇到读取文件不知如何操作的,最后要访问下官方文档或者google查询。
pd.read_csv官方文档
另外,可以直接在原数据集文件加后缀名.csv即可转换成csv文件,但前提是data中的数据已经以,分割好了。
pd.read_csv()中读取文件时,默认第一行作为列名,但有时候第一行也是我们需要的数据,这时需制定参数header=None,或者给每列提前设置好名字,names=[‘column0',‘column1',…]