人工智能学习笔记----05
数据理解
一、数据导入
一般都是使用一些模块导入csv文件
csv文件介绍
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本来开启,再则先另存新档后用EXCEL开启,也是方法之一。
例如:
二、数据的维度
一般为言,进行数据处理的都是二阶的张量。
三、数据可视化
一般使用matplotlib来实现
四、数据预处理
进行数据的一些变换或者分割之类的操作
五、选定数据的特征
有一些特征可以根据我们的直观判断就知道是否是有意义的特征,可以直接进行筛选。
本次笔记做到这了,先结束了啦。
后面会继续学习的偶!!!
欢迎大家进行吐槽了啦。~~~~~~