吴思楠机器学习之路:Numpy里多维数组的创建

开发 开发工具 机器学习
Numpy是Python科学计算的核心库之一,主要提供了对多维数组的强有力支持。

[[188605]]

Numpy是Python科学计算的核心库之一,主要提供了对多维数组的强有力支持。

什么是多维数组?

核心对象是同型的多维数组(简单理解就是一个表格,通常内容都是些数字),具有相同的数据类型。

概念:

1. axes(轴):数组的维度统称为轴。

2. rank:轴的数量称为rank。

举例:一维数组[1,2,1],就是一个rank为1的数组,因为它只有一个轴(一维)。下图显示的是一个rank为2(二维)的数组。它的***个轴(维)的长度是2,如红色线框所示;第二个轴(维)的长度是3,如蓝色线框所示。这个有点像数据结构里说的:数组的元素本身也可以是数组类型一样,***扩展下去。

Numpy里的多维数组:ndarray

Numpy的数组类numpy.array一般称呼为ndarray,这么叫主要是为了和Python的数组类array.array区分开来。后面的文章里,如无特殊说明的地方,array和ndarray均是指的numpy.array。

ndarray(numpy.array)的主要属性:

  • ndim:数组的轴数(维度)
  • shape:python的元组类型,其中每个数字分别表示的是各个轴(维)上数组的长度
  • size:多维数组里全部元素的总数(等于shape元组里所有数值的乘积)
  • dtype:多维数组里元素的类型。同一个多维数组里所有的元素都是同一种类型

这里插播一下:

Anaconda是一个基于Python的Data Science Platform,相当于一个包装了数据分析常用库和工具的软件。它是我们开始学习的一个好帮手。下载地址:https://www.continuum.io/anaconda-overview

安装好后,打开“IPython”,或者“Jupyter QtConsole”,或者“Spyder”都可以。它们本质上都是对IPython这个交互式环境的包装。

练习:创建一个ndarray。

直接使用numpy.array()方法,参数为python的 list or tuple (sequence type)。下面的代码里,“In”是我们输入的代码,“Out”是上一行代码的输出。不是每一行代码都会有输出哦。

代码:

下面这张图是在“Spyder”里执行上面代码的效果图:

双击上图中的变量查看窗口(Variable explorer)里的ndarray,可以看到一个二维数组的展示图:

创建ndarray的一些其它方法

1. zeros,ones和empty方法

  • numpy.zeros
  • numpy.ones
  • numpy.empty

numpy提供了另外一种快速创建ndarray的方法,尤其适合数组内容未知的情况,同时也避免了数组增长过程中的开销

2. arange方法

arange可以返回一个平均分布的ndarray(numpy.array)。可以分别设置开始(可选),结束(必填)和间距(可选)。下面的示例非常清楚的展示了该方法的使用。

3. reshape方法

顾名思义,此方法是将一个已经存在了的ndarray,转换为另外一个shape(形状,即数组各个轴上的长度)的多维数组。新数组包含了原来所有的数据。

注意:新的形状必需保持size相同,直白一点,就是***个shape的参数,3x4=12,需要和第二个shape的参数2x6=12,始终保持一致。

4. random方法

用随机数填充新数组的内容。numpy里有多个产生数据数组的方法,容易搞晕。产生随机数目前我见到两大类,一类是按照“均匀分布”(例如概率论里的“0-1连续分布”)产生,另一类是按照“正态分布”产生的。

在numpy里,我们会见到random,ranf,sample这几个方法,其实它们全部都是:

numpy.random.random_sample这个方法的别名,都是基于“均匀分布”产生随机数。下面的代码验证了这一点:

详细介绍下用的最多一个:

numpy.random.random

API:http://t.im/1b9sw

它随机返回半开区间[0.0, 1.0)的浮点数,方法参数只有一个:

size : int或者int型元组,同时也作为返回数组的shape。如果输入的是(2,3,5),则首先抽取2x3x5=30个随机数,然后形成一个形状为(2,3,5)的多维数组作为返回值。如果没有提供参数,则直接返回一个随机数。

练习:生成[12, 30)区间的一个6x3的数组

代码:

好了,关于numpy第1讲就到这里,还有很多内容待后面用到的时候又再介绍。

【本文为51CTO专栏作者“吴思楠”的原创稿件,转载请通过51CTO联系作者获取授权】

戳这里,看该作者更多好文

责任编辑:武晓燕 来源: 51CTO专栏
相关推荐

2021-05-24 16:01:35

人工智能AI机器学习

2010-07-21 13:53:07

Perl引用

2011-05-28 08:57:54

BlueCoat罗楠思

2022-02-18 17:34:47

数组多维五维数组

2017-04-14 14:57:03

机器学习学习资源

2021-12-17 08:27:55

NumpyPython 机器学习

2023-06-01 16:41:39

NumPyPython

2011-06-08 15:21:18

多维数组

2018-05-11 14:34:24

人工智能机器学习深度学习

2022-06-06 12:53:17

吴恩达AI机器学习

2009-09-16 09:01:40

C#多维数组

2011-06-08 14:42:33

C++多维数组

2022-06-02 15:42:05

Python机器学习

2009-09-17 16:36:59

C#一维数组C#多维数组

2011-07-04 11:05:03

数组java

2021-04-13 09:25:21

机器学习人工智能计算机

2017-02-08 15:59:11

人工智能机器

2009-01-16 21:54:41

服务器虚拟化VMware

2009-11-20 09:24:10

PHP多维数组排序

2010-03-15 13:17:00

Python多维数组
点赞
收藏

51CTO技术栈公众号