股票

[第32集]基变换和图像压缩

根据网易公开课之MIT线性代数视频所做的笔记—[第32集]基变换图像压缩

—————————————————————————————

    视频地址:http://v.163.com/special/opencourse/daishu.html

—————————————————————————————

这节课看了两遍才看个大概,不知道到底理解到哪一步,还请明白人多多指教。

这节课的内容:

基变换

压缩相关知识

这章的主题是线性变换与矩阵的关联,线性变换不一定是在坐标系内,矩阵用坐标来表示线性变换,即矩阵基于坐标来描述线性变换。

[第32集]基变换和图像压缩

一个512X512的图像。对黑白图像来说,像素表示的是灰度值,从0到255.一个像素就表示为xi,取值范围是[0,255),换句话说就是有2^8种可能性,占8个比特位。每个像素都有一个值,共有512²个像素。(按我的理解,我们看到的照片的大小多少像素里面,每个像素也是表示一个灰度值,然后我们看图片的时候,显示器把这些灰度值翻译成具体的灰度,这样我们就可以看到真实的图像)我们实际上是对R^n中的向量x做操作,在这里,n=512²。一个图像就是一个向量,含有图像的信息,一个图像里面可以得到一个长度为n的向量。如果是彩色图像,长度就是这个的三倍(三原色?)。

标准压缩方式,即当前录像用到的叫做JPEG,联合图像专家组—Joint Photographic Experts Group。

基变换

我们当前的标准基是每个像素的一个值,我们有长度为512²长度的向量x,xi取值范围是0≤xi<255。

衬衫、黑板的例子就是说明,当图像的像素的灰度差距不大是,这时候的标准版无法描述复杂的图像,所以不适合做标准基。 一个基本的事实,各处每个像素值的标准基,要充分利用上这个特点,就是我们得到的大部分像素点,其灰度值和相邻像素灰度值是一样的。标准基应该充分表达出这种不同,而不需要在这些细微的不同中找差异。(类似于描述正态分布曲线,如果只有100位的标准基,标准基应该取-50到50这个范围,每个间隔1,而不是取 -5~5,每个间隔0.1。前者可以充分展示出集中性,比如十个向量就描述了整个图像;而后者细分了相似情况下的差异,需要100个向量才能描述)

一个非常好的基向量就是,所有元素都为1的向量,这不在标准基中。

 

构造好用的基向量:

[第32集]基变换和图像压缩

所有元素都为1的向量,它自己一个向量就能完整的给出所有像素一致图像的信息。最烂的向量是-1和1交替,表示最混乱的情况。

好用的基,就是对相同的图像来说,可以用最少的向量来描述它(只要我们的眼睛无法区分就行),这样其占用的空间最小。

 

无损压缩步骤(傅里叶基)

[第32集]基变换和图像压缩

输入信号x 

==> 进行基变换(选择一组更好的基)

==> 得到系数c 

==> 输入64个像素,得到64个系数(到现在是无损压缩)

==>扔掉较小系数的压缩(有损压缩),叫做阀值量化,每个系数,每个基向量,超过阀值的(阀值设定为我们肉眼看不出区别为止)

==> 得到压缩后的一套系数C’,里面有很多0。可能全1的向量很少扔掉,一般情况下它的系数比较大,但是像正负符号频繁交替的向量,在平滑信号中,出现的次数就很少了(即系数很小)。频繁交替的基本是高频信号,噪音或者抖动,全1的是低频信号,频率为0。

==> 丢掉系数小的信号后,用剩下的乘以对应的基向量重构信号,这时候求和项就不再有64个,即实现了压缩。

小波基

[第32集]基变换和图像压缩

每一个R^8中的向量都是这些标准基的组合。关于线性代数的问题就是,找出这些组合的系数。

例题,8个像素P,表示成小波基:

[第32集]基变换和图像压缩

第一步变换是信息的无损压缩步骤。构造矩阵,然后进行基变换。现在看出小波基的好处了,如果列向量标准正交,那么逆等于其转置。

基变换的方法

[第32集]基变换和图像压缩

已知一个基上的向量,在变换到不同的基中时,令矩阵为W,则W的列向量就是新基的向量。已知在旧基下的x,然后转换成新基下的向量c,确切关系就是 x = Wc

[第32集]基变换和图像压缩

已知线性变换T,对于nxn的矩阵来说的,假设是从八维空间变换到八维空间的。引入矩阵,对于第一组基,v1到v8,得到矩阵A;第二组基,w1到w8,得到矩阵B。则A、B相似。

A是变换T的矩阵?

[第32集]基变换和图像压缩

A是由T变换过来,但是A、B分别取不同的基变换的,于是每个向量有了不同的坐标,两组新坐标的关系就是相似。

矩阵是什么?A是什么?

[第32集]基变换和图像压缩

利用基v1到v8,如果我们知道作用在八个基向量上的变换是什么,就可以知道T的具体情况。只要知道T作用到v1上是什么,T作用到v2上是什么……因为T是线性变换,x是这些基的组合,只要知道基向量的变换,就可以表示所有向量。

如果有一组特征向量基,T(vi)和vi同向,则A经过变换成了对角阵。特征向量基是完美基!

打赏
原文链接:,转发请注明来源!

发表评论