影响算法效率的因素-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读影响算法效率的因素

影响算法效率的因素

2018-03-07

影响算法效率的因素

1、从大的方面来讲，所选择的语言对算法的效率影响很大。一般来说，使用越高级的语言所需要的时间和空间就越大。另外，不同编译器产生的代码质量不同，这对算法的效率也会有影响。

2、存储结构

数据的存储结构，分为顺序存储结构和链式存储结构。顺序存储结构的特点是借助元素在存储器中的相对位置来表示数据元素之间的逻辑关系；链式存储结构则是借助指示元素存储地址的指针表示数据元素之间的逻辑关系。不同的问题求解选用不同的存储结构。

例：稀疏矩阵的存储和转置算法

（1）存储

如果采用数组的方式进行存储，对稀疏矩阵来说有很多零元素，因而浪费空间严重，因此我们对稀疏矩阵进行压缩存储。只存储稀疏矩阵的非零元素。在数据结构教材中用三元组表示方法，建立三元组顺序表。

//..................................................................................................................

#define MAXSIZE 12500

typedef struct{

int i,j;

ElemType e;

}Triple;

Typedef struct{

Triple data[MAXSIZE + 1];

int mu,nu,tu;

}TSMatrix;

//....................................................................................

（2）转置

直接进行转置时，对要转置的A表从第一行起扫描一遍，按照原矩阵的列序进行转置，得到的新矩阵是以行序为主序的。但是这样做只适合于非零元素的个数非常少的情况，否则和矩阵的直接转置算法时间复杂度相差无几。

改进：矩阵的快速转置算法

附设两个变量，num[col]表示矩阵中第col 列中非零元的个数，cpot[col]表示第col 列第一个非零元在b.data中的位置。

我们可以再矩阵转置之前将我们附设的两个变量都求出来，然后进行转置，即为快速转置算法。

3、指针操作

在使用指针时，指针的有秩序扫描非常重要。例如在模式匹配中，如果直接进行匹配，当有不完全匹配时，主串的指针需要回溯。在KMP算法中，我们先可以求出每个元素的next函数值，从而在发生不完全匹配时，主串的指针不必要回溯，只需要模式串的元素回到当前元素的next函数值所指的元素再进行匹配即可。当主串和模式串有很多不完全匹配时，KMP算法可以大大提高效率。

4、查找的效率

有很多快速查找的算法都可以提高查找的效率，如建立索引，折半查找等，都是在记录和关键字之间进行比较，从而寻求关系。这一类查找建立在比较的基础之上。查找的效率依赖于查找过程中所进行的比较次数。

哈希表

在哈希表中，使得记录的存储位置和关键字之间建立一个确定的存储关系，因而在查找时，只需要根据这个对应的关系f 找到给定值K 的像f(k)。用这个思想建立哈希表。如在基因组匹配时，用哈希表非常方便。

5.数据类型的选择

数据类型的选择也会影响算法效率，在对时间和空间要求非常严格时，尽可能的使用占用空间较小的数据类型。使用动态开辟空间会使得效率降低，所有在能确定或估计出需要的空间大小的情况下尽量使用静态数字。个人觉得用vector虽然方便，但是效率并不高。

6、存储方式

用堆操作还是用栈操作，对于不同的问题需要仔细选择。在串和队列的有关操作中用堆操作合适，在树的操作中用栈操作合适，如建立二叉树中序遍历的递归算法或非递归算法，用栈操作好。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；