经典线性结构之线性表、栈和队列数据结构详解和实例分析-srcmini

在上一篇文章：数据结构、算法分析、算法复杂度、大O符号中有提到数据结构有三种基本结构形式：集合结构、线性结构、树形结构、图状或网状结构，更形象的解析是结点和结点之间的逻辑关系，例如一对一关系为线性结构，而一对多关系为树形结构，有过数据表设计经验的朋友一定对这个很熟悉，这就是为什么一般程序员都是在做增删改查了。数据结构以逻辑结构分类，可分为线性结构非线性结构，经典线性结构包括线性表、栈和队列，非线性结构有树和图，本节重点讲解线性结构，注意这是逻辑结构分类的叫法。而另一种是以数据在内存中的存储结构进行分类，可分为顺序结构、链式结构、索引结构和哈希结构。

本节相关内容在C语言教程高级数据结构和算法详解中有更基本和详细的讲解，可参考获取更多有用的信息。

一、抽象数据类型（Abstract Data Type）

我们知道程序由数据结构和算法组成，这是说一个程序可能含有大量的数据结构和算法，而抽象数据类型（简称ADT）则是一个其中的一个基本单元，也就是说一个程序是有一个或多个ADT组成的。什么是抽象数据类型ADT呢？ADT即数据结构+算法，ADT实际上就类似于基本数据类型（如整型、浮点型）+算术操作，ADT是比基本数据类型包含更多数据的一种类型，例如链表、二叉树、栈+相关的算法操作，算法操作例如增删改查，集合结构有并和交的操作，所以当我们在说抽象数据类型或ADT时，说的就是数据结构+算法。

数据结构指的是数据的组织方式，包含结点数据和逻辑关系，在代码上设计一个数据结构的时候，至少要包含数据域、结点及结点间的逻辑关系，以及ADT主要接口，详细的内容在上一篇文章中有解释，对数据结构的理解比较重要，这涉及到我们设计程序的时候对数据模型的合理选择。

算法是对某一问题的具体求解方法，包括算法设计、算法分析和算法证明，这里解释一下分治算法，分治算法是对某一问题的整体分析，并不是一个具体的算法，它主要用于分析问题，如下图：

将问题规模为N分解成k个相同或相似的子问题，上面根据数据结点特点划分只是其中一个建议，到子问题的时候才是真正选择具体求解算法，一般这里可以很容易写成递归的形式。

下面说一下ADT代码设计的一个建议规范格式，在设计数据结构的时候，需要考虑逻辑结构和存储结构，ADT的设计包含是数据结构和算法，主要包含：

1、数据域Data，实际的业务数据模型；

2、结点Node，数据结构的基本数据单元，结点成员包含数据域Data，以及结点间的逻辑关系，有的地方可能会看到将数据域和结点写成一个整体；

3、ADT对外接口，整个ADT数据对象的对外体现，成员包含基本结点信息，以及一些额外信息，如ADT的大小，二叉树ADT的根结点等。

下面是一个完整的例子：

// 数据结构的主要表示
// 数据域，抽象业务数据
typedef struct data{
    int price;
    int weight;
} Data;

// 结点，基本数据单元，这里是一个链表的结点形式
typedef struct node{
    Data data; // 结点的数据域
    struct node *next; // 下一个结点的指针
} Node;

// ADT对外接口，ADT对象的主要持有者
typedef struct list{
    Node *head; // 头结点
    Node *tail; // 尾结点
    unsigned int size; // ADT的大小
} List;

// 算法
// 创建一个空List，并进行初始化
extern List *list_init();

// 添加一个结点到指定位置
extern int list_add(List *list, Data *data, unsigned int position);

// 清空所有结点
extern int list_clear(List *list);

二、线性表（List）

线性表的基本形式为：a1, a2, …, aN，N为表的大小，N=0为空表，ai为结点，以索引i=0为表最前，ai的后继元为ai+1，ai的前驱为ai-1。线性表根据数据的存储结构有两种方式：顺序结构和链式结构，称为顺序表和链表。

1、顺序表ADT（Sequence List）

顺序表即数组，数组的形式又有栈数组和堆数组，栈数组指表在栈内存中存储，堆数组则是在堆内存中存储。顺序表的大小固定，过大可能浪费空间，过小可能空间不足，顺序表在查找数据上相对较好，为O(N)，但是在增加、删除、修改数据较差，最坏情况为O(N)。在设计顺序表ADT时要注意按照上面建议的ADT风格设计，对于顺序表，ADT接口至少要提供表的首地址，下面是图书顺序表ADT的完全声明：

// 图书数据元素/数据域
typedef struct book{
    unsigned int id;
    char title[256];
    char author[128];
} Book;

// 结点声明省略，直接使用数据域作为结点，除非有更复杂的需求添加指针域或其它
//typedef struct ele{
//    Book book;
//} Ele;

// 顺序表ADT对外接口
typedef struct seqlist{
    Book *books[MAX_SIZE];
    unsigned int size;
    unsigned int max_size;
} SeqList;

// 创建并初始化SeqList
extern SeqList* seqlist_init();

// 检查顺序表是否为空
extern int seqlist_is_empty(SeqList *seqList);

// 检查顺序表是否已满
extern int seqlist_is_full(SeqList *seqList);

// 在表指定索引位置添加结点，index=0默认在末尾添加
extern int seqlist_add(SeqList *seqList, Book *book, unsigned int index);

// 根据Book的id获取结点数据
extern Book* seqlist_get(SeqList *seqList, unsigned int id);

// 根据id删除结点数据
extern int seqlist_delete(SeqList *seqList, unsigned int id);

// 清空顺序表
extern int seqlist_clear(SeqList *seqList);

以上算法声明都是一些经常需要的操作，例如初始化、判断是否为空、是否已满等，对于顺序表ADT对外接口，可以typedef声明一个指针别名，在实现接口的时候要仔细参数的正确性，复杂的算法需要画一下执行流程图或画图分析数据结构，下面是接口的实现代码：

// 创建并初始化SeqList
SeqList* seqlist_init(){
    SeqList *seqList = (SeqList*)malloc(sizeof(SeqList));
    if(!seqList){
        perror("init seqlist failed.");
        return NULL;
    }
    seqList->size = 0;
    seqList->max_size = sizeof(seqList->books) / sizeof(seqList->books[0]);
    return seqList;
}

// 检查顺序表是否为空
int seqlist_is_empty(SeqList *seqList){
    return seqList == NULL || seqList->size == 0;
}

// 检查顺序表是否已满
int seqlist_is_full(SeqList *seqList){
    return seqList->size == seqList->max_size;
}

// 在表指定索引位置添加结点，index=0默认在末尾添加
/**
 * seqlist = NULL, FULL
 * book = NULL
 * index < 0,
 * index = 0
 * index < max_size
 * index > size
 * */
int seqlist_add(SeqList *seqList, Book *book, unsigned int index){
    if(seqList == NULL || seqlist_is_full(seqList) || book == NULL || index > seqList->max_size - 1 || index < 0)
        return -1;

    Book *data = (Book*)malloc(sizeof(Book));
    if(!data){
        perror("init data failed.");
        return -1;
    }
    data->id = book->id;
    strcpy(data->title, book->title);
    strcpy(data->author, book->author);

    if(index == 0 || index >= seqList->size){
        seqList->books[seqList->size] = data;
        seqList->size++;
        return 1;
    }

    for (int i = seqList->size; i > index; --i) {
        seqList->books[i] = seqList->books[i - 1];
    }
    seqList->books[index] = data;
    seqList->size++;
    return 1;
}

// 根据Book的id获取结点数据
Book* seqlist_get(SeqList *seqList, unsigned int id){
    if(seqlist_is_empty(seqList))
        return NULL;
    for (int i = 0; i < seqList->size; ++i) {
        if(seqList->books[i]->id == id)
            return seqList->books[i];
    }
    return NULL;
}

// 根据id删除结点数据
int seqlist_delete(SeqList *seqList, unsigned int id){
    if(seqlist_is_empty(seqList))
        return -1;
    for (int i = 0; i < seqList->size; ++i) {
        if(seqList->books[i]->id == id){
            for (int j = i; j < seqList->size - 1; ++j) {
                seqList->books[j] = seqList->books[j + 1];
            }
            seqList->books[seqList->size - 1] = NULL;
            seqList->size--;
            return 1;
        }
    }
    return -1;
}

// 清空顺序表
int seqlist_clear(SeqList *seqList){
    for (int i = 0; i < seqList->size; ++i) {
        free(seqList->books[i]);
    }
    free(seqList);
    return 1;
}

顺序表的添加和删除数据通过左右移动结点实现，为O(N)比较费时，写好的算法需要根据参数条件证明算法的正确性，可结合调用实例调试算法，主要是改变不同的参数输入进行测试，多方面的测试可保证算法的健壮性，下面是顺序表ADT的使用示例：

SeqList *seqList = seqlist_init();
printf("size: %u, max size: %u\n", seqList->size, seqList->max_size);
Book b1;
b1.id = 5;
strcpy(b1.title, "The Price of Salt");
strcpy(b1.author, "Highsmith");
Book b2;
b2.id = 6;
strcpy(b2.title, "The Old Man and The Sea");
strcpy(b2.author, "Hemingway");
Book b3;
b3.id = 3;
strcpy(b3.title, "One Hundred Years of Solitude");
strcpy(b3.author, "Garcia");
seqlist_add(seqList, &b1, 0);
seqlist_add(seqList, &b2, 3);
seqlist_add(seqList, &b3, 1);
for (int i = 0; i < seqList->size; ++i) {
    printf("%s\n", seqList->books[i]->title);
}
putchar('\n');
printf("%s\n", seqlist_get(seqList, 3)->title);
seqlist_delete(seqList, 5);
putchar('\n');
for (int i = 0; i < seqList->size; ++i) {
    printf("%s\n", seqList->books[i]->title);
}
seqlist_clear(seqList);

2、链表ADT（Linked List）

链表的结点数据使用链式结构进行储存，每个结点存储下一个后继结点的指针，链表有三种基本形式，如上图，单链表的所有结点单向链接，最后结点的指针成员值为NULL；双向链表的每个结点存储前后结点的指针，第一个和最后一个结点可互相指向，又称为双向循环链表，双向链表会增加空间开销，增加操作数据的开销，但是可以简化删除操作；循环链表的最后一个结点的指针成员指向头结点，循环链接。

链表相对线性表，增加、删除结点的操作较好，最好为O(1)，但是查找较慢为O(N)。在设计链表ADT时，对外ADT接口只要需要提供表头指针。

下面使用链表实现一元多项式函数ADT，例如x^2+x+3，将多项式的每一项作为一个结点储存，结点主要储存每一项的系数和指数，提供的功能操作算法有加减乘、导数/微商和不定积分和定积分，首先看ADT的声明代码：

/**
 * 实现多项式ADT
 * a0*X^n + a1*X^(n-1) + ... + an-1*X
 * 主要存储ai系数和n指数
 * */

// 多项式的每一项表达式
typedef struct expression{
    float coefficient; // 系数
    float exponent; // 指数
} Expression;

// 多项式项结点
typedef struct item{
    Expression expression;
    struct item *next;
} Item;

// 多项式ADT对外接口，使用单链表实现
typedef struct polynomial{
    Item *head; // 头结点
    Item *tail; // 尾结点
    unsigned int size; // 多项式的项数
} Polynomial;

/**
 * 单个多项式自身的运算，包括初始化、检查是否空或已满、添加表达式、获取单项、清除数据
 * */
extern Polynomial* poly_init();
extern int poly_is_empty(Polynomial *polynomial);
extern int poly_is_full(Polynomial *polynomial);
extern int poly_add(Polynomial *polynomial, Expression *expression);
extern Expression* poly_get(Polynomial *polynomial, float exponent);
extern int poly_delete(Polynomial *polynomial, float exponent);
extern int poly_clear(Polynomial *polynomial);

/**
 * 多项式的运算：多项式相加、相减、相乘
 * 单个多项式求导数/微商、积分（定积分和不定积分）
 * */
extern Polynomial* poly_plus(Polynomial *poly1, Polynomial *poly2);
extern Polynomial* poly_subtract(Polynomial *sub1, Polynomial *sub2);
extern Polynomial* poly_multiply(Polynomial *poly1, Polynomial *poly2);

extern Polynomial* poly_differential(Polynomial *poly);
extern Polynomial* poly_in_integral(Polynomial *poly);
extern float poly_integral(Polynomial *poly, float lower, float upper);

// 计算多项式的代数值
extern float poly_algebraic_value(Polynomial *poly, float value);

// 以字符串的形式输出多项式代数式
extern char* poly_algebraic_expression(Polynomial *poly);

由于实现和调用代码过长，这里就不贴过多的代码了，需要查看或获取完整的代码请查看github项目：https://github.com/onnple/polynomial，该项目提供多项式函数的基本运算：加减乘、导数/微商、不定积分和定积分运算。

三、栈（Stack）

栈是一种先进后出的表，表的最前端称为栈底，尾端称为栈顶，它限制删除和插入的操作只在表的一个位置上，即栈顶的位置。栈顶是表的末尾，入栈和出栈的位置，栈底是表的头部，栈的最基本操作是入栈push和出栈pop。

栈ADT的实现接口中至少要提供栈顶和栈底，实现方式也有两种：顺序表和单链表，这两种方式操作都很方便，数据较小的情况下使用顺序表数组会更方便。栈是一种很简单的数据结构，但是非常有用，例如我们的程序代码在栈内存中执行，和栈数据结构的操作是一样的，下面是使用双向链表实现的栈ADT的声明，该例子是C语言实现一个简单的语法检查器和进制转换器，栈ADT至少要提供栈顶和栈底：

// 字符，栈数据结点
typedef int SData;

typedef struct snode{
    SData data;
    struct snode *prev;
    struct snode *next;
} SNode;

// 语法检查栈ADT对外接口
typedef struct stack{
    SNode *top;
    SNode *bottom;
    unsigned int size;
} Stack;

extern Stack* stack_init();
extern int stack_is_tempty(Stack *stack);
extern int stack_is_full(Stack *stack);
extern int stack_push(Stack *stack, const SData* data);
extern SData stack_pop(Stack *stack);
extern SData stack_peek(Stack *stack);
extern int stack_clear(Stack *stack);

// 语法检查
extern int syntax_auth(const char str[], int len);

// 进制转换
extern char* to_base_str(int value, int base);

在这里，栈ADT相当于数据容器，在面向对象编程如Java中，数据结构类是充当数据容器对象，可以使用void指针实现面向对象中添加不同类型的数据，这种ADT可作为通用ADT，但在操作细节上相对较难，而特定情况的ADT则比较直接，而且可以在细节上访问，下面是详细的实现细节：

Stack* stack_init(){
    Stack *stack = (Stack*)malloc(sizeof(Stack));
    if(!stack){
        perror("init stack failed.");
        return NULL;
    }
    stack->top = NULL;
    stack->bottom = NULL;
    stack->size = 0;
    return stack;
}

int stack_is_tempty(Stack *stack){
    return stack->size == 0;
}

int stack_is_full(Stack *stack){
    SData *data = (SData*)malloc(sizeof(SData));
    if(!data)
        return 1;
	Free(data);
    return -1;
}

int stack_push(Stack *stack, const SData* data){
    if(stack == NULL || data == NULL)
        return -1;
    SNode *sNode = (SNode*)malloc(sizeof(SNode));
    if(!sNode){
        perror("init data failed.");
        return -1;
    }
    memset(sNode, 0, sizeof(SNode));
    sNode->data = *data;
    sNode->next = NULL;
    sNode->prev = NULL;

    if(stack->size == 0){
        stack->top = sNode;
        stack->bottom = sNode;
        stack->size++;
        return 1;
    }
    stack->top->next = sNode;
    sNode->prev = stack->top;
    stack->top = sNode;
    stack->size++;
    return 1;
}

SData stack_pop(Stack *stack){
    SNode *node = stack->top;
    SData data = node->data;
    stack->top = node->prev;
    free(node);
    stack->size--;
    return data;
}

SData stack_peek(Stack *stack){
    if(stack == NULL || stack->size == 0)
        return -1;
    return stack->top->data;
}

int stack_clear(Stack *stack){
    if(stack == NULL)
        return -1;
    SNode *node = stack->bottom;
    while(node){
        SNode *temp = node->next;
        free(node);
        node = temp;
    }
    free(stack);
    return 1;
}


// 语法检查: {} [] ()
int syntax_auth(const char str[], int len){
    Stack *stack = stack_init();
    if(!stack)
        return -1;
    for (int i = 0; i < len; ++i) {
        SData data = str[i];
        if((stack_peek(stack) == '{' && data == '}') ||
                (stack_peek(stack) == '[' && data == ']') ||
                (stack_peek(stack) == '(' && data == ')'))
            stack_pop(stack);
        else
            stack_push(stack, &data);
    }
    int result = stack->size == 0 ? 1 : -1;
    stack_clear(stack);
    return result;
}

// 进制转换 base < 10
char* to_base_str(int value, int base){
    if(value < 0 || base <= 0 || base >= 10)
        return NULL;
    if(value == 0)
        return 0;
    Stack *stack = stack_init();
    if(!stack)
        return NULL;
    int number = 0;
    while(value > 0){
        number = value % base;
        stack_push(stack, &number);
        value = value / base;
    }
    char *str = (char *)malloc(stack->size * sizeof(char) + 1);
    memset(str, 0, stack->size * sizeof(char) + 1);
    int len = stack->size;
    char temp[1];
    for (int i = 0; i < len; ++i) {
        sprintf(temp, "%d", stack_pop(stack));
        strcat(str, temp);
    }
    *(str + len) = '\0';
    stack_clear(stack);
    return str;
}

以下是文本语法检查和进制调用的实际调用，进制范围为0~9，相对还算简单。上面的代码基本都有根据应用的实现，由此你可以发现，一个完整的程序就是这样写的，先写清楚需求，然后从需求中抽象出数据结构，不同的需求有不同的数据结构，之后就是完整的ADT实现，多个ADT就组成了一个完整的程序。写程序就是在写ADT，可能有些ADT的数据结构比重较轻，数据简单或直接没有。

四、队列（Queue）

队列是一种先进先出的表，队列有队头和队尾，入队Enqueue表示从队尾插入数据，出队Dequeue表示从队头删除数据。队列是一种相当简单的数据结构，但是非常有用，比如你可能听过的消息队列、任务队列等，设计队列ADT至少需要提供队头和队尾，实现方式根据顺序存储和链式存储也有两种方式：顺序表和链表，这里使用链表实现队列ADT，实现一个任务队列，如果你学过JavaScript，应该都知道JavaScript事件循环机制，其中就有任务队列，在主线程执行完后到任务队列获取任务执行，下面是任务队列ADT的声明部分：

// 任务队列ADT声明
// 任务数据域
typedef void (*Task)(void);

// 任务结点
typedef struct tnode{
    Task task;
    struct tnode *next;
} TNode;

// 任务队列ADT
typedef struct queue{
    TNode *head;
    TNode *tail;
    unsigned int size;
} Queue;

extern Queue* queue_init();
extern int queue_is_empty(Queue *queue);
extern int queue_is_full(Queue *queue);
extern int queue_enqueue(Queue *queue, Task task);
extern Task queue_dequeue(Queue *queue);
extern int queue_clear(Queue *queue);
extern int queue_execute_tasks(Queue *queue);

任务队列ADT中，使用函数指针表示一个任务，其它结构和一般的队列结构没什么不同，最基本的还是对链表的操作，建议多使用链式结构，很多高级的数据结构都是使用链式结构实现的，实际上很多你需要的数据结构都可以使用链式结构，链式结构的一个特点使用malloc和指针，下面是任务队列ADT的实现代码：

Queue* queue_init(){
    Queue *queue = (Queue*)malloc(sizeof(Queue));
    if(!queue){
        perror("init queue failed.");
        return NULL;
    }
    queue->head = NULL;
    queue->tail = NULL;
    queue->size = 0;
    return queue;
}

int queue_is_empty(Queue *queue){
    return queue->size == 0;
}

int queue_is_full(Queue *queue){
    TNode *node = (TNode*)malloc(sizeof(TNode));
    if(!node)
        return 1;
    free(node);
    return -1;
}

int queue_enqueue(Queue *queue, Task task){
    if(queue == NULL || task == NULL)
        return -1;
    TNode *node = (TNode*)malloc(sizeof(TNode));
    if(!node)
        return -1;
    node->task = task;
    node->next = NULL;

    if(queue->size == 0){
        queue->head = node;
        queue->tail = node;
        queue->size++;
    }
    queue->tail->next = node;
    queue->tail = node;
    queue->size++;
    return 1;
}

Task queue_dequeue(Queue *queue){
    if(queue == NULL || queue->size == 0)
        return NULL;
    TNode *node = queue->head;
    queue->head = node->next;
    Task task = node->task;
    free(node);
    return task;
}

int queue_clear(Queue *queue){
    if(queue == NULL)
        return -1;
    TNode *node = queue->head;
    while(node){
        TNode *temp = node->next;
        free(node);
        node = temp;
    }
    free(queue);
    return 1;
}

int queue_execute_tasks(Queue *queue){
    if(queue == NULL)
        return -1;
    TNode *node = queue->head;
    while(node){
        TNode *temp = node->next;
        (node->task)();
        free(node);
        node = temp;
    }
    queue->head = NULL;
    queue->tail = NULL;
    queue->size = 0;
    return 1;
}

下面是任务队列ADT的使用，任务队列和消息队列在很多应用中都有，例如一些常见的消息队列中间件ActiveMQ、RabbitMQ、RocketMQ和Kafka，基本原理也是基于队列数据结构。

void task1(void){
    printf("01 processing the result of ajax......\n");
}

void task2(void){
    printf("02 rendering the data of elements......\n");
}

void task3(void){
    printf("03 execute the task of timeout......\n");
}

void queue(void){
    Queue *queue = queue_init();
    queue_enqueue(queue, task3);
    queue_enqueue(queue, task1);
    queue_enqueue(queue, task2);
    Task task = queue_dequeue(queue);
    task();
    queue_execute_tasks(queue);
    queue_clear(queue);
}

经典线性结构之线性表、栈和队列数据结构详解和实例分析

一、抽象数据类型（Abstract Data Type）

二、线性表（List）

1、顺序表ADT（Sequence List）

2、链表ADT（Linked List）

三、栈（Stack）

四、队列（Queue）

相关推荐

评论抢沙发

评论前必须登录！

猜你喜欢

热门标签

回顶部

一、抽象数据类型（Abstract Data Type）

二、线性表（List）

1、顺序表ADT（Sequence List）

2、链表ADT（Linked List）

三、栈（Stack）

四、队列（Queue）

相关推荐

评论 抢沙发

评论前必须登录！

猜你喜欢

热门标签

回顶部

评论抢沙发