个性化阅读
专注于IT技术分析

经典线性结构之线性表、栈和队列数据结构详解和实例分析

在上一篇文章:数据结构、算法分析、算法复杂度、大O符号中有提到数据结构有三种基本结构形式:集合结构、线性结构、树形结构、图状或网状结构,更形象的解析是结点和结点之间的逻辑关系,例如一对一关系为线性结构,而一对多关系为树形结构,有过数据表设计经验的朋友一定对这个很熟悉,这就是为什么一般程序员都是在做增删改查了。数据结构以逻辑结构分类,可分为线性结构非线性结构,经典线性结构包括线性表、栈和队列,非线性结构有树和图,本节重点讲解线性结构,注意这是逻辑结构分类的叫法。而另一种是以数据在内存中的存储结构进行分类,可分为顺序结构、链式结构、索引结构和哈希结构。

本节相关内容在C语言教程高级数据结构和算法详解中有更基本和详细的讲解,可参考获取更多有用的信息。

一、抽象数据类型(Abstract Data Type)

我们知道程序由数据结构和算法组成,这是说一个程序可能含有大量的数据结构和算法,而抽象数据类型(简称ADT)则是一个其中的一个基本单元,也就是说一个程序是有一个或多个ADT组成的。什么是抽象数据类型ADT呢?ADT即数据结构+算法,ADT实际上就类似于基本数据类型(如整型、浮点型)+算术操作,ADT是比基本数据类型包含更多数据的一种类型,例如链表、二叉树、栈+相关的算法操作,算法操作例如增删改查,集合结构有并和交的操作,所以当我们在说抽象数据类型或ADT时,说的就是数据结构+算法。

数据结构指的是数据的组织方式,包含结点数据和逻辑关系,在代码上设计一个数据结构的时候,至少要包含数据域、结点及结点间的逻辑关系,以及ADT主要接口,详细的内容在上一篇文章中有解释,对数据结构的理解比较重要,这涉及到我们设计程序的时候对数据模型的合理选择。

算法是对某一问题的具体求解方法,包括算法设计、算法分析和算法证明,这里解释一下分治算法,分治算法是对某一问题的整体分析,并不是一个具体的算法,它主要用于分析问题,如下图:

分治算法图解

将问题规模为N分解成k个相同或相似的子问题,上面根据数据结点特点划分只是其中一个建议,到子问题的时候才是真正选择具体求解算法,一般这里可以很容易写成递归的形式。

下面说一下ADT代码设计的一个建议规范格式,在设计数据结构的时候,需要考虑逻辑结构和存储结构,ADT的设计包含是数据结构和算法,主要包含:

1、数据域Data,实际的业务数据模型;

2、结点Node,数据结构的基本数据单元,结点成员包含数据域Data,以及结点间的逻辑关系,有的地方可能会看到将数据域和结点写成一个整体;

3、ADT对外接口,整个ADT数据对象的对外体现,成员包含基本结点信息,以及一些额外信息,如ADT的大小,二叉树ADT的根结点等。

下面是一个完整的例子:

// 数据结构的主要表示
// 数据域,抽象业务数据
typedef struct data{
    int price;
    int weight;
} Data;

// 结点,基本数据单元,这里是一个链表的结点形式
typedef struct node{
    Data data; // 结点的数据域
    struct node *next; // 下一个结点的指针
} Node;

// ADT对外接口,ADT对象的主要持有者
typedef struct list{
    Node *head; // 头结点
    Node *tail; // 尾结点
    unsigned int size; // ADT的大小
} List;

// 算法
// 创建一个空List,并进行初始化
extern List *list_init();

// 添加一个结点到指定位置
extern int list_add(List *list, Data *data, unsigned int position);

// 清空所有结点
extern int list_clear(List *list);

二、线性表(List)

线性表的基本形式为:a1, a2, …, aN,N为表的大小,N=0为空表,ai为结点,以索引i=0为表最前,ai的后继元为ai+1,ai的前驱为ai-1。线性表根据数据的存储结构有两种方式:顺序结构和链式结构,称为顺序表和链表。

1、顺序表ADT(Sequence List)

顺序表基本形式

顺序表即数组,数组的形式又有栈数组和堆数组,栈数组指表在栈内存中存储,堆数组则是在堆内存中存储。顺序表的大小固定,过大可能浪费空间,过小可能空间不足,顺序表在查找数据上相对较好,为O(N),但是在增加、删除、修改数据较差,最坏情况为O(N)。在设计顺序表ADT时要注意按照上面建议的ADT风格设计,对于顺序表,ADT接口至少要提供表的首地址,下面是图书顺序表ADT的完全声明:

// 图书数据元素/数据域
typedef struct book{
    unsigned int id;
    char title[256];
    char author[128];
} Book;

// 结点声明省略,直接使用数据域作为结点,除非有更复杂的需求添加指针域或其它
//typedef struct ele{
//    Book book;
//} Ele;

// 顺序表ADT对外接口
typedef struct seqlist{
    Book *books[MAX_SIZE];
    unsigned int size;
    unsigned int max_size;
} SeqList;

// 创建并初始化SeqList
extern SeqList* seqlist_init();

// 检查顺序表是否为空
extern int seqlist_is_empty(SeqList *seqList);

// 检查顺序表是否已满
extern int seqlist_is_full(SeqList *seqList);

// 在表指定索引位置添加结点,index=0默认在末尾添加
extern int seqlist_add(SeqList *seqList, Book *book, unsigned int index);

// 根据Book的id获取结点数据
extern Book* seqlist_get(SeqList *seqList, unsigned int id);

// 根据id删除结点数据
extern int seqlist_delete(SeqList *seqList, unsigned int id);

// 清空顺序表
extern int seqlist_clear(SeqList *seqList);

以上算法声明都是一些经常需要的操作,例如初始化、判断是否为空、是否已满等,对于顺序表ADT对外接口,可以typedef声明一个指针别名,在实现接口的时候要仔细参数的正确性,复杂的算法需要画一下执行流程图或画图分析数据结构,下面是接口的实现代码:

// 创建并初始化SeqList
SeqList* seqlist_init(){
    SeqList *seqList = (SeqList*)malloc(sizeof(SeqList));
    if(!seqList){
        perror("init seqlist failed.");
        return NULL;
    }
    seqList->size = 0;
    seqList->max_size = sizeof(seqList->books) / sizeof(seqList->books[0]);
    return seqList;
}

// 检查顺序表是否为空
int seqlist_is_empty(SeqList *seqList){
    return seqList == NULL || seqList->size == 0;
}

// 检查顺序表是否已满
int seqlist_is_full(SeqList *seqList){
    return seqList->size == seqList->max_size;
}

// 在表指定索引位置添加结点,index=0默认在末尾添加
/**
 * seqlist = NULL, FULL
 * book = NULL
 * index < 0,
 * index = 0
 * index < max_size
 * index > size
 * */
int seqlist_add(SeqList *seqList, Book *book, unsigned int index){
    if(seqList == NULL || seqlist_is_full(seqList) || book == NULL || index > seqList->max_size - 1 || index < 0)
        return -1;

    Book *data = (Book*)malloc(sizeof(Book));
    if(!data){
        perror("init data failed.");
        return -1;
    }
    data->id = book->id;
    strcpy(data->title, book->title);
    strcpy(data->author, book->author);

    if(index == 0 || index >= seqList->size){
        seqList->books[seqList->size] = data;
        seqList->size++;
        return 1;
    }

    for (int i = seqList->size; i > index; --i) {
        seqList->books[i] = seqList->books[i - 1];
    }
    seqList->books[index] = data;
    seqList->size++;
    return 1;
}

// 根据Book的id获取结点数据
Book* seqlist_get(SeqList *seqList, unsigned int id){
    if(seqlist_is_empty(seqList))
        return NULL;
    for (int i = 0; i < seqList->size; ++i) {
        if(seqList->books[i]->id == id)
            return seqList->books[i];
    }
    return NULL;
}

// 根据id删除结点数据
int seqlist_delete(SeqList *seqList, unsigned int id){
    if(seqlist_is_empty(seqList))
        return -1;
    for (int i = 0; i < seqList->size; ++i) {
        if(seqList->books[i]->id == id){
            for (int j = i; j < seqList->size - 1; ++j) {
                seqList->books[j] = seqList->books[j + 1];
            }
            seqList->books[seqList->size - 1] = NULL;
            seqList->size--;
            return 1;
        }
    }
    return -1;
}

// 清空顺序表
int seqlist_clear(SeqList *seqList){
    for (int i = 0; i < seqList->size; ++i) {
        free(seqList->books[i]);
    }
    free(seqList);
    return 1;
}

顺序表的添加和删除数据通过左右移动结点实现,为O(N)比较费时,写好的算法需要根据参数条件证明算法的正确性,可结合调用实例调试算法,主要是改变不同的参数输入进行测试,多方面的测试可保证算法的健壮性,下面是顺序表ADT的使用示例:

SeqList *seqList = seqlist_init();
printf("size: %u, max size: %u\n", seqList->size, seqList->max_size);
Book b1;
b1.id = 5;
strcpy(b1.title, "The Price of Salt");
strcpy(b1.author, "Highsmith");
Book b2;
b2.id = 6;
strcpy(b2.title, "The Old Man and The Sea");
strcpy(b2.author, "Hemingway");
Book b3;
b3.id = 3;
strcpy(b3.title, "One Hundred Years of Solitude");
strcpy(b3.author, "Garcia");
seqlist_add(seqList, &b1, 0);
seqlist_add(seqList, &b2, 3);
seqlist_add(seqList, &b3, 1);
for (int i = 0; i < seqList->size; ++i) {
    printf("%s\n", seqList->books[i]->title);
}
putchar('\n');
printf("%s\n", seqlist_get(seqList, 3)->title);
seqlist_delete(seqList, 5);
putchar('\n');
for (int i = 0; i < seqList->size; ++i) {
    printf("%s\n", seqList->books[i]->title);
}
seqlist_clear(seqList);

2、链表ADT(Linked List)

链表的三种基本形式-单链表、循环链表和双链表

链表的结点数据使用链式结构进行储存,每个结点存储下一个后继结点的指针,链表有三种基本形式,如上图,单链表的所有结点单向链接,最后结点的指针成员值为NULL;双向链表的每个结点存储前后结点的指针,第一个和最后一个结点可互相指向,又称为双向循环链表,双向链表会增加空间开销,增加操作数据的开销,但是可以简化删除操作;循环链表的最后一个结点的指针成员指向头结点,循环链接。

链表相对线性表,增加、删除结点的操作较好,最好为O(1),但是查找较慢为O(N)。在设计链表ADT时,对外ADT接口只要需要提供表头指针。

下面使用链表实现一元多项式函数ADT,例如x^2+x+3,将多项式的每一项作为一个结点储存,结点主要储存每一项的系数和指数,提供的功能操作算法有加减乘、导数/微商和不定积分和定积分,首先看ADT的声明代码:

/**
 * 实现多项式ADT
 * a0*X^n + a1*X^(n-1) + ... + an-1*X
 * 主要存储ai系数和n指数
 * */

// 多项式的每一项表达式
typedef struct expression{
    float coefficient; // 系数
    float exponent; // 指数
} Expression;

// 多项式项结点
typedef struct item{
    Expression expression;
    struct item *next;
} Item;

// 多项式ADT对外接口,使用单链表实现
typedef struct polynomial{
    Item *head; // 头结点
    Item *tail; // 尾结点
    unsigned int size; // 多项式的项数
} Polynomial;

/**
 * 单个多项式自身的运算,包括初始化、检查是否空或已满、添加表达式、获取单项、清除数据
 * */
extern Polynomial* poly_init();
extern int poly_is_empty(Polynomial *polynomial);
extern int poly_is_full(Polynomial *polynomial);
extern int poly_add(Polynomial *polynomial, Expression *expression);
extern Expression* poly_get(Polynomial *polynomial, float exponent);
extern int poly_delete(Polynomial *polynomial, float exponent);
extern int poly_clear(Polynomial *polynomial);

/**
 * 多项式的运算:多项式相加、相减、相乘
 * 单个多项式求导数/微商、积分(定积分和不定积分)
 * */
extern Polynomial* poly_plus(Polynomial *poly1, Polynomial *poly2);
extern Polynomial* poly_subtract(Polynomial *sub1, Polynomial *sub2);
extern Polynomial* poly_multiply(Polynomial *poly1, Polynomial *poly2);

extern Polynomial* poly_differential(Polynomial *poly);
extern Polynomial* poly_in_integral(Polynomial *poly);
extern float poly_integral(Polynomial *poly, float lower, float upper);

// 计算多项式的代数值
extern float poly_algebraic_value(Polynomial *poly, float value);

// 以字符串的形式输出多项式代数式
extern char* poly_algebraic_expression(Polynomial *poly);

由于实现和调用代码过长,这里就不贴过多的代码了,需要查看或获取完整的代码请查看github项目:https://github.com/onnple/polynomial,该项目提供多项式函数的基本运算:加减乘、导数/微商、不定积分和定积分运算。

三、栈(Stack)

栈的模型图解

栈是一种先进后出的表,表的最前端称为栈底,尾端称为栈顶,它限制删除和插入的操作只在表的一个位置上,即栈顶的位置。栈顶是表的末尾,入栈和出栈的位置,栈底是表的头部,栈的最基本操作是入栈push和出栈pop。

栈ADT的实现接口中至少要提供栈顶和栈底,实现方式也有两种:顺序表和单链表,这两种方式操作都很方便,数据较小的情况下使用顺序表数组会更方便。栈是一种很简单的数据结构,但是非常有用,例如我们的程序代码在栈内存中执行,和栈数据结构的操作是一样的,下面是使用双向链表实现的栈ADT的声明,该例子是C语言实现一个简单的语法检查器和进制转换器,栈ADT至少要提供栈顶和栈底:

// 字符,栈数据结点
typedef int SData;

typedef struct snode{
    SData data;
    struct snode *prev;
    struct snode *next;
} SNode;

// 语法检查栈ADT对外接口
typedef struct stack{
    SNode *top;
    SNode *bottom;
    unsigned int size;
} Stack;

extern Stack* stack_init();
extern int stack_is_tempty(Stack *stack);
extern int stack_is_full(Stack *stack);
extern int stack_push(Stack *stack, const SData* data);
extern SData stack_pop(Stack *stack);
extern SData stack_peek(Stack *stack);
extern int stack_clear(Stack *stack);

// 语法检查
extern int syntax_auth(const char str[], int len);

// 进制转换
extern char* to_base_str(int value, int base);

在这里,栈ADT相当于数据容器,在面向对象编程如Java中,数据结构类是充当数据容器对象,可以使用void指针实现面向对象中添加不同类型的数据,这种ADT可作为通用ADT,但在操作细节上相对较难,而特定情况的ADT则比较直接,而且可以在细节上访问,下面是详细的实现细节:

Stack* stack_init(){
    Stack *stack = (Stack*)malloc(sizeof(Stack));
    if(!stack){
        perror("init stack failed.");
        return NULL;
    }
    stack->top = NULL;
    stack->bottom = NULL;
    stack->size = 0;
    return stack;
}

int stack_is_tempty(Stack *stack){
    return stack->size == 0;
}

int stack_is_full(Stack *stack){
    SData *data = (SData*)malloc(sizeof(SData));
    if(!data)
        return 1;
	Free(data);
    return -1;
}

int stack_push(Stack *stack, const SData* data){
    if(stack == NULL || data == NULL)
        return -1;
    SNode *sNode = (SNode*)malloc(sizeof(SNode));
    if(!sNode){
        perror("init data failed.");
        return -1;
    }
    memset(sNode, 0, sizeof(SNode));
    sNode->data = *data;
    sNode->next = NULL;
    sNode->prev = NULL;

    if(stack->size == 0){
        stack->top = sNode;
        stack->bottom = sNode;
        stack->size++;
        return 1;
    }
    stack->top->next = sNode;
    sNode->prev = stack->top;
    stack->top = sNode;
    stack->size++;
    return 1;
}

SData stack_pop(Stack *stack){
    SNode *node = stack->top;
    SData data = node->data;
    stack->top = node->prev;
    free(node);
    stack->size--;
    return data;
}

SData stack_peek(Stack *stack){
    if(stack == NULL || stack->size == 0)
        return -1;
    return stack->top->data;
}

int stack_clear(Stack *stack){
    if(stack == NULL)
        return -1;
    SNode *node = stack->bottom;
    while(node){
        SNode *temp = node->next;
        free(node);
        node = temp;
    }
    free(stack);
    return 1;
}


// 语法检查: {} [] ()
int syntax_auth(const char str[], int len){
    Stack *stack = stack_init();
    if(!stack)
        return -1;
    for (int i = 0; i < len; ++i) {
        SData data = str[i];
        if((stack_peek(stack) == '{' && data == '}') ||
                (stack_peek(stack) == '[' && data == ']') ||
                (stack_peek(stack) == '(' && data == ')'))
            stack_pop(stack);
        else
            stack_push(stack, &data);
    }
    int result = stack->size == 0 ? 1 : -1;
    stack_clear(stack);
    return result;
}

// 进制转换 base < 10
char* to_base_str(int value, int base){
    if(value < 0 || base <= 0 || base >= 10)
        return NULL;
    if(value == 0)
        return 0;
    Stack *stack = stack_init();
    if(!stack)
        return NULL;
    int number = 0;
    while(value > 0){
        number = value % base;
        stack_push(stack, &number);
        value = value / base;
    }
    char *str = (char *)malloc(stack->size * sizeof(char) + 1);
    memset(str, 0, stack->size * sizeof(char) + 1);
    int len = stack->size;
    char temp[1];
    for (int i = 0; i < len; ++i) {
        sprintf(temp, "%d", stack_pop(stack));
        strcat(str, temp);
    }
    *(str + len) = '\0';
    stack_clear(stack);
    return str;
}

以下是文本语法检查和进制调用的实际调用,进制范围为0~9,相对还算简单。上面的代码基本都有根据应用的实现,由此你可以发现,一个完整的程序就是这样写的,先写清楚需求,然后从需求中抽象出数据结构,不同的需求有不同的数据结构,之后就是完整的ADT实现,多个ADT就组成了一个完整的程序。写程序就是在写ADT,可能有些ADT的数据结构比重较轻,数据简单或直接没有。

四、队列(Queue)

队列的基本模型

队列是一种先进先出的表,队列有队头和队尾,入队Enqueue表示从队尾插入数据,出队Dequeue表示从队头删除数据。队列是一种相当简单的数据结构,但是非常有用,比如你可能听过的消息队列、任务队列等,设计队列ADT至少需要提供队头和队尾,实现方式根据顺序存储和链式存储也有两种方式:顺序表和链表,这里使用链表实现队列ADT,实现一个任务队列,如果你学过JavaScript,应该都知道JavaScript事件循环机制,其中就有任务队列,在主线程执行完后到任务队列获取任务执行,下面是任务队列ADT的声明部分:

// 任务队列ADT声明
// 任务数据域
typedef void (*Task)(void);

// 任务结点
typedef struct tnode{
    Task task;
    struct tnode *next;
} TNode;

// 任务队列ADT
typedef struct queue{
    TNode *head;
    TNode *tail;
    unsigned int size;
} Queue;

extern Queue* queue_init();
extern int queue_is_empty(Queue *queue);
extern int queue_is_full(Queue *queue);
extern int queue_enqueue(Queue *queue, Task task);
extern Task queue_dequeue(Queue *queue);
extern int queue_clear(Queue *queue);
extern int queue_execute_tasks(Queue *queue);

任务队列ADT中,使用函数指针表示一个任务,其它结构和一般的队列结构没什么不同,最基本的还是对链表的操作,建议多使用链式结构,很多高级的数据结构都是使用链式结构实现的,实际上很多你需要的数据结构都可以使用链式结构,链式结构的一个特点使用malloc和指针,下面是任务队列ADT的实现代码:

Queue* queue_init(){
    Queue *queue = (Queue*)malloc(sizeof(Queue));
    if(!queue){
        perror("init queue failed.");
        return NULL;
    }
    queue->head = NULL;
    queue->tail = NULL;
    queue->size = 0;
    return queue;
}

int queue_is_empty(Queue *queue){
    return queue->size == 0;
}

int queue_is_full(Queue *queue){
    TNode *node = (TNode*)malloc(sizeof(TNode));
    if(!node)
        return 1;
    free(node);
    return -1;
}

int queue_enqueue(Queue *queue, Task task){
    if(queue == NULL || task == NULL)
        return -1;
    TNode *node = (TNode*)malloc(sizeof(TNode));
    if(!node)
        return -1;
    node->task = task;
    node->next = NULL;

    if(queue->size == 0){
        queue->head = node;
        queue->tail = node;
        queue->size++;
    }
    queue->tail->next = node;
    queue->tail = node;
    queue->size++;
    return 1;
}

Task queue_dequeue(Queue *queue){
    if(queue == NULL || queue->size == 0)
        return NULL;
    TNode *node = queue->head;
    queue->head = node->next;
    Task task = node->task;
    free(node);
    return task;
}

int queue_clear(Queue *queue){
    if(queue == NULL)
        return -1;
    TNode *node = queue->head;
    while(node){
        TNode *temp = node->next;
        free(node);
        node = temp;
    }
    free(queue);
    return 1;
}

int queue_execute_tasks(Queue *queue){
    if(queue == NULL)
        return -1;
    TNode *node = queue->head;
    while(node){
        TNode *temp = node->next;
        (node->task)();
        free(node);
        node = temp;
    }
    queue->head = NULL;
    queue->tail = NULL;
    queue->size = 0;
    return 1;
}

下面是任务队列ADT的使用,任务队列和消息队列在很多应用中都有,例如一些常见的消息队列中间件ActiveMQ、RabbitMQ、RocketMQ和Kafka,基本原理也是基于队列数据结构。

void task1(void){
    printf("01 processing the result of ajax......\n");
}

void task2(void){
    printf("02 rendering the data of elements......\n");
}

void task3(void){
    printf("03 execute the task of timeout......\n");
}

void queue(void){
    Queue *queue = queue_init();
    queue_enqueue(queue, task3);
    queue_enqueue(queue, task1);
    queue_enqueue(queue, task2);
    Task task = queue_dequeue(queue);
    task();
    queue_execute_tasks(queue);
    queue_clear(queue);
}
赞(0)
未经允许不得转载:srcmini » 经典线性结构之线性表、栈和队列数据结构详解和实例分析

评论 抢沙发

评论前必须登录!