Skip to content

算法之旅2.0-栈与队列

约 5171 字大约 17 分钟

数据结构队列

2023-05-10

它们以简单却严格的法则,精准模拟着日常运作的秩序,成为数据流转的基石。

栈(stack)是一种遵循先入后出逻辑的线性数据结构。

可以将栈类比为桌面上的一摞盘子,如果想取出底部的盘子,则需要先将上面的盘子依次移走。我们将盘子替换为各种类型的元素(如整数、字符、对象等),就得到了栈这种数据结构。

把堆叠元素的顶部称为“栈顶”,底部称为“栈底”。将把元素添加到栈顶的操作叫作“入栈”,删除栈顶元素的操作叫作“出栈”。

栈的常用操作

栈的常用操作如表所示,具体的方法名需要根据所使用的编程语言来确定。在此,我们以常见的 push()pop()peek() 命名为例。

通常情况下,我们可以直接使用编程语言内置的栈类。然而,某些语言可能没有专门提供栈类,这时我们可以将该语言的“数组”或“链表”当作栈来使用,并在程序逻辑上忽略与栈无关的操作。

// 在Go中,推荐使用Slice当作栈来使用
var stack []int

// 元素入栈
stack = append(stack, 1)
stack = append(stack, 3)
stack = append(stack, 2)
stack = append(stack, 5)
stack = append(stack, 4)

// 访问栈顶元素
peek := stack[len(stack)-1]

// 元素出栈
pop := stack[len(stack)-1]
stack = stack[:len(stack)-1]

// 获取长度
size := len(stack)

// 判断是否为空
isEmpty := len(stack)==0

栈的实现

为了深入了解栈的运行机制,我们来尝试自己实现一个栈类。

栈遵循先入后出的原则,因此我们只能在栈顶添加或删除元素。然而,数组和链表都可以在任意位置添加和删除元素,因此栈可以视为一种受限制的数组或链表。换句话说,我们可以“屏蔽”数组或链表的部分无关操作,使其对外表现的逻辑符合栈的特性。

基于链表的实现

使用链表实现栈时,我们可以将链表的头节点视为栈顶,尾节点视为栈底。

对于入栈操作,我们只需将元素插入链表头部,这种节点插入方法被称为“头插法”。而对于出栈操作,只需将头节点从链表中删除即可。

  1. 底层实现

  2. 入栈

  3. 出栈

  4. 结束

以下是基于链表实现栈的示例代码:

// 基于链表实现的栈
type linkedListStack struct{
  // 使用内置包 list来实现
  data *list.List
}

// 初始化栈
func newLinkedListStack() *linkedListStack{
  return &lindedListStack{
    data: list.New(),
  }
}

// 入栈
func (s *linkedListStack) push(value int){
  s.data.PushBack(value)
}

// 出栈
func (s *linkedListStack) pop() any{
  if s.isEmpty(){
    return nil
  }
  e := s.data.Back()
  s.data.Remove(e)
  return e.Value
}

// 访问栈顶元素
func (s *linkedListStack) peek() any{
  if s.isEmpty(){
    return nil
  }
  e := s.data.Back()
  return e.Value
}

// 获取栈的长度
func (s *linkedListStack) size() int{
  return s.data.Len()
}

// 判断栈是否为空
func (s *linkedListStack) isEmpty() bool {
    return s.data.Len() == 0
}

/* 获取 List 用于打印 */
func (s *linkedListStack) toList() *list.List {
    return s.data
}

基于数组的实现

使用数组实现栈时,我们可以将数组的尾部作为栈顶。如图所示,入栈与出栈操作分别对应在数组尾部添加元素与删除元素,时间复杂度都为O(1)O(1)

  1. 底层实现

  2. 入栈

  3. 出栈

  4. 结束

由于入栈的元素可能会源源不断地增加,因此我们可以使用动态数组,这样就无须自行处理数组扩容问题。以下为示例代码:

// 基于数组实现栈
type arrayStack struct{
  data []int // 数据,Go中用切片
}

// 初始化栈
func newArrayStack() *arrayStack{
  return &arrayStack{
    // 设置栈的长度为0, 容量为16
    data: make([]int, 0, 16),
  }
}

// 栈的长度
func (s *arrayStack) size() int{
  return len(s.data)
}

// 栈是否为空
func (s *arrayStack) isEmpty() bool{
  return s.size==0
}

// 入栈
func (s *arrayStack) push(v int){
  // 切片会自动扩容
  s.data = append(s.data, v)
}

// 出栈
func (s *arrayStack) pop() any{
  val := s.peek()
  s.data = s.data[:len(s.data)-1]
}

// 获取栈顶元素
func (s *arrayStack) peek() any{
  if s.isEmpty(){
    return nil
  }
  val := s.data[len(s.data)-1]
  return val
}

// 获取slice用于打印
func (s *arrayStack) toSlice() []int{
  return s.data
}

两种实现对比

两种实现都支持栈定义中的各项操作。数组实现额外支持随机访问,但这已超出了栈的定义范畴,因此一般不会用到。

时间效率

在基于数组的实现中,入栈和出栈操作都在预先分配好的连续内存中进行,具有很好的缓存本地性,因此效率较高。然而,如果入栈时超出数组容量,会触发扩容机制,导致该次入栈操作的时间复杂度变为O(n)O(n)

在基于链表的实现中,链表的扩容非常灵活,不存在上述数组扩容时效率降低的问题。但是,入栈操作需要初始化节点对象并修改指针,因此效率相对较低。不过,如果入栈元素本身就是节点对象,那么可以省去初始化步骤,从而提高效率。

综上所述,当入栈与出栈操作的元素是基本数据类型时,例如 int 或 double ,我们可以得出以下结论。

  • 基于数组实现的栈在触发扩容时效率会降低,但由于扩容是低频操作,因此平均效率更高。
  • 基于链表实现的栈可以提供更加稳定的效率表现。

空间效率

在初始化列表时,系统会为列表分配“初始容量”,该容量可能超出实际需求;并且,扩容机制通常是按照特定倍率(例如 2 倍)进行扩容的,扩容后的容量也可能超出实际需求。因此,基于数组实现的栈可能造成一定的空间浪费。

然而,由于链表节点需要额外存储指针,因此链表节点占用的空间相对较大。

综上,我们不能简单地确定哪种实现更加节省内存,需要针对具体情况进行分析。

栈的典型应用

  • 浏览器中的后退与前进、软件中的撤销与反撤销。每当我们打开新的网页,浏览器就会对上一个网页执行入栈,这样我们就可以通过后退操作回到上一个网页。后退操作实际上是在执行出栈。如果要同时支持后退和前进,那么需要两个栈来配合实现。

  • 程序内存管理。每次调用函数时,系统都会在栈顶添加一个栈帧,用于记录函数的上下文信息。在递归函数中,向下递推阶段会不断执行入栈操作,而向上回溯阶段则会不断执行出栈操作。

队列

队列(queue)是一种遵循先入先出规则的线性数据结构。顾名思义,队列模拟了排队现象,即新来的人不断加入队列尾部,而位于队列头部的人逐个离开。

如图所示,我们将队列头部称为“队首”,尾部称为“队尾”,将把元素加入队尾的操作称为“入队”,删除队首元素的操作称为“出队”。

队列常用操作

队列的常见操作如表所示。需要注意的是,不同编程语言的方法名称可能会有所不同。我们在此采用与栈相同的方法命名。

可以直接使用编程语言中现成的队列类:

// 初始化队列
// 在Go中,将list作为队列来使用
queue := list.New()

// 元素入队
queue.PushBack(1)
queue.PushBack(3)
queue.PushBack(2)
queue.PushBack(5)
queue.PushBack(4)

// 访问队首元素
peek := queue.Front()

// 元素出队
pop := queue.Front()
queue.Remove(pop)

// 获取队列的长度
size := queue.Len()

// 判断队列是否为空
isEmpty := queue.Len() == 0

队列实现

为了实现队列,我们需要一种数据结构,可以在一端添加元素,并在另一端删除元素,链表和数组都符合要求。

基于链表的实现

如图所示,我们可以将链表的“头节点”和“尾节点”分别视为“队首”和“队尾”,规定队尾仅可添加节点,队首仅可删除节点。

  1. 底层实现

  2. 入队

  3. 出队

  4. 结束

以下是用链表实现队列的代码:

// 基于链表实现的队列
type linkedListQueue struct{
  // 使用内置包list实现队列
  data *list.List
}

// 初始化队列
func newLinkedListQueue() *linkedListQueue{
  return &linkedListQueue{
    data: list.New(),
  }
}

// 入队
func (s *linkedListQueue) push(value any){
  s.data.PushBack(value)
}

// 出队
func (s *linkedListQueue) pop() any{
  if s.isEmpty(){
    return nil
  }
  e := s.dataFront()
  s.data.Remove(e)
  return e.Value
}

// 访问队首
func (s *linkedListQueue) peek() any{
  if s.isEmpty(){
    return nil
  }
  e := s.data.Front()
  return e.Value
}

// 获取队列长度
func (s *linkedListQueue) size() int{
  return s.data.Len()
}

// 判断队列是否为空
func (s *linkedListQueue) isEmpty() bool{
  return s.data.Len() == 0
}

// 获取list用于打印
func (s *linkedListQueue) toList *list.List{
  return s.data
}

基于数组的实现

在数组中删除首元素的时间复杂度为O(n)O(n),这会导致出队操作效率较低。然而,我们可以采用以下巧妙方法来避免这个问题。

可以使用一个变量 front 指向队首元素的索引,并维护一个变量 size 用于记录队列长度。定义 rear = front + size ,这个公式计算出的 rear 指向队尾元素之后的下一个位置

基于此设计,数组中包含元素的有效区间为 [front, rear - 1],各种操作的实现方法如图 5-6 所示。

  • 入队操作:将输入元素赋值给 rear 索引处,并将 size 增加 1 。
  • 出队操作:只需将 front 增加 1 ,并将 size 减少 1 。
  1. 底层实现

  2. 入队

  3. 出队

  4. 结束

你可能会发现一个问题:在不断进行入队和出队的过程中,frontrear 都在向右移动,当它们到达数组尾部时就无法继续移动了。为了解决此问题,我们可以将数组视为首尾相接的“环形数组”

对于环形数组,我们需要让 frontrear 在越过数组尾部时,直接回到数组头部继续遍历。这种周期性规律可以通过“取余操作”来实现,代码如下所示:

// 基于环形数组实现队列
type arrayQueue struct{
  nums []int      // 用于存储队列元素的数组
  front int       // 队首指针,指向队首元素
  queSize int     // 队列长度
  queCapacity int // 队列容量(即最大容纳元素数量)
}

// 初始化队列
func newArrayQueue(queCapacity int) *arrayQueue{
  return &arrayQueue{
    nums: make([]int, queCapacity),
    queCapacity: queCapacity,
    front: 0,
    queSize: 0
  }
}


// 队列长度
func (q *arrayQueue) size() int{
  return q.queSize
}

// 队列是否为空
func (q *arrayQueue) isEmpty() bool{
  return q.queSize == 0
}

// 入队
func (q *arrayQueue) push(num int){
  // 队列已满
  if q.queSize == q.queCapacity{
    // 这里可以补充扩容实现~~~
    return
  }
  // 计算队尾指针,指向队尾索引+1
  // 通过取余操作实现rear越过数组尾部后回到头部
  rear := (q.front+q.queSize) % q.queCapacity
  // 将num添加到队尾
  q.nums[rear]=num
  // 长度+1
  q.queSize++
}

// 出队
func (q *arrayQueue) pop() any{
  num := q.peek()
  if num == nil{
    return nil
  }
  // 队首指针向后移动一位,若越过队尾,则返回数组头部
  q.front = (q.front+1) % q.queCapacity
  q.queSize--
  // 这里可以实现缩容~~~
  return num
}

// 访问队首元素
func (q *arrayQueue) peek() any{
  if q.isEmpty{
    return nil
  }
  return q.nums[q.front]
}

// 获取Slice用于打印
func (q *arrayQueue) toSlice() []int{
  rear := q.front+q.queSize
  if rear >= q.queCapacity{
    rear %= q.queCapacity
    return append(q.nums[q.front:], q.nums[:rear]...)
  }
  return q.nums[q.front:rear]
}

// 自动扩容为原来的 2 倍
func (q *arrayQueue) expandCapacity() {
	newCap := q.queCapacity * 2
	newNums := make([]int, newCap)

	// 按入队顺序复制旧数据
	for i := 0; i < q.queSize; i++ {
		newNums[i] = q.nums[(q.front+i)%q.queCapacity]
	}

	q.nums = newNums
	q.front = 0
	q.queCapacity = newCap
}

以上实现的队列仍然具有局限性:其长度不可变。然而,这个问题不难解决,我们可以将数组替换为动态数组,从而引入扩容机制。有兴趣的读者可以尝试自行实现。

两种实现的对比结论与栈一致,在此不再赘述。

队列典型应用

  • 淘宝订单。购物者下单后,订单将加入队列中,系统随后会根据顺序处理队列中的订单。在双十一期间,短时间内会产生海量订单,高并发成为工程师们需要重点攻克的问题。
  • 各类待办事项。任何需要实现“先来后到”功能的场景,例如打印机的任务队列、餐厅的出餐队列等,队列在这些场景中可以有效地维护处理顺序。

双向队列

在队列中,我们仅能删除头部元素或在尾部添加元素。如图所示,双向队列(double-ended queue)提供了更高的灵活性,允许在头部和尾部执行元素的添加或删除操作。

双向队列常用操作

双向队列的常用操作如表所示,具体的方法名称需要根据所使用的编程语言来确定。

同样地,我们可以直接使用编程语言中已实现的双向队列类:

/* 初始化双向队列 */
// 在 Go 中,将 list 作为双向队列使用
deque := list.New()

/* 元素入队 */
deque.PushBack(2)      // 添加至队尾
deque.PushBack(5)
deque.PushBack(4)
deque.PushFront(3)     // 添加至队首
deque.PushFront(1)

/* 访问元素 */
front := deque.Front() // 队首元素
rear := deque.Back()   // 队尾元素

/* 元素出队 */
deque.Remove(front)    // 队首元素出队
deque.Remove(rear)     // 队尾元素出队

/* 获取双向队列的长度 */
size := deque.Len()

/* 判断双向队列是否为空 */
isEmpty := deque.Len() == 0

双向队列实现

双向队列的实现与队列类似,可以选择链表或数组作为底层数据结构。

基于双向链表的实现

对于双向队列而言,头部和尾部都可以执行入队和出队操作。换句话说,双向队列需要实现另一个对称方向的操作。为此,我们采用“双向链表”作为双向队列的底层数据结构。

如图所示,我们将双向链表的头节点和尾节点视为双向队列的队首和队尾,同时实现在两端添加和删除节点的功能。

  1. 底层实现

  2. 队尾入队

  3. 队首入队

  4. 队尾出队

  5. 队首出队

  6. 结束

实现代码如下:

// 基于双向链表实现的双向队列
type linkedListDeque struct{
  // 使用内置包list
  data *list.List
}

// 初始化双端队列
func newLinkedListDeque() *linkedListDeque{
  return &linkedListDeque{
    data: list.New(),
  }
}

// 判断是否队列是否为空
func (s *linkedListDeque) isEmpty() book{
  return s.data.Len() == 0
}

// 获取队列长度
func (s *linkedListDeque) size() int{
  return s.data.Len()
}

// 访问队首元素
func (s *linkedListDeque) peekFirst() any{
  if s.isEmpty(){
    return nil
  }
  e := s.data.Front()
  return e.Value
}

// 访问队尾元素
func (s *linkedListDeque) peekLast() any{
  if s.isEmpty(){
    return nil
  }
  e := s.data.Back()
  return e.Value
}

// 队首元素入队
func (s *linkedListDeque) pushFirst(value any){
  s.data.PushFirst(value)
}

// 队尾元素入队
func (s *linkedListDeque) pushLast(value any){
  s.data.PushBack(value)
}

// 队首元素出队
func (s *linkedListDeque) popFirst() any{
  if s.isEmpty(){
    return nil
  }
  e := s.data.Front()
  s.data.Remove(e)
  return e.Value
}

// 队尾元素出队
func (s *linkedListDeque) popLast() any{
  if s.isEmpty(){
    return nil
  }
  e := s.data.Back()
  s.data.Remove(e)
  return e.Value
}

基于数组的实现

如图所示,与基于数组实现队列类似,我们也可以使用环形数组来实现双向队列。

  1. 底层实现

  2. 队尾入队

  3. 队首入队

  4. 队尾出队

  5. 队首出队

  6. 结束

在队列的实现基础上,仅需增加“队首入队”和“队尾出队”的方法:

// 基于环形数组实现的双向队列
type arrayDeque struct{
  nums []int // 用于存放双向队列元素的数组
  front int // 队首指针,指向队首元素
  queSize int // 双向队列的长度
  queCapacity int // 队列容量(即最大容纳元素数量)
}

// 初始化队列
func newArrayDeque(queCapacity int) *arrayDeque{
  return &arrayDeque{
    nums: make([]int, queCapacity),
    queCapacity: queCapacity,
    front: 0,
    queSize: 0,
  }
}

// 获取双向队列的长度
func (q * arrayDeque) size() int{
  return q.queSize
}

// 判断双向队列是否为空
func (q *arrayDeque) isEmpty() bool{
  return q.queSize == 0
}

// 计算环形数组的索引
func (q *arrayDeque) index(i int) int{
  // 通过取余操作实现数组首位相连
  // 当 i 越过数组尾部后,回到头部
  // 当 i 越过数组头部后,回到尾部
  return (i + q.queCapacity) % q.queCapacity
}

// 队首入队
func (q *arrayDeque) pushFirst(num int){
  if q.queSize == q.queCapacity{
    fmt.Println("双向队列已满")
    return
  }
  // 队首指针向左移动一位
  // 通过取余操作实现front越过头部后回到尾部
  q.front = q.index(q.front - 1)
  // 将num 添加至队首
  q.nums[q.front] = num
  q.queSize++
}

// 队尾入队
func (q *arrayDeque) pushLast(num int){
  if q.queSize == q.queCapacity{
    fmt.Println("双向队列已满")
    return
  }
  // 计算队尾指针,指向队尾索引+1
  rear := q.index(q.front + q.queSize)
  // 将 num 添加至队尾
  q.nums[rear] = num
  q.queSize++
}

// 访问队首元素
func (q *arrayDeque) peekFirst() any{
  if q.isEmpty(){
    return nil
  }
  return q.nums[q.front]
}

// 访问队尾元素
func (q *arrayDeque) peekLast() any{
  if q.isEmpty(){
    return nil
  }
  // 计算元素索引
  last := q.index(q.front + q.queSize - 1)
  return q.nums[last]
}

// 队首出队
func (q *arrayDeque) popFirst() any{
  num := q.peekFirst()
  if num == nil{
    return nil
  }
  // 队首指针向后移动一位
  q.front = q.index(q.front + 1)
  q.queSize--
  return num
}

// 队尾出队
func (q *arrayDeque) popLast() any{
  num := q.peekLast()
  if num == nil{
    return nil
  }
  q.queSize--
  return num
}


// 获取Slice用于打印
func (q *arrayDeque) toSlice() []int{
  // 仅转换有效长度范围内的元素
  res := make([]int, q.queSize)
  for i,j := 0, q.front; i<q.queSize; i++{
    res[i] = q.nums[q.index(j)]
    j++
  }
  return res
}

双向队列应用

双向队列兼具栈与队列的逻辑,因此它可以实现这两者的所有应用场景,同时提供更高的自由度。

我们知道,软件的“撤销”功能通常使用栈来实现:系统将每次更改操作 push 到栈中,然后通过 pop 实现撤销。然而,考虑到系统资源的限制,软件通常会限制撤销的步数(例如仅允许保存5050步)。当栈的长度超过 5050时,软件需要在栈底(队首)执行删除操作。但栈无法实现该功能,此时就需要使用双向队列来替代栈。请注意,“撤销”的核心逻辑仍然遵循栈的先入后出原则,只是双向队列能够更加灵活地实现一些额外逻辑。

小结

重点

  • 栈是一种遵循先入后出原则的数据结构,可通过数组或链表来实现。
  • 在时间效率方面,栈的数组实现具有较高的平均效率,但在扩容过程中,单次入栈操作的时间复杂度会劣化至O(n)O(n)。相比之下,栈的链表实现具有更为稳定的效率表现。
  • 在空间效率方面,栈的数组实现可能导致一定程度的空间浪费。但需要注意的是,链表节点所占用的内存空间比数组元素更大。
  • 队列是一种遵循先入先出原则的数据结构,同样可以通过数组或链表来实现。在时间效率和空间效率的对比上,队列的结论与前述栈的结论相似。
  • 双向队列是一种具有更高自由度的队列,它允许在两端进行元素的添加和删除操作。

Q & A

Q:撤销(undo)和反撤销(redo)具体是如何实现的?

使用两个栈,栈 A 用于撤销,栈 B 用于反撤销。

  1. 每当用户执行一个操作,将这个操作压入栈 A ,并清空栈 B 。
  2. 当用户执行“撤销”时,从栈 A 中弹出最近的操作,并将其压入栈 B 。
  3. 当用户执行“反撤销”时,从栈 B 中弹出最近的操作,并将其压入栈 A 。