算法之旅2.0-栈与队列
它们以简单却严格的法则,精准模拟着日常运作的秩序,成为数据流转的基石。
栈
栈(stack)是一种遵循先入后出逻辑的线性数据结构。
可以将栈类比为桌面上的一摞盘子,如果想取出底部的盘子,则需要先将上面的盘子依次移走。我们将盘子替换为各种类型的元素(如整数、字符、对象等),就得到了栈这种数据结构。
把堆叠元素的顶部称为“栈顶”,底部称为“栈底”。将把元素添加到栈顶的操作叫作“入栈”,删除栈顶元素的操作叫作“出栈”。
栈的常用操作
栈的常用操作如表所示,具体的方法名需要根据所使用的编程语言来确定。在此,我们以常见的 push()
、pop()
、peek()
命名为例。
通常情况下,我们可以直接使用编程语言内置的栈类。然而,某些语言可能没有专门提供栈类,这时我们可以将该语言的“数组”或“链表”当作栈来使用,并在程序逻辑上忽略与栈无关的操作。
// 在Go中,推荐使用Slice当作栈来使用
var stack []int
// 元素入栈
stack = append(stack, 1)
stack = append(stack, 3)
stack = append(stack, 2)
stack = append(stack, 5)
stack = append(stack, 4)
// 访问栈顶元素
peek := stack[len(stack)-1]
// 元素出栈
pop := stack[len(stack)-1]
stack = stack[:len(stack)-1]
// 获取长度
size := len(stack)
// 判断是否为空
isEmpty := len(stack)==0
栈的实现
为了深入了解栈的运行机制,我们来尝试自己实现一个栈类。
栈遵循先入后出的原则,因此我们只能在栈顶添加或删除元素。然而,数组和链表都可以在任意位置添加和删除元素,因此栈可以视为一种受限制的数组或链表。换句话说,我们可以“屏蔽”数组或链表的部分无关操作,使其对外表现的逻辑符合栈的特性。
基于链表的实现
使用链表实现栈时,我们可以将链表的头节点视为栈顶,尾节点视为栈底。
对于入栈操作,我们只需将元素插入链表头部,这种节点插入方法被称为“头插法”。而对于出栈操作,只需将头节点从链表中删除即可。
底层实现
入栈
出栈
结束
以下是基于链表实现栈的示例代码:
// 基于链表实现的栈
type linkedListStack struct{
// 使用内置包 list来实现
data *list.List
}
// 初始化栈
func newLinkedListStack() *linkedListStack{
return &lindedListStack{
data: list.New(),
}
}
// 入栈
func (s *linkedListStack) push(value int){
s.data.PushBack(value)
}
// 出栈
func (s *linkedListStack) pop() any{
if s.isEmpty(){
return nil
}
e := s.data.Back()
s.data.Remove(e)
return e.Value
}
// 访问栈顶元素
func (s *linkedListStack) peek() any{
if s.isEmpty(){
return nil
}
e := s.data.Back()
return e.Value
}
// 获取栈的长度
func (s *linkedListStack) size() int{
return s.data.Len()
}
// 判断栈是否为空
func (s *linkedListStack) isEmpty() bool {
return s.data.Len() == 0
}
/* 获取 List 用于打印 */
func (s *linkedListStack) toList() *list.List {
return s.data
}
基于数组的实现
使用数组实现栈时,我们可以将数组的尾部作为栈顶。如图所示,入栈与出栈操作分别对应在数组尾部添加元素与删除元素,时间复杂度都为O(1)。
底层实现
入栈
出栈
结束
由于入栈的元素可能会源源不断地增加,因此我们可以使用动态数组,这样就无须自行处理数组扩容问题。以下为示例代码:
// 基于数组实现栈
type arrayStack struct{
data []int // 数据,Go中用切片
}
// 初始化栈
func newArrayStack() *arrayStack{
return &arrayStack{
// 设置栈的长度为0, 容量为16
data: make([]int, 0, 16),
}
}
// 栈的长度
func (s *arrayStack) size() int{
return len(s.data)
}
// 栈是否为空
func (s *arrayStack) isEmpty() bool{
return s.size==0
}
// 入栈
func (s *arrayStack) push(v int){
// 切片会自动扩容
s.data = append(s.data, v)
}
// 出栈
func (s *arrayStack) pop() any{
val := s.peek()
s.data = s.data[:len(s.data)-1]
}
// 获取栈顶元素
func (s *arrayStack) peek() any{
if s.isEmpty(){
return nil
}
val := s.data[len(s.data)-1]
return val
}
// 获取slice用于打印
func (s *arrayStack) toSlice() []int{
return s.data
}
两种实现对比
两种实现都支持栈定义中的各项操作。数组实现额外支持随机访问,但这已超出了栈的定义范畴,因此一般不会用到。
时间效率
在基于数组的实现中,入栈和出栈操作都在预先分配好的连续内存中进行,具有很好的缓存本地性,因此效率较高。然而,如果入栈时超出数组容量,会触发扩容机制,导致该次入栈操作的时间复杂度变为O(n)。
在基于链表的实现中,链表的扩容非常灵活,不存在上述数组扩容时效率降低的问题。但是,入栈操作需要初始化节点对象并修改指针,因此效率相对较低。不过,如果入栈元素本身就是节点对象,那么可以省去初始化步骤,从而提高效率。
综上所述,当入栈与出栈操作的元素是基本数据类型时,例如 int 或 double ,我们可以得出以下结论。
- 基于数组实现的栈在触发扩容时效率会降低,但由于扩容是低频操作,因此平均效率更高。
- 基于链表实现的栈可以提供更加稳定的效率表现。
空间效率
在初始化列表时,系统会为列表分配“初始容量”,该容量可能超出实际需求;并且,扩容机制通常是按照特定倍率(例如 2 倍)进行扩容的,扩容后的容量也可能超出实际需求。因此,基于数组实现的栈可能造成一定的空间浪费。
然而,由于链表节点需要额外存储指针,因此链表节点占用的空间相对较大。
综上,我们不能简单地确定哪种实现更加节省内存,需要针对具体情况进行分析。
栈的典型应用
浏览器中的后退与前进、软件中的撤销与反撤销。每当我们打开新的网页,浏览器就会对上一个网页执行入栈,这样我们就可以通过后退操作回到上一个网页。后退操作实际上是在执行出栈。如果要同时支持后退和前进,那么需要两个栈来配合实现。
程序内存管理。每次调用函数时,系统都会在栈顶添加一个栈帧,用于记录函数的上下文信息。在递归函数中,向下递推阶段会不断执行入栈操作,而向上回溯阶段则会不断执行出栈操作。
队列
队列(queue)是一种遵循先入先出规则的线性数据结构。顾名思义,队列模拟了排队现象,即新来的人不断加入队列尾部,而位于队列头部的人逐个离开。
如图所示,我们将队列头部称为“队首”,尾部称为“队尾”,将把元素加入队尾的操作称为“入队”,删除队首元素的操作称为“出队”。
队列常用操作
队列的常见操作如表所示。需要注意的是,不同编程语言的方法名称可能会有所不同。我们在此采用与栈相同的方法命名。
可以直接使用编程语言中现成的队列类:
// 初始化队列
// 在Go中,将list作为队列来使用
queue := list.New()
// 元素入队
queue.PushBack(1)
queue.PushBack(3)
queue.PushBack(2)
queue.PushBack(5)
queue.PushBack(4)
// 访问队首元素
peek := queue.Front()
// 元素出队
pop := queue.Front()
queue.Remove(pop)
// 获取队列的长度
size := queue.Len()
// 判断队列是否为空
isEmpty := queue.Len() == 0
队列实现
为了实现队列,我们需要一种数据结构,可以在一端添加元素,并在另一端删除元素,链表和数组都符合要求。
基于链表的实现
如图所示,我们可以将链表的“头节点”和“尾节点”分别视为“队首”和“队尾”,规定队尾仅可添加节点,队首仅可删除节点。
底层实现
入队
出队
结束
以下是用链表实现队列的代码:
// 基于链表实现的队列
type linkedListQueue struct{
// 使用内置包list实现队列
data *list.List
}
// 初始化队列
func newLinkedListQueue() *linkedListQueue{
return &linkedListQueue{
data: list.New(),
}
}
// 入队
func (s *linkedListQueue) push(value any){
s.data.PushBack(value)
}
// 出队
func (s *linkedListQueue) pop() any{
if s.isEmpty(){
return nil
}
e := s.dataFront()
s.data.Remove(e)
return e.Value
}
// 访问队首
func (s *linkedListQueue) peek() any{
if s.isEmpty(){
return nil
}
e := s.data.Front()
return e.Value
}
// 获取队列长度
func (s *linkedListQueue) size() int{
return s.data.Len()
}
// 判断队列是否为空
func (s *linkedListQueue) isEmpty() bool{
return s.data.Len() == 0
}
// 获取list用于打印
func (s *linkedListQueue) toList *list.List{
return s.data
}
基于数组的实现
在数组中删除首元素的时间复杂度为O(n),这会导致出队操作效率较低。然而,我们可以采用以下巧妙方法来避免这个问题。
可以使用一个变量 front
指向队首元素的索引,并维护一个变量 size
用于记录队列长度。定义 rear = front + size
,这个公式计算出的 rear
指向队尾元素之后的下一个位置。
基于此设计,数组中包含元素的有效区间为 [front, rear - 1]
,各种操作的实现方法如图 5-6 所示。
- 入队操作:将输入元素赋值给
rear
索引处,并将size
增加 1 。 - 出队操作:只需将
front
增加 1 ,并将size
减少 1 。
底层实现
入队
出队
结束
你可能会发现一个问题:在不断进行入队和出队的过程中,front
和 rear
都在向右移动,当它们到达数组尾部时就无法继续移动了。为了解决此问题,我们可以将数组视为首尾相接的“环形数组”
对于环形数组,我们需要让 front
或 rear
在越过数组尾部时,直接回到数组头部继续遍历。这种周期性规律可以通过“取余操作”来实现,代码如下所示:
// 基于环形数组实现队列
type arrayQueue struct{
nums []int // 用于存储队列元素的数组
front int // 队首指针,指向队首元素
queSize int // 队列长度
queCapacity int // 队列容量(即最大容纳元素数量)
}
// 初始化队列
func newArrayQueue(queCapacity int) *arrayQueue{
return &arrayQueue{
nums: make([]int, queCapacity),
queCapacity: queCapacity,
front: 0,
queSize: 0
}
}
// 队列长度
func (q *arrayQueue) size() int{
return q.queSize
}
// 队列是否为空
func (q *arrayQueue) isEmpty() bool{
return q.queSize == 0
}
// 入队
func (q *arrayQueue) push(num int){
// 队列已满
if q.queSize == q.queCapacity{
// 这里可以补充扩容实现~~~
return
}
// 计算队尾指针,指向队尾索引+1
// 通过取余操作实现rear越过数组尾部后回到头部
rear := (q.front+q.queSize) % q.queCapacity
// 将num添加到队尾
q.nums[rear]=num
// 长度+1
q.queSize++
}
// 出队
func (q *arrayQueue) pop() any{
num := q.peek()
if num == nil{
return nil
}
// 队首指针向后移动一位,若越过队尾,则返回数组头部
q.front = (q.front+1) % q.queCapacity
q.queSize--
// 这里可以实现缩容~~~
return num
}
// 访问队首元素
func (q *arrayQueue) peek() any{
if q.isEmpty{
return nil
}
return q.nums[q.front]
}
// 获取Slice用于打印
func (q *arrayQueue) toSlice() []int{
rear := q.front+q.queSize
if rear >= q.queCapacity{
rear %= q.queCapacity
return append(q.nums[q.front:], q.nums[:rear]...)
}
return q.nums[q.front:rear]
}
// 自动扩容为原来的 2 倍
func (q *arrayQueue) expandCapacity() {
newCap := q.queCapacity * 2
newNums := make([]int, newCap)
// 按入队顺序复制旧数据
for i := 0; i < q.queSize; i++ {
newNums[i] = q.nums[(q.front+i)%q.queCapacity]
}
q.nums = newNums
q.front = 0
q.queCapacity = newCap
}
以上实现的队列仍然具有局限性:其长度不可变。然而,这个问题不难解决,我们可以将数组替换为动态数组,从而引入扩容机制。有兴趣的读者可以尝试自行实现。
两种实现的对比结论与栈一致,在此不再赘述。
队列典型应用
- 淘宝订单。购物者下单后,订单将加入队列中,系统随后会根据顺序处理队列中的订单。在双十一期间,短时间内会产生海量订单,高并发成为工程师们需要重点攻克的问题。
- 各类待办事项。任何需要实现“先来后到”功能的场景,例如打印机的任务队列、餐厅的出餐队列等,队列在这些场景中可以有效地维护处理顺序。
双向队列
在队列中,我们仅能删除头部元素或在尾部添加元素。如图所示,双向队列(double-ended queue)提供了更高的灵活性,允许在头部和尾部执行元素的添加或删除操作。
双向队列常用操作
双向队列的常用操作如表所示,具体的方法名称需要根据所使用的编程语言来确定。
同样地,我们可以直接使用编程语言中已实现的双向队列类:
/* 初始化双向队列 */
// 在 Go 中,将 list 作为双向队列使用
deque := list.New()
/* 元素入队 */
deque.PushBack(2) // 添加至队尾
deque.PushBack(5)
deque.PushBack(4)
deque.PushFront(3) // 添加至队首
deque.PushFront(1)
/* 访问元素 */
front := deque.Front() // 队首元素
rear := deque.Back() // 队尾元素
/* 元素出队 */
deque.Remove(front) // 队首元素出队
deque.Remove(rear) // 队尾元素出队
/* 获取双向队列的长度 */
size := deque.Len()
/* 判断双向队列是否为空 */
isEmpty := deque.Len() == 0
双向队列实现
双向队列的实现与队列类似,可以选择链表或数组作为底层数据结构。
基于双向链表的实现
对于双向队列而言,头部和尾部都可以执行入队和出队操作。换句话说,双向队列需要实现另一个对称方向的操作。为此,我们采用“双向链表”作为双向队列的底层数据结构。
如图所示,我们将双向链表的头节点和尾节点视为双向队列的队首和队尾,同时实现在两端添加和删除节点的功能。
底层实现
队尾入队
队首入队
队尾出队
队首出队
结束
实现代码如下:
// 基于双向链表实现的双向队列
type linkedListDeque struct{
// 使用内置包list
data *list.List
}
// 初始化双端队列
func newLinkedListDeque() *linkedListDeque{
return &linkedListDeque{
data: list.New(),
}
}
// 判断是否队列是否为空
func (s *linkedListDeque) isEmpty() book{
return s.data.Len() == 0
}
// 获取队列长度
func (s *linkedListDeque) size() int{
return s.data.Len()
}
// 访问队首元素
func (s *linkedListDeque) peekFirst() any{
if s.isEmpty(){
return nil
}
e := s.data.Front()
return e.Value
}
// 访问队尾元素
func (s *linkedListDeque) peekLast() any{
if s.isEmpty(){
return nil
}
e := s.data.Back()
return e.Value
}
// 队首元素入队
func (s *linkedListDeque) pushFirst(value any){
s.data.PushFirst(value)
}
// 队尾元素入队
func (s *linkedListDeque) pushLast(value any){
s.data.PushBack(value)
}
// 队首元素出队
func (s *linkedListDeque) popFirst() any{
if s.isEmpty(){
return nil
}
e := s.data.Front()
s.data.Remove(e)
return e.Value
}
// 队尾元素出队
func (s *linkedListDeque) popLast() any{
if s.isEmpty(){
return nil
}
e := s.data.Back()
s.data.Remove(e)
return e.Value
}
基于数组的实现
如图所示,与基于数组实现队列类似,我们也可以使用环形数组来实现双向队列。
底层实现
队尾入队
队首入队
队尾出队
队首出队
结束
在队列的实现基础上,仅需增加“队首入队”和“队尾出队”的方法:
// 基于环形数组实现的双向队列
type arrayDeque struct{
nums []int // 用于存放双向队列元素的数组
front int // 队首指针,指向队首元素
queSize int // 双向队列的长度
queCapacity int // 队列容量(即最大容纳元素数量)
}
// 初始化队列
func newArrayDeque(queCapacity int) *arrayDeque{
return &arrayDeque{
nums: make([]int, queCapacity),
queCapacity: queCapacity,
front: 0,
queSize: 0,
}
}
// 获取双向队列的长度
func (q * arrayDeque) size() int{
return q.queSize
}
// 判断双向队列是否为空
func (q *arrayDeque) isEmpty() bool{
return q.queSize == 0
}
// 计算环形数组的索引
func (q *arrayDeque) index(i int) int{
// 通过取余操作实现数组首位相连
// 当 i 越过数组尾部后,回到头部
// 当 i 越过数组头部后,回到尾部
return (i + q.queCapacity) % q.queCapacity
}
// 队首入队
func (q *arrayDeque) pushFirst(num int){
if q.queSize == q.queCapacity{
fmt.Println("双向队列已满")
return
}
// 队首指针向左移动一位
// 通过取余操作实现front越过头部后回到尾部
q.front = q.index(q.front - 1)
// 将num 添加至队首
q.nums[q.front] = num
q.queSize++
}
// 队尾入队
func (q *arrayDeque) pushLast(num int){
if q.queSize == q.queCapacity{
fmt.Println("双向队列已满")
return
}
// 计算队尾指针,指向队尾索引+1
rear := q.index(q.front + q.queSize)
// 将 num 添加至队尾
q.nums[rear] = num
q.queSize++
}
// 访问队首元素
func (q *arrayDeque) peekFirst() any{
if q.isEmpty(){
return nil
}
return q.nums[q.front]
}
// 访问队尾元素
func (q *arrayDeque) peekLast() any{
if q.isEmpty(){
return nil
}
// 计算元素索引
last := q.index(q.front + q.queSize - 1)
return q.nums[last]
}
// 队首出队
func (q *arrayDeque) popFirst() any{
num := q.peekFirst()
if num == nil{
return nil
}
// 队首指针向后移动一位
q.front = q.index(q.front + 1)
q.queSize--
return num
}
// 队尾出队
func (q *arrayDeque) popLast() any{
num := q.peekLast()
if num == nil{
return nil
}
q.queSize--
return num
}
// 获取Slice用于打印
func (q *arrayDeque) toSlice() []int{
// 仅转换有效长度范围内的元素
res := make([]int, q.queSize)
for i,j := 0, q.front; i<q.queSize; i++{
res[i] = q.nums[q.index(j)]
j++
}
return res
}
双向队列应用
双向队列兼具栈与队列的逻辑,因此它可以实现这两者的所有应用场景,同时提供更高的自由度。
我们知道,软件的“撤销”功能通常使用栈来实现:系统将每次更改操作 push 到栈中,然后通过 pop 实现撤销。然而,考虑到系统资源的限制,软件通常会限制撤销的步数(例如仅允许保存50步)。当栈的长度超过 50时,软件需要在栈底(队首)执行删除操作。但栈无法实现该功能,此时就需要使用双向队列来替代栈。请注意,“撤销”的核心逻辑仍然遵循栈的先入后出原则,只是双向队列能够更加灵活地实现一些额外逻辑。
小结
重点
- 栈是一种遵循先入后出原则的数据结构,可通过数组或链表来实现。
- 在时间效率方面,栈的数组实现具有较高的平均效率,但在扩容过程中,单次入栈操作的时间复杂度会劣化至O(n)。相比之下,栈的链表实现具有更为稳定的效率表现。
- 在空间效率方面,栈的数组实现可能导致一定程度的空间浪费。但需要注意的是,链表节点所占用的内存空间比数组元素更大。
- 队列是一种遵循先入先出原则的数据结构,同样可以通过数组或链表来实现。在时间效率和空间效率的对比上,队列的结论与前述栈的结论相似。
- 双向队列是一种具有更高自由度的队列,它允许在两端进行元素的添加和删除操作。
Q & A
Q:撤销(undo)和反撤销(redo)具体是如何实现的?
使用两个栈,栈 A 用于撤销,栈 B 用于反撤销。
- 每当用户执行一个操作,将这个操作压入栈 A ,并清空栈 B 。
- 当用户执行“撤销”时,从栈 A 中弹出最近的操作,并将其压入栈 B 。
- 当用户执行“反撤销”时,从栈 B 中弹出最近的操作,并将其压入栈 A 。