排序算法适用场景比较：不同情况该怎么选

排序 算法适用场景比较：不同情况该怎么选

写程序时，排序几乎无处不在。从电商网站按价格筛商品，到后台日志按时间排序分析，不同的数据规模和使用条件，决定了该用哪种排序方式。不是所有情况都适合上快排，也不是小数组非得堆排序。

小数组：插入排序更轻快

当数据量在10到50之间，比如手机App里用户最近打开的文件列表，插入排序往往比快排还快。原因很简单——它逻辑简单，没有递归开销，缓存友好。现代CPU对连续内存访问效率高，插入排序正好吃准这一点。

void insertion_sort(int arr[], int n) {
    for (int i = 1; i < n; i++) {
        int key = arr[i];
        int j = i - 1;
        while (j >= 0 && arr[j] > key) {
            arr[j + 1] = arr[j];
            j--;
        }
        arr[j + 1] = key;
    }
}

大数组通用选择：快速排序

大多数标准库里的sort函数，底层是快排或其变种。比如你要处理几万条用户订单，按下单时间重排，快排平均O(n log n)的性能很稳。但它最坏情况会退化到O(n²)，所以工业实现通常加随机化pivot，或者切换到堆排序保底（像IntroSort）。

不过快排不稳定，相同元素可能被打乱顺序。如果你之前按用户名排过一次，再按成绩排，还想保持用户名有序，就得换别的。

要求稳定？归并排序上场

学生成绩管理系统里，先按班级排，再按总分排，还得保证同分学生原来的顺序不变——这时候就得用归并排序。它是稳定的，而且对链表结构也友好。虽然要额外O(n)空间，但在内存不是瓶颈的今天，这代价常可接受。

数据库系统做外部排序，比如几十G的日志文件无法全读进内存，就是靠归并的思想：先分块排序写回磁盘，再逐段合并。

数据范围小？试试计数排序

如果排序的是年龄、分数（比如0到100）、等级这类有限范围的整数，计数排序能干到O(n)。某公司内部统计员工年龄分布，总共就几千人，最大年龄不超过80，建个长度81的数组计数就行，比任何比较排序都快。

void counting_sort(int arr[], int n, int max_val) {
    int count[101] = {0};
    int output[n];
    for (int i = 0; i < n; i++)
        count[arr[i]]++;
    for (int i = 1; i <= max_val; i++)
        count[i] += count[i - 1];
    for (int i = n - 1; i >= 0; i--) {
        output[count[arr[i]] - 1] = arr[i];
        count[arr[i]]--;
    }
    for (int i = 0; i < n; i++)
        arr[i] = output[i];
}

近乎有序的数据：冒泡其实不慢

别一听冒泡就摇头。现实中有些数据本来基本有序，比如微博热搜榜每分钟刷新一次，前后变化不大。这种情况下，冒泡排序加个标志位判断是否发生交换，可以O(n)完成。虽然听起来“土”，但特定场景下真能省事。

优先队列需求：堆排序有优势

任务调度系统中，每个任务带优先级，要不断取最高优先级执行。堆结构天然支持动态插入和提取最值，而堆排序正是基于此。虽然整体排序性能不如快排，但如果你需要边排序边操作，它就派上用场了。

操作系统内核中的定时器管理，常用最小堆来组织超时事件，而不是每次全排序。

实际开发看库函数

日常写业务代码，别自己从头实现排序。C++的std::sort、Java的Arrays.sort()、Python的sorted()都经过千锤百炼。它们内部往往是混合策略：小数组用插入，一般用快排+归并的组合，遇到最坏情况自动降级。你只需要清楚什么时候该排序、按什么字段排，底层交给库就行。