前言
前幾天一個(gè)朋友在微信里面問我一個(gè)關(guān)于 JS 數(shù)組排序的問題。通過該問題發(fā)現(xiàn)了一些之前沒發(fā)現(xiàn)的內(nèi)容,下面話不多少了,來一起看看詳細(xì)的介紹吧。
原始數(shù)組如下:
var data = [ {value: 4}, {value: 2}, {value: undefined}, {value: undefined}, {value: 1}, {value: undefined}, {value: undefined}, {value: 7}, {value: undefined}, {value: 4} ];
data 是個(gè)數(shù)組,數(shù)組的每一項(xiàng)都是一個(gè)擁有 value 作為 key 的對(duì)象,值為數(shù)字或者 undefined。
data .sort((x, y) => x.value - y.value) .map(x => x.value);
對(duì)數(shù)組的 value 進(jìn)行排序,然后把排完序的數(shù)組進(jìn)行 flat 處理。得到的結(jié)果如下:
[2, 4, undefined, undefined, 1, undefined, undefined, 7, undefined, 4]
顯然這沒有達(dá)到我們的目的。
現(xiàn)在我們修改一下排序,挑戰(zhàn)一下函數(shù)的調(diào)用順序:先對(duì)數(shù)組進(jìn)行扁平化(flat)處理,然后再排序。
data .map(x => x.value) .sort((x, y) => x - y)
這時(shí)我們得到的結(jié)果和之前截然不同:
[1, 2, 4, 4, 7, undefined, undefined, undefined, undefined, undefined]
遇到這種情況第一感覺肯定是要去看看 ECMA 規(guī)范,萬一是 JS 引擎的 bug 呢。
在 ES6 規(guī)范 22.1.3.24 節(jié)寫道:
Calling comparefn(a,b) always returns the same value v when given a specific pair of values a and b as its two arguments. Furthermore, Type(v) is Number, and v is not NaN. Note that this implies that exactly one of a < b, a = b, and a > b will be true for a given pair of a and b.
簡(jiǎn)單翻譯一下就是:第二個(gè)參數(shù) comparefn 返回一個(gè)數(shù)字,并且不是 NaN。一個(gè)注意事項(xiàng)是,對(duì)于參與比較的兩個(gè)數(shù) a 小于 b、a 等于 b、a 大于 b 這三種情況必須有一個(gè)為 true。
所以嚴(yán)格意義上來說,這段代碼是有 bug 的,因?yàn)楸容^的結(jié)果出現(xiàn)了 NaN。
在 MDN 文檔上還有一個(gè)細(xì)節(jié):
如果 comparefn(a, b) 等于 0, a 和 b 的相對(duì)位置不變。備注:ECMAScript 標(biāo)準(zhǔn)并不保證這一行為,而且也不是所有瀏覽器都會(huì)遵守。
翻譯成編程術(shù)語就是:sort 排序算法是不穩(wěn)定排序。
其實(shí)我們最疑惑的問題上,上面兩行代碼為什么會(huì)輸出不同的結(jié)果。我們只能通過查看 V8 源碼去找答案了。
V8 對(duì)數(shù)組排序是這樣進(jìn)行的:
如果沒有定義 comparefn 參數(shù),則生成一個(gè)(高能預(yù)警,有坑?。?/p>
comparefn = function (x, y) { if (x === y) return 0; if (%_IsSmi(x) && %_IsSmi(y)) { return %SmiLexicographicCompare(x, y); } x = TO_STRING(x); // <----- 坑 y = TO_STRING(y); // <----- 坑 if (x == y) return 0; else return x < y ? -1 : 1; };
然后定義了一個(gè)插入排序算法:
function InsertionSort(a, from, to) { for (var i = from + 1; i < to; i++) { var element = a[i]; for (var j = i - 1; j >= from; j--) { var tmp = a[j]; var order = comparefn(tmp, element); if (order > 0) { // <---- 注意這里 a[j + 1] = tmp; } else { break; } } a[j + 1] = element; }
為什么是插入排序?V8 為了性能考慮,當(dāng)數(shù)組元素個(gè)數(shù)少于 10 個(gè)時(shí),使用插入排序;大于 10 個(gè)時(shí)使用快速排序。
后面還定義了快速排序函數(shù)和其它幾個(gè)函數(shù),我就不一一列出了。
函數(shù)都定義完成后,開始正式的排序操作:
// %RemoveArrayHoles returns -1 if fast removal is not supported. var num_non_undefined = %RemoveArrayHoles(array, length); if (num_non_undefined == -1) { // There were indexed accessors in the array. // Move array holes and undefineds to the end using a Javascript function // that is safe in the presence of accessors. num_non_undefined = SafeRemoveArrayHoles(array); }
中間的注釋:Move array holes and undefineds to the end using a Javascript function。排序之前會(huì)把數(shù)組里面的 undefined 移動(dòng)到最后。因此第二個(gè)排序算法會(huì)把 undefined 移動(dòng)到最后,然后對(duì)剩余的數(shù)據(jù) [4,2,1,7,4] 進(jìn)行排序。
而在第一種寫法時(shí),數(shù)組的每一項(xiàng)都是一個(gè) Object,然后最 Object 調(diào)用 x.value - y.value 進(jìn)行計(jì)算,當(dāng) undefined 參與運(yùn)算時(shí)比較的結(jié)果是 NaN。
當(dāng)返回 NaN 時(shí) V8 怎么處理的呢?我前面標(biāo)注過,再貼一次:
var order = comparefn(tmp, element); if (order > 0) { // <---- 這里 a[j + 1] = tmp; } else { break; }
NaN > 0 為 false,執(zhí)行了 else 分支代碼。
思考題,以下代碼的結(jié)果:
[1, 23, 2, 3].sort()
總結(jié)
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com