Avor數(shù)據(jù)排序順序
發(fā)布時間:
2022-05-17 15:27:29
Avor數(shù)據(jù)排序順序,對象化前景常使用的操作就是排序,在Avro確定了數(shù)據(jù)標(biāo)準(zhǔn)排列順序以后,就允許系統(tǒng)寫入的數(shù)據(jù)被另外的系統(tǒng)高效地排序了,這是個很重要的優(yōu)化。即使Avro二進(jìn)制數(shù)據(jù)還沒有反序列化對象,也可以對其進(jìn)行高效排序。
要對擁有相同模式的數(shù)據(jù)項(xiàng)進(jìn)行比較,可以采用對模式的深度優(yōu)先、從左到右遞歸遍歷的方式。遇到不能匹配的項(xiàng)即按原來順序,比如,boolean類型的數(shù)據(jù)和int類型的數(shù)據(jù)不能匹配,因此就不用進(jìn)行排序。具體來說,相同模式的兩個項(xiàng)進(jìn)行比較時需遵從以下規(guī)則。
① null數(shù)據(jù)總是相等的。
② boolean類型中false排在true的前面。
③ int、long、float與double數(shù)據(jù)按照數(shù)值的升序排列。
④ bytes和fixed數(shù)據(jù)根據(jù)8位無符號值按照字節(jié)序進(jìn)行比較。
⑤ string數(shù)據(jù)根據(jù)Unicode按字節(jié)進(jìn)行比較,值得注意的是,對字符串而言,既然UTF-8作為二進(jìn)制編碼使用,那么按字節(jié)排序和按字符串二進(jìn)制數(shù)據(jù)排序是相同的。
⑥ array數(shù)據(jù)根據(jù)元素按字節(jié)序進(jìn)行比較。
⑦ enum數(shù)據(jù)根據(jù)枚舉模式中符號的位置進(jìn)行排序。例如,枚舉的符號位["z","a"]把"z"排在"a"前面。
⑧ union數(shù)據(jù)先按照聯(lián)合的分支進(jìn)行排序,接著按照分支的類型排序。例如,聯(lián)合["int","string"]中,所有整型將排在所有字符型值前,而整型和字符型各自按照上面的規(guī)則排序。
⑨ record數(shù)據(jù)根據(jù)字段按字節(jié)序排序。如果字段指定順序?yàn)椋?br>
● "ascending":其值排序的順序不變;
● "descending":其值排序的順序反轉(zhuǎn);
● "ignore":排序時其值將被忽略。⑩ map數(shù)據(jù)不進(jìn)行比較。試圖比較包含映射的數(shù)據(jù)是非法的,除非映射是“有序”的,否則“忽略”記錄字段。
上一篇:
虛擬化技術(shù)分類有哪些
下一篇:
譜聚類算法