不同的編碼裡,字元和位元組的對應關係也不同,與編碼方式有關,常見的編碼字元與位元組的對應關係如下:
1、ASCII碼中,一個英文字母(不分大小寫)佔一個位元組的空間,一個中文漢字佔兩個位元組的空間。一個二進位制數字序列,在計算機中作為一個數字單元,一般為8位二進位制數,換算為十進位制,最小值0,最大值255。
2、UTF-8編碼中,一個英文字元等於一個位元組,一箇中文(含繁體)等於三個位元組。
3、Unicode編碼中,一個英文等於兩個位元組,一箇中文(含繁體)等於兩個位元組。
符號:英文標點佔一個位元組,中文標點佔兩個位元組。舉例:英文句號“.”佔1個位元組的大小,中文句號&ldquo。”佔2個位元組的大小。
4、GBK編碼方式是中文佔兩個位元組,英文佔1個位元組。