汉字内码是指汉字在计算机内部存储和传输时使用的二进制编码。在汉字内码中,一个汉字通常用两个或三个字节来表示。如果汉字内码的两个字节的最高位必须为1,这意味着这个内码是按照特定的格式编码的,其中每个字节的最高位为1表示这是一个汉字字符的编码。在一些编码方案中,如UTF-16,这是常见的表示多字节字符编码的方式。
例如,如果一个汉字内码的两个字节是11000000和11111111,那么它们的最高位都是1,这是符合要求的。而如果一个汉字内码的两个字节是00000001和01111111,那么它们的最高位都是0,这就违反了要求,因为根据规定,汉字内码的最高位必须是1。
需要注意的是,不同的编码方案可能有不同的规定和标准,因此具体的规定可能会因编码方案而异。
为了区别汉字与普通ASCII字符,国标汉字内码只能叠加到特殊ASCII字符所用的空间上。这是为了最大限度保障兼容性。
最高位必须为1,因此内码的区、位部分必须大于0x80。实际上还有一部分0x80~0x9F保留的,汉字内码计算时实际为区/位码+0xA0。
存储1024个国标汉字需要的字节数=1024*2=2048,
因为一个汉字需要两个字节的地址空间!
呵呵,祝你早日解决问题!