匹配任意中文字符(unicode编码):[\x{4e00}-\x{9fff}] (GBK编码):([\xb0-\xfe][\x00-\xff])+ 这是我在阅读《正则指引》一书,书中写的,亲测可行。
/[\x{4e00}-\x{9fa5}]/iu 匹配汉字
/[^\x{4e00}-\x{9fa5}]/iu 匹配非汉字
汉字在Unicode中称作CJK 统一表意符号 (CJK Unified Ideographs),包括U+3400-U+4DBF/U+4E00-U+9FFF/U+20000-U+3FFFD,参见百度百科【统一码】。
匹配输入汉字:"^[\u4e00-\u9fa5]{0,}$"
echo preg_match('/[^x00-xff]+/','中文');