UTF-8 character regexp
(?:^|(?<=[\x00-\xBF]))([\x80-\xFF][\x80-\xBF]{1,5}|[\x00-\x7F])
Z potrzeby…
Zakładając, że wejście jest poprawnym UTF-8, to wyrażenie pasuje do dokładnie jednego
znaku (nie bajta czy oktetu).
Ten regexp nie nadaje sie do walidacji, byłby dużo dłuższy :P
aha?